该【基于数据挖掘的电影水军识别技术与应用的中期报告 】是由【niuwk】上传分享,文档一共【2】页,该文档可以免费在线阅读,需要了解更多关于【基于数据挖掘的电影水军识别技术与应用的中期报告 】的内容,可以使用淘豆网的站内搜索功能,选择自己适合的文档,以下文字是截取该文章内的部分文字,如需要获得完整电子版,请下载此文档到您的设备,方便您编辑和打印。基于数据挖掘的电影水军识别技术与应用的中期报告一、研究背景在互联网时代,网络评论成为人们了解商品、服务等的主要依据之一。然而,网络上出现了许多水军,他们通过虚假评论、点赞等手段来夸大商品或服务的好处,破坏了网络评论的公正性和客观性。因此,如何在海量网络评论中准确地识别水军,成为了亟待解决的问题。二、研究内容本研究基于数据挖掘技术,从评论文本特征和用户行为特征两个方面,构建了水军识别模型。具体内容如下:(一),生成关键词向量;,使用K-means聚类算法将评论文本分为不同的主题;,生成相似度向量。(二),计算用户的评论活跃度、关键词热度、话题敏感度等指标;、评论频率、点赞行为等信息,计算用户的时间分布行为、评论频率行为和点赞行为。(三)综合特征将评论文本特征和用户行为特征进行综合,构建水军识别模型,用于对新的用户进行识别。三、研究成果在评价数据集上进行了实验,结果表明该模型可以准确地识别水军,模型的准确率为90%,召回率为85%。该模型可以应用于电影、餐饮、旅游等领域的评论分析,有效提高评论的质量和可信度。四、,提高其准确度和召回率;,用于实际应用;,提高模型的识别能力和精度。
基于数据挖掘的电影水军识别技术与应用的中期报告 来自淘豆网www.taodocs.com转载请标明出处.