下载此文档

《信息与电脑》杂志情感分析研究综述_袁媛pdf.doc


文档分类:研究报告 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
信息与电脑社交营销 2015 年第 21 期 munication 本文来源于《信息与电脑》杂志社,投稿邮箱: XXYDN1989@ 情感分析研究综述袁媛(杭州电子科技大学管理学院,浙江杭州 310018 ) 摘要: 情感分析,又成为倾向性分析。是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程。随着社交媒体的快速发展及应用,如微博、 *** 等,产生了大量的评论信息,由于微博属于短文本,因此对微博的情感分析来源于文本情感分析。基于此,在介绍文本情感分析研究现状的基础上再介绍微博情感分析的研究现状。关键词: 微博;情感分析;情感词典中图分类号: 文献标识码:A 文章编号: 1003-9767 ( 2015 ) 21-049-02 随着互联网的快速发展,尤其是微博、微信等新社交网络的兴起,网络用户每天都会发布并传播高达上亿的信息。这些海量的文本信息中,有很大一部分是表达用户观点倾向和情感倾向,这些情感文本信息是非常宝贵的意见资源,包含着人们对社会各种现象的不同观点和立场,话题涉及政治、经济、军事、娱乐、生活等领域。个人和组织越来越的把情感观点信息用于决策,因此使用计算机技术自动地对其分析处理,在选举、销量预测、精准营销等领域有着广泛的应用,情感分析技术应运而生。 1 文本情感分析研究综述文本情感分析研究始于 20 世纪 90 年代。情感分析主要分为两类,一是基于情感词典的文本情感分类, 二是基于机器学****的文本情感分类。在基于情感词典的文本情感分类相关研究中,主要有以下成果。 Riloff 和 Shepherd 建立一个基于语料数据的语义分析系统,该系统的输入为某个类别的种子词集合和一个有代表性的文本语料,系统输出为和该类别相关的单词排序列表。 Hatzivassiloglou 和 Mckeown 在大规模语料的基础上使用对数线性回归模型来验证连词对形容词正面或负面的语义倾向的影响,结果发现每个连词被认为是独立的情况下准确率达到 82% 。徐琳宏和林鸿飞根据表达情感复杂度将句子划分为单情感词的简单句、多情感词的简单句和多情感词的复杂句;然后从句子的词汇和结构两方面考虑提取影响语句的情感色彩的9 个语义特征,并在已有的情感词汇本体和句子级关键情感词汇识别的基础上将语义特征加入到条件随机域中,进而进行文章级的情感分析。使用基于学****进行文本情感分析时,比较重用的机器学****方法主要有:支持向量机( SVM )、 K 最近邻( KNN )和最大熵( ME )。如 Pang 和 Lee 等人对文本进行情感分类,分为正面情感和负面情感。并对比了 Na ? ve Bayes 、 ME 和 SVM 这三种机器学****算法对电影评论的分类效果,结果发现 SVM 的分类效果最好,并且对不同的输入特征,准确率大部分在 81% ~ 83% 。 Whitelaw 和 Garg 等人提出文本中抽取和分析评价词组, 如“ very good ”和“ not terribly funny ”,来进行情感分析。首先使用半自动的方法来建立评价形容词和修饰词词组。对电影评论进行分类,然后将标准词袋特征和评价词组作为支持向量机的特征输入进行情感分类模型的训练。最后在电影评论语料上进行测试,发现准确率高达 % 。 Boiy 和 Moens 使用机器学****的方法对三

《信息与电脑》杂志情感分析研究综述_袁媛pdf 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人63229029
  • 文件大小56 KB
  • 时间2017-05-29