下载此文档

Web页面用户评论信息抽取技术与研究.pdf


文档分类:IT计算机 | 页数:约76页 举报非法文档有奖
1/76
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/76 下载此文档
文档列表 文档介绍
省秎蘅摘要页面上用户的商品评论信息已成为影响电子商务消费者进行购买决策时的关键因素之一。近年来随着电子商务的发展,关于商品的评论信息呈指数级增长,从而导致潜在用户难以在这些大量信息中寻找到有参考的评论信息,大大减低了评论信息的应用范围。论文将通过对趁嫫缆坌畔⑾钟邢低辰峁购统槿算法的分析,结合信息抽取课题,研究如何在大规模、Ⅳ页面评论信息下确保抽取的高准确性和高效性。论文在分析典型、页面信息抽取系统和算法的基础上,根据现有系统的优缺点和抽取算法的不足,提出了基于树权值的信息抽取算法,该算法通过对抓取到的、Ⅳ页面转化为标签树结构,将标签树进行噪音去除等预处理后,自底而上的为每个树节点赋上权值,使得不同层次不同标签的节点具有不同的权值,然后根据相似树和位置连续性来识别出数据记录区域,包含数据记录的标签树集进行树对准操作后生成基准树作为抽取模板,最后根据抽取模板对数据记录进行对准和抽取。该算法具有很强的自适应性,能根据不同评论信息的结构产生不同的抽取模板,同时不需要过多的人为干预,抽取结果显示该算法在抽取上有较好的效基于这个算法,论文设计了一个将单个趁孀;1昵┦鳎颖昵┦髦识别出数据记录区域,然后将数据记录对准后产生模板,最后将属性标注过的模板从一系列趁嬷谐槿⌒畔⒌南低场6允迪终飧鏊惴ǖ南低秤肫渌惴ǖ南统进行了实验对比,结果表明该系统在无需人为过多的干预,具有高度自动化的同时,也具有较高的准确性,同时在运行时间上远远优于其他系统。关键词:用户评论信息,权值,标签树,信息抽取果。浙江大学硕貉宦畚
蛐眦,萒綼劬啪韘鏻俄虢疏“鷓甒鷗匆鷗锄畆,匆谢衔羍印甈鷗亢餰,鏼伊痵猚痵琹猠玛瑂,甧籶甌,部胢,仃、Ⅳ,仃,行仃,鳌緐,瑃ⅱ鬳,丘,,、Ⅳ瑃,辏甧,猼.
曲,а猲啊:⑴穑ⅱ鬳,,瑃騭浙江大学硕士学位论文
摘要兽⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.第滦髀邸引言⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.研究背景和意义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..论文工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第隆ⅱ鬳趁嫘畔⒊槿⊙芯孔凼觥信息抽取技术发展简介⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯、Ⅳ页面信息抽取面临问题⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯国内外研究现状⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯...⋯⋯⋯⋯.第孪低程逑到峁寡芯亢蜕杓啤现有典型系统体系结构⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.芙帷基于权值的系统体系结构分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯系统功能划分⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.ⅱ鬳趁娴拇砗妥;.ⅰ系统体系结构特点⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第禄谌ㄖ档摹ⅱ鬳趁娲碜;建立标签树⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.标签⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯。.昵┦鞫ㄒ濉形式化定义⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯树节点权值赋值算法⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.
.吃胍簟本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第禄谌ㄖ档氖菁锹际侗稹评价信息页面结构分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯数据记录识别流程和算法设计⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.鞫宰******⒑褪莩槿’.0蹇庵心0逦げ呗浴实验结果对比⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯第略拖低澈褪笛榉治觥系统实现⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.趁娲砗妥;??∧?⒛?榈氖迪帧测试和分析⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯.ⅱ【啊本章小结⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯..第伦芙嵊胝雇未来的工作⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯参考文献⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯⋯攻读硕士学位期间

Web页面用户评论信息抽取技术与研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数76
  • 收藏数0 收藏
  • 顶次数0
  • 上传人2982835315
  • 文件大小0 KB
  • 时间2015-11-14