中文新闻话题动态演化及其关键技术研究.pdf


文档分类:论文 | 页数:约134页 举报非法文档有奖
1/ 134
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/ 134
文档列表 文档介绍
博士学位论文中国科学技术大学中文新闻话题动态演化及其关键技术研究作者姓名:学科专业:完成时间:赵旭剑计算机应用技术导师姓名:岳丽华教授二欢晡逶乱蝗
㈣㈣’:痁:.穑痷一’
签字日期:—批乒钐起如剑趑如到塑迹呵笪逊ぃ骸唬好签字日期:中国科学技术大学学位论文原创性声明中国科学技术大学学位论文授权使用声明,本人声明所呈交的学位论文,是本人在导师指导下进行研究工作所取得的成果。除已特别加以标注和致谢的地方外,论文中不包含任何他人已经发表或撰写有学位论文的部分使用权,即:学校有权按有关规定向国家有关部门或机构送交口保密!D导师签名:过的研究成果。与我一同工作的同志对本研究所做的贡献均已在论文中作了明确的说明。作者签名:作为申请学位的条件之一,学位论文著作权拥有者授权中国科学技术大学拥论文的复印件和电子版,允许论文被查阅和借阅,可以将学位论文编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存、汇编学位论文。本人提交的电子文档的内容和纸质论文的内容相一致。保密的学位论文在解密后也遵守此规定。
摘要对传统新闻媒体,网络新闻在时效性与互动性上的优势使它对于社会重大事件的望能够将与某一事件相关的网络新闻信息整合成一个新闻话题,从而能够全面地了解新闻事件的概貌。面对这样的需求,以新闻话题为研究对象,结合不同的研究领域,衍生出了面向互联网的新闻搜索、新闻聚类、新闻分类、新闻热点挖掘等多个研究方向,较好地解决了新闻话题的检测问题。但是,传统的新闻话题检动态演化研究对网络新闻流数据进行合理、有序的自动化处理与组织成为当前互之后通过聚类的方法,深入挖掘演化过程中话题在强度和内容上的变化轨迹。话络新闻检索、网络舆情监控、互联网突发事件检测与应急管理等方面具有十分重技术挑战,以中文新闻为基础,对新闻话题动态演化中的若干关键问题进行了深系统框架和主要研究对象,讨论了该领域的国内外相关工作,从理论上阐述了新接着,论文围绕话题模型、时态信息处理以及话题动态演化挖掘三个方面展开深入研究,提出一种面向中文网络新闻的话题信息抽取方法,同时,给出一种针对真实新闻文本的时态表达规范化处理算法,在此基础上,又构建一个面向中文新闻网页的话题时间解析器,自动抽取话题时间,最后结合以上工作,提出一种具有统一框架的新闻话题演化挖掘算法。随着互联网的发展,网络新闻的日益普及已经成为一个不可阻挡的趋势。相报道具有更为深远的影响力,成为人们获取新闻信息的主要来源。通常,人们希测以新闻信息的文本话题抽取为主要的目标,缺乏对新闻话题的动态演化特性的挖掘和支持。随着用户对于新闻自动组织能力要求的提高,如何通过新闻话题的联网信息处理技术的热点问题。新闻话题动态演化蚣虺苹疤舛莼研究是对文本话题演变过程的时态语义挖掘。它首先建立在传统的话题模型研究理论基础之上,将话题转化为可进行计算和比较的信息表示模型,同时结合文档的时间信息,充分研究话题演化的不同阶段下与话题内容紧密关联的话题时间,并根据时间顺序构建话题序列,题动态演化研究可以准确完整地获取新闻话题动态演化各个阶段的话题内容,帮助用户理解新闻话题的来龙去脉以及话题内容之间的相关性和差异性,因此在网要的作用和应用前景。在这样的研究背景下,本论文针对新闻话题动态演化研究中的理论性问题与入研究。论文首先介绍了新闻话题动态演化研究的背景和意义,分析了该研究的闻话题动态演化研究的基本思想和研究思路。本论文的主要贡献可归纳为以下几个方面:
提出了一种基于语言学知识的中文新闻话题信息抽取方法。该方法基于对互联网新闻特征的研究,通过引入中文词性与位置特征建立启发式规则,修正了错误标注的话题词候选对象,进而有效扩充了话题词对象集合,提高了抽取结果的语义正确性和话题完整性。攵阅壳笆碧泶锕娣痘硐喙毓ぷ髦胁握帐奔溲≡窕撇荒苁视真实新闻文本的问题,提出了一种基于参照时间动态选择的时态表达规范化算法。通过挖掘时态表达中修饰符和时态名词两部分内容各自的时态参照特征,对其进行参照分类,在此基础上根据时态表达的类别为其分配正确的参照时间,,显著提高了时态表达规范攵孕挛呕疤馐奔涑槿∷惴ㄗ既仿式系偷奈侍猓岢隽艘恢只诨疤庖时间依存关系模型的话题时间抽取方法。该方法通过深入研究不同类型新闻的报语义依存关系,,并以该模型为理论指导,利用话题权重和无监督学习两种策略抽取新闻报道中的话题时间。该算法较同类方法具有更高的准确率,大大改善『.现有工作中新闻话题与话题时间相关性差的问题。不足,提出了一种基于特征演变的新闻话题动态演化挖掘方法。通过引入词项特征在话题演化过程中的变化特性,构建增量式特征计算模型,并且利用已有话题的准确率,充分改善了关联计算的整体性能,进而有效提高了最终挖掘结果的正通过本论文的研究,

中文新闻话题动态演化及其关键技术研究 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数 134
  • 收藏数 0 收藏
  • 顶次数 0
  • 上传人 quality
  • 文件大小 0 KB
  • 时间2014-01-14
最近更新