下载此文档

以关键词抽取为核心的文摘句选择策略.pdf


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
万方数据
以关键词抽取为核心的文摘旬选择策略1212h21212中文信息学报引言为了从海量信息中快速、准确地获取有用信息,多文档自动文摘技术变得越来越重要。面向查询的多文档自动文摘技术的任务是基于特定的查询,将大量的查询结果文档中的相关内容浓缩为一个包含与查询相关的各个主题,并且内容简洁、组织良好、冗余低、满足个性化需求的摘要,它更具有针对性,更能适应当前环境下对于信息获取的个性化需要。目前国内外学者关于面向查询的多文档自动文摘都进行了很多有意义的探索研究。热薣通过手工修剪句子,然后提出独立于查询的特征和依赖于查询的特征,并对两个特征分别进行打分,最后将每个句子的两个特征线性组合以得到最后的分数,在考虑冗余性的情况下反复226文章编号:~——.华中师范大学计算机科学系,湖北武汉;矣镅宰试醇嗖庥胙芯恐行耐缑教宸种行模蔽浜摘要:针对面向查询的多文档自动文摘,该文提出了一种以关键词抽取为核心的文摘句选择策略。通过查询扩征,并将这两个特征值进行特征融合得到词语的重要度以确定关键词。然后通过关键词的重要度来给候选句打技术来调整候选句的得分,最后生成文摘。该文将特征关键词:计算机应用;中文信息处理;多文档文摘;关键词抽取;文摘句选择Weil2(2007CB310804)(1307042)作者简介:马亮.男,硕士,研究方向为多文档自动文摘;何婷婷,女。教授,博导,研究方向为自然语言年月展的相关技术得到相关多文档集中词语的查询相关性特征,利用最大似然估计法得到语料中词语的话题相关性特MMR(MaximalDUC2005TP391AFan91CHENJinguan91SHAO.,琀琀收稿日期:——定稿日期:——基金项目:国家自然科学基金资助项目;湖北省自然科学基金资助项目国家重点基础研五”科技支撑计划课题资助项目处理;李芳,女,硕士,研究方向为多文档自动文摘。琋NOV2008Lian912~,ScienceHuazhong430079China甆,,,:multidocumentsummarizationThisexpansioncalculateswordTheitand甇featuresthewordscomputer籆summarizationkeywordstractionsummary.·
万方数据
提出了一种在文23抽取出分数最高的句子作为最后的文摘句。该系统DUC2007MMR本摘要中自动获取话题信号词的方法,该方法利用相关文档集和非相关文档集中词语的频率来计算话题信号词的统计量,并采用互信息量和最大似然估计量来近似计算,能够较好地提取出与话题相关的信号词。瓹热薣通过人工生成的多篇文摘来近似计算查询条件下信号词出现的概率,并将该值作为经验值用来挑选文摘句,还加入了语言知识的预处理热缍识逃锖颓暗几贝实南[53局关联特征的融合来抽取文摘句以生成摘要,取得包含文档集的重要内容的关键词语;然后根据这些关键词语的重要度给候选句打分,并利用改进的摘的流程,第三部分是关键词提取策略,第四部分是文摘生成策略,第五部分是实验结果与分析,第六部分是结论与将来的工作。从下面的流程图中可以看出,本系统分为语料l户的查询条件得到相关的多文档集,并假设在该文能地满足用户的查询需求,同时也较好地概括了文档的主要内容。本文同时也选择与用户的查询条件不相关的文档集作为对比来

以关键词抽取为核心的文摘句选择策略 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人755273190
  • 文件大小381 KB
  • 时间2021-02-23