1/3
文档分类:IT计算机

基于词汇链与互信息的关键词抽取研究.pdf


下载后只包含 1 个 PDF 格式的文档,没有任何的图纸或源代码,查看文件列表

特别说明:文档预览什么样,下载就是什么样。

下载所得到的文件列表
基于词汇链与互信息的关键词抽取研究.pdf
文档介绍:
卅院掉 年 月 第 卷 第 期
...
基 于词汇链 与互信 息的关键词抽取研究
任 莉莉,方元康,
.池州学院 数 学与计算机科学系 ,安徽 池州 ;.南京航空航天大学 计算机学院 ,江苏 南京
【摘要】基于统计 的关键 词抽取 方法忽略 了词语的深层语义信 息,而词 汇链 的关键 词抽取方法能弥补这一缺 陷,但 词汇链的构造 需要计
算语义相似度 ,而语义相似度 的计算需要知识库的支持 ,提 出了一种综合考虑词汇链和互信息模 型的关键词抽取算法。首先对文本进行预处
理 ,借助词 汇链和 互信 息模型来表达词语 间语义关系,以及对未包含词及相关联度高而相似度值 不理想的关键词识别。实验结果表明 :在准
确率和召回率方面,较基于统计的和基于词汇链 的关键词抽取算 法均有所提高。
关键词】关键词抽取;词汇链;互信 息;准确率 ;召 回率
中图分类号 【文献标识码】 文章编号】一— —
引 言 针对 现有 关键 词抽 取 方法存 在 的不 足 ,提 出 了
一 种 既考 虑词 语 的语义 关 系 、又兼 顾词 语 的统计 分
随着 现代科 技 和信 息技 术 的迅猛 发展 。网络 上
布 .即综 合考 虑 词 汇链 和互 信 息 的关 键 词 抽 取 算
的数 据 以接近 指数 级 的速度 在递 增 。如何 科 学 、准
内容来自淘豆网www.taodocs.com转载请标明出处.
相关文档
非法内容举报中心
文档信息
  • 页数3
  • 收藏数0 收藏
  • 顶次数0
  • 上传人zhufutaobao
  • 文件大小261 KB
  • 时间2021-11-09