第 卷 第 期 计 算 机 工 程 年 月
. .
· 人工智能及识 别技术 · 文章编号:—— 文献标识码: 中图分类号:
融合语 义资源和 关键词 的文本聚类
吴舜尧 邵峰晶 王金龙 孙仁诚 ,王 营 岫
.青岛大学 .自动化工程学院;.信息工程学院 ,山东 青 岛 ;
.青岛理工大学计算机工程学院,山东 青岛
摘 要 :融合关键词形式的属性层知识可有效提高文本聚类 的聚类质量 ,但融合关键词 的簇 中心初始化仍是一个开放性问题 。为
此,提出一种融合语义资源和关键词 的文本聚类方法 。通过 语义识别文本集 的主题 ,采用基于资源分配的网络推断策略,
通过文献协同关系发现潜在语义相关性 ,以选择最能代表各主题的重要文档初始簇中心,并利用软约束与测度学****相结合的策略
融合关键词辅助文本聚类。在 文本集上的实验结果表明,与 和仅融合关键词的文本聚类方法相比,该方法
可有效提升聚类质量,尤其在 数据集上标准互信息最多可提升约 %。
关健词 :关键词;文本聚类 ;语义 ;簇 中心初始化 ;网络推断;重要文档
融合语义资源和关键词的文本聚类 来自淘豆网www.taodocs.com转载请标明出处.