基于语义的中文信息检索技术分析与研究现代计算机^总第二九三期v基于语义的中文信息检索技术分析与研究王春红(运城学院计算机科学与技术系,运城o44ooo)摘要:对隐含语义索引模型在中文文本检索中的应用进行分析,:隐含语义索引(LSI);信息检索;SVD;,在传统的信息检索中,:用户提出提问式——,许多分词f或短语):——:a=lad1?f?埘,1?-,?』4矩阵通过奇异值分()I41~:A=U?VT其中,矩阵?是对角线矩阵,对角线上的元素称为矩阵A的奇异值矩阵和矩阵两个矩阵的列向量都是正交归一化的f/"左奇异值向量矩阵":"右奇异值向量矩阵":其中r是矩阵A的秩,且有:,,TU=V=(为12阶单位矩阵)如图1所示将矩阵?对角线上的奇异值沿对角线从大到小递减排列,之后再把矩阵?,我们可以得到一个新的近似的分解:A×?kXT这里,和的列向量均为正交向量,这样,就用近似地表征原词一文档矩阵A,,从而使每个词/文本都可以利用左,右奇异值向量,,词语使用多样性等对信息检索的影响在同一个空间中表示词语和文本,词一词,词一文本,文本一文本的相似度,收稿日期:2008—04—21修稿日期:2008—10—07作者简介:王春红(1965-),女,山西人,副教授,学士,研究方向为信息检索,////.?=
基于语义的中文信息检索技术分析与研究 来自淘豆网www.taodocs.com转载请标明出处.