下载此文档

蒙古文信息检索系统中检索单元选取方法的研究-计算机科学与技术专业毕业论文.docx


文档分类:IT计算机 | 页数:约58页 举报非法文档有奖
1/58
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/58 下载此文档
文档列表 文档介绍
IIlIIllrllr111rilliIr[IliltfIqIIfY1887437一原创性声明本人声明:所呈交的学位论文是本人在导师的指导下进行的研究工作及取得的研究成果。除本文已经注明引用的内容外,论文中不包含其他人已经发表或撰写过的研究成果,也不包含为获得内墓直太堂及其他教育机构的学位或证书而使用过的材料。与我一同工作的同t-志对本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。学位论文作者签名: 指导教师签名:—趁r暮俊美El El 期:在学期间研究成果使用承诺书‘本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:内蒙古大学有权将学位论文的全部内容或部分保留并向国家有关机构、部门送交学位论文的复印件和磁盘,允许编入有关数据库进行检索,也可以采用影印、缩印或其他复制手段保存、汇编学位论文。为保护学院和导师的知识产权,作者在学期间取得的研究成果(含计算机软件、程序)属于学位论文作者签名:垂玺苤 ’指导教师签名:!鱼竺坠日 期:l啦俳日 期:。婵√。蒙古文信息检索系统中检索单元选取方法的研究摘要目前,中文信息检索和英文信息检索都进入成熟阶段,但是由于蒙古语言的独特性,蒙古文信息检索还有很多关键技术问题尚未完全解决,这些问题的解决对蒙古文信息检索的发展具有重要的意义,本文所研究的课题就是其中之一。蒙古语是内蒙古自治区的主体民族语言,是属于黏着性语言。蒙古文单词由词根衔接不同的词缀构成的,本文结合蒙古语的自身特点,利用已选好的信息检索模型对蒙古文信息检索系统中检索单元选取方法做了进一步的研究。、向量空间模型和语言模型,并采用三种平滑算法进行平滑处理,分别是Good."lutingSmooth方法、JMSmooth方法、KatzSmooth方法,供选择的检索单元有整词形式、词根形式、词根+词缀的形式、,‘对每一种选取好的检索单元,都进行以下四个步骤:对语料库建立索引,解析Query,检索以及评价,从而比较它们的查全率和查准率,找出合适的检索单元。本文使用了29510篇文档,文档集大小为156M,我们对此建立了信息检索测试,包括:语料库、12个Topic及对应的相关性文档。运用Lemur搭建了信息检索实验平台。实验结果表明蒙古文信息检索系统中较为适合的检索单元为词根+(n=4)形式。关键字:蒙古文信息检索,检索单元,语言模型,Query结构化StudyontheMethodsintheSelectionofRetrievalUnitInMongolianInformationRetrievalSystemABSTRACTCurrently,,duetotheuniquenessofMongolianlanguage,,,-IDFModel,VectorSpaceModel,LanguageModel,andusetheGood—Turingmethod,JMmethod,,root,,thisp

蒙古文信息检索系统中检索单元选取方法的研究-计算机科学与技术专业毕业论文 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数58
  • 收藏数0 收藏
  • 顶次数0
  • 上传人wz_198613
  • 文件大小4.11 MB
  • 时间2019-04-10