现代信息检索中的文本分类及图像恢复研究摘要和/或空间复杂度较高,不易实现。针对上述问题,本文提出了一种对最特征选择。实际上词与词之间存在很强的的相关性,本文提出了基于期信息化的飞速发展使各种信息呈现爆炸式增长,这给人们的工作、学习和生活提供了极大便利,但淹没于大量无用、重复信息之中的有用信息很难通过人工的方法被全面准确地提取出来,人们陷于信息提取的泥潭中,快速有效的信息检索技术成为了唯一的解决方案。信息检索主要包含两个部分:按照科学的体系结构对信息进行归类和获取用户真实意图,反馈给用户所需的信息。前者是提高效率的关键,本文的研究则集中于信息归类,围绕中文文本分词、特征选择和分类方法以及图像检索中的模糊图像恢复等关键技术展开探索。研究过程使用了理论分析和计算机实验验证两种主要方法。以理论分析确定实验目的,指导实验方法;以实验数据支持理论分析,推动更深入的理论分析。本文首先介绍了信息检索的发展现状,结合本论文的主要研究内容论述了信息检索中的关键技术,对本论文的内容安排和主要创新作了说明。而后,从总体上介绍了自动文本分类系统的组成结构和功能,为后面的研究打下了基础。本论文所作的创新主要包括以下几个部分:现有机械分词方法准确率偏低,对后续特征选择和分类造成了破坏,影响了文本分类精度;非机械分词法虽然有较好的分词精度,但是时间大匹配法进行改进得到的预测最大匹配分词方法。预测最大匹配法通过对长词出现可能性和起始位置进行预测,使分词过程更符合长词优先准则。通过对新方法分词性能和时间复杂度的分析,证明了该方法以较小的复杂度增加为代价明显提高了分词准确性,接近全局最大匹配的性能。以词为特征表示中文文本时特征维数较高,需要剔除对分类贡献小的特征。现有特征选择方法基于词与词之间相互独立的假设,属于标量望交叉熵的向量特征选择方法,兼顾了词与类别及词与词之间的相关性。本文还研究了使用浠缓推嬉熘捣纸馓卣魃傻姆椒āJ笛橹っ髟北京邮人学博貉宦畚摘蟹
知识水坝***@pologoogle为您整理
相同的分词和分类法基础上,相对于标量特征选择,向量特征选择法配合甃变换和奇异值分解的特征生成方法有效提高了文本分类的精度。分类器是文本分类系统的核心,经典的掷喾ㄊ迪旨虻ィ分类性能欠佳。在分析了ǘ匝就臣铺匦岳玫钠嫘缘幕上,本文提出了基于方差的文本分类算法,利用了不同类别文本在分布上的差别。为了同时发挥ǖ乃俣扔攀坪蛃法的性能优势,本文提出了使用ù址掷嘟岷蟂ⅥⅥ细分类的新分类方法。计算机实验表明在使用相同的分词和特征选择方法的基础上,本文提出的分类法,特别是岷蟂的分类法显著改进了分类器的性能。多媒体信息的检索是未来信息检索的发展方向,本文对图像检索系统中的图像样本预处理技术进行了探索。借鉴通信领域应用的惴ǎ提出了一种在无先验知识的情况下对图像进行盲恢复的方法。通过这种方法可以有效提高图像样本的质量,进而提高图像检索的效率和准确性。未来智能信息检索技术的发展是无可限量的,本文的最后对全文内容进行了总结,概括了其主要的贡献及意义,并提出了今后的研究方向。关键词:
知识水坝***@pologoogle为您整理
酬锄髂础舯,Ⅲ;齣“,曲鷄豻,,畆廿.,Ⅱ衄托ⅱ.,甀北京邮电;Р┮籌:学位论文摘要
.蟘鷈鷒鰁蛳豴.゛资╯籦辳百够蚼,瓻舐鱲姐∽....’,
.,:.
导师髂名:—主譬—速—一目期!1咂笪嫩掏疞本人签名:盥疆本入签塞:垫嚣爨:兰壁萑⋯一独创性甏葱滦声明美手论文矮震援羧瓣谟蹊呈塑垒热星至本入声饕瑟蘩瓮耱透文是奉夫在霉露意甏下遂蜇嚣硪变工箨爱致褥的褥究成粟。撄我所知,除了文中特别加以标注和致谢巾所罗列的内容以外,论文中不包含其他人已经发袈戴撰写过的礤究成果,也不饿盘为获褥托寨邮电大学域蔟他鼗襄壤瓣熬学建或疆繁蔼整器蘧斡麓襄。与我一嚣工箨蕊疑惑辩奉骚突黪辍黎螽何贡献均已在论文率作了明确的说明并表示了谢意。申请学位论文姆资料若有不嬲之处,本人承掇一切相关谢任。学德论文律者究套了解炅观辜ù笱в泄仫鞲胶褪褂醚У侣畚牡墓媾矗研究生线校攻读学位期间论文工作的知识产权单位属北京邮呶大学。学校:灯权保蟹并惫漫窳奏关部门竣糗稳送交谂灾戆复露转移磁盘,竞麓:攀僚逡文鼓蠢辫秘爨蘩;擎蔽莓疆公毒学攘论文翁垒帮躐部努蠹容,爵疆龛诲采掰影露、赣瘁袋黧它复制筝段保存、汇编辫位论文。琶艿难宦畚脑诮饷芎笞袷卮斯娑保辩论文注释:本学位论文属予保密在一蜃繁杳芎箦砸ū臼诰瑊睾。嚣像密谂支注释:零学建谂交苓矮予爨密鏊赘,逶霉誊蔽投蔷。
现代信息检索中的文本分类及图像恢复研究(可复制论文) 来自淘豆网www.taodocs.com转载请标明出处.