四 川 大学
硕 士 学位论文
二
作题 目 蒸于字节流的余文检索技术研究与实现一一一
一
者 弩 东 航 完成 日期 卫典乏年 通里月一 里目 一
培 养 单 位 四 川 大 学
指 导 教 师 唐常杰 教授 一
研 究 方 向 数据库与知识工程 一
授予学位 日期 四万 年 业 一月 一 」已
基于 字节流 的全文检索技术研究与实现
计算机应用专业
研 究生 普东航 指导老师 唐 常杰 教授
全文检索是 当前信息检 索技 术的重要研 究方 向 , 是从大容 量文档库 中找寻
。
所需信息的最有效手段 实现全 文检索系统 的核心是建立有效 的全文检索模型 ,
目前全文检索模型根据索引项的不 同可分为基于关键词的方法和 基 于字 符的方
法两类模型 , 基于关键 词 的方法检 索速度 快 , 容易支持同 义词 查询 , 索 引空间
。
效率好 , 很多商业应用 的全文检索模 型都是 使用 基于 关键词 的方法 但 查准率
和 查全率不 够高 , 不能支持整句或文 档片断的查询 , 对中文 的处理不方便 , 在
。
中文分词方面表现欠佳
近年来 , 我 国学术界提 出的基于单汉字 的全文
。
检索方法得 到重视 , 本文将之扩展为 能适用各种文件 的基 于字节流 的方法 它
能弥补基于关键词检索方法 的上述缺 点 , 检索速度介 于全文扫描和关键词方法
。
之 间 , 但 目前的一些检索模 型和基于 关键词 的方法相 比 , 性 能还较低
为了解 决时空 间效率的问题 , 本文做 了下列工作
分析 了全文检索技术 的基本方法 以及几种 常用 的全文检索模 型 , 并对
基于字节流的全文检索技术 的优势和 不足进行 了分析
、
提 出并实现 了交叉 链表 倒排 后继 表
、 相邻地址
。
三种基于字 节流 的全 文检索模型
对提 出的三种模型进行 了详细的性能分析 , 在
基于字节流的全文检索技术研究与实现 来自淘豆网www.taodocs.com转载请标明出处.