下载此文档

InfoMall数据检索服务的设计以及全文检索系统的初步实现.doc


文档分类:IT计算机 | 页数:约32页 举报非法文档有奖
1/32
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/32 下载此文档
文档列表 文档介绍
InfoMall数据检索服务的设计以及全文检索系统的初步实现
InfoMall Data Retrieval Service and its Full Text Retrieval System
姓名:
学号:
院系:信息科学技术学院
专业:计算机科学与技术
指导教师:
2005年6月
论文评定
导师评语
为历史存档的网页信息提供全文信息检索,是更好展示和挖掘网页历史信息必不可少的手段。为历史存档网页建立索引提供检索服务,不同于搜索引擎,通常其数据量更大,并且具有自己的特性。杨志丰同学的毕业论文工作,是对这一部分内容有益的探索。
论文所涉及的工作是在中国Web信息博物馆(InfoMall)的基础上完成的。通过对InfoMall网页信息博物馆的数据需求的分析,利用基于时间、空间、内容的网页数据三维模型,设计了InfoMall数据检索服务,并规约了服务原语,设计了系统组成。该文进一步设计和实现了InfoMall数据检索服务的系统组成中的主要模块——全文索引系统。主要针对InfoMall数据的特点和数据检索服务的需求,在空间利用率和系统灵活性两个方面做了探讨和优化。
论文内容丰富,所涉及的工作量大,且有较强的系统性,是一篇很有价值的论文。
在毕业设计工作的过程中,该同学态度端正,积极努力,表现出很强的进取精神和踏实的工作作风,为InfoMall的发展做出了贡献。
成绩___优______ 指导教师签字__闫宏飞_______
_2005_年_6_月_9_日
摘要
中国Web信息博物馆是北京大学网络实验室研究和开发的中国万维网(World Wide Web)历史信息的存储和展示系统。但现有系统提供的服务不能满足用户对宝贵的历史网页数据的信息需求,因而限制了它的广泛使用。本文试图从实际出发,探讨和尝试如何利用保存下来历史网页数据提供公共信息服务。
本文通过对InfoMall网页信息博物馆的数据需求的分析,利用基于时间、空间、内容的网页数据三维模型,设计了InfoMall数据检索服务,并规约了服务原语,设计了系统组成。例如,利用我们提供的服务,用户可以查询“1997年2月到2005年2月期间内蒙古自治区范围内所有*.域名下内容包含‘民主’的网页文档的全文”。
本文设计和实现了InfoMall数据检索服务的系统组成中的主要模块――全文索引系统。我们主要针对InfoMall数据的特点和数据检索服务的需求,在空间利用率和系统灵活性两个方面做了探讨和优化。
关键词
InfoMall,历史网页,信息检索,倒排文件,索引
Abstract
Web InfoMall is a digital library to store web pages of Chinese World Wide Web periodically and exhibit them to people online, which is designed and developed work and Distributed Systems Laboratory of Peking University. However current available services are too limited to meet user’s information needs and prevent it from being widely used. That is a great waste of the valuable archaic web pages. In this article, we present our ideas of how to use these archaic web pages to provide information service to public.
In this article, we analyzed the user’s information needs and designed a powerful service called InfoMall Data Retrieval Service, using a three-dimensional model based on time, space and content. We specified the syntax of query and designed ponent of the system. In addition, we designed and implement the full text retrieval system that is a ponent of InfoMall Data Retrieva

InfoMall数据检索服务的设计以及全文检索系统的初步实现 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数32
  • 收藏数0 收藏
  • 顶次数0
  • 上传人策划大师
  • 文件大小0 KB
  • 时间2011-11-13