下载此文档

信息检索、系统和常用的搜索引擎.ppt


文档分类:IT计算机 | 页数:约80页 举报非法文档有奖
1/80
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/80 下载此文档
文档列表 文档介绍
信息检索、系统和常用的搜索引擎*-*-了解文献、信息、信息检索、*-*-、信息检索基本理论(1)文献:是记录有知识的一切载体的总和。包括载体与知识两部分。远古时期的结绳记事:绳子+每个结表示的含义;甲骨文时期:大动物的骨头、龟壳+记录的内容;竹简时期:竹子+记录的内容;纸张时代:书、手稿等+记录的内容;现代:音像制品、电子出版物等+记录的内容。(2)信息:从客观上说,信息是指一切事物存在方式和运动规律的表征,或我们对周围世界的一种认识。有正确与错误之分。(3)信息检索:信息检索是指将杂乱无序的信息有序化形成信息集合,并根据需要从信息集合中查找出特定信息的过程。(4)信息检索系统:任何具有信息存储与检索功能的系统,均可以称之为信息检索系统。从狭义上讲,信息检索系统可以理解为一种可以向用户提供信息检索服务的系统。*-*-::手工检索系统计算机检索系统计算机检索系统由计算机硬件、检索软件、数据库及通信网络等组成。硬件主要包括:中心计算机、检索终端及数据输出设备等;检索软件是检索系统的灵魂,负责管理数据库和处理检索提问,它决定系统的检索能力;数据库是检索系统的信息源,是检索作业的对象;通信网络是信息传递的设施,其主要作用是在检索终端和中心计算机之间进行信息传递。*-*-:*-*-?解决之道::目录(DIRECTORY,或CATALOG);基于ROBOT的搜索引擎;元搜索引擎(用得较少)。:目录方式所使用的数据库是依靠专职编辑或志愿人员建立起来的。目录的用户界面基本上都是分级结构。有两种使用方式:由开始几个大类入口→逐级向下访问→找到自己感兴趣的类别。利用目录提供的搜索功能直接查找一个关键词。*-*-:比较精确。由于目录依靠人工来评价一个网站的内容,因此用户从目录搜索得到的结果往往比从其它的搜索引擎得到的结果更具参考价值。缺点:有一定时延。只能在已经保存的站点特性描述数据库中进行搜索,因此站点本身的动态变化可能不会及时反映到特性描述数据库中。:一个能够沿着链接漫游整个WEB集合的程序。特点:需要定期访问大多数以前搜集的网页,刷新索引,以反映出网页的更新情况,并去除一些无效链接。代表:天网,GOOGLE*-*-(META-SEARCHENGINE):是一种调用其他独立搜索引擎的引擎。“元”(META)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。元搜索引擎是用户同时利用多个引擎进行网络信息搜索的中介。检索时,元搜索引擎整理用户提交的检索请求,调用多个独立搜索引擎进行搜索,优化搜索结果,统一显示。*-*-:布尔检索、词位检索用得少:截词检索、限制检索注:并不是每个检索系统都支持所有的检索技术。:AND、OR、NOT*-*-(1)AND逻辑与是一种具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示。使用“逻辑与”组配技术,缩小了检索范围,增强了检索的专指性,可提高检索信息的查准率。例:“打印机驱动程序”查询关键词:打印机、驱动程序检索表达式:打印机AND驱动程序(2)OR逻辑或是一种具有并列关系概念的组配,用“+”或“OR”算符表示。使用“逻辑或”检索技术,扩大了检索范围,能提高检索信息的查全率。检索“微型计算机”方面的有关信息查询关键词:微型计算机、微机检索表达式:微型计算机OR微机

信息检索、系统和常用的搜索引擎 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数80
  • 收藏数0 收藏
  • 顶次数0
  • 上传人AIOPIO
  • 文件大小6.93 MB
  • 时间2020-09-13