1/80
文档分类:IT计算机

信息检索、系统和常用的搜索引擎.ppt


下载后只包含 1 个 PPT 格式的文档,里面的视频和音频不保证可以播放,查看文件列表

特别说明:文档预览什么样,下载就是什么样。

下载所得到的文件列表
信息检索、系统和常用的搜索引擎.ppt
文档介绍:
信息检索、系统和常用的搜索引擎*-*-8.1信息检索教学目的了解文献、信息、信息检索、信息检索系统等概念了解信息检索的类型掌握常用搜索引擎的使用方法掌握专题数据库的检索方法8.2检索系统的类型8.3网络检索系统8.4检索意愿的表达8.5常用搜索引擎8.6网络专题数据库习题与实验*-*-8.1信息检索1、信息检索基本理论(1)文献:是记录有知识的一切载体的总和。包括载体与知识两部分。远古时期的结绳记事:绳子+每个结表示的含义;甲骨文时期:大动物的骨头、龟壳+记录的内容;竹简时期:竹子+记录的内容;纸张时代:书、手稿等+记录的内容;现代:音像制品、电子出版物等+记录的内容。(2)信息:从客观上说,信息是指一切事物存在方式和运动规律的表征,或我们对周围世界的一种认识。有正确与错误之分。(3)信息检索:信息检索是指将杂乱无序的信息有序化形成信息集合,并根据需要从信息集合中查找出特定信息的过程。(4)信息检索系统:任何具有信息存储与检索功能的系统,均可以称之为信息检索系统。从狭义上讲,信息检索系统可以理解为一种可以向用户提供信息检索服务的系统。*-*-8.2检索系统的类型1.检索系统按照检索的功能划分可分为:书目检索系统事实数据检索系统2.检索系统按照检索的手段划分可分为:手工检索系统计算机检索系统计算机检索系统由计算机硬件、检索软件、数据库及通信网络等组成。硬件主要包括:中心计算机、检索终端及数据输出设备等;检索软件是检索系统的灵魂,负责管理数据库和处理检索提问,它决定系统的检索能力;数据库是检索系统的信息源,是检索作业的对象;通信网络是信息传递的设施,其主要作用是在检索终端和中心计算机之间进行信息传递。*-*-8.2检索系统的类型3.常用信息检索系统类型:*-*-8.3网络检索系统1.用户如何在网络上找到信息?解决之道:搜索引擎2.搜索引擎的分类:目录(DIRECTORY,或CATALOG);基于ROBOT的搜索引擎;元搜索引擎(用得较少)。8.3.1目录目录:目录方式所使用的数据库是依靠专职编辑或志愿人员建立起来的。目录的用户界面基本上都是分级结构。有两种使用方式:由开始几个大类入口→逐级向下访问→找到自己感兴趣的类别。利用目录提供的搜索功能直接查找一个关键词。*-*-8.3网络检索系统优点:比较精确。由于目录依靠人工来评价一个网站的内容,因此用户从目录搜索得到的结果往往比从其它的搜索引擎得到的结果更具参考价值。缺点:有一定时延。只能在已经保存的站点特性描述数据库中进行搜索,因此站点本身的动态变化可能不会及时反映到特性描述数据库中。8.3.2基于ROBOT的搜索引擎ROBOT:一个能够沿着链接漫游整个WEB集合的程序。特点:需要定期访问大多数以前搜集的网页,刷新索引,以反映出网页的更新情况,并去除一些无效链接。代表:天网,GOOGLE*-*-8.3网络检索系统8.3.3元搜索引擎元搜索引擎(META-SEARCHENGINE):是一种调用其他独立搜索引擎的引擎。“元”(META)为“总的”、“超越”之意,元搜索引擎就是对多个独立搜索引擎的整合、调用、控制和优化利用。元搜索引擎是用户同时利用多个引擎进行网络信息搜索的中介。检索时,元搜索引擎整理用户提交的检索请求,调用多个独立搜索引擎进行搜索,优化搜索结果,统一显示。*-*-8.4检索意愿的表达8.4.1布尔检索1.常用检索技术用得多:布尔检索、词位检索用得少:截词检索、限制检索注:并不是每个检索系统都支持所有的检索技术。2.布尔检索布尔运算符:AND、OR、NOT*-*-8.4检索意愿的表达(1)AND逻辑与是一种具有概念交叉或概念限定关系的组配,用“*”或“AND”算符表示。使用“逻辑与”组配技术,缩小了检索范围,增强了检索的专指性,可提高检索信息的查准率。例:“打印机驱动程序”查询关键词:打印机、驱动程序检索表达式:打印机AND驱动程序(2)OR逻辑或是一种具有并列关系概念的组配,用“+”或“OR”算符表示。使用“逻辑或”检索技术,扩大了检索范围,能提高检索信息的查全率。检索“微型计算机”方面的有关信息查询关键词:微型计算机、微机检索表达式:微型计算机OR微机 内容来自淘豆网www.taodocs.com转载请标明出处.
相关文档
非法内容举报中心
文档信息
  • 页数80
  • 收藏数0 收藏
  • 顶次数0
  • 上传人AIOPIO
  • 文件大小6.93 MB
  • 时间2020-09-13
文档标签