下载此文档

搜索引擎 - 搜索引擎-课件(PPT精).ppt


文档分类:IT计算机 | 页数:约118页 举报非法文档有奖
1/118
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/118 下载此文档
文档列表 文档介绍
搜索引擎
1
我们被信息淹没, 但却渴求知识。

——《大趋势》约翰·奈斯比特
2
主要教学内容
搜索引擎概念及其发展历程
搜索引擎的原理简介
搜索引擎的几点使用说明
Google入门到精通
其他搜索引擎简介
3
搜索引擎的发展历程
因特网是世界上最大的信息宝库,它已成为全球范围内传播和交流科研信息、教育信息、商业信息和社会信息的最主要的渠道,要想在这一浩瀚无边、变化多端而又鱼龙混杂的信息海洋中发现并查找出有利用价值的信息并不是一件易事,犹如大海捞针。为了有效的利用这些资源,大量的搜索引擎便出现了。
4
搜索引擎的概念
所谓搜索引擎,是指询服务的一种信息服务系统。它们主要通过网络搜索软件(又称网络搜索机器人)或多种人工方式,将,经过加工处理建成索引数据库或目录指南,从而能够对用户提出的各种查询请求做出响应,并提供用户所需要的信息。
搜索引擎的发展历程
5
搜索引擎的发展历程
搜索引擎的雏形
算是现代搜索引擎的雏形。
虽然当时万维网还未得到全面的推广,但还是经常需要在网络中传输大量的文件,由于这些文件大多散布在分散的FTP主机中,查询起来非常不便,,于是便有了Archie。
Archie工作原理与现在的搜索引擎很相似,它依靠脚本程序自动搜索网上共享的文件,然后对相关信息进行索引,以供使用者查询。
不过此时的搜索工具还只限于文件索引功能,随后出现的一些类似于Archie的搜索工具中就加入了检索网页的功能。
6
搜索引擎发展历程
蜘蛛程序的由来
当时,电脑“机器人”一词可是非常流行,它指的是某个能够以人类无法达到的速度不间断地执行某种任务的软件程序。
由于专门用于检索网络信息的“机器人”程序像蜘蛛一样在网络间爬来爬去,因此,搜索引擎中的“机器人”程序就被称为“蜘蛛”程序。
世界上第一个用于监测互联网发展规模的“机器人” Wide Web Wanderer(四W)。刚开始它只用来统计互联网上的服务器数量,后来则发展为能够检索网站域名。
与杰瑞的Wanderer程序相对应,,它是Archie的HTTP版本。ALIWEB不使用“机器人”程序,而是依靠网站主动提交信息来建立自己的链接索引,类似于现在我们熟知的Yahoo等网站。
7
第一个搜索引擎
第一个真正意义上的现代搜索引擎出现在1994年7月。当年4月,美国斯坦福大学的两名博士生,(/guiren/?newsid=16651)共同创办了大家熟知的超级目录索引Yahoo,从此搜索引擎进入了高速发展的时期。
目前,互联网上大大小小的搜索引擎已达千余家,其检索的信息量也与从前不可同日而语。随着互联网规模和信息量的急剧膨胀,一家搜索引擎光靠自己单打独斗已无法适应目前的市场状况,因此现在搜索引擎之间开始出现了分工协作,并有了专业的搜索引擎技术和搜索数据库服务提供商。它本身可能并不是直接面向用户的搜索引擎,但向其他搜索引擎提供全文网页搜索服务。从这个意义上来说,它们是搜索引擎的搜索引擎。
8
搜索引擎的原理简介
作为处于用户层和可以把独立搜索引擎看成是一个双层的客户机/服务器(Client/Server----C/S)结构体系:当用户访问搜索引擎时,用户端为客户机,向搜索引擎发出检索请求,搜索引擎为服务器,检索自己的索引数据库并将检索结果以应答形式提交给用户;当搜索引擎采集数据时,搜索引擎为客户机,向统为服务器,将有关数据(例如搜索引擎。
9
搜索引擎的原理简介
机器人搜索引擎
机器人搜索引擎的自动信息搜集功能一般通过两种方式实现:一种是定期搜索,即搜索引擎定期主动派出“蜘蛛”程序,对一定IP地址范围内的网站进行检索,一旦发现更新或新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是提交网站搜索,即由网站所有者主动向搜索引擎提交网址,然后搜索引擎在一定时间内专门向该网站派出“蜘蛛”程序,扫描并将有关信息存入数据库,以备用户查询。
当用户使用搜索服务时,搜索引擎在数据库中搜寻用户输入的关键词,如果找到与用户要求内容相符的网站,便采用特殊的算法计算出各网页的信息关联程度、比如说网页中关键词的匹配程度、出现的位置/频率等,然后根据关联程度高低,按顺序将这些网页链接制成索引返回给用户。
10

搜索引擎 - 搜索引擎-课件(PPT精) 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数118
  • 收藏数0 收藏
  • 顶次数0
  • 上传人huiwei2002
  • 文件大小3.49 MB
  • 时间2018-01-06