下载此文档

搜索引擎.ppt


文档分类:IT计算机 | 页数:约28页 举报非法文档有奖
1/28
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/28 下载此文档
文档列表 文档介绍
信息第一课
------ 学会上网
课堂导入
1、你会上网吗?
在浩如烟海的Internet上,不会搜索,
就不能叫会上网。
2、你了解搜索引擎吗?
什么是搜索引擎?搜索引擎的分类有哪些?它们是怎么工作的?
本节课学****任务:
1、了解什么是搜索引擎?
2、知道搜索引擎的原理及分类?
3、掌握简单的搜索技巧?
4、学会使用百度搜索引擎。
什么是搜索引擎
搜索引擎是指根据一定的策略、运用特定的计算机程序或人工从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
获得网站网页资料,能够建立数据库并提供查询的系统,我们都可以把它叫做搜索引擎。
我们常说的搜索引擎,通常指的是收集了因特网上几千万到几十亿个网页并对网页中的每一个词(即关键词)进行索引,建立索引数据库的全文搜索引擎。
搜索引擎的分类
搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
按照工作原理的不同,可以把它们分为两个基本类别:全文搜索引擎(Full Text Search Engine)和分类目录(Directory)。
我们常用的是全文搜索引擎,如Google和百度。
全文搜素引擎
我们平时看到的全文搜索引擎,实际上只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现给我们。
不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同,所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。
分类目录
分类目录的收集、分析信息两部分主要依靠人工完成。
分类目录一般都有专门的编辑人员,负责收集网站的信息。随着收录站点的增多,现在一般都是由站点管理者递交自己的网站信息给分类目录,然后由分类目录的编辑人员审核递交的网站,以决定是否收录该站点。如果该站点审核通过,分类目录的编辑人员还需要分析该站点的内容,并将该站点放在相应的类别和目录中。所有这些收录的站点同样被存放在一个“索引数据库”中。用户在查询信息时,可以选择按照关键词搜索,也可按分类目录逐层查找。
全文搜索VS分类目录
全文搜索引擎的数据库是依靠一个叫“网络机器人(Spider)”或叫“网络蜘蛛(crawlers)”的软件,通过网络上的各种链接自动获取大量网页信息内容,并按一定的规则分析整理形成的。Google、百度都是比较典型的全文搜索引擎系统。
分类目录则是通过人工的方式收集整理网站资料形成数据库的,比如雅虎中国以及国内的搜狐、新浪、网易分类目录。另外,在网上的一些导航站点,也可以归属为原始的分类目录,比如网址之家/)。
全文搜索VS分类目录
全文搜索引擎和分类目录在使用上各有长短。
全文搜索引擎因为依靠软件进行网页获取,所以数据库的容量非常庞大,但是,它的查询结果往往不够准确。
分类目录依靠人工收集和整理网站,能够提供更为准确的查询结果,但收集的内容却非常有限。为了取长补短,现在的很多搜索引擎,都同时提供这两类查询。
全文搜索引擎的工作原理
全文搜索引擎的“网络机器人”或“网络蜘蛛”是一种网络上的软件,它遍历Web空间,能够扫描一定IP地址范围内的网站,并沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。它为保证采集的资料最新,还会回访已抓取过的网页。
网络机器人或网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。

搜索引擎 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数28
  • 收藏数0 收藏
  • 顶次数0
  • 上传人iris028
  • 文件大小996 KB
  • 时间2021-01-25