1/19
文档分类:IT计算机

网络搜索引擎google.ppt


下载后只包含 1 个 PPT 格式的文档,里面的视频和音频不保证可以播放,查看文件列表

特别说明:文档预览什么样,下载就是什么样。

下载所得到的文件列表
网络搜索引擎google.ppt
文档介绍:
第七讲:
网络搜索引擎
信 息 检 索
2007.11.21

*

Contents
搜索引擎的基本概念和原理
常用的几种中、英文搜索引擎
搜索引擎检索实例

一、搜索引擎的基本概念和原理
概念
搜索引擎(Search Engine)是指通过网络搜索软件或网站登陆等方式,将互联网上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询作出响应,提供用户所需的信息。
组成
WWW服务器,搜索程序(如spider、robot),索引数据库(包括成千上万甚至上亿个网页),检索程序(用来处理用户的检索请求)

一、搜索引擎的基本概念和原理

Internet搜索引擎就像信息海洋中的导航员,能帮助人们快速找到所需的信息。然而随着各种信息的巨量增长,人们使用搜索引擎也遇到了许多困难,相同的搜索词在不同的搜索引擎中得出不同的结果,在质量和数量上都有所不同。产生这种现象是因为不同的搜索引擎采集信息的方法、标引的内容以及检索功能是有所区别的,下面详细介绍一下几种搜索引擎。
二、中、英文搜索引擎

中、外文搜索引擎介绍
百 度 http:///
天网搜索 http:///
谷歌中文 http:///
雅 虎 http:///
AltaVista http:///
…………
二、中、英文搜索引擎

Google简介
Google是数学名词Googol的谐音,表示一个 1 后面跟着100 个零或10的100次方。由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明。目前被公认为万维网上最大的搜索引擎,它提供了简单易用的免费服务,使用户能够访问一个包含超过 80 亿个网址的索引。
Google 使用PageRank™技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。
Google 搜索引擎

1、基本搜索技术:
(1)布尔逻辑:
逻辑”与”:AND、+或空格,如:墨攻 + 鸡犬不宁。 逻辑”或”:OR, | 如:墨攻 | 鸡犬不宁。
逻辑”非”:-如:张艺谋 –大红灯笼高高挂。(注:-前面有空格,后面没有空格 )
(2)短语搜索: “beijing university of technology”
(3) 英文字母大小写与通配符的用法:大小写不敏感,通配符目前只可以用*来替代单个字符

LOGO
Google 搜索引擎

(4)忽略高频字符以及强制搜索
Google对一些网络上出现频率极高的英文单词,如“the”、“ com ”、“www”等,以及一些符号如“、”、“.”等作忽略处理。如果必须要使用某一常见字词才能获得需要的结果,您可以在该字词前面放一个“+”号,从而将其包含在查询字词中。
如:搜索 www 的历史internet,但搜索引擎把“www”和“的”都省略了。于是上述搜索只搜索了“历史”和“internet”。这显然不符合要求。
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号(注:在“+”号前留一空格) 。如:搜索+www +的历史internet。
另一个强制搜索的方法是把上述的关键字用英文双引号引起来。如:搜索“www的历史”internet。
Google 搜索引擎

2、命令型搜索技术:
(1) 制定网域。要在某个特定的站点中进行搜索,可以在Google搜索框中输入“site”。例如要查找人民网上的新闻,可以输入:“新闻site:people.com.cn”。
输入“金庸 古龙 site:sina.com.cn”搜索包含“金庸”和“古龙”的中文新浪网站页面。
注:site后的冒号为英文字符,而且冒号后不能有空格,网站域名不能有“http://”和www前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式。而不能是“域名/频道名”方式。
Google 搜索引擎
内容来自淘豆网www.taodocs.com转载请标明出处.
非法内容举报中心
文档信息
  • 页数19
  • 收藏数0 收藏
  • 顶次数0
  • 上传人dllw1314
  • 文件大小180 KB
  • 时间2021-05-20