下载此文档

【一剑SEO技巧分享二】搜索引擎的工作原理.doc


文档分类:IT计算机 | 页数:约5页 举报非法文档有奖
1/5
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/5 下载此文档
文档列表 文档介绍
Forpersonaluseonlyinstudyandresearch;mercialuse【一剑SEO技巧分享二】搜索引擎的工作原理  一剑SEO技巧分享系列文章/神州一剑2008/文大家知道,所谓的互联网是指的全球的因特网,你所在的位置,只是局域网板块上的一个很小的点。而在前面的《【一剑SEO技巧分享一】什么是搜索引擎》一文陈剑已经讲过,搜索引擎按其工作原理上来区分,分为全文检索搜索引擎,分类目录搜索引擎和元搜索引擎三种类型。 搜索引擎的工作原理基本分做三步:第一步:从互联网上搜集信息网络蜘蛛Spider,是一个很形象的名字。把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。网络蜘蛛是通过网页的链接地址来寻找网页,从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网站所有的网页都抓取完为止。第二步:整理信息、建立索引数据库当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。由分析索引系统程序对收集回来的网页进行分析,提取相关网页所在网址链接、编码类型、页面内容包含的关键词、关键词位置、生成时间、大小、与其它网页的链接关系等信息,根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面内容中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。  第三步:在索引数据库中搜索排序、接受查询最后,由页面生成系统将搜索结果的链接地址、页面内容摘要等内容,组织起来返回给用户。网络蜘蛛(spider)一般按照各搜索引擎的周期不同,可能是几天、几周或几月,也可能对不同重要性的网页有不同的更新频率,要定期重新访问所有网页,更新网页索引数据库,以反映出网页内容的更新情况,增加新的网页信息,去除死链接,并根据网页内容和链接关系的变化重新排序。这样,网页的具体内容和变化情况就会以更新的形态,反映到用户搜索查询的结果中。全文搜索引擎全文搜索引擎的信息搜集基本都是自动的。也就是说搜索引擎,利用称为网络蜘蛛(spider)的自动搜索机器人程序。沿着网络上的链接从一个网页到另一个网页,从一个网站到另一个网站采集网页资料。就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。而网络蜘蛛采集的网页,还要有其它程序进行分析,根据一定的相关度算法进行大量的计算建立网页索引,才能添加到索引数据库中。我们在检索信息时登录的搜索引擎,只是一个搜索引擎系统的检索界面,当你输入关键词进行查询时,搜索引擎会从庞大的数据库中找到符合该关键词的所有相关网页的索引,并按一定的排名规则呈现给我们。不同的搜索引擎,网页索引数据库不同,排名规则也不尽相同。所以,当我们以同一关键词用不同的搜索引擎查询时,搜索结果也就不尽相同。分类目录搜索引擎和全文搜索引擎一样,分类目录的整个工作过程也同样分为收集信息、分析信息和查询信息三部分,只不过分类目录的收集、分析信息两部分主要依靠人工完成。分类目录一般都有专门的编辑人员,负责收集网

【一剑SEO技巧分享二】搜索引擎的工作原理 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数5
  • 收藏数0 收藏
  • 顶次数0
  • 上传人小枷
  • 文件大小21 KB
  • 时间2019-03-13