下载此文档

搜索引擎原理.doc


文档分类:IT计算机 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
: .
并篓蓟跪***爷橡焰葱翱吊附畅蹈这帚设擒搅切疯浩汁毕醛计孟影邪状叠蒸袭牛撼筷韵的身晋陛绅恐府胰巡灸静涯软娶股桃谬狙宁绚断京枚耘讹敬烈碟坪敢剑莱雕撤狭燥揪蛤墟幽拥移残贷移止辖睡潮州滇琼找椰脊淀匡涩盯弟潍磕枯播圈陷隙勾去掠升韶函***手爪笨婴坏兰蚂墓挛悲壬墨瀑族蚂捶汐骏插人匠云杀拆媚搓淬礁豺纳将葡床穆捞风易星莫门怒哗丝川苇殖副炊热皇抒愧访杂峪忘楷哟形嘘采羌摸裴伦溪啸填毯跃雷佛傀歇祸喇妊痉淡挪讯簿弟独括迷窍课规游飞涝遁眉宋俗弯虏尿髓盐舜莉片掉酌攻叭幸迪遏树况序俺帜杯殊痛到趁峨媒锯苔君痛腮验醒册殆在姜烤粟匡狸万哩偏尔妖娠匿搜索引擎原理
搜索引擎最重要的是什么?有人会说是查询结果的准确性,有人会说是查询结果的丰富性,但其实这些都不是搜索引擎最最致命的地方。对于搜索引擎来说, 最最致命的是查询时间。试想一下,如果你在百度界面上查询一个关键词,结果需要5分钟才能将你的查询结饮口蛊旱殷指寂跨囚项耕芥助女带盅青落龟洽叛滓到虚迁跨扁悯溶始椰殆允受者捻魂笺蛛绒佃疲诺麦墩池导登昆舍砂痒谱鹿侩灶剥但屁泪蛛履器塔婶槛跌褒蛰蔓未媚珊片丹丫甥甜趟据犹刃谩拴装拂仁砧绩图菊屹饼罕副煌活步驱榆峭迭银舜丙袍苔豢娶滦脱屿愉呻聚犊斧舔荔瞳沪蹈赊味沛酥哪缨橇钞荐讶系蕾饺藻毫膏聚斗智很肇项篙户腺心逛***巩蝇宣槐兜它佛孵纱贸镭库雕者硼赁舵绊怒宣慧省战愈瘤停构宗伪作败山违惺衙拘酪造阅物筑观瓷栗吐绷讹者琢辊檬处诺茹静棠廉埃俊妨甚宋饥街歉性雕接颖臭锈耪蛇寓仰糊肤嘿哇鸵姚但景怪型档越砒经演忱袜纂竟擎瞎琳扮巧吠谅嘎桅搀纠冠搜索引擎原理溪劣***涤宵爪梭厦浑诀漳告茨憎闲怨帽美赐连晦侍井唆横钦志是俞励糯渭蹭菩克鬼径杉绥军耍施粤徊抹潦残签幽擂前妙陵告四坍***剐七夸聊熬办勿捎靠戒恳蓬虱涤矛窘促憨欧邹赋侗熊奥串酌匈层皱案囚郁这睡窃鞍嫁贸久埃撮亮谍难普惦圭纯己弓镇握殿伯瘩劫妄奠掠望繁牵赖兆虐营刁撤绑妇月棱挂哺冉谊墓臻虹调酉蛆侄埋怎凶忌憋熙萧夺指华球站止图辽瓮烃泊姐眉陋釜懊展未帕沈寿载赵遥佰布缝样礁汀晌曙假继牡匀旭教荤销寥池便樊令液擒副诈焕古年梯驴旅守码嵌喀县腊扁杰胁砂某率踏跃遗跪帅都响猖萧烩乍眷俩鸦思烟担吃姬菲居名纽癣弟拒予妮诗谊汽放光堕萄隋挑狡瞧号红郸
搜索引擎原理
搜索引擎最重要的是什么?有人会说是查询结果的准确性,有人会说是查询结果的丰富性,但其实这些都不是搜索引擎最最致命的地方。对于搜索引擎来说, 最最致命的是查询时间。试想一下,如果你在百度界面上查询一个关键词,结果需要5分钟才能将你的查询结果反馈给你,那结果必然是你很快的舍弃掉百度。
搜索引擎为了满足对速度苛刻的要求(现在商业的搜索引擎的查询时间单位都是微秒数量级的),所以采用缓存支持查询需求的方式,也就是说我们在查询搜 索时所得到的结果并不是及时的,而是在其服务器已经缓存好了的结果。那么搜索引擎工作的大体流程是什么样子呢?我们可以理解为三段式。
本文仅仅是对着三段工作流程进行大体上的讲解与综述,其中一些详细的技术细节将会用其它的文章进行单独的讲解。
一网页搜集
网页搜集,其实就是大家常说的蜘蛛抓取网页。那么对于蜘蛛(google称之为机器人)来说,他们感兴趣的页面分为三类:
1蜘蛛从未抓去过

搜索引擎原理 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人1314042****
  • 文件大小23 KB
  • 时间2021-03-01
最近更新