下载此文档

智能搜索引擎.ppt


文档分类:IT计算机 | 页数:约74页 举报非法文档有奖
1/74
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/74 下载此文档
文档列表 文档介绍
1网络智能搜索引擎主要内容?网络智能搜索引擎概述?网络智能搜索引擎的结构原理?网络智能搜索机理?网络智能搜索策略?网络智能搜索引擎的关键技术?网络智能搜索引擎实例分析一、网络智能搜索引擎概述((一一) ) 搜索引擎发展简况搜索引擎:是指通过网络搜索软件或网站登陆等方式,以一定的策略在互联网上搜集和发现信息,并将Web上大量网站的页面收集到本地,经过加工处理和组织,从而能够对用户提出的各种查询做出响应,提供用户所需的信息。1993年底,NASA,Repository-Based Software Engineering (RBSE) spider——第一个索引Html文件正文的搜索引擎,第一个使用关键词串匹配的引擎;1994年7月,Michael Mauldin,Lycos——第一个现代意义上的搜索引擎;1994年,David Filo和杨致远,Yahoo——成功地使网络信息搜索的概念深入人心,揭开了搜索引擎大发展的序幕。第一代搜索引擎1998年前以Lycos为代表索引量少, 极少重新搜集网页并刷新索引, 检索速度慢; 实现技术上基本沿用较为成熟的信息检索、网络、数据库等技术;目录式搜索引擎依靠专业人员对信息进行甄别和分类,信息准确、导航质量高,但不能深入网站的内部细节,容易导致信息丢失,并且由于人工编辑能力有限,常导致网站信息陈旧、数据库更新不及时等问题;采用全文检索技术的搜索引擎信息量大,更新及时,毋需人工干预,但由于不能区分同行异义以及不能联想到关键字,容易导致返回大量夹杂冗余信息的检索结果,且检准率低,用户必须从结果中进行筛选。第二代搜索引擎1998年起如谷歌、百度索引数据库规模有所扩大; 开始出现主体搜索和地域搜索等; 对检索结果展开相关度评价;开始使用自动分类技术; 极大提高了搜索的质量和效率;元搜索引擎1995年出现返回的检索结果信息量更大、更全,但用户需要做更多筛选; 在一定程度上解决了独立搜索引擎对于某些检索请求的查询结果不够全面、准确的现状,但不能从本质上克服原有搜索引擎所固有的弊端;(二)搜索引擎的智能行为分析1、影响搜索引擎性能的最关键因素:(1)信息的采集。搜索过程应在一定条件下选择最优路径沿着具有相关主题的链接进行搜索,这要求搜索引擎能够识别相应的网站和网页信息资源,是一种智能性的体现。(2)信息的加工处理与组织。当采用合适的算法和策略从网络信息资源中获取到原始超文本信息后,还需要从中抽取出有价值的信息内容进行索引存储,构建信息数据库。(3)信息检索。信息检索查询为用户提供直接服务,它根据用户的信息需求,完成对数据库的查找过程,并以一定的方式向用户提供查询结果。信息检索是搜索引擎最终的价值体现,是影响搜索引擎性能的关键环节。2、搜索引擎的智能性分析:(1)检索技术的智能化①机灵的网络蜘蛛?智能搜索引擎的设计网络蜘蛛能遍历整个因持网,自动完成在线信息的索引,还能通过启发式学****采取最有效的搜索策略,上自动收集、整理过的信息。同时,它能够对网页内容的相关性及该网页所包含的链接质量等做出判断,质量较差或内容不大相关的网页将不被选取,从而保证信息来源的质量,提高检索效果。②语义检索及自然语言理解技术?语义检索是一种建立在文献概念相关关系基础上的检索。通过抽取能够描述文献内容的概念(如用文中的关键词或与之相应的主题词)建立一种语义索引,而用户在系统的辅助下选用合适的词语表示自己的信息需求,然后在两者之间执行概念匹配,匹配在语义上相同、相近、相包含的词语,从而实现信息的深度检索?借助自然语言理解技术,智能搜索引擎能够实现基于知识(或概念)层面的检索,并且对知识有一定的理解与处理能力,能够实现分词技术、同义词技术、概念搜索、短语识别以及机器翻译技术等。因而智能搜索引擎具有信息服务的智能化、人性化特征,允许用户采用自然语言进行信息检索,并能为用户提供更方便、更确切的搜索服务。

智能搜索引擎 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数74
  • 收藏数0 收藏
  • 顶次数0
  • 上传人分享精品
  • 文件大小0 KB
  • 时间2016-02-02