下载此文档

数字出版教程教学课件-第九章 数字出版编辑中的网络信息获取与鉴别.pptx


文档分类:IT计算机 | 页数:约41页 举报非法文档有奖
1/41
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/41 下载此文档
文档列表 文档介绍
第四单元 数字出版的编辑 第九章 数字出版编辑中的网络信息获取与鉴别
本章概要
1、重点掌握搜索引擎的使用技巧
2、重点掌握网络虚假信息及谣言的辨别方法。
第九章 数字出版编辑中的网络信息获取与鉴别
第一节 搜索引擎
第二节 门户网站

第三节 网络虚假信息及谣言辨别
第一节 搜索引擎
一、搜索引擎的定义
搜索引擎(Search Engine)是指在互联网环境中的信息检索系统。
第一节 搜索引擎
二、搜索引擎的原理
搜索引擎的原理,可以看作三步:


从互联网上抓取网页→建立索引数据库→在索引数据库中搜索排序。
第一节 搜索引擎
三、搜索引擎的类型
(一)按查询类型划分
搜索引擎按查询类型分为分类型搜索引擎(即范畴层次搜索引擎,List-based Search Engine)和词语型搜索引擎(Words-based Search Engine)两大类。
(二)按覆盖范围划分
搜索引擎按覆盖范围可分为通用搜索引擎和专业搜索引擎两大类。
(三)按引擎功能划分
搜索引擎按引擎功能可分为常规搜索引擎和多元搜索引擎(Meta Search Engine)两大类。常规搜索引擎是单一引擎;多元搜索引擎是多个单一引擎的组合,对同一个查询可同时在多个搜索引擎上进行,或组合指定的搜索引擎查询,或在单一搜索引擎上查询,可综合输出查询结果,也可分别输出每个搜索引擎的查询结果。
第一节 搜索引擎
四、搜索引擎尚待解决的问题
(一)缺乏检索词汇控制
网络检索工具大都采用自然语言标引和检索,其必然结果是同义词得不到控制,词语间相互关系得不到揭示,最终影响检索效果。而网络信息的数量大、变化大、涉及面广,现有的受控语言难以适应网络信息标引和检索的需要。
(二)自动标引有局限性
自动标引不可能像人工标引那样进行甄别和选择,而主要依赖关键词词频等标准判断网络文件的价值。为了弥补自动标引所带来的不足,大多数网络检索工具都先后增加了“评论”栏目,由专门的雇员选评各行业和各学科的最佳网络信息。如雅虎的“Cool Sites”,Excite的“Site Reviews”和Lycos的“Top 5% Sites”等都属于这类评论。
第一节 搜索引擎
(三)缺乏检索专业信息的能力
网络检索工具不根据专业划分检索范围,这与传统的检索工具截然不同。每个学科都有自己独特的词汇和用语,因此特定的专业检索工具应该使用与之相应的标引和检索语言,而这一点是包罗万象的网络检索工具难以做到的,所以,需要研制专业网络检索工具。
(四)“把关人”缺失
由于网络信息的发布存在“把关人”缺失问题,网络上的信息良莠不齐,因此,通过搜索引擎获得的信息,从整体上看缺乏准确性、权威性、科学性,需要用户对信息内容进行甄别。
第一节 搜索引擎
五、互联网信息检索策略
(一)基本检索策略:布尔逻辑检索
几乎所有的检索系统都具有布尔检索功能,布尔运算符包括AND、NOT、OR。
用“A AND B”进行查询的结果是既包含查询词A又包含查询词B的文章。
用“A OR B”进行查询的结果是至少包含A和B中一个查询词的文章。
用“A NOT B”进行查询的结果是包含查询词A而不包含查询词B的文章。
第一节 搜索引擎
(二)范围限定
二次检索:对于再次检索,可以重新开始,在整个索引中检索,也可限定在前次检索结果内,优化检索。
时间范围(时间限制):雅虎系统设定检索时间范围为最近三年,用户也可在一天到三年的时间范围内进行选择。
语言限制:AltaVista可以查询基于25种语言的信息,其中包括英语、日语、汉语、德语等。但是查询时不能用含有双字节的字符(如汉语、日语等)进行查找。如果查找汉语信息,可用英语查找,并将结果限定在汉语中。

数字出版教程教学课件-第九章 数字出版编辑中的网络信息获取与鉴别 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数41
  • 收藏数0 收藏
  • 顶次数0
  • 上传人Q+1243595614
  • 文件大小2.16 MB
  • 时间2021-09-27