下载此文档

信息检索20-链接分析.ppt


文档分类:IT计算机 | 页数:约52页 举报非法文档有奖
1/52
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/52 下载此文档
文档列表 文档介绍
第20讲链接分析LinkAnalysis2017/10/:Hub节点&:Hub节点&Authority节点提纲.*基本的采集过程初始化采集URL种子队列;重复如下过程:从队列中取出URL下载并分析网页从网页中抽取更多的URL将这些URL放到队列中这里有个“Web的连通性很好”***Mercator采集器(待采集URL缓冲池).7*本讲内容锚文本:Web上的链接相关信息为什么对IR有用?HITS:另一个著名的基于链接分析的排序算法(IBM)PageRank:一个著名的基于链接分析的排序算法(Google)引用分析(Citationanalysis):PageRank及其他基于链接排序方法的数学基础.*Web可以看成一个有向图假设1:超链接代表了某种质量认可信号超链d1→d2表示d1的作者认可d2的质量和相关性假设2:锚文本描述了文档d2的内容这里的锚文本定义比较宽泛,包括链接周围的文本 例子:“Youcanfindcheapcars˂ahref=http://…˃here˂/a˃.”锚文本:“Youcanfindcheaphere”.

信息检索20-链接分析 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数52
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小1.16 MB
  • 时间2020-10-20