TOC
❖ 什么是检索模型?
❖ 布尔模型
❖ 向量空间模型
❖ TF-IDF框架
信息检索与搜索引擎 陈若愚 ❖ 检索质量评价标准
计算机学院
检索模型与搜索排序 北京信息科技⼤学
1 2
概述 内容相似性计算框架
❖ 搜索结果排序是搜索引擎最核⼼的构成部分,决定了搜 查询表⽰:“苹果”
索引擎的质量好坏及⽤户的满意程度
❖ 搜索结果排序最重要的两个因素是:(⽤户查询和⽹页 信息需求
的)内容相关性和⽹页链接情况
相关度计算
❖ 在给定⽤户搜索词的情况下,如何判断⽹页内容是否与
检索模型
⽤户查询相关,这是由检索模型决定的
❖ 最重要的检索模型包括:布尔模型、向量空间模型、概
率模型、语⾔模型... ⽂档表⽰
3 4
❖ ⽤户发出查询词Q后,可以把⽂档集根据“是否相关”及
“是否包含查询词”两个维度进⾏划分
包含查询词 不包含查询词 检索模型的理想化假设
相关⽂档
I II ❖ 假设⽤户需求已经通过查询⾮常清晰明确地表达出来
IV III ❖ 检索模型的研究不涉及⽤户需求建模
❖
不相关⽂档 ⽤户需求建模是现阶段搜索引擎发展的重要⽅向
❖ 好的检索模型,应该在排序结果中,提升第⼀、第⼆象
限⽂档的排名,抑制第三、第四象限⽂档的排名
5 6
布
Lec.05-检索模型与搜索排序 来自淘豆网www.taodocs.com转载请标明出处.