下载此文档

《信息检索模型》PPT课件.ppt


文档分类:IT计算机 | 页数:约99页 举报非法文档有奖
1/99
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/99 下载此文档
文档列表 文档介绍
信息检索模型
哈工大信息检索研究室
2007
1
精选ppt
这一部分将讲述
布尔模型,向量空间模型,扩展的布尔模型
概率模型和基于语言模型的信息检索模型的区别和联系
基于本体的信息检索模型和基于隐性语义索引的信息检索模型
2
精选ppt
信息检索模型的概述
3
精选ppt
什么是模型?
模型是采用数学工具,对现实世界某种事物或某种运动的抽象描述
面对相同的输入,模型的输出应能够无限地逼近现实世界的输出
举例:天气的预测模型
信息检索模型给出了文档的表示方法,查询的表示方式以及查询与文档的匹配过程
4
精选ppt
信息检索模型
信息检索模型是一个四元组[D, Q, F, R(qi, dj)]
D: 文档集的机内表示
Q: 用户需求的机内表示
F: 文档表示、查询表示和它们之间的关系的模型框 架(Frame)
R(qi, dj): 排序函数,给query qi 和document dj评分
信息检索模型取决于:
从什么样的视角去看待查询式和文档
基于什么样的理论去看待查询式和文档的关系
如何计算查询式和文档之间的相似度
5
精选ppt
模型分类
信息检索模型
布尔
向量空间
概率
知识
模糊集
扩展的布尔模型
集合论
代数
扩展的向量空间
隐性语义索引
神经网络
语言模型
推理网络
信念网络
概率
基于本体论的模型
人工智能
6
精选ppt
布尔模型(Boolean Model)
7
精选ppt
布尔模型
最早的IR模型,也是应用最广泛的模型
目前仍然应用于商业系统中
Lucene是基于布尔(Boolean)模型的
8
精选ppt
布尔模型描述
文档表示
一个文档被表示为关键词的集合
查询式表示
查询式(Queries)被表示为关键词的布尔组合,用“与、或、非”连接起来,并用括弧指示优先次序
匹配
一个文档当且仅当它能够满足布尔查询式时,才将其检索出来
检索策略基于二值判定标准
9
精选ppt
举例
Q=病毒AND(计算机OR电脑)ANDNOT医
文档:
D1:…据报道计算机病毒最近猖獗
D2:小王虽然是学医的,但对研究电脑病毒也感兴趣…
D3:计算机程序发现了艾滋病病毒传播途径
上述文档哪一个会被检索到?
10
精选ppt

《信息检索模型》PPT课件 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数99
  • 收藏数0 收藏
  • 顶次数0
  • 上传人相惜
  • 文件大小718 KB
  • 时间2021-02-01