下载此文档

03信息检索模型.ppt


文档分类:IT计算机 | 页数:约106页 举报非法文档有奖
1/106
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/106 下载此文档
文档列表 文档介绍
这一部分将讲述
布尔模型,向量空间模型,扩展的布尔模型
概率模型和基于语言模型的信息检索模型的区别和联系
基于本体的信息检索模型和基于隐性语义索引的信息检索模型
信息检索模型的概述
什么是模型?
模型是采用数学工具,对现实世界某种事物或某种运动的抽象描述
面对相同的输入,模型的输出应能够无限地逼近现实世界的输出
举例:天气的预测模型
信息检索模型
是表示文档,用户查询以及查询与文档的关系的框架
信息检索模型
信息检索模型是一个四元组[D, Q, F, R(qi, dj)]
D: 文档集的机内表示
Q: 用户需求的机内表示
F: 文档表示、查询表示和它们之间的关系的模型框架(Frame)
R(qi, dj): 排序函数,给query qi 和document dj评分
信息检索模型取决于:
从什么样的视角去看待查询式和文档
基于什么样的理论去看待查询式和文档的关系
如何计算查询式和文档之间的相似度
模型分类
信息检索模型
布尔
向量空间
概率
知识
模糊集
扩展的布尔模型
集合论
代数
扩展的向量空间
隐性语义索引
神经网络
语言模型
推理网络
信念网络
概率
基于本体论的模型
人工智能
布尔模型(Boolean Model)
布尔模型
最早的IR模型,也是应用最广泛的模型
目前仍然应用于商业系统中
Lucene是基于布尔(Boolean)模型的
布尔模型描述
文档D表示
一个文档被表示为关键词的集合
查询式Q表示
查询式(Queries)被表示为关键词的布尔组合,用“与、或、非”连接起来,并用括弧指示优先次序
匹配F
一个文档当且仅当它能够满足布尔查询式时,才将其检索出来
检索策略基于二值判定标准
算法R
根据匹配框架F判定相关
举例
Q=病毒AND(计算机OR电脑)ANDNOT医
文档:
D1:…据报道计算机病毒最近猖獗
D2:小王虽然是学医的,但对研究电脑病毒也感兴趣…
D3:计算机程序发现了艾滋病病毒传播途径
上述文档哪一个会被检索到?

03信息检索模型 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数106
  • 收藏数0 收藏
  • 顶次数0
  • 上传人xgs758698
  • 文件大小1.53 MB
  • 时间2017-06-30