•关键问题
-相关性:一个查询结果是否包含所要查询内容
•主题相关:文本和查询是否有话题内容相关,即,主题相关
•用户相关:查询结果与用户相关
•检索模型:是对查询与文档匹配过程的形式化表示,是排序 算法的基础
-评价问题:比较相
•关键问题
-相关性:一个查询结果是否包含所要查询内容
•主题相关:文本和查询是否有话题内容相关,即,主题相关
•用户相关:查询结果与用户相关
•检索模型:是对查询与文档匹配过程的形式化表示,是排序 算法的基础
-评价问题:比较相关性、比较排序算法
•准确率:检索结果中相关文档比例
•召回率:全部相关文档中被检索出来的比例
•其他方法:如,日志数据、点击流数据(利用用户反馈)
-注重用户的信息需求,为其提供更优质的服务
•查询建议、查询扩展、相关反馈、知识图谱
•搜索引擎:信息检索技术在大规模文本集合上的
实际应用
-搜索引擎被设计成各种不同的结构,
•网络搜索引擎,如google、yahoo!、百度、搜狗
•企业搜索引擎,如Autonomy
•桌面搜索引擎,如微软的VistaTM
-搜索引擎的关键问题
•有效的排序算法、评价及用户交互
•大规模数据的运行环境
•搜索引擎性能:响应时间、查询吞吐量、索引速度、增量更 新、覆盖率、时新性、可扩充性、可定制性
-搜索引擎的其他应用
•垃圾信息过滤、主题信息搜索,
信息检索与搜索引擎 来自淘豆网www.taodocs.com转载请标明出处.