下载此文档

基于主题树的个性化元搜索引擎.pdf


文档分类:IT计算机 | 页数:约7页 举报非法文档有奖
1/7
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/7 下载此文档
文档列表 文档介绍
万方数据
基于主题树的个性化元搜索引擎计算机工程与设计张宗仁,杨天奇.魈馐髂P吣洗笱Ъ扑慊蒲担愣ü阒言摘要:针对元搜索引擎在个性化处理上的不足,提出了主题树的方法,把用户的查询映射到主题树上并返回相关查询,比较准确地表达了不同用户的检索需求。根据用户的浏览行为提出了准确度偏差,用户满意度的评价公式,以用户为中心反映排序是否符合用户的需要.结果排序时不仅考虑了页面的标题、摘要和用户查询的相关性,也考虑了各成员搜索引擎的原来的排序信息以及关键词出现的个数和位置.实验结果表明,该方法有效地提高了元搜索引擎的结果排序能力和个性化处理能力,结果的显示顺序基本符合用户的需要.关键词:元搜索引擎;主题树;个性化;信息检索;相关度;结果合成中图法分类号:文献标识码:文章编号:.....,∥’礱劬蜸;;;目前的搜索引擎存在以下不足:针对性不强,不能满足不同背景、不同目的和不同时期的用户需求,对于同一输入,返回同样的结果,存在“千人一面”的情况。事实上,大部分检索词都非常短并且含义模糊,对于同样的查询,不同的用户也许有完全不同的信息需求。例如,用户输入“苹果”,有些用户可能希望返回“水果”方面的信息,而其他用户也许是希望得到“苹果电脑”方面的信息。在索引的全面性、更新的及时性上存在着很大的不足Ⅲ,很难满足用户对时效性强的信息需求。比如一些热点新闻,更新的速度非常快。在许多算法中,相似度的计算主要考虑关键词出现的个数,但是却忽略了关键词出现的位置,因为一般来说出现位置比较前重要性比较高,这导致了与用户查询的相似度的计算不够准确捌。难以获得基于用户兴趣的排序结果,因为每个独立搜索引擎都有自己的排序方法。因此如何准确地给成员搜索引擎分配权重显的尤其重要,而且它们对于每个领域的搜索能力有比较大的差距,所以可以根据类别不同分别设置权重。本文提出的基于主题树的方法在一定程度上解决了上面提出的部分问题。主题树的方法把用户的查询映射到相应的主题上,这样有利于消除歧义,缩小用户查询的范围。用户输入检索词都非常短的原因之一是他们不知道如何表达需要检索的信息,通过相关检索的提示让用户逐步清晰需要输入的检索诃。元搜索引擎的合并算法主要有啵菏占峁匦排序,利用搜索引擎排序信息排序,相关分值融合。收集结果重新排序的方法仅仅提高了查全率,如果一些重要的信息排在后面,则不容易被用户检索到,因此导致准确率不高。利用搜索引擎排序信息排序打乱原来的排序,充分利用各成员搜索引擎的排序信息,并在此基础上合并结果,能够提高查准率,因此本文的排序采此类中的位置排序方法。为了检验结果的排序是否符合用户的个性化需求,提出了准确度偏差公式.当前一般有种魈饷枋龇椒ā癐:基于关键词的主题描述收稿日期:盒薅┤掌冢.。,琋琂:.瑆瓵甋硒簃籸;基金项目:广东省科技计划基金项目。作者简介:张宗仁,男,广东梅州人,硕士研究生,研究方向为人工智能、数据挖掘;杨天奇,男,江西南昌人,教授,硕士生导师,研究方向为人工智能、神经网络、数据挖掘。.’産
万方数据
至圣酬成黼悸竺型鰈毓工是独立的,不能表示多个主题之间的关系n望每酢猽罕■荔阿赢同Т<计算机工程与设计喙啬?樗得⒒谧匀挥镅愿袷轿谋镜闹魈饷枋和基于分类法的主题描述。用一组互相独立的关键词来描述主题。砸欢斡杀晏夂兔枋鲎槌傻淖匀语言格式的文本来描述主题。这两种描述方法在表示主题时

基于主题树的个性化元搜索引擎 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数7
  • 收藏数0 收藏
  • 顶次数0
  • 上传人755273190
  • 文件大小445 KB
  • 时间2021-02-23