面向搜索引擎需求的用户行为分析研究清华大学计算机系信息检索课题组2012年6月3日主要研究方向信息检索模型与算法互联网搜索技术社会网络与计算社会科学课题组成员马少平,张敏,金奕江,刘奕群信息检索组搜索引擎是最重要的网络应用系统中国:,80%使用率仅次于即时通讯产品()某些观点:Peopledon'.(JakobNielsen,principaloftheNielsenGroup)搜索引擎的回答:%on-%on-Score news,)研究背景搜索引擎技术挑战(Google’sviewpoint).(inSIGIRforum2002,IJCAI2003)Spam,ContentQuality,QualityEvaluation,Webconvention,DuplicatedData,Vaguely-(inSIGIR2005,ECIR2008)SearchEngineSpam,Evaluation反映出的共性问题:垃圾网页、质量评估、性能评价,…研究背景课题组研究思路研究背景用户信息需求需求描述是否清晰?查询需求理解查询推荐清晰不清晰检索过程内容相关度网页质量评估用户行为反馈垃圾网页识别其它排序因素......搜索性能评价垃圾网页识别网页质量评估用户行为反馈课题组研究思路利用用户群体智慧应对挑战The“Tenthousandcent”project用户行为信息来源搜索引擎查询日志,搜索引擎用户交互行为日志,用户浏览行为日志,…可以公开获取的行为日志资源SogouQ:s/dl/:http://imat-: 如何协助用户组织查询,如何理解查询网页质量评估: 如何利用链接结构应对真实Web的挑战垃圾网页识别: 如何提升垃圾识别的通用性和及时性检索算法设计 如何利用用户反馈提升结果相关性搜索性能评价: 如何实现准确客观的自动性能评测内容提纲重要性:%的用户查询会话包含对查询推荐的点击当前解决方案:推荐与用户所提交查询相似性最高的查询如何定义相似性?基于内容信息计算相似性(Fonseca,2003;Baeza-Yates,2004,2007);基于点击行为计算相似性(.al,2001;,2002;Cucerzan,2007;Liu,2008)问题:相似性高的查询不一定能够比原查询更好的描述用户信息需求查询推荐技术搜索引擎针对“推荐技术#BaiduGoogleChinaSogou1pes2010(putergame)2010国家公务员职位表(Nationalcivilservicepositionsfor2010)2010年国家公务员(Nationalcivilserviceexamin2010)2qq2010(asoftware)2010年国家公务员报名(Nationalcivilserviceexamregistrationin2010)2010发型(fashionhairstylesin2010)3实况2010(putergame)2010国家公务员报名(Nationalcivilserviceexamregistrationin2010)2010年考研报名(Graduateentranceexamin2010)4实况足球2010(putergame)2010公务员报名(civilserviceexamregistrationin2010)5卡巴斯基2010(Kaparsky2010)2010公务员考试(civilserviceexam2010)如何理解用户信息需求?结果点击=>用户对结果摘要的内容感兴趣查询推荐技术Result1Result2Result3Result10…查询点击
面向搜索引擎需求的用户行为分析研究 - 智能技术与系统国家重点实验 ... 来自淘豆网www.taodocs.com转载请标明出处.