下载此文档

个性化推荐技术综述.doc


文档分类:IT计算机 | 页数:约13页 举报非法文档有奖
1/13
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/13 下载此文档
文档列表 文档介绍
个性化推荐技术综述.doc个性化推荐技术综述杨莉云(广东商学院华商学院,广州511300)摘要:的发展在给用户带来丰富信息资源的同时也给用户快速找到自己需要的信息带来了很大的困难,用户迫切需要一种能够根据自身特点组织和调整信息的服务模式,个性化服务应运而生。本文根据推荐原理的不同分别介绍了基于内容的推荐技术、协同过滤推荐技术、混合推荐技术及其它的推荐技术,分析各种技术的优缺点及适用条件,并对今后个性化推荐技术的研究热点和发展方向进行了展望。关键词:推椁系统;基于内容的推荐;协同过滤;关联规则0引言信息技术的发展和互联网的普及使用户更方便地接触到更多的信息,但用户在享受信息技术带来的便利的同时,也遇到了信息“过载”的问题,用户无法从海量的信息中提取自己所需要的信息。一些搜索引擎通过用户输入关键字可以检索出相关内容,但山于缺乏用户兴趣的知识,会把所有与Z相关的信息全部呈现给川户,不能过滤掉用户不感兴趣的信息。也彳j—些电子商务网站会有“热点推荐”的功能,但是面向所有用户的非个性化推荐。用户如何在一个网站上快速而有效地找到白己所需要的项目和信息?个性化推荐系统是解决这一问题的有效途径。1基于内容的推荐基于内容的推荐起源于信息检索领域,它利用资源和用户兴趣的相似性来过滤信息。肖先分析项目的内容,根拥用户评价过的项目建立用户的兴趣模型,即用户描述文件。根据用户描述文件的不同乂可以分为基于向量空间模型的推荐、基于关键词分类的推荐、慕于领域分类的推荐和基于潜在语义索引的推荐。1・1基于向量空间模型的的推荐基于向量空间模型的推荐是基于内容推荐的最常用的方法。该方法将用户描述文件及项目表示成一个〃维特征向量{(7,叱),(/2,叫),・・亿,叫)}。向量的每一维山一个关键词及其权重组成。权重可取布尔型和实数值,分别表示了用户是否对某个概念感兴趣及感兴趣的程度°。关键词根据推荐项目的不同可以是项目不同的属性值,对文本项目来说,关键词就是从文档中抽取的单词,权巫可以通过TF-1DF技术计算得到。对目标用户进行推荐时,将用户描述文件看成目标项目,可采用多种方式(如欧氏距离、余弦相似性、相关相似性等)计算其它项目与目标项目的相似性,按相似性从大到小的顺序将项目输出给用户。1・2基于关键词分类的推荐Mooney提出了基于文档特征词分类的预测思想:将推荐看成是项目分类问题。首先定义一组类(评分),并让用户对一组训练项目进行评价,基于这个评价计算每个关键词属于某个类的条件概率,从而得出用户的特征描述。然后根据这个特征描述计算推荐候选集中各个项日属于某个类的后验概率。最脂将这个后验概率作为项日的推荐预测并将具冇最高得分的推荐提交给用户⑵O用户的兴趣也是通过关键词来表达,与向量空间模型不同,用户描述文件用特征词一类别矩阵来表示,加是特征词个数,斤是类别数,每一个元索"J表示第j个特征词属于第丿类殆夂徃晰滋I\诵口淌冷,曲加洞弧弟H浴右T而口烯療PF上作者简介:杨莉云,女,1984年生,汉族,河南驻马店人,讲师:主要研究方向:电子商务、管理信息系统。这种方法的假设条件是,所有的项目都可以通过特征词集合中的特征词来表达,每个特征词出现的概率依赖于项目类别而独立于其它特征词。对给定的项目V,每一个类别的后验概率可以通过如下的贝叶斯规则进行计算:P(CjI/)=P(Cj)P⑴l/l11〃(讣丿/=!其中%为项H的第/•个特征词,i/i是项日中特征词的数量。前验概率〃(/)可以被忽峪,因为对于任何一个给定的项目其是一个常量。其中的参数按以下方式进行估算:日标用户对每一个训练项目加都给予一个评价,于是先验概率p(Cj)可通过下式计算:IitemIH IExamplesIIExamplesI+=j的所有项目。设Keywords表示所有训练项R中的所有不同的特征词,1ExamplesI表示训练集中的项目数,对于每一个的类别Cj,刃表示所冇属于该类的的训练项目中的不同特征词的总数,对Keywords中的每一个特征词%•,nk表示该词语在所有属于该类别的训练项日中的次数,则条件概率0(®lj)可以通过下式来计算:"(aI勺)=IExamplesI71+IKeywordsIIExamplesI这些参数都通过Laplace估算进行“平滑”以避免对没仃岀现在仃限训练样木中的特征词的零概率估算。文档分类完成后,根据后验概率最高的类目决定项目的预期评价。岑咏华认为这种评价不科学,预期评价应该是所冇类目后验概率的数学期望*。最后,将预期评价较高的前K个项目作为推荐呈现给用户。1・3基于领域分类的推荐为了更好地区别用户兴趣Z间的差异,曾春等提出了一种基于概率模型的文本推荐方法,把用户兴趣文件表示为用户对不同领域感兴趣的概率,先建立一个领域分类模型,然后计算所冇文档和

个性化推荐技术综述 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数13
  • 收藏数0 收藏
  • 顶次数0
  • 上传人pppccc8
  • 文件大小94 KB
  • 时间2020-09-21