下载此文档

传统的协同过滤方法既不能处理大数据量的推荐也不能处理.doc


文档分类:生活休闲 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
传统的协同过滤方法既不能处理大数据量的推荐, 也不能处理只有很少评分的用户。这篇论文提出了著名的概率矩阵分解的方法来解决这个问题。 概率矩阵分解的思想是以中线性因子模型,它使用与用户相关的系数,将用户的偏好建模成一个一系列向量的线性组合。具体如下:假设有M个电影和N个用户。R_ij表示第i个用户对电影j的评分。假设隐变量的维度是D,那么我们希望将评分矩阵 R分解成两个矩阵,即用户隐矩阵U∈RD×N,和电影隐矩阵V∈RD×M。其中,U_i表示第i个用户的隐向量,V_j表示第j个电影的隐向量。假设评分是一个有高斯噪音的正态分布。 那么我们的评分应当有如下公式:这里的 是指高斯分布的概率密度函数。I_ij是指示函数,表明如果用户i评论了电影j,那么其结果等与1,否则就是0。因此,上面的结果就是所有已经被评论的电影得分的乘积,也就是似然函数了。我们给每个用户和电影的隐向量(特征向量)一个均值为 0的高斯先验。有:这里的I是一个D维单位对角矩阵。那么,用户和电影特征的后验分布计算如下:对两边取个ln上面这三项都是形式完全一样,只是系数和均值方差不同,我们以其中一个为例,剩下都一样。即求解我们给出用户i的概率密度函数:注意,由于I是对角阵,那么 ,所以:类似地,我们可以得到进而我们可以得到最终的公式。公式如下:ÿg2i=I,ț=1z11i=lIij Ine'+.VDln 最大化后验概率U和V(最大可能性),等价于求下式的最小值:其中:f=-

传统的协同过滤方法既不能处理大数据量的推荐也不能处理 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人琥珀
  • 文件大小224 KB
  • 时间2020-07-31