下载此文档

基于用户聚类的图书协同推荐算法研究.doc


文档分类:IT计算机 | 页数:约8页 举报非法文档有奖
1/8
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/8 下载此文档
文档列表 文档介绍
基于用户聚类的图书协同推荐算法研究
杨彦荣 张莹 摘 要:针对协同过滤推荐算法中因图书评分数据稀疏,导致推荐质量和推荐效率低的问题,提出结合用户聚类的图书协同过滤推荐算法。首先将用户身份特征数据和行为数据进行向量化表示,并利用掘的主要任务之一是聚类分析,它将物理或抽象对象的集合划分成多个类簇,同一个簇中的对象彼此相似,不同簇中的对象彼此相异。在众多的聚类算中最常用、最经典的是K-means聚类算法[3]。K-means聚类原理是:依据两个对象的距离越大,相似度越小的准则,通过最小化误差函数优化将所有对象划分为K个簇,K为预先确定的常数。K-means聚类算法具有速度快、质量高、伸缩性好等优点,经常被应用到各种聚类任务中,其主要流程如下。
(1)在包括N个对象的数据集中随机选择K个对象作为聚类中心的初始值。
(2)通过距离公式对每个对象到聚类中心的距离进行计算,从中根据最近原则将对象依次分配到距离它最近的聚类中心存在簇中,计算误差平方和准则函数E的值。
(3)设立新的聚类中心,通过计算各个簇中的所有对象的平均值作为各个簇的聚类中心,以此来得到误差平方和准则函数E的值。
(4)把步骤(3)的E值同前一次计算E值来对比,假如两个E值的差的绝对值小于等于之前设定好的阈值,则聚类的准则函数收敛,转到步骤(5),否则转到步骤(2)。
(5)输出K个聚类。
协同过滤推荐算法
作为当前应用最广泛的个性化推荐技术之一,协同过滤推荐算法在用户行为中寻找特定模式,创建用户特有的推荐内容。协同过滤本算法优点是无需了解领域知识,大多数情况推荐结果令人满意,但也有结果缺乏解释性的缺点。基于用户的协同过滤算法包含以下步骤。
(1)相似度计算构建目标用户兴趣相似的用户集合,Pearson相关系数常用来计算两个用户之间的相似度,在Pearson基础上引入用户评分来计算用户相似度[4]。目标用户u与用户v的相似度用Suv来表示,用户u和v都评分过的共同项目集合用Iuv表示,目标用户u和用户v对物品i的评分用rui和rvi表示,表用户u和用户v所有评分的平均分用和表示。用户相似度计算如式(1)所示。
(1)
(2)评分预测计算预测目标用户对其没有评价过文献的评分,基于用户相似集合通过评分预测来预测评分。
(2)
公式中,Pui是目标用户u对物品i的评分预测,得出的P评分预测越高,目标用户U感兴趣的程度或者几率就越高。
(3)最终按照评分的高低可以给予目标用户TOPN的推荐列表。
基于用户聚类的图书协同过滤推荐
针对图书用户评分数据稀疏导致基于用户协同推荐效率低的问题,在基于用户协同过滤的基础上,将用户聚类融合到协同推荐的过程中,在协同过滤推荐之前首先使用K-means聚类算法对用户进行聚类,将用户划分成不同的类别;然后计算目标用户与各类别的距离,并选择最近距离的类别作为目标用户的检索空间,与整个用户空间相比目标用户搜索空间大大缩减;最后在目标用户的检索空间中通过用户相似度计算确定目标用户的最近邻居,在此基础上产生推荐列表。
2 实验及分析
数据收集及数据预处理
该文实验中以某高校图书馆图书借阅数据为基础,

基于用户聚类的图书协同推荐算法研究 来自淘豆网www.taodocs.com转载请标明出处.

非法内容举报中心
文档信息
  • 页数8
  • 收藏数0 收藏
  • 顶次数0
  • 上传人好用的文档
  • 文件大小16 KB
  • 时间2022-05-16