协同过滤推荐算法2011年11月17日://://://://://dx.587766.com/mwap.dx04131.com3g.gggsw.com://m.jhdxjk.com4g.d1222.com://://dx.587766.com/sy/://dx.587766.com/wj/dx.587766.com/bjdxb://://://://://://://://m.dxcccf.com://jk.chengfang120.com/://://dx.ltaaa.com/m/://jh.km120s.com/://cs.08711000.com/://://gz.xiejdx.com/://m.xiejdx.com://://://xa.oepsi.com/://m.cj5p.com://://://://3g.ipmllc.com://计算机应用技术一:协同过滤算法综述二:在个性化服务中的应用计算机应用技术综述算法简介相似性比较方法用户-项目矩阵稀疏性问题及解决办法冷启动问题推荐速度推荐策略评估方法计算机应用技术一算法简介随着互联网的普及,网络资源的激增,用户很难快速找到需要的信息。为了提供精确而又快速的推荐,研究者提出了多种推荐算法,其中协同过滤推荐算法是应用最为成功的一种。协同过滤这一概念首次于1992年由Goldberg、Nicols、Oki及Terry提出,应用于Tapestry系统,该系统仅适用较小用户群(比如,某一个单位内部),而且对用户有过多要求(比如,要求用户显式的给出评价).目前,许多电子商务网站都已经使用了推荐系统,如Amazon、CDNow、Drugstore,当当网上书店和Moviefinder等。计算机应用技术一算法简介目前主要有两类协同过滤推荐算法:基于用户的协同过滤推荐算法和基于项目的协同过滤推荐算法.基于用户的协同过滤推荐算法基于这样一个假设,即如果用户对一些项目的评分比较相似,则他们对其他项目的评分也比较相似.算法根据目标用户的最近邻居(最相似的若干用户)对某个项目的评分逼近目标用户对该项目的评分.基于项目的协同过滤推荐算法认为,用户对不同项目的评分存在相似性,当需要估计用户对某个项目的评分时,可以用户对该项目的若干相似项目的评分进行估计.计算机应用技术一算法简介1.存在两个问题:稀疏性:在推荐系统中,每个用户涉及的信息相当有限,用户所评价或者购买的产品占产品总数的比例很小,造成用户—项目偏好矩阵非常稀疏,很难找到相似用户,推荐性能可能很差。扩展性:是指发现相似关系的运算法则通常需要很长的计算时间,并且时间会随着用户数目和产品数目的增加而增加,特别是在在线实时推荐中,这是一个急需解决的问题。2.基于协同过滤技术的推荐过程可分为3个阶段:数据表述;发现最近邻居;产生推荐数据集。计算机应用技术二:相似性比较方法相似性计算是协同过滤推荐算法中最关键的一步,传统的相似度计算方法有以下几种:1.余弦相似性把用户评分看作n维项目空间上的向量,用户间的相似性通过向量间的余弦夹角度量,设用户i和用户j在n维项目空间上的评分分别表示为向量,则用户i和用户j之间的相似性为:计算机应用技术二:相似性比较方法2.修正的余弦相似性余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项目的平均评分来改善上述缺陷。计算机应用技术二:相似性比较方法3.相关相似性设经用户i和用户j共同评分的项目集合用Iij表示,则用户i和用户j之间的相似性sim(i,j)通过Pearson相关系数度量:计算机应用技术二:相似性比较方法余弦相似性度量方法把用户评分看作一个向量,用向量的余弦夹角度量用户间的相似性,然而没有包含用户评分的统计特征;修正的余弦相似性方法在余弦相似性基础上,减去了用户对项目的平均评分,然而该方法更多体现的是用户之间的相关性而非相似性,相关性和相似性是两个不同的概念,相似性反映的是聚合特点,而相关性反映的是组合特点;相似相关性方法,依据双方共同评分的项目进行用户相似性评价,如果用户间的所有评分项目均为共同评分项目,那么相似相关性和修正的余弦相似性是等同的.用户对共同评分项目的评分确实能很好地体现用户的相似程度,但由于用户评分数据的极端稀疏性,用户间共同评分的项目极稀少,使得相似相关性评价方法实际不可行.计算机应用技术三:用户-项目矩阵稀疏性问题及解决办法1.矩阵填充技术最简单的填充办法就是将用户对未评分项目的评分设为一个固定的缺省值,或者设为其他用户对该项目的平均评分.然而用户对未评分项目的评分不可能完全相同,这种办法不能从根本上解决稀