文献综述-餐饮电子商务个性化推荐系统推荐算法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

科研训练文献综述餐饮电子商务个性化推荐系统推荐算法研究院系:软件学院班级:1105班姓名:学号:指导老师:2013/9/15餐饮电子商务个性化推荐系统推荐算法研究TheResearchonrecommendationalgorithmofRecommendationSysteminCateringE-Commerce餐饮电子商务个性化推荐系统推荐算法文献综述摘要:随着电子商务的快速发展,大数据以及云计算时代的到来,个性化推荐系统成为了电子商务网站的核心技术之一。本文分析了个性化推荐的特点,发展。作为个性化推荐系统的核心----推荐算法,本文讲述了常见的几种算法(协同过滤,基于内容推荐,社会网络(二部分图)算法,混合算法),比较了这几种算法的优劣。最后根据餐饮的特点,作者提出了自己的一些关于推荐算法的想法。Abstract:Withtherapiddevelopmentofe-commerce,theadventoftheeraofbigdataandcloudcomputing,personalizedrecommendationsystemhasbecomeoneofthecoretechnologyofe-commercesites.Thispaperanalysesthecharacteristicsofpersonalizedrecommendation,development.Asthecoreofthepersonalizedrecommendationsystem,recommendationalgorithm,thispapertellsthestoryofseveralcommonalgorithm(collaborativefilteringandcontent-basedrecommendation,socialnetwork(2parts)algorithm,thehybridalgorithm),comparingtheseveralkindsofadvantagesanddisadvantagesofthealgorithm.Finallyaccordingtothecharacteristicsofthefoodandbeverage,theauthorputforwardsomeideasabouttherecommendationalgorithm.关键字:数据挖掘;推荐系统;个性化;协同过滤Keywords:datamining;Recommendationsystem;Personalized;Collaborativefiltering一、概述信息爆炸的现代互联网时代,简单搜索引擎已无法满足用户在海量信量中获取信息的需要,信息的利用率降低。为解决这一问题,研究人员提出了个性化推荐系统,可有效地解决在单个的互联网用户在海量信息中的获取有用信息的问题。个性化推荐系统是通过分析用户的历史行为,提示用户习惯和喜好,建立相应的推荐算法,为每个用户产生一个推荐列表,使其可以快速地找到自己感兴趣的信息。上世纪末,推荐系统主要应用于音乐、电影、书籍等产品的推荐。近年来,推荐系统已被广泛地应用于电子商务领域,成为电子商务中不可缺少的一部分,各大电子商务网站,如Amazon、ebay都不同程度的使用了推荐系统,显著地提高了电子商务企业的销售额,同时也为用户搜索商品提供了方便。与此同时对推荐系统的研究在理论上促进了多学科的交叉发展。设计出更优秀的推荐算法已经成为理论界关注的热点。目前为止,学者们提出了基于内容的推荐算法、协同过滤推荐算法、基于复杂网络的推荐算法、混合推荐算法等不同的算法,数据挖掘领域、机器学习领域的一些新方法也被应用到推荐算法中。二、推荐系统的基本概念和关键问题2.1推荐系统的定义推荐系统的定义有不少,但被广泛接受的推荐系统的概念和定义是Resnick和Varain锄在1997年给出的:“它是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程”。简单来说就是起到了一个导购员的作用。2.2推荐系统的发展个性化推荐系统作为一个独立的概念提出源于20世纪90年代。1995年,卡耐基.梅隆大学的RobertArmstrong等人在美国人工智能协会上提出了个性化导航系统WebWatcher;斯坦福大学的MarkoBalabanovic等人在同一会议上推出了个性化推荐系统LIRA;1995年8月,麻省理工学院的HenryLieberman在国际人工智能联合大会(IJCAI)上提出了个性化导航智能体Letizia;1996年,Yahoo推出了个性化入口MyYahoo;亚马逊的图书推荐系统成果应用引来学术界的研究热潮。1997年,AT&T实验室提出了基于协作过滤的个性化推荐系统PHOAKS和ReferralWeb;1999年,德国Dresden技术大学的TanjaJoerding实现了个性化电子商务原型系统TELLIM;2000年,NEC研究院的Kurt等人为搜索引擎citeseet增加了个性化推荐功能;2001年,IBM公司在其电子商务平台Websphere中增加了个性化功能,以便商家开发个性化电子商务网站。2003年,Google开创了AdWards盈利模式,通过用户搜索的关键词来提供相关的广告。AdWords的点击率很高,是Google广告收入的主要来源。2007年3月开始,Google为AdWords添加了个性化元素。不仅仅关注单次搜索的关键词,而是对用户一段时间内的搜索历史进行记录和分析,据此了解用户的喜好和需求,更为精确地呈现相关的广告内容。2008年,开源分布式平台和技术开始渐渐流行,为超大型电子商务网站应用推荐引擎技术奠定了基础。Hadoop及其子平台Hive、Pig等获得青睐。专注于分布式推荐系统引擎算法和机器学习算法的apache项目Mahout也在不久后问世。2.2推荐系统的体系结构推荐系统有3个重要的模块:用户建模模块、推荐对象建模模块、推荐算法模块。通用的推荐系统模型流程如图1所示。推荐系统把用户模型中兴趣需求信息和推荐对象模型中的特征信息匹配,同时使用相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。2.3推荐系统的评价推荐系统性能的优劣也是研究的一个重要方向。首先预测的准确度是一个重要的评价指标。其次卖方也希望能够给客户提供新颖的产品,能够给用户惊喜的产品。人们往往还对推荐系统在算法性能,隐私保护等方面有所要求。在推荐系统中推荐算法是决定其性能的关键。下面我将对推荐算法进行较为详细的综述。三、推荐算法综述推荐算法比较流行的有协同过滤(col—laborativefiltering)算法、基于内容的过滤(contentbasedrecommendation)算法、基于二部图关系的推荐算法、混合算法。下面将对这几种算法进行介绍。3.1协同过滤(col—laborativefiltering)算法协同过滤算法是目前最成功的推荐算法,它于20世纪90年代开始研究并促进了整个推荐系统研究的繁荣。它的核心思想是用户对一些相似产品的评分比较相似;兴趣爱好相似的用户群对一些产品的评分比较相似。协同过滤推荐一般分为三类。基于用户的协同推荐(UserbaedCoIlaborativeFiIbering);基于项目的协同推荐(ItemBasedcoIlaborativeFiIbering);基于模型的协同推荐(ModelBasedcoIlaborativeFiltering)。·Userbased协同过滤推荐是提出的最早的协同过滤算法。其是根据其他用户的观点产生对目标用户的推荐列表。它基于这样一个假设:如果用户对一些项的评分比较相似,则他们对其它项的评分也比较相似。协同过滤推荐系统使用统计技术搜索目标用户的若干最近邻居,然后根据最近邻居对项的评分预测目标用户对未评分项的评分,选择预测评分最高的前若干项作为推荐结果反馈给用户。User-based协同过滤推荐算法的核心就是通过最近邻居的评分产生最后的推荐结果,当前用户对未评分项的评分通过最近邻居对该项评分的加权平均值逼近。用户相似性度量、最近邻居查询和预测评分是整个Userbased协同过滤推荐算法的主要工作,相应的,Userbased协同过滤推荐算法可以划分为如下三个阶段:1).数据表示:对用户己经购买过的商品进行建模,从而可以有效度量用户之间的相似性。2).最近邻查询:搜索当前用户的最近邻居。3).推荐产生:根据当前用户最近邻居对商品的评分信息预测当前用户对未评分商品的评分,产生TOPn一商品推荐。数据表示:在Userbased协同过滤推荐中,必须根据不同用户对商品的评分信息产生推荐结果。用户评分数据可以用一个m’n阶矩阵A(m,n)表示,m行代表m个用户,n列代表n个项,第i行第j列的元素凡J代表用户i对项j的评分。用户评分数据矩阵如图3.1所示。图3.1:用户评分矩阵最近邻查询:最近邻查询是整个Useobased协同过滤推荐算法的核心部分,其效果和效率很大程度上决定了User一based协同过滤推荐算法的效果和效率。所谓最近邻居,就是购买行为或评分行为与当前用户比较相似的若干用户。最近邻查询阶段实质上就是Userbased协同过滤推荐算法的模型建立阶段。.1).余弦相似性(Cosine):用户评分看作为n维项空间上的向量,如果用户对项没有进行评分,则将用户对该项的评分设为O,用户间的相似性通过向量间的余弦夹角度量。设用户i和用户j在n维项空间上的评分分别表示为向量I,j,则用户i和用户j之间的相似性sim(I,j)为:分子为两个用户评分向量的内积,分母为两个用户向量模的乘积。2).相关相似性(Correlation):设用户i和用户j共同评分过的项集合用寿表示,则用户i和用户j之间的相似性sim(i,j)通过Pearson相关系数度量:Ric表示用户i对项c的评分,Ri和Rj分别表示用户i和用户j的平均评分。3).修正的余弦相似性(Ad,’ustedcosine):在余弦相似性度量方法中没有考虑不同用户的评分尺度问题,修正的余弦相似性度量方法通过减去用户对项的平均评分上述缺陷,设用户i和用户j共同评分过的项集合用介表示,Ii和寿分别表示用户i和用户j评分过的项集合,则用户i和用户j之间的相似性sim(i,j)为:Ri,j表示用户i对项c的评分,i和j分别表示用户i和用户j的平均评分。推荐产生:通过上面提出的相似性度量方法得到目标用户的最近邻居,下一步需要产生相应的推荐。设用户u的最近邻居集合用刀N公表示,则用户u对项i的预测评分pu,,可以通过用户u对最近邻居集合凡叽中项的评分得到,计算方法如下sim(u,n)表示用户u与用户n之间的相似性,Rn.j表示用户n对项i的评分。Ru和Rn分别表示用户u和用户n对项的平均评分。itembased协同过滤推荐根据用户对相似项的评分预测该用户对目标项的评分,它基于这样一个假设:如果大部分用户对一些项的评分比较相似,则当前用户对这些项的评分也比较相似。基于项的协同过滤推荐系统使用统计技术找到目标项若干最近邻居,由于当前用户对最近邻居的评分与对目标项的评分比较类似,所以可以根据当前用户对最近邻居的评分预测当前用户对目标项的评分,然后选择预测评分最高的前若干项作为推荐结果反馈给用户。在具体的计算方法中,其与userbase协同过滤算法相似。协同过滤的优点:(1)复杂的非结构化的对象可以应用协同过滤,比如电影、音乐、图像等推荐对象。(2)善于发现用户新的兴趣点。协同过滤可以发现内容上完全不相似的资源,用户对推荐信息的内容事先是预料不到的。协同过滤的缺点:冷启动问题。新进入的用户由于得不到他们的兴趣偏好而无法获得推荐,新的推荐项目由于没有用户评价它就得不到推荐,这就是冷启动问题。冷启动问题是推荐系统研究的难点和重点。打分稀疏性问题。由于用户数目的大量增长,而且用户之间选择存在差异性,使得用户的评分差别非常大。同时推荐对象的

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功