PPT模板下载:行业PPT模板:节日PPT模板:素材下载:背景图片:图表下载:优秀PPT下载:教程:教程:教程:资料下载:课件下载:范文下载:试卷下载:教案下载:沃尔玛数据利用沃尔玛—啤酒与尿布01沃尔玛—进军互联网0203沃尔玛数据分析案例04推荐系统的组成及实现方法概述沃尔玛--啤酒与尿布01沃尔玛—进军互联网0203沃尔玛数据分析案例04推荐系统的组成及实现方法概述沃尔玛—啤酒与尿布在一家超市中,人们发现了一个特别有趣的现象:尿布与啤酒这两种风马牛不相及的商品居然摆在一起。但这一奇怪的举措居然使尿布和啤酒的销量大幅增加了。这可不是一个笑话,而是一直被商家所津津乐道的发生在美国沃尔玛连锁超市的真实案例。原来,美国的妇女通常在家照顾孩子,所以她们经常会嘱咐丈夫在下班回家的路上为孩子买尿布,而丈夫在买尿布的同时又会顺手购买自己爱喝的啤酒。这个发现为商家带来了大量的利润,但是如何从浩如烟海却又杂乱无章的数据中,发现啤酒和尿布销售之间的联系呢?这又给了我们什么样的启示呢?大数据天然不是沃尔玛,但沃尔玛天然是大数据!沃尔玛--啤酒与尿布01沃尔玛—进军互联网0203沃尔玛数据分析案例04推荐系统的组成及实现方法概述•网站数据库整合迁移•Hadoop集群扩展工作•收购Kosmix沃尔玛—进军互联网收购专注于数据挖掘或移动社交的初创公司如OneOps、Inkiru,TastyLabs,OneRiot建立WalmartLabs社交媒体应用数据Walmart网络商城电子数据消费者线下交易数据沃尔玛—进军互联网实时更新Walmart’sBigData降低决策执行成本创造新的消费机会MakeCustomeraBiggerSpender沃尔玛--啤酒与尿布01沃尔玛—进军互联网0203沃尔玛数据分析案例04推荐系统的组成及实现方法概述沃尔玛—案例沃尔玛资深会员Sam购买商品种类、数量、型号购买信息、支付方式配送信息、会员卡信息住址、联系方式在沃尔玛的购物流程监控视频、门禁数据等……沃尔玛信息系统WalMart’sApp购物清单上百分之八十以上商品的推荐信息和电子优惠券信息按商场流程标注了每件商品的具体位置、型号信息用手机扫描商品,然后收银台手机扫描支付数据端更新Sam的相关消费信息,并进行预测,把数据提交至APP………………沃尔玛—案例当Sam再次驾车到Walmart……沃尔玛—案例Sam很喜欢一款899美金威尔逊网球拍但没有加入扫描清单,球拍旁边的塑胶运动模特脑袋里边的摄像头记录下了他的一举一动Sam的停留时间,拿起网球拍的次数及观察端详球拍的视角,甚至他是左手握拍还是右手握拍等等,包括,而第二个月,Sam的手机推送信息中已经有了沃尔玛推荐的性价比更高的一款Babolat轻碳球拍。更让Sam惊喜的是……沃尔玛—案例当Sam时隔半年再次来到Walmart网上商城……首页推荐上有会员八折的罐装威尔逊网球只因Sam在twitter上点了个赞,首页推荐就有了新款特价的全钢西门子榨汁机Sam的facebook上唯一关注的音乐人RobbieWilliams的新专辑根据Sam的身体健康状况,告诉他家附近的一家健身房年卡正在打折出售沃尔玛—案例分析线下数据•WalmartLabs着手整合了沃尔玛旗下网站•把分散在Oracle、Neteeza、Greenplum等数据库中资源统一存入Hadoop数据仓库•尝试进行内部数据共享分析•TheSocialGenome将消费者线下购物数据、网络浏览点击数据、社交网络关系数据及消费者个人数据等组合成实时更新扩展且具有定向预测功能的强大数据库•据社交网络上展现的兴趣,预测他们可能购买的产品。网上商城Kosmix团队•对社交媒体的语义分析功能,利用Facebook和Twitter的数据,工程师从每天热门消息中,推出与社会时事呼应的商品,创造消费需求•追踪系统:专门管理追踪庞大的社交动态沃尔玛—案例分析通过对社交网络进行深度的数据挖掘,实现网站主页、商品搜索个性化,依据消费者的兴趣来排列页面上的结果。数据显示,截止到13年1月31日,沃尔玛全球互联网销售额增长30%增幅十年来第一次超越亚马逊。事实证明,沃尔玛的线上大数据已经能够为其线下营收带来销售增量。沃尔玛—案例分析媒体称沃尔玛拥有将近七成美国人的相关消费数据,八成以上的境内邮箱信息。通过其强大数据库的算法推荐和预测方案,个人消费数据能够预测一系列的高敏感个人信息,沃尔玛将清楚地知道你是谁,你要买什么,甚至你下一步要干什么。由于缺乏个人信息保护意识,很多有色,低收入,边缘化社区人群个人数据信息受到大数据商业计划侵犯,而弱势人群在沃尔玛的数据标签化分类中很容易被识别区分出来,遭受弱歧视化待遇。大数据会随着数据的结构化和规模化滚动雪球,越来越“大”,越来越“快”,这个世界上最大的零售商在利用数据技术追逐利润的同时也逐渐引起人们的担忧。沃尔玛--啤酒与尿布01沃尔玛—进军互联网0203沃尔玛数据分析案例04推荐系统的组成及实现方法概述推荐系统的组成及实现方法概述推荐系统80%20%热门推荐人工推荐相关推荐个性化推荐这三者与算法关系不大,而其效果的好坏却决定了整个系统推荐效果好坏的80%。要做好一个推荐系统,首先要把这三者完成好。热门推荐•即点击量高的产品•将热门的东西推荐给用户是非常合情合理的,因为既然热门,也侧面说明了很大概率上该用户也会喜欢该商品•置于推荐的醒目位置推荐系统的组成及实现方法概述人工推荐•比如在体育新闻中,巴萨夺冠之类的大新闻一出,马上登上头条,进入人工推荐•不用计算特征值、相似度、是否符合用户兴趣等•置于推荐的醒目位置推荐系统的组成及实现方法概述个性化推荐•本质上是为了解决长尾问题,把那些不热门的东西,但是很可能符合某特定用户品味的商品挖掘出来,推荐给特定的用户群。推荐系统的组成及实现方法概述•要解决个性化,首先就是要对用户分析,最成熟的办法就是对用户打标签,即用户特征提取或者用户行为分析。个性化推荐•二八定律:在任一祖东西中,最重要的只占约20%,其余80%虽是多数却是次要的。•长尾理论是网络时代兴起的一种新理论。由于成本和效率的因素,当商品储存流通展示的场地和渠道足够宽广,商品生产成本急剧下降以至于个人都可以进行生产,并且商品的销售成本急剧降低时,几乎任何以前看似需求极低的产品,只要有卖,都会有人买。这些需求和销量不高的产品所占据的共同市场份额,可以和主流产品的市场份额相比,甚至更大。推荐系统的组成及实现方法概述个性化推荐•用户特征提取关键在于【数据统计+人工分析】。即:将用户的浏览记录等记录下来,统计他最常点击的东西,最常去的频道,或者收集更详细的信息,然后给他打上相应的标签,据这些标签进行推荐。•标签库的设计和积累,是非常广泛和重要的,而这方面需要大量依赖于【人工分析】,而不是看论文调算法能做到的。推荐系统的组成及实现方法概述•最后就是根据标签的定向推荐,此时需要对每个标签进行权重设置。设置的方法其实就是【拍脑袋】,如有先前的经验值可直接可以拿来用。在拍完脑袋之后需要观察点击率变化,然后再对权重进行调整,即根据评测和反馈来调整,优化推荐系统。推荐系统的组成及实现方法概述•推荐系统本质上首先是一个系统,需要不断的对各种效果进行评测,不断地优化,而不是一味地研究算法。•当一个做推荐系统的部门开始重视数据清理,数据标柱,效果评测,数据统计,数据分析这些所谓的脏活累活,这样的推荐系统才会有救。谢谢!