先讲个小故事葡萄酒品质预测法国波尔多葡萄酒品质预测12.145+0.00117×冬天降雨量+0.614×生长期平均气温-0.00386×收获季节降雨量Why为什么要做数据分析1How怎么做数据分析2Cases典型案例3Tools常用工具4目录CONTENTShyw我们为什么需要数据分析?大致两种原因,我们需要数据分析我们最终需要的并不是数据而是数据分析之后产生的有意义的信息这样的信息可以帮助我们决策让我们了解自己往何处去•预测未来将会发生什么先见之明•已经发生的事情为什么发生后见之明how数据分析的一般流程01建立数据体系建立数据体系•明确目标02数据收集与处理03数据解读与决策•确定数据指标•建立数据分析模型数据指标与数据模型•冬天降雨量•收获季节降雨量•收获季节平均气温葡萄酒的品质=12.145+0.00117×冬天的降雨量+0.614×生长期平均气温-0.00386×收获季节降雨量数据指标数据模型网站分析常用数据指标•PV(pageview)•UV(uniquevistor)•Newvistor•Returnvistor•UIP(uniqueIP)•Bouncerate•Deliverrate•Uniqueopenrate•UniqueCTR(clickthroughrate)•ATOS(Avg.TimeonSite)•Conversionrate……页面浏览量独立访客新访客回访客独立IP跳出率送达率(邮件)打开率(邮件)点击率平均访问时间转化率……数据指标小测试邮件营销报告:我们共发出去10million封邮件,到达率(deliverrate)为99.99%,邮件打开率(uniqueopenrate)达19%,点击率(uniqueCTR)19%,从点击来看,80%的客户都是新访客(NewVisitor),访客来到了网站之后,平均访问时间(ATOS)为19秒如何理解这份营销报告中的数据?•到达率99.99%,那么有9.999million的客户收到了邮件。•有1.9million的客户打开了email,也有1.9million点击了email这样想起来应该打开邮件的客户都点击了。•1.9million里面有80%是新用户,这次营销带来了1.52million的新客户•1.9million访客,他们平均在我网站逗留了19秒——时间太短了吧要切实理解数据指标的含义及其获取方法01建立数据体系02数据收集与处理03数据解读与决策数据收集与处理•获取数据资源•去除无效及虚假数据•根据数据模型进行运算宏观:宏观经济及互联网行业发展互联网:互联网使用行为及特征网络产品:产品使用行为和竞争分析自有产品:自有产品的用户特征和行为消费者:用户生活形态与媒介习惯数据资源[消费者生活形态与媒介习惯]新生代CMMS、CTR-CNRS[互联网使用行为和特征]新生代CMMS、CTR-CNRS;艾瑞iUserTracker、华通明略NetTrack、comScore[相关网络产品的用户使用]第3方行业研究报告;产品专项研究;第3方数据监测自有产品用户行为与特征]网民调研;尼尔森NNRT、万瑞监测;产品Log数据[宏观经济]国家统计局统计数据[互联网行业发展]CNNIC、中科三方[其他相关产业发展]国家统计局,相关行业协会数据获取数据资源数据分析师产品运营…去除无效及虚假数据•流量时间分布异常•流量行为异常(转化率)•流量地域异常……•时间分布异常(数据波动大)•地域异常(都来自同一ip段)•其他异常(用户名有规则…)……01建立数据体系02数据收集与处理03数据解读与决策数据解读与决策•Sowhat式数据解读•产品优化及发展Sowhat式数据解读每个客户平均访问了17个页面每个客户看的页面多,说明客户粘性高,说明我们的营销活动很成功PV:500,000Vistor:30,000本次活动和上次相比,最大的区别有两个:第一,之前我们是在腾讯做的文字链广告,这次我们换到了新浪的Banner广告;第二,之前我们没有在广告中提到我们的公司名称,这次我们把公司名称和logo放最大。我们推测这两个变动可能是我们广告效果提升的原因。我们认为下一次我们应该投入更多的经费在新浪网上,而且都用来购买Banner广告。同时投入10%经费去原有网站,如果同一个内容的广告效果仍然有巨大的效果差异的话,我们就能得出结论说我们应该加大在新浪上的投放,而且要用Banner而不是文字链。”对于我们这个行业,平均数据是人均浏览10个页面,所以17个是挺多的。另外,由于我们的网站上主要是产品页面,客户浏览页面多说明他兴趣越大。而浏览信息多也使得他对我们更加了解,这对我们市场信息的传递,品牌印象的生成,以至于将来的销售促进都是有好处的……Sowhat数据解读与决策支持案例1、24小时流量分布数据一般的视频网站,会有如下访问特征:访问高峰,一般出现在上午9-11,下午2-4,晚上7-21如果出现了特殊事件(各种社会热点事件)例如5.12地震的访问高峰,在地震出现后的2个小时•网站的内容运营,在大批访问量来的时候,发布好内容,用户就会及时看到•网站或者产品功能更新,或者上线选择在什么时候好呢?那肯定是在访问用户少的时候,影响范围比较小,这就是24小时数据的应用。看这个数据的目的是什么呢?数据解读与决策支持案例2、网站流入数据分布•了解流入构成,知道流量从哪里来,需要在哪里做推广•站外流入,一般跟网站的seo相关,同时可以做关键字分析看这个数据的目的是什么呢?日期总PV站内流入频道流入站外流入总数新占比例总数新占比例总数新占比例百度谷歌2011.4.1510000200010%300030%500020%asesc数据分析的典型案例Farecast.comAmazon.cn哈拉斯知道你的痛苦oolst数据分析的常用工具表现层分析层存储层TableauCytoscapeClementineEnterpriseMinerSwiffucinetXcelsiusFlex用户级企业级数据分析工具Colorwheel感谢关注欢迎交流