如何进行有效的数据分析网站参谋部金雪Aug.2008人=吃饭+睡觉+上班+玩猪=吃饭+睡觉,代入:人=猪+上班+玩,即:人-玩=猪+上班.结论:不懂玩的人=会上班的猪男人=吃饭+睡觉+挣钱猪=吃饭+睡觉男人=猪+挣钱猪=男人-挣钱结论:男人不挣钱等于猪。女人=吃饭+睡觉+花钱。猪=吃饭+睡觉。代入上式得:女人=猪+花钱。移项得:女人-花钱=猪。结论:女人不花钱的都是猪。男人+女人=2吃饭+2睡觉+挣钱+花钱=2(吃饭+睡觉)=2猪结论:男人+女人就是两头猪思考:问题出在哪里?提纲•什么是数据分析•数据分析可以帮你作什么•如何作有效的数据分析•一些数据分析的常用方法•如何有效地Present分析结果•案例分享什么是数据分析•请牢记:–所有的分析要从“结果”出发,没有结论的数字罗列并不是分析;–“结果”:发现问题和解决问题。什么是数据分析•我的一些感受:–数据分析不是一门复杂的科学;•而是一些简单的“commonsense”;•复杂的运算通常只是令分析结果更差而不是更好;•绝大多数是简单的想法和简单的沟通–数据分析有时候是一门艺术•同样的数据会有不同的解读•优秀和平庸的差异,有时候差在一种灵感提纲•什么是数据分析•数据分析可以帮你作什么•如何作有效的数据分析•一些数据分析的常用方法•如何有效地Present分析结果•案例分享数据分析可以帮你作什么?•企业运用和实施–营运规划–绩效分析–投资与决策分析与检验数据分析在营运规划中的作用•寻找未来企业的“成长引擎”•确定企业发展的助力和阻力•为长期规划和短期规划制定“growingmap-发展线路图”GrowingMap2008年的阿里巴巴2012年的阿里巴巴从数据中了解和发现客户:他们的类型,需求,行踪,习惯,趋势等等,为开发有价值的产品和服务提供源泉让数据来衡量产品和运营的效果,找到改进和完善的方案数据分析为战略决策提供支持和建议好的决策以数据为本,而不是靠拍脑袋和闭门造车数据分析在营运规划中的作用绩效分析与绩效管理•什么才是有效的绩效管理–量化的KPI–报表管理和设计–单一的KPI管理vs全面的KPI管理(BSC)–静态的vs动态的–只考虑成果的vs综合考虑成果和成本的–无计划/预测/控制的管理和有计划/预测/控制的管理–无预警机制的管理和有预警机制的管理递进的过程投资和决策分析•举例:–Marketing上的运用:•新产品,新生产线的盈利预测•广告的成本-效益的分析,盈亏平衡点的分析–Operation:•提高劳动生产率的敏感度分析–其他•买还是租提纲•什么是数据分析•数据分析可以帮你作什么•如何作有效的数据分析•一些数据分析的常用方法•如何有效地Present分析结果•案例分享问有效的问题对业务的理解是前提!Page5如何进行有效的数据分析建立一些假设寻找正确的数据分解手中数据的关系KISS验证假设和结果的关系Step1:问有效的问题•问题是否真的有效的3个检验•检验1-复杂性检验–问题是否直接并相关•检验2-有用性检验–这个问题的答案是否对分析有帮助•检验3-可行性性检验–我收集的数据是否真的能帮助我解答问题问有效的问题-复杂性检验如何量化PV增加的各种因素的影响,如广告,经济,新的主页…?失败案例•太过复杂,N多种问题被合并成一个•无法知道每种因素和浏览量增加的相关性,所以无法量化失败原因成功案例哪些因素导致最近一周PV急剧上升?问有效的问题-有用性检验中国供应商自身产品的质量和价格是否是影响其成交的重要因素?是否可以通过提高中国供应商的产品质量提高他的成交,继而提高续签率?失败案例产品质量当然是成交的重要因素,了解了这个答案并无法帮助我们提高续签率,因为客户产品是我们不可控的。失败原因成功案例有效反馈数量多少是否是影响中国供应商续签率的重要因素?问有效的问题-可行性检验的美国次贷危机在短期和长期内对阿里巴巴营收有何影响?失败案例有太多的因素你不可控制:美国次贷危机将持续的时间;美国次贷危机对中国外贸企业的具体影响;美国政府和中国政府的应对策略;….失败原因成功案例美国次贷危机爆发前后,来自美国的活跃买家和买家询盘数量是否有影响?Step2:建立一些假设•假设为什么重要–复杂的问题通常有很多潜在的答案–没有强有力的假设,你会浪费很多时间并没有证明任何东西–正确的假设决定你收集怎样的数据并如何看待他们建立一些假设-案例•问题:影响中供反馈数量的因素有哪些?可能的假设需要的数据•自身活跃度•阿里巴巴分配资源•同类产品的竞争程度•广告投入--登录次数;ATM使用时长--发布产品数量;Repostoffer数量--主动发送报价数量--产品曝光次数--中供MinisitePV和Session--产品总数在该行业的排名--产品曝光次数在该行业的排名--购买广告(关搜和黄展)的次数--购买广告(关搜和黄展)的金额•一致性–免费会员曝光数据只有从08年7月开始有,无法分析08年4月产品默认搜索实现后对中供、ITP和免费会员曝光资源分配的影响–Analysiswasaflop-MMsdidnotusethesamestandards•精确度–数据不能准确量化:例如销售人员的销售技巧–数据的取得很困难:例如客户的数据如成交•时效性–联合国关于各国经济和中小企业数据基本是2年前的•清楚各项数据的最合适来源•明白各项数据的局限性和可能潜在的错误Step3:取得有效的数据•常见的问题Step4:分解原因•为何要分解原因?–一个问题往往有潜在的多个答案,如果不将多种因素分解,单独分析,无法了解哪个才是真正的直接相关因素。•分解的原则:直接不交集–直接因素:因素和结果之间没有其他可能的间接关系•例如:最近的周末都下雨最近的雨天我们的PV就下降所以雨天是PV下降的原因•案例失败的原因:雨天和PV之间有周末这个因素,而周末是PV下降的原因。分解原因的建议•分解原因的一些建议–问一问:每个原因是否已经互不相交?–问一问:每个原因是否是直接的,是否是其他原因的衍生产物?•如何分析被分解的原因(KISS原则)–孤立一个因素,将有无此因素的两个结果进行比较–例如:将某段到期中供中,按其是否在该段期间内有无购买广告分群,再按这两群人体的续签率进行对比,可大致了解广告对中供续签率的影响。Step5:KISS原则-KeepItSimpleandStupid•分析被分解的原因的两个KISS工具:–“开关”工具•影响前vs影响后•有影响vs无影响–“XY”工具•X–影响因素•Y-产生结果“开关”工具–案例•问题:哪些是影响续签率的重要因素?•假设:订阅TradeAlert能增加买家机会,从而可能会影响效果和续签率•简单的分析方法:“有/无”订阅群体的续签率是否存在差异69%79%0%20%40%60%80%100%NY续签合同续签率45%65%0%20%40%60%80%100%NY新签合同续签率N无订阅Y有订阅•问题:哪些是影响中供获得曝光机会的主要原因?•假设:产品覆盖面广应该是影响曝光的重要因素•简单的分析方法:带来曝光的买家搜过关键词数(代表产品覆盖面)与产品曝光次数的“XY”分析“XY”工具–案例曝光数与产品覆盖面关系图0100002000030000010002000300040005000Num.ofKeywordsNum.ofImpressionsStep6:验证假设和结果的关系•反复问自己几个问题:–分析结果在逻辑上是否合理?•是否有明显的逻辑错误?•征询前线同事的直接感受是否与分析结果相符?•一些违反直觉的结果往往代表一定有什么东西你没有考虑到。–什么东西是你的老板肯定会问的?•假设他的问题•并准备好你的答案•这就是为什么有些人就是与众不同。提纲•什么是数据分析•数据分析可以帮你作什么•如何作有效的数据分析•一些数据分析的常用方法•如何有效地Present分析结果•案例分享数据分析一些技术方法•比较分析–对比参照数据,追踪差异原因;–预测;去年同期;上期都可以是参照数据。•趋势分析–最常用的报表手段•因素分析–中供反馈数与哪些因素相关?自身活跃度?排名?广告?产品数量?–某些工具:相关系数等。•比率分析–常用的财务上的比率分析有:资产负债率;–人力资源管理上经常用的是:人员周转率,人员离职率等–在网站分析上:•粘度(PV/Session)•FeedbackRate(Feebacks/接收人数)数据分析一些技术方法•组成分析法–将某一数据拆分,研究其组成,如:•国家组成分析•行业组成分析•内部数据和外部数据的比较分析–中供与竞争对手付费产品性价比分析•层层筛选法–适用于选择目标市场和目标群体–对多种影响因素按其重要程度进行一定组合,先按第一组合选择出较大范围目标对象,再按第二组合对第一组合筛选出来的对象进一步缩小范围,以此类推,得出最终目标对象较为复杂的分析方法数据挖掘方法(DataMining)定义:从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。优势:•可处理海量数据•可分析N种影响因素对结果的影响程度•可根据历史来预测未来分析方法举例1在这张图中可以看到:1)比较分析2)趋势分析3)组成分析OverseasPV按来源'00027540255661562571426023444046854654821892225225023722484274823702777277630053283349136873848152215091528128212801138884105313471129100210931016167564744437%40%41%42%44%39%39%33%35%36%38%36%37%36%-5001,0001,5002,0002,5003,0003,5004,0004,500Jun-07Jul-07Aug-07Sep-07Oct-07Nov-07Dec-07Jan-08Feb-08Mar-08Apr-08May-08Jun-08Jul-080%10%20%30%40%50%60%70%80%SEOOverseasPVPPCOverseasPV网站自身SEMOverseasPV%分析方法举例2--层层筛选法PotentialBuyerMarketSelectionTop23PotentialBuyerMarkets1.ImportValue3.E-readinessScore2.Num.ofSME4.DailyB2BUVSource:UNComtradeSource:WorldBankSource:EconomistSource:AlexaStep1Top15PotentialBuyerMarketsStep2分析方法举例3--数据挖掘神经网络分析法1.模型Clementine流截图ITPLeads新签概率模型分发前1天至分发后7天(共8天)内是否有TP点击申请0.325337国家等级0.324456职位(分发前)-JOB_TITLE0.319277公司商业类型(分发前)0.293584登陆(1-7)0.235074贸易角色0.231231贸易通在线时间(1-7)0.216833IP地址与填写国家匹配0.210831公司名称长短0.194522Email质量0.148998是否有ATM在线时间0.137432是否创建公司库(分发前)0.085716登录与分发时差0.084323发布sellingoffer数(1-7)0.056906是否有电话号码0.05354发布sample(1-7)0.05299是否有公司网址0.037913发布Quotation数(1-7)0.0257342.神经网络关键字段ITPLeads新签概率模型分析方法举例3--数据挖掘神经网络模型影响因素重要程度提纲•什么是数据分析•数据分析可以帮你作什么•如何作有效的数据分析•一些数据分析的常用方法•如何有效地Present分析结果•案例分享有效的分析必须匹配完美的演示•了解你的听众–谈谈他们感兴趣的东西–