数据挖掘是什么•通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。•数据挖掘是一门科学,有科学的方法和模型作为基础•数据挖掘又是一门艺术,需要使用者对商业问题的深入理解和模型适用条件深刻的认识数据挖掘能干什么谁是客户?销售什么?如何销售?•发现客户特征•发现客户与产品的关系•发现客户购买喜好•客户分群了解客户特征和喜好及所属阶段•产品关联分析模型发现产品捆绑和交叉销售机会•客户分群和营销响应模型识别对某特定营销方式感兴趣的客户。母婴购物会员特征:•浏览特征•搜索特征•关注广告特征•是否价格敏感•其他数据挖掘相关模型的分类1.描述性模型:我们的客户是什么样子的?他们需要什么?2.预测性模型:如何选取最好的针对性客户交互方式,以保证利润最大化?揭示蕴含于历史数据中的规律无指导的学习无指导性分群关联规则(购物篮)逻辑回归线性回归非线性回归决策树神经网络对未来事件的预测有指导的学习指导性分群技术相关:技术相关:精准营销闭环流程会员数据整合数据挖掘营销策划营销执行营销评估抽取转换装载会员行为价值BI渠道选择Offer设计预测模型选取目标客户时间(3-5月)任务四五一二三四五一二三四五一二三四五一二三四五一二三四五一二三四五一二三四五一二三四五一二三四五1确定合适的客户群进行IDM营销测试(三选一)2挑选目标客户分群做本次营销活动3开发并完善营销活动创意4Offer1/Offer2設計5确定Offer基本方案,確定資費6确定销售渠道组合7构建预测模型8产生目标客户列表和目标客户数据9産生對燳組列錶並過濾目標客戶列錶檢查數據10數據審查11編寫产品说明書/用户申请和处理流程12制定营销活动合约13制定沟通脚本(不同渠道)14设计彩页、直邮15彩页/直邮印刷等16IT需求说明书(确认IT/帐务支撑)17IT/帐务系统支撑设计与测试18制定客户已有其他套餐的处理方法19用户申请Offer档次上升或下降的处理方法20制定非目标客户申请的处理方法21針對競爭對手可能的嚮應的應對处理方法22制定营销活动执行计划(配送、呼叫中心等资源安排)23营销结果跟踪糢版/营销评估指标24为Offer取名25与渠道(10000号,营业厅,客户經理)进行沟通/培训26协调渠道,对(目标/非目标)客户作出相应的回应27進行個別抽查測試各team情況28市场营销测试活动开始29考察测试活动响应,优化预测模型30必要的話适当修改Offer方案/脚本并与渠道沟通31IT/帐务支撑的修改与测试32执行市场营销活动IDM营销活动开展时间安排编号12-1619-234月26-5月21执行管控计划改进营销策划改进营销执行改进模型精度绩效分析•客户关系管理的提出是伴随着产品极大丰富、买方市场形成而产生的——从“客户得到的就是他们所想要的”到“客户得到他们所想要的”的演变•CRM的核心是“了解他们,倾听他们”•CRM的目标可以概括为“吸引潜在客户进入,提高现有客户满意度和忠诚度,降低客户流失”•客户关系管理(CRM)的两个层面操作型CRM:方便与客户交流,简化操作流程分析型CRM:了解客户客户关系管理的价值客户行为数据挖掘在客户关系管理中的应用围绕会员生命周期,建立与之配套的会员分析模型,对生命周期进行精细化管理会员生命周期在不同生命周期阶段需考虑不同问题•如何发现并获取潜在客户?阶段A(Acquisition):会员获取•如何把客户培养成高价值客户?阶段B:(Build-up)会员提升•如何培养顾客忠诚度?阶段C:(Climax)会员成熟•如何延长客户“生命周期”?阶段D:(Decline)会员衰退•如何赢回客户?阶段E:(Exit)会员流失会员价值对应模型•会员购物概率模型•品类偏好模型•客户分群•生命周期识别•复购模型•客户流失预警•流失挽回模型多种价值创造杠杆在不同时期应用•寻找意向价值更高的会员,对其进行激活转化•刺激需求的产品组合/服务•交叉销售•针对性营销•高价值客户的差异化服务•高危客户预警机制•高危客户挽留举措•高价值客户赢回方法场景一购买概率预测•问题描述:访问网站的会员成千上万,哪些会员是随便逛逛,哪些会员是有意向购买,哪些会员即将购买。•结果描述:(逻辑回归)找到意向价值高的会员及时营销进行购物转化。黄色格子为过去表现出目标行为的客户;白色格子为过去没有目标行为的客户寻找已经有目标行为的客户的共同特征运用已经有目标行为的客户的共同特征,按照相似程度,给其他客户打分得到模型计分,选出相似性高的客户(红色格子)0501001502002503003504000255075100编号电话号码姓名住址185486643AXX街XX号297645756BXX街XX号359801486CXX街XX号421957216DXX街XX号559114637EXX街XX号696272059FXX街XX号760095245GXX街XX号857252087HXX街XX号954408928IXX街XX号1051565770JXX街XX号1148722611KXX街XX号1245879453LXX街XX号1343036294MXX街XX号1440193136NXX街XX号1537349977OXX街XX号1634506819PXX街XX号1731663661QXX街XX号目标客户列表Y=F(X)2周会员行为记录201309012013090220130903……2013091320130914观察窗口20130915…….20130920购物窗口浏览后的购物会员2周会员行为记录201309072013090820130909……2013091920130920观察窗口20130921…….20130925预测窗口谁会买?目标:20个会员购买产品的会员数量:5响应率:25%通过响应模型选取目标会员目标:100个会员购买产品的会员数量:10响应率:10%现有方法选取目标会员场景二交叉销售分析•问题描述:如何决定苏宁消费会员的二次推荐商品•结果描述:(Web图,关联规则)鱼和蔬菜的关联性最强;购买啤酒与蔬菜罐头的人有87%的人会购买冻肉场景三流失率分析•问题描述:哪些会员即将流失?根据客户信息,预测客户流失可能性•结果描述:(神经网络,逻辑回归,决策树)输入流失概率(0.87)输出男29末次访问时间累计消费金额月访问频次…………•业界经验,发展一个新客户比保持一个老客户的费用要高5倍,而如果“用户保持率”增加5%,将有望为企业带来25%---85%的利润增长。•因此,对老客户的保留直接关系到企业的利益,客户的流失对企业的经营产生深远的影响。场景四客户分群之一RFM分群•问题描述:客户是谁?如何区分不同的客户?谁是优质会员?•结果描述:(聚类,RFM分群)R:RECENCY(消费间隔时间)F:FRENQUENCY(消费频次)M:MONETARY(平均消费金额)•理论上,最近一次消费时间越近的客户,价值也越高。•最常购买的客户,也是满意度忠诚度最高的客户。•消费金额变量代表客户的消费能力。场景四客户分群之二价值矩阵模型•问题描述:客户是谁?如何区分不同的客户?谁是优质会员?•结果描述:(聚类,价值矩阵模型)•客户价值矩阵模型是在对传统的RFM模型修正的基础上提出的改进模型。•在客户价值矩阵中,购买次数F和平均购买额A的基准是各自的平均值,一旦确定了坐标轴的划分,客户就被定位在客户价值矩阵的某一象限区间内。•依据客户购买次数的高低和平均购买额的多少,客户价值矩阵将客户划分成四种类型,即乐于消费型客户、优质型客户、经常客户和不确定客户建模流程购买概率预测模型①确立目标②构建宽表9/1(建模)9/2(验证)9/16(验证)9/18(验证)占比当天注册、当天购买596454695832614060%无法获取行为非当天注册,当天购买,前两周有浏览255022242317389328%模型覆盖非当天注册,当天购买,前两周无浏览12511626135132812%无法获取行为分析非当天注册、当天购买,购买前2周内有行为的未转化会员为首购模型构建了共计176个字段的宽表③构建模型行为窗口(8/18-8/31)9/1预测点行为窗口(8/19-9/1)9/2行为窗口(9/2-9/15)9/16行为窗口(9/4-9/17)9/18行为窗口预测窗口基于Logistic回归模型,构建了4个首购概率模型,生成会员的购买概率。概率值越大的会员,发生购买的可能性越大。④模型评估模型评估一般分为效能评估和稳定性评估探查宽表字段与购买相关性。以2周行为预测1天的购买(1)效能评估:即评估建模效果的好坏。效能评估的方法有多种,本次使用捕获图的方式进行评估。捕获图:即按照会员的购买预测概率从大到小倒序排序,计算预测概率最大的前n%的会员的实际购买率与自然购买率的比值,比值越大说明模型效果越好。(2)稳定性评估:即评估模型的稳定性。一般使用将建模样本分成几组,比较各组数据建模后的参数、模型效果的差异,如果差异不大,说明模型比较稳定。接触信息:渠道偏好产品:子品类购买情况品类间关联规则收银台:品类、时间、次数收藏:品类、时间会员信息:性别,年龄,注册距今时长等购物车:品类、时间、次数评价晒单信息浏览:时长、次数、页面数、末次浏览时间、频次、时间段等宽表建模效果建模流程–购买率y=0.482*重点邮箱+0.9602*重点电话+-0.3841*注册距今时长分段+-0.1691*末次加入购物车距今时长分段+-0.1019*末次加入收银台距今时长分段+0.7121*近第一天的浏览四级页面数+0.8251*近一周PV分段+0.08812*近一周广告浏览分段+0.05665*产品浏览趋势分段+0.1181*近一天搜索次数+0.5012*近一天WAP搜索次数分段+0.368*近一周WAP搜索次数+0.2557*WAP近一周是否有浏览时长+0.9641*APP近一天浏览数分段+0.1544*APP近一周浏览数分段+0.3981*APP近一天是否有搜索+-0.541*APP末次购物车距今时长分段+-0.58831ˆ1ype购买概率:9/1前10%提升率为4.79/189/29/16前10%提升率为5.2前10%提升率为4.9前10%提升率为4.91.模型在建模集(9/1)、验证集(9/2日、9/16与9/18)均表现出了类似的提升曲线,说明模型的稳定性较好;2.模型在10%的人群处(约6万人群),能够选出约50%的目标客户(约1200人),是随机筛选的5倍。未来方向:建立人与商品的联系•个性化推荐,千人千面,找到人与商品的联系未来方向:针对会员做精准营销产品驱动大型的,粗放销售凭感觉来洞悉市场许多分散的营销活动以广告和价格来吸引客户大众化销售客户驱动小型的,针对性的营销凭事实来洞悉市场集中的,整合的营销活动以主动营销和产品价值定位来吸引客户精准化营销