基于数据挖掘技术的精准智能营销2013年8月10日•精准智能营销FAQ•What•Why•How•Which•基于聚类分析的客户分群•战术分群与目标市场营销•总结•精确智能营销FAQ--What金字塔客层架构图潜在客户群PotentialAccounts经常往来客户群OrdinaryAccounts主要交易客户群MajorAccounts客户来源的基础建设提升忠诚客户价值差异化增值服务创造更高的利润留下有价值的客户才能创造更高的利润•精确智能营销FAQ--What精确智能营销,即精准营销(Precisionmarketing),就是在精准定位的基础上,依托数据挖掘技术手段建立个性化的顾客沟通服务体系,实现企业可度量的低成本扩张之路。就是公司需要更精准、可衡量和高投资回报的营销沟通,需要更注重结果和行动的营销传播计划,还有越来越注重对直接销售沟通的投资。精准营销是相对大众营销而言的。•精确智能营销FAQ--Why市场竞争迫使企业由规模型发展向规模效益型发展转型电子商务、金融、保险、通讯等运营商的经营模式从“技术驱动”向“市场驱动”、“客户驱动”转化大众化营销已经失去了其优势基于客户信息、客户价值和行为,深入数据分析的洞察力营销、精确化营销的理念逐渐被各大运营商所接受,并渴望通过从数据中挖掘价值来减少营销成本、提高营销效益数据挖掘技术成为实现这些目标的必要手段•聚类(clustering)是指把一组个体按照相似性归成若干类别,即“物以类聚”,保证各组间特征的相异性最大,同组内各观测值特征的相似性最大。•聚类分析能帮助发现特征迥异的不同客户群,和对客户分群起关健作用的指标变量。各条记录在细分变量空间的透视图点对点短信梦网短信本地通话通话行为数据业务长途通话各行为特征在空间的位置相对集中,因此被划分为有一定共同行为特征的客户群•精确智能营销FAQ--How•精确智能营销FAQ--How低高高高12845376因素二(国内呼叫次数)因素三(IP呼叫次数)因素一(繁忙时段呼叫次数)示例实施的难易程度客户信息(CustomerInfo)客户价值(CustomerValue)客户行为(Behavioral)态度(Attitudinal)•性别•年龄•户藉•职业•婚姻状况•教育程度•收入•通话时段•繁忙和非繁忙通话量•漫游服务•方便程度•行为方式的变化•高利润率•中等利润率•低利润率•负利润率•形象•价值观•生活方式•心理因素客户信息客户行为客户价值客户态度客户细分方式•精确智能营销FAQ--How•考虑不同客户细分方法的有效性及实施的难易程度,并结合系统所提供的数据资源和用户特点,采用客户行为方式进行客户细分,再结合客户信息和客户价值准确定位细分人群客户信息客户行为客户群X客户细分三维分析体系三维分析体系所带来的业务利益客户价值•识别高价值客户群,成为目标客户群客户行为•如何针对目标客户群,根据客户行为分析,扩展及保留客户群,提供服务满足客户需求客户信息•整理客户群的背景资料以便市场营销人员能找到目标客户群•精确智能营销FAQ--How•数据挖掘流程确定商业目标ETL建立模型数据收集、管理数据探索、修改各部门访谈数据中心支持数据挖掘工程师数据挖掘、商业分析、市场营销人员商业理解BusinessUnderstanding数据理解DataUnderstanding数据准备DataPreparation建立模型Modeling模型评估Evaluation结果发布Deployment模型调优应用策略•精确智能营销FAQ--How11•精确智能营销FAQ--HowDataUnderstandingBusinessUnderstandingDataPreparationModellingEvaluationDeploymentDataCRISP-Cross-IndustryStandardProcess各个环节顺序进行,但需要不断地循环往复进行数据探索和模型的调优•精确智能营销FAQ--Which客户流失分析客户综合价值评估交叉销售和增量销售客户信用评估欺诈行为分析……某电信运营商定义的客户分群的商业目标是“对某市数十万公众客户,从价值和行为的分析维度进行客户分群,以了解不同客户群的消费行为特征,为发展新业务、流失客户保有、他网用户争夺的针对性营销策略的制订提供分析依据,并实现企业保存量、激增量的战略目标”。电信客户从营销属性分为三类:公众客户、商业客户和大客户,其中公众客户消费行为有较大的随机性,客户分布难有规律可寻,比较适于聚类分析。•案例描述—基于聚类分析的移动智能营销•精确智能营销FAQ•基于聚类分析的客户分群•客户分群的商业理解•数据分群的数据理解•客户分群的数据准备•客户分群的模型建立•客户分群的模型评估•客户分群的模型发布•战术分群与目标市场营销•总结•客户分群的商业理解从商业角度理解项目的目标和要求,然后把理解转化为数据挖掘问题的定义和一个旨在实现目标的初步计划;明确项目的商业目标,这个目标应该是适于用基于聚类分析的客户分群方法去达到的。•精确智能营销FAQ•基于聚类分析的客户分群•客户分群的商业理解•数据分群的数据理解•客户分群的数据准备•客户分群的模型建立•客户分群的模型评估•客户分群的模型发布•战术分群与目标市场营销•总结•客户分群的数据理解“巧妇难为无米之炊”,数据是挖掘的基础;在确定目标和方案后需要进行“数据理解”,以确定要支持我们的分析目标需要哪些方面的数据,数据基础是否已经具备,数据质量是否能满足要求,如果不能得到肯定的答复,我们建议推迟项目实施直至条件成熟,因为“进去的是垃圾出来的仍是垃圾”,错误的分析结果可能会给我们带来重大的损失。•客户分群的数据理解分析业务系统中的客户信息、客户消费及购买使用行为三个方面最近六个月的历史数据。电信企业拥有业务受理开通的CRM系统,进行计费、帐务及欠费处理的计费系统,卡类业务的智能网系统,客户服务的10000号系统,营销服务的渠道系统,还有结算系统、宽带、窄带及小灵通系统等等,这些业务系统储蓄了企业运营的海量客户数据。•基于访谈中了解的客户需求,采用用户行为特征作为细分变量,用户人口统计信息和客户价值作为描述变量,从而定位人群特征。•对行为特征从以下几个方面来获取信息对多元化服务的需求程度服务类型对通话的多层次需求本地、长途、漫游呼叫时长本地、长途、漫游呼叫次数呼叫时间、次数(繁忙/非繁忙时段,工作/休息时段)呼叫类型(主叫、被叫、呼转)对资费的敏感程度IP使用情况优惠时段通话情况拨打1861次数对方便性及信息实时性的需求SMS使用次数Monternet使用次数WAP上网时间GPRS数据流量导出客户需求种类客户数据注:细分变量——用于进行客户细分的变量描述变量——将客户细分成各个群体后,各群体的基本特征•客户分群的数据理解•客户分群的数据理解通话范围本地通话d_localt_local省内长途通话d_toll_inprnt_toll_inprn省间长途通话d_toll_btwprnt_toll_btwprn国际、港澳台长途通话d_toll_htm+iddt_toll_htm+idd活动范围省内漫游通话d_rm_inprnt_rm_inprn省际漫游通话d_rm_btwprnt_rm_btwprn国际漫游通话d_rm_iddt_rm_iddIP使用情况IP通话d_ipt_ip•基于客户需求,并结合以上行为特征选取的方向,定义几组数据作为细分变量与各运营商联系程度网内通话比例d_mob_vs_Ttlt_mob_vs_Ttl联通通话比例d_uni_vs_Ttlt_uni_vs_Ttl小灵通通话比例d_phs_vs_Ttlt_phs_vs_Ttl固话通话比例d_fix_vs_Ttlt_fix_vs_Ttl呼转行为d_fwd_totalt_fwd_total数据业务使用情况WAP使用d_wapt_wap点对点及网间短信发送次数t_sms_total梦网短信发送次数t_sms_mont客服到营业厅次数t_service拨打1860次数t_1860拨打1861次数t_186120注:其中d_X代表时长,t_X代表次数•客户分群的数据理解客户基本信息agespecial_feet_fwd_unimalesms_feed_fwd_fixfemalewap_feet_fwd_fixGenderMissingip_fee闲时忙时通话情况d_pkon_totalCashPaygprs_feet_pkon_totalPrePaymessage_feed_pkoff_totalvip_markother_feet_pkoff_totaldue_mark主叫被叫情况d_outgoing_total工作时间、生活时间通话情况d_worktime_totaltenure_in_dayst_outgoing_totalt_worktime_total费用信息ARPUd_incoming_totald_resttime_totalshould_feet_incoming_totalt_resttime_totalfavor_fee联系人群范围distinct_out_total各项短信使用情况t_sms_p2prent_feedistinct_in_totalt_sms_linklocal_fee与联系紧密人群的主被叫情况d_outgoing_topNt_sms_topNinprn_feet_outgoing_topNsms_msg_lengthbtwprn_feed_incoming_topNdistinct_sms_sendhtm_feet_incoming_topNdistinct_spidd_fee各项呼转情况d_fwd_mobrm_inprn_feet_fwd_mobrm_btwprn_feed_fwd_srvrm_idd_feet_fwd_srvrm_toll_feed_fwd_uni21通过细分变量将客户进行细分,再通过以下描述变量定位人群,进一步分析人群特征。•精确智能营销FAQ•基于聚类分析的客户分群•客户分群的商业理解•数据分群的数据理解•客户分群的数据准备•客户分群的模型建立•客户分群的模型评估•客户分群的模型发布•战术分群与目标市场营销•总结•客户分群的数据准备数据准备流程:•客户分群的数据准备—选择数据决定用来分析的数据选择标准:与数据挖掘目标的相关性数据选择包括数据表格中属性(列)和记录(行)的选择•客户分群的数据准备—选择数据用户及客户的基本信息:客户身份信息、联系方式、产品拥有情况,用户竣工时间、入网时长、服务开通情况、优惠套餐信息、客户服务信息(投诉、咨询、催缴情况)等。价值信息:话音、宽窄带业务的月租费、使用费、优惠费用及增值业务、新业务、信息费和卡类、结算费用,还包括了缴欠费信息。行为信息:时长、次数、跳次、发话不同号码数、时长集中度(拨打时长最多的三个号码拨打时长在总时长中占比)、次数集中度。•客户分群的数据准备—选择数据基础表中数据属性粒度要求尽量细,以便于在后期灵活构建数据。将价值和行为变量从专业(区内、区间、本地移动、本地异商固网、传统国内长途、传统国际长途、传统港澳台长途、传统异地行动、IP国内长途、IP国际长途、IP港澳台长途、IP异地行动)和时段(白天:7:00-18:00、晚上:18:00-7:00、特殊时段:0:00-7:00)两个维度进行了划分。•客户分群的数据准备—清洗数据将数据质量提高到所选分析技术和分析目标要求的水平。包括选择需要进行数据清洗的子集,插入适当的默认值或者通过更加复杂的技术如建模来估计缺失值,比如某月份的数据缺失可以用前后月份数据的平均值来填充,将拥有产品较多(可能不是公众客户)及公免的客户数据剔除。此阶段需要对基础表的数据进一步探索和检验。宽表生成流程注:宽表是将数据经过组合所形成的包括细分变量和描述变量的记录表。DSS目前开放的表格作为接口表其他接口文件作为中