数据蕴含价值信息创造未来广州市网迅信息技术有限公司1汕头电信低质用户活跃度提升解决方案--2017.12.25数据蕴含价值信息创造未来广州市网迅信息技术有限公司目录一数据挖掘项目经验2二IPTV活跃度提升解决方案三套餐流量使用率提升解决方案数据蕴含价值信息创造未来广州市网迅信息技术有限公司五个数据挖掘模型,两个客户画像标签3G升4G换卡模型(营销响应模型)政企专线离网预警模型(用户保有模型)双百兆目标用户模型(营销响应模型)乐享5折用户聚类模型(用户画像刻画)乐享5折用户生命周期分析(用户画像刻画)手机加副卡目标用户模型(营销响应模型)乐享5折目标用户模型(营销响应模型)数据挖掘客户标签(数据挖掘基础能力沉淀)数据蕴含价值信息创造未来广州市网迅信息技术有限公司3G升4G换卡营销模型目标为提升当前3G升级4G营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销。截止9月份,共提供5批次,共计48.2万精确目标用户营销清单给外呼相关部门进行营销测试分区预测在网预测离网实际在网536,69131374实际离网216897522离网命中率19.30%离网覆盖率25.8%提升度3.9521.37%9.46%3.01%4.30%高概率中概低概率对照组模型评估模型实际应用营销成功率数据蕴含价值信息创造未来广州市网迅信息技术有限公司双百兆目标用户模型目标为提升当前营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销。本模型以老宽带用户为出发点,以是否融合划分不同子模型,利用随机森林算法,构建最终目标用户模型。3.6%3.6%3.6%3.6%3.5%3.4%3.4%3.4%3.4%3.4%3.0%3.1%3.2%3.3%3.4%3.5%3.6%3.7%3.8%3.9%4.0%套餐大类近三个月月均客户移动流量近三个月月均客户移动出账套餐打标费用套餐小类同客户名下移动号码数近三个月月均客户移动计费时长近三个月月均上网时长近三个月月均访问体育网页次数近三个月月均电影次数字段重要性模型评估测试分区预测未办理预测办理实际未办理59,5632650实际办理19409049办理命中率77.30%办理覆盖率82.30%提升度5.15模型实际应用月份外呼量接通量接通率接通后成功率总体成功率20160917736479827%2.3%0.6%2016106666238136%3.2%1.1%20161122821836037%2.8%1.0%模型经过10月,11月两月实际应用,接通率,接通后成功率及总体成功率均比未使用模型前有明显提升。10月总体成功率接近9月的两倍。数据蕴含价值信息创造未来广州市网迅信息技术有限公司手机加副卡目标用户模型目标为提升当前营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销。手机加副卡模型分成两部分,一部分为网龄3个月以上的用户,另一部分为网龄3个月以下的用户。利用逻辑回归算法和KNN分类算法,分别构建模型。测试分区预测未办理预测办理实际未办理35946679实际办理43352948办理命中率81.2%办理覆盖率40.4%提升度10.5逻辑回归模型评估变量名称系数套餐内流量129.4764099用户类型40.28923193合同剩余月份数11.35521583近3月月均充值金额4.687194277套餐小类-4.658930608同客户下手机流量-2.077296871同客户下4G手机流量0.936129902同客户下4G用户数0.888651916语音使用率-0.854310481逻辑回归模型系数注:系数的绝对值越大,对模型的影响越大。测试分区预测未办理预测办理实际未办理1170793219实际办理57255664办理命中率63.7%办理覆盖率49.7%提升度7.4KNN分类模型评估KNN分类模型字段重要性39.0%27.0%28.0%16.0%23.0%12.0%0%10%20%30%40%50%套餐内流量套餐内语音套餐价值套餐小类性别年龄数据蕴含价值信息创造未来广州市网迅信息技术有限公司政企离网预警模型目标通过深度数据挖掘方法,挖掘政企专线用户离网规律,并提前2个月预测用户离网概率测试分区预测在网预测离网实际在网4,507277实际离网137109离网命中率27.23%离网覆盖率47.15%模型的效能(ROC)曲线01020304050607080901000102030405060708090100随机曲线模型曲线最优曲线数据蕴含价值信息创造未来广州市网迅信息技术有限公司乐享5折目标用户模型目标为提升当前营销成功率,通过数据挖掘模型,找出意愿度更高的用户优先进行营销,利用随机森林算法,构建最终目标用户模型。32.0%10.0%8.0%8.0%6.0%6.0%6.0%6.0%6.0%6.0%0.00%10.00%20.00%30.00%40.00%近半年使用终端数性别近三个月平均漫游被叫时长-省内…近三个月平均被叫时长合约到期时间分段模型评估字段重要性测试分区预测未办理预测办理实际未办理51599300实际办理19212954办理命中率90.8%办理覆盖率60.5%提升度10.5月份外呼量接通量接通率接通后成功率总体成功率2016104497153334%2.9%1.1%2016115056187037%2.8%1.0%模型实际应用0204060801000102030405060708090100随机曲线模型曲线最优曲线模型效能(ROC)曲线数据蕴含价值信息创造未来广州市网迅信息技术有限公司乐享5折用户聚类模型为了提高乐享5折用户的活跃度及价值,我们将对用户进行分群,以达到精细化营销的目的。根据聚类模型的数据要求,需要观测用户在基准月前3个月及次月的行为表现,因此选取2016年2月作为基准月。2016年2月,出账用户17.6万,其中,套餐使用时长不足3个月的用户2.3万,疑似用完即扔用户1707户,疑似养卡用户6709户。基于精细化营销的目的,剔除套餐使用时长不足3个月及疑似养卡、用完即扔用户,最后聚类的目标用户12.4万户,接下来的聚类模型针对这部分用户进行建模。出账用户:17.6万正常:16.5万停/预拆:1.1万•疑似用完即扔:T+4个月内开始产生欠费,并且欠费后连续2个月依然有欠费记录用户•疑似养卡:省公司模型清单疑似用完即扔:1707疑似养卡:6709套餐使用时长3:2.3万聚类目标用户:12.4万数据蕴含价值信息创造未来广州市网迅信息技术有限公司聚类模型构建思路数据输入行为字段相关性分析价值字段相关性分析Z-SCORE标准化行为因子分析Z-SCORE标准化价值因子分析行为层次聚类两步聚类价值层次聚类两步聚类价值-行为聚类混合聚类行为相关字段价值相关字段降维标准化降维聚类建模模型优化群特征分析群策略建议本次聚类模型的构建,采用聚类数据挖掘中成熟的“行为-价值”分析框架,分别对用户的行为和价值特征进行聚类,并总结用户在这两个维度上的特征,从而给出用户画像由于聚类模型对于输入字段的要求,需要对行为字段和价值字段进行Z-SCORE标准化及主成分算法分析,降维之后作为输入,通过测试多个聚类算法(K-MEANS聚类算法、两步聚类算法)并选择聚类模型通过聚类的结果,分析不同用户群的特征,并针对用户特征提出针对性的营销策略数据蕴含价值信息创造未来广州市网迅信息技术有限公司行为-价值分群平面图A-1A-3A-4A-6A-2A-7A-5V-3V-2V-1V-7V-8V-4V-5V-6平均ARPU平均流量X-1低值温饱群X-6中档低活跃群X-2传统节省群X-3低端时尚群X-4流量活跃群X-5通话活跃群X-7高端稳定群通过观察用户分类在年龄、通话、流量、短信、在网时长、离网、ARPU、欠费等方面的特征及趋势,将用户分为以下7个典型用户群用户分群分布图分群号分群名称用户数用户占比X-1低端温饱群3534627.3%X-2传统节省群2382418.4%X-3低端时尚群1984915.3%X-4流量活跃群1471011.3%X-5通话活跃群1473411.4%X-6中档低活跃群64665.0%X-7高值稳定群1472711.4%数据蕴含价值信息创造未来广州市网迅信息技术有限公司七大用户群客户画像•本地消费能力较低的中老年群体,社交圈子较小,只有基础的通话需求X-1低端温饱群27.3%•本地有一定消费能力的中老年群体,有一定社交圈子,主要通信需求为通话,没有形成流量使用习惯X-2传统节省群18.4%•外来人口中消费能力较强的群体,通话活跃度非常高,且人均漫游通话时间最长,但流量需求低X-5通话活跃群11.4%•有一定消费能力的时尚年轻群体,终端新、流量使用非常活跃,同时也有一定通话需求X-4流量活跃群11.3%•本地年轻人群,消费能力不高,但追求新终端、偏好使用流量,群体流量贡献度大X-3低端时尚群15.3%•忠诚的电信老用户,通话、流量活跃度高,流失率低,终端新•外来人口人群,漫游通话需求量大,终端旧,通话和流量活跃度低,资费敏感,流失率高X-6中档低活跃群5.0%X-7高值稳定群11.4%ARPU值活跃度数据蕴含价值信息创造未来广州市网迅信息技术有限公司针对性营销策略建议根据构建的聚类模型,应用到4月份用户,其分群简要情况如下:分群号分群名称总用户数单产品用户个人单产品用户个人单产品用户占总体比例营销政策X-1低端温饱群32615309753007022.8%亲情圈子等增强用户黏性产品X-2传统节省群29275288532843521.6%话费充值送优惠、预存优惠X-3低端时尚群21758210982069315.7%4G终端升级,新千元机终端推荐,流量包推荐X-4流量活跃群17320170281666512.6%4G终端升级,新中高端终端推荐,流量包推荐,内容增值产品推荐X-5通话活跃群14246140041375010.4%基础话务包推荐,漫游话务包,套餐档次升级X-6中档低活跃群6412626059754.5%预存送话费,提高本金余额,漫游话务包推荐X-7高值稳定群17073167601633312.4%积分礼品兑换等客户关怀手段数据蕴含价值信息创造未来广州市网迅信息技术有限公司乐享5折用户生命周期分析对分析用户的户均ARPU、流量、主被叫、短信、销户率和终端更换率进行综合分析,发现流量使用量随着终端更换率的提升而逐步提升。T+5月之后在主叫通话时长未出现明显增加的情况下,流量逐月增加,但ARPU值并未表现出增加迹象,用户的流量使用习惯逐步养成。T+17月后用户的销户率处于整个生命周期当中较低的水平,并趋势稳定。0.00%2.00%4.00%6.00%8.00%10.00%12.00%0.0050.00100.00150.00200.00250.00300.00户均ARPU(元)户均流量(*10M)户均主叫(分钟)户均被叫(分钟)户均短信(条)销户率更换终端率数据蕴含价值信息创造未来广州市网迅信息技术有限公司可为用户特征分析—销户结点(1/2)销户正常ARPU84.280.9销户正常流量6341568销户正常主叫47225针对T+3月销户用户和在网8月以上正常用户,在T+2月进行特征比较,销户用户主叫语音时长为正常用户的21%,流量为正常用户的40%,ARPU无明显变化。单位:元单位:兆单位:分钟通过建模发现T+3月销户用户中,变量重要性前三的指标为:T+2月主叫环比上月减少62.8%,T+2月被叫小于等于21.5分钟,T+0月ARPU大于61.2元。T+2月主叫环比上月减少62.8%71.1%20.9%28.9%79.1%0.0%50.0%100.0%销户用户正常用户T+2月主叫环比上月减少62.8%T+2月主叫环比上月非减少62.8%76.8%30.9%23.2%69.1%0.0%50.0%100.0%销户用户正常用户T+2月被叫小于等于21.5分钟T+2月被叫大于21.5分钟T+2月被叫小于等于21.5分钟67.7%44.0%32.3%56.0%0.0%50.0%1