数据挖掘案例研究_手机电视经营挖掘

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

手机电视经营分析挖掘刘文TEL:139176430202008.03.31STT©2008Confidential商业理解:项目目的z“InGodwetrust:allothersmustbringdata”—W.EdwardsDeming■“除了上帝,我只信数据.”z依据数据,全面分析手机电视的经营分析情况z为手机电视经营分析作决策支持STT©2008Confidential商业理解:手机电视介绍z概念■手机电视是中国移动开展的基于手机的新媒体业务,目前主要有CCTV手机电视、东方手机电视、CRI手机电视、影视专区等业务。用户可以用手机在线收看直播节目,并且可以点播、下载观看其他精彩的节目内容,而在夜间,可以使用“闲时下载”功能,下载当日精彩推荐节目。z业务介绍■CCTV共开通个直播频道与电视信号同步,包含CCTV1—6新闻、音乐,以及各个轮播频道。余套直播滚播频道和各类点播栏目;新的栏目和内容将不断推陈出新。包含影视、动漫、体育、时尚、音乐、娱乐综艺等分类,每天都会更新内容。z计费方式■通信费和信息费两部分■通信费统一按照当地资费标准收取■信息费资费根据不同的业务内容收取■CCTV手机电视业务目前提供两种信息费资费:•1)包月方式:6元/月•2)按次方式:1元/次■东方手机电视业务目前提供两种信息费资费:•1)包月方式:10元/月•2)按次方式:1元/次STT©2008Confidential数据理解:从数据发现经营现状z取10月份入网的东方包月用户的2007年10月--2008年2月的消费情况。点播,下载,直播一用户同一时间内多次点播数据预处理,杜绝trashin,trashout数据预处理,杜绝trashin,trashout可能情况:节目代码不一致,但是节目名称相同:“第一段”STT©2008Confidential数据理解:数据探索z简单统计指标■月入网用户数■月人均收看次数■月均下载量■月均消费■消费人群平均年龄■消费人群月均账单额■……STT©2008Confidential粘着度分析(1)z用户手机电视下载业务粘着度分析几乎所有用户的使用量均成下降趋势STT©2008Confidential粘着度分析(2)z用户所有类型(下载,直播,点播)粘着度分析所有10月份入网用户月均使用量所有10月份入网后在网用户月均使用量STT©2008Confidential粘着度原因分析z原因分析■服务质量:调查何种原因(节目太少?下载速度慢?终端支持?);引入投诉信息■定价因素:引入账单信息,查看手机电视消费额占总消费额比重z改进方式技术:3G营销:■关联规则:寻找相关联业务,改进本业务拓宽方式;发现节目之间关联,进行交叉销售■客户分群:细分客户群,找出各个客户群群体特征,有针对性定制产品■时间序列:分析业务将来走势,进行未来预测■分类模型:客户获取模型,客户流失模型,发现客户群将来行为因素STT©2008Confidential关联规则模型z数据--交易记录z目的:发现商品之间关联■AÆB■关联规则计算方法P(A-B)=P(B|A)=P(AB)/P(A)IKEAIKEA淘宝淘宝STT©2008Confidential关联规则原理z概念AÆB■目(session):customer■项(item):transaction■前因(antecedent):A■结果(consequent):B■支持度(support):P(AB)■置信度(consequent):P(B|A)■规则长度:Length(P(C|AB))=3z算法:1.APriori2.FP-Tree–FPGrowth3.FPV-FrequentPatternVerticalCustomer1ACustomer1BCustomer1CCustomer2DCustomer2ACustomer3BCustomer3CCustomer4DCustomer4ACustomer4C……事件集Customer1Customer2Customer3Customer4…客户集STT©2008Confidential手机电视下载节目关联分析(1)z数据事件集客户集STT©2008Confidential手机电视下载节目关联分析(2)z建模STT©2008Confidential手机电视下载节目关联分析(3)z导入客户集STT©2008Confidential手机电视下载节目关联分析(4)z客户集数据描述STT©2008Confidential手机电视下载节目关联分析(5)z导入事件(交易)数据STT©2008Confidential手机电视下载节目关联分析(6)z参数设置STT©2008Confidential手机电视下载节目关联分析(7)z概述STT©2008Confidential手机电视下载节目关联分析(8)z训练模型STT©2008Confidential手机电视下载节目关联分析(9)STT©2008Confidentialz模型概述手机电视下载节目关联分析(10)STT©2008Confidential手机电视下载节目关联分析(11)z关联规则探索STT©2008Confidential关联规则模型z案例:发现数据业务之间关联ID使用业务客户1彩铃客户1彩信客户1手机报客户2来电提醒客户2手机报客户3语音杂志客户3彩铃客户4彩信ID使用业务(10-20)客户1彩铃(10-20)客户1彩信(10-20)客户1手机报(1-10)客户2语音杂志(1-10)客户2手机报(10-20)客户3语音杂志(10-20)客户3彩铃(1-5)客户4彩信(1-10)表1表2STT©2008Confidential客户细分(CustomerSegmentation)z网站:新浪新闻首页—按类别分类文件,按心情分类……z可口可乐z中国移动的三个品牌:■全球通:贾樟柯,王石■动感地带:周杰伦■神州行:葛优z中国联通品牌STT©2008ConfidentialHELLO,MOTO!----摩托,现在还好吗?z两年间中国市场份额跌去三分之二zMOTO没落的五个原因■过份依赖单一明星产品,未能对用户有效分类■降价过快导致渠道利润骤降,中高端形象受损■与运营商合作不够深入,失利定制手机市场■工业设计未能保持创新,未能充分利用品牌优势■错失技术潮流,向网络,娱乐,多媒体转型缓慢STT©2008Confidential单一主打产品8000X,1984年上市,世界第一台手机,重大贡献磅,售价3995美元V998+,2000年12月上市,翻盖,双频,自编铃声V70,2002年2月上市,360度旋转开盖,圆形显示屏RAZRV3,2004年10月上市,超薄机身,金属键盘明1200,2004年10月上市,时尚商务,手写RAZRV8,2007年6月上市,高速处理器,大内存,多媒体应用STT©2008ConfidentialSTT©2008Confidential案例:套餐梳理资费案梳理结合应用——各资费案的定位与作用资费案梳理结合应用——各资费案的定位与作用IP商务产品0月租、双向产品区域优惠产品农村城市客户价值(消费/话务量)高中低客户需求(细分市场)动感学生动感地带全球通全球通套餐全球通套餐(高月租、纯单向产品)20元50元100-120元80元长话优惠产品商务卡200分钟限制400分钟限制主流资费细分市场补充型资费低月租、高单价,单向产品系列神州行STT©2008Confidential客户分群方法z按照单个维度来分■客户画像•包月沉默用户:包月用户,但近n个月内从未登陆过。•包月懒惰用户:包月用户,最近n个月登录过,但未使用过任何业务。•包月活跃用户:包月用户,最近n个月访问过手机电视页面,并使用过业务。•尝试型用户:非包月用户,最近n个月内访问过手机电视WAP站点,但主要使用免费业务。•犹豫型客户:非包月用户,最近n个月内访问过手机电视WAP站点,但主要使用按次业务。■弊端:不能观察多个维度之间关系■真实的用户群体可能不是如此的分布形式z按照两个或三个维度分■行为分群^价值分群z自动聚类STT©2008Confidential两维度分群:中央音乐平台全曲用户画像价值分群价值分群((消费金额消费金额))行为分群行为分群((下载曲目下载曲目))V1V1V2V2V3V3V4V4V5V5V6V6B1B1B2B2B3B3B4B4B5B5B6B6昙花一现高盈利群低成本群沉默群STT©2008Confidential聚类模型z商业问题■识别客户群体的特征,进行产品定制z数据准备■各个节目收看次数■10月新增东方梦视界包月用户节目使用(大于300条)z建立模型算法■k-means、C-means、O-cluster、Kohonen自组织神经网络STT©2008Confidential**************初始中心初始中心原理:客户分群(Kmeans算法)****XYZ……STT©2008Confidential*****************初始点初始点测量距离测量距离Kmeans算法*STT©2008Confidential******************Kmeans算法初始中心初始中心测量距离测量距离初始分簇初始分簇*STT©2008Confidential******************移动中心移动中心Kmeans算法初始中心初始中心测量距离测量距离初始结果初始结果**STT©2008ConfidentialKmeans算法****************移动中心移动中心初始中心初始中心测量距离测量距离初始结果初始结果最终结果最终结果…………**STT©2008Confidential聚类算法技术细节z数据进行标准化z除去异常值z变指数分布平缓化z合适分群数目:5—10群z采用监督变量规划其它变量,使得分群切合目标z增强模型的可解释性STT©2008Confidential一般分群:无监督分群年龄年青中年老年变量:年龄收入用户1年轻低用户2中年高用户3老年中用户:年青年青中年中年老年老年低低中中高高用户用户11用户用户33用户用户22年龄年龄收入收入收入低中高无监督:没有标准化距离的方式STT©2008Confidential年龄购买频率年轻40%中年20%老年40%收入购买频率Small20%Medium60%High20%变量目标变量年龄收入用户1年青(40%)低(20%)用户2老年(40%)高(20%)用户3老年(40%)中(60%)用户:中年中年年青年青++老年老年高高++低低中中用户用户1=1=用户用户22用户用户33年龄年龄收入收入分群改进:有监督分群有监督:目标变量标准化各个变量STT©2008Confidential*****************增强模型的可解释性z最小描述长度(MinimumDescriptionLength)用MDL转换“模糊形状”簇为超立方体,i.e.SQL表达式.STT©2008Confidential手机电视客户分群(1)z聚类模型STT©2008ConfidentialSTT©2008ConfidentialSTT©2008ConfidentialSTT©2008ConfidentialSTT©2008Confidential模型解释模型应用模型部署STT©2008ConfidentialSTT©2008Confidential模型解读z群3:CCTV群■对CCTV的所有节目使用频率很高,尤其音乐台和新闻台z群4:休闲群■对新闻娱乐和音乐频道使用频率高■三个重要变量:新闻娱乐-all音乐频道-alllove-radio-1z群6:音乐一族■对音乐情有独衷■二个重要变量:love-radio-1音乐频道-allz群1:音乐一族■同群6z群7:低使用群■偶尔听音乐■重要变量:音乐频道-all=1z群5:低使用群■偶尔下载娱乐■重要变量:美女血精灵性感热舞=1z群2:沉默群■几乎无任何使用记录客户价值参见模型CLUSTERSTT©2008Confide

1 / 64
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功