735您能预测哪些客户有可能流失吗?本章中,我们将阐述可预测哪些客户在不久的将来可能会从您公司流失的数据挖掘方法,电信业务常将这种方法称为客户流失预测。如今,电信业务市场日渐成熟,电信公司也意识到主动性客户关系管理的重要性,从而非常关注对现有客户服务,即如何维系重要客户,以及怎样使之为公司带来更丰厚的利润?通过数据挖掘,您可以根据客户历史数据获得数据挖掘模型,从而生成公司很可能流失的客户列表。最终,这将为您制订有效的市场营销战略提供有价值的业务洞察力,以防止公司客户的流失。本章所阐述的客户流失预测过程是以采用数据挖掘方法的预测建模为基础的,包括对每个客户的流失可能性的预测,以及对可能流失客户及不会流失客户的分类。745.1业务需求客户流失预测通常因其市场饱和度和动态市场变化等典型市场特征而成为电信公司首要考虑的问题。由于电信市场日趋饱和,所以获取新客户的成本比留住现有客户群要昂贵得多,并且竞争对手、技术,以及法律法规等动态市场变化更容易使客户流失到其他公司。5.1.1数据挖掘的作用何在?客户流失管理要求对客户行为具有良好的了解。首要问题是要弄清楚哪些客户将会从公司流失,以及哪些客户会给公司带来利润。为防止客户流失,公司需要采取的首要措施是在客户流失到其他公司前掌握客户行为,并努力找到客户流失的行为模式,这样公司就可以提前采取一些规避措施。您可以通过简单的查询方式、OLAP分析,或仅根据经验来了解客户行为。但是,在把握与客户流失相关的客户行为的过程中,数据挖掘起着极其重要的作用,而这些客户行为隐藏在诸如呼叫事务等庞大的数据集中。应当建立合适的数据挖掘模型来识别客户流失行为模式,并为客户提供适当的产品和服务以防止流失。在以下章节中,我们将阐述如何应用数据挖掘方法来防止电信企业的客户流失现象,以及如何将其应用到您的CRM系统中。5.1.2起点?该通用方法的第一步是把您要提出的业务需求转换成一个或多个可通过数据挖掘解答的问题。客户流失预测是一种不断变化的过程,而非单一事件。客户流失预测与公司的客户保持过程密切相关。客户保持过程涉及三个方面:明确哪些客户可能会流失。确定可能流失的客户中您需要保留哪些客户。开发客户保持策略(开展客户保持活动)以防止好这些客户流失。作为客户保持过程的基础,客户流失预测对公司而言是一件非常有意义的工作。然而,客户流失预测所面临的挑战在于,如何预测未来的客户行为,以及如何根据这一预测针对客户采取相应的措施。75重要的一点是,必须牢记:成功的客户流失预测模型需完全适合公司客户保留程序。客户流失预测建模不仅包括对客户流失情况进行评分,还包括业务战略开发中会用到的客户流失描述。我们将详细讨论数据挖掘是如何利用您公司可用的变量来让您预测哪些客户很可能会流失。其中的基本假设是,从公司流失的客户在流失之前都会出现一些显而易见的行为或特征。因此,您可以在其从公司流失之前尽早发现这些行为。在构建客户流失预测模型时,我们并不建议您对各种各样的客户流失情况进行整体预测。对客户流失进行明确的定义,并对流失类型加以过滤,将会使预测能力最大化,从而使其对业务用户更具意义。以下章节阐述的客户流失定义和流失过滤是流失预测过程中最为重要的步骤之一。5.1.3客户流失的定义客户流失是客户因某种原因而离开为其服务公司的一种常见行为。客户离开某公司的原因多种多样。根据客户流失原因,我们可识别不同种类的客户流失。可根据促成客户流失的责任方(公司或客户)来对客户流失进行分类。自愿流失如果导致客户流失的首要责任在于客户本身,我们称之为自愿流失。在这种情况下,可根据各种流失原因对自愿流失进行进一步细分,如:合同到期、手机变更、服务质量、业务竞争、专业流失、技术更改、法律法规变更等等。总之,一切不属于非自愿流失的客户流失都被认为是自愿流失。76提示:自愿流失的原因多种多样,但主要取决于各个国家的电信政策。例如,如果客户对公司应尽的义务有一定时间期限,那么客户流失的主要原因就可能是合同到期。但是,如果客户对公司没有义务,那么更常见的客户流失原因可能是客户的专业发生变化。专业流失客户总是希望从其他服务提供商处获得更好的服务,因此会频繁地改变向其提供服务的公司。非自愿流失非自愿流失是指客户流失责任在于公司的一种客户流失。造成这种情况下,可能是因为公司因为某种原因(如:资信问题)而决定终止向客户提供服务。5.1.4客户流失过滤根据公司的客户流失原因定义不同的客户流失类型是非常重要的,因为如果我们能针对每一种模型来预测特定类型的客户流失,那么在建立和实用预测模型时,流失预测的效果就会更好。提示:区分客户流失类型的另一种方法是:首先,根据将从公司流失的客户情况建立模型,然后再利用其它模型确定流失原因(客户流失类型)。用于区分不同客户流失类型的过滤程序包括以下步骤:弄清楚客户流失类型(从某个公司(国家)流失到另一公司(国家))。确定需要预测的客户流失类型。定义把该类客户流失同其他客户流失类型区别开来所需的过滤过程。本章中,将以无线公司的私人用户为例来进行自愿客户流失预测,其中不涉及哪些为获得更好服务而从公司流失的客户。有关因资信问题而导致的非自愿客户流失,请参阅第6章“如何发现客户的真正价值”。775.2备用数据很显然,如果没有关于您客户的数据,您就无法进行数据挖掘。但是,哪些数据才是您需要的呢?数据挖掘方法的第二阶段将识别哪些数据是解决业务需求所需的数据,以及从何处获取这些数据。以下是电信公司客户流失预测建模一般所需的数据类型:客户流失指标客户信息数据-人口统计数据-合同数据呼叫数据计费和支持数据根据事务数据推导出的客户指标其它数据5.2.1客户流失指标在预测建模过程中,我们需要用于建立预测模型的目标变量。即需要预测的变量;本案例中为客户流失变量。5.2.2客户信息数据客户信息数据可分为两组。一组是客户人口统计学数据,另一组是与客户合同相关的数据。人口统计学数据诸如年龄、性别、职业等客户统计数据可在首次向其提供电话服务时由客户提供,这些数据对于识别或阐述客户群的特征非常有用。但是,某个客户的私人信息可能会随时发生变化,并且,如果公司不经常收集可靠数据的话,这些就容易变得过时或不准确。78合同数据合同数据是一些与客户合同相关的数据,如合同开始时间、价格方案、支付方式、服务描述、客户所选手机类型等。这些信息可通过最初的合同收集,但它们可能会因之后的公司策略或客户计划的变更而改变。有时,合同变更信息对客户流失预测而言是最有用的信息。因为电信行业的市场情况和政策因公司(或所在国)的不同而不同,因而我们不能对客户流失预测最有用的因素一概而论。5.2.3呼叫数据呼叫数据可以各种方式对客户呼叫行为进行描述。通常,呼叫数据应可在一定时间范围内进一步汇总,以供客户流失预测建模时使用。在该案例中,我们使用了过去6个月的呼叫数据。呼叫数据可用呼叫次数、呼叫记录,或呼叫额表示。与呼叫相关的信息可成为决定客户流失的重要因素之一,通常表示为推导数据的基础。呼叫数据可分为三组。一组为呼叫频率,一组为呼叫质量,第三组为呼叫模式。呼叫频率呼叫频率数据可用客户呼叫行为表示,如:对最常用电话号码的呼叫次数、对不同电话号码的呼叫次数等等。呼叫质量呼叫质量数据包含有关客户在呼叫期间是否遇到问题的信息。成功呼叫次数、中断呼叫次数和失败呼叫次数均是表示呼叫数据质量的参数。呼叫数据质量常常是预测客户流失行为的有用数据。呼叫模式呼叫模式数据用于描述与特定时间范围或某种呼叫类型相关的客户行为。呼叫模式数据可以折扣时间范围内的呼叫次数、夜间呼叫次数和来电次数为例。795.2.4计费和支付数据计费和支付数据可包含计费数额、客户给公司带来的收入和欠款数额等信息。对因资信问题引起的非自愿客户流失问题与自愿客户流失问题而言,此类信息具有重要作用。5.2.5根据呼叫事务数据推导的主要指标正确推导产生的主要指标(亦称主要指标或主要性能指标)可将实际业务经验转化成数据,而客户行为则可利用从详细呼叫数据推导而来的数据得到充实。推导指标的示例对客户流失预测建模有着重要作用。在第81页的5.3节“初始化及及预处理数据”中,您可找到对部分此类指标的详尽阐述。呼叫质量指标呼叫行为趋势指标客户影响范围指标灵活性指标5.2.6其它数据可能有些特定因素会被公司内客户流失管理部门根据经验认为是很重要的因素,如:客户索赔数据和竞争对手的信息数据。客户索赔数据可用于描述客户对您服务的满意度。竞争对手信息可帮助公司识别其他公司可能导致您客户大量流失的行为。5.2.7用于客户流失预测的数据模型表5-1是本章用于客户预测建模的变量样表——资料来源于一家无线电信公司。表5-1数据模型样表变量名说明CHURN_INDICATOR1Churn时间延迟后客户是否从公司流失。CUSTOMERINFO80变量名说明2Age年龄3Gender性别4Job职业5Agent首次使用电话的地方6Handset_type手机型号7New_handset现在使用的手机是或不是新手机。8Priceplan价格计划9Pay_method支付方式10Status客户当前联系状态(可联系、暂时不可联系等)11Grade客户等级(金、银、铜牌客户等)12Contract_exp合同到期日。13Tenure自开始业务关系以来已持续了多少个月。14Suspen_before在最近6个月内电话被中止的次数。15Discon_before最近6个月内电话打不通的次数。16Handset_ch手机型号变更次数。17Pay_method_ch支付方式变更次数。18Priceplan_ch价格计划变更次数。19Svc_call呼叫相关服务(呼叫转发、呼叫等待)的次数。20Svc_info信息相关服务(如SMS)的次数。21Svc_data数据相关服务的次数。22Svc_discount与折扣优惠计划相关服务的次数23Svc_free免费服务的次数24Svc_nonfree有偿服务的次数呼叫81变量名说明25Total_dur总通话时长分钟数。26Inbound_dur拨出呼叫的时长。27Discount_share折扣优惠呼叫(常规呼叫方面)。28Complet_call3个月内完成呼叫的次数。计费/支付29Revenue收入30Bill_amt话费额31Pay_delayed_before费用支付延迟发生过多少次?推导指标32Outsphere拨打不同电话号码的次数。33Mobility呼叫期间所访问的网元的数量。34Concentration就总呼叫次数而言,对最常用两个电话的呼叫。35Quality与失败呼叫相关的成功呼叫。36Call_trendN个月内的呼叫记录(分钟)趋向。5.3初始化及预处理数据为了创建我们的数据模型,我们必须收集所有的原始数据,并将其转换成数据模型所需的格式。我们称此阶段为过程初始化及预处理阶段,即数据挖掘方法的第三阶段。但是,在把数据初始化成进行数据挖掘所需格式的综合表格、视图或平面文件之前,客户流失预测需要考虑预测特征所需要的其它因素——以历史数据为基础预测未来。确定时间窗口在初始化所有已定义数据时,有必要指明建议采用的数据采集时间范围。82为了确定在模型中将要使用哪些客户流失信息及客户数据时间范围,您应定义以下三个项目:数据窗口:用于构建模型的输入变量时间范围。预报窗口:用于预测和在初始化目标预测变量(客户流失指标)时采用的时间范围。客户流失预测模型常指“WHO以及WHEN”模型,这种模型试图解决“哪些客户会从公司流失”和“这些客户将在什么时候离开公司”的问题。预报窗口是客户流失建模的“WHO”部分。在建模阶段,预报窗口是确定客户是否会离开为其提供服务公司的时间框架。时间间隔:数据窗口和预报窗口之间的时间间隔。在此,我们取数据窗口为六个月、时间间隔为两个月、预报窗口为一个月,如图5-1所示。在建模阶段,客户流失信息将和从二月到七月这六个月时间内的、在七月底以前现有客户的历史数据一起使用,无论这些客户是否会在十月离开公司都是如此。在预测十一月可能流失的客户时