第三节融合传统信用分析与统计分析技术的客户信用评级基于财务指标的信用评价统计模型基于财务和非财务指标的信用评级体系一、基于财务指标的信用评价统计模型——信用风险度量模型化的初步尝试信用评分模型(线性多元判别模型)线性概率模型、Logit模型与Probit模型类神经网络技术与模糊分析(一)信用评分模型(多元线性判别模型)传统信用评级的经典方法——线性判别模型判别分析的基本框架判别分析(discriminantanalysis)的目的:针对不同群组的样本,找出最能够有效区分群组的变量,建立判别函数判别分析在信用评级中的应用:找到一组具有判别能力的变量,组成一个(或多个)判别函数,将样本按各个变量的实际观察值输入该函数,得到样本的判别分数,据此判断样本归属的信用等级线性判别模型的发展历程大卫·杜兰(1941),率先将线性判别模型应用于信用评估领域毕沃(Beaver,1966),单变量分析——对1954-1964间危机企业(79家)进行随机抽样,利用1:1配对法,寻找相同产业、相似规模的正常企业作为比较对象——考察14个财务比率在企业失败(债务违约或破产)前5年的差异程度——现金流量/负债总额是预测经营失败的最佳指标(其次为负债/总资产;资产利润率)奥特曼(Altman,1968),多变量分析提出逐步多元判别分析法(stepwisemultiplediscriminantanalysis,MDA)——信用评分模型(1)原始的Z计分模型(Altman,1968)基本思想:破产公司呈现的财务比率与经营良好的公司截然不同→利用数理统计中的辨别分析技术,对银行过去的贷款案例进行分析,选择若干最能反映借款人财务状况、对贷款质量影响最大、最具预测或分析价值的财务比率,利用权重加以综合,设计出一个能最大程度区分贷款风险度(区分破产与非破产企业)的数学模型(判断函数)模型构建:首先,选择样本Altman选取两组公司,一为破产组,一为非破产组。其次,选择变量分析一组变量(财务指标),选择变量的标准是在组内差异最小化的同时实现组间差异最大化,从原始的22个变量中选取5变量然后,将5变量组成Z计分模型X1营运资本/总资产(WC/TA)X2留存收益/总资产(RE/TA)X3税息前利润/总资产(EBIT/TA)X4权益市场值/总债务帐面值(MVE/TL)X5销售收入/总资产(S/TA)公式(判别函数):Z=1.2X1+1.4X2+3.3X3+0.6X4+0.999X5组内方差组间方差Max附表:分组均值和F比率破产组均值非破产组均值F比率X1营运资本/总资产-6.1%41.4%32.6X2留存收益/总资产-62.6%35.5%58.86X3税息前利润/总资产-31.8%15.4%26.56X4权益市场值/总债务帐面值40.1%247.7%33.26X5销售收入/总资产1.51.92.84其后,设定临界值(分类标准)(破产)下限值为1.81,其下为破产区域;(非破产)上限值为2.99,其上为非破产区域;中间是忽略(灰色)区域1.812.99检验Z计分模型的分类准确度第一类准确度:模型将破产公司确认为差第二类准确度:模型将运行良好的公司确认为强→整体准确度(最佳分界值是第一类错误成本和第二类错误成本的函数)(2)ZETA模型(1977)特点:集中研究大型公司的破产;样本更新;分析过程适当调整;反映财务标准与会计实践中的新变化;对统计判别技术进行修正与精炼。7变量模型(1)资产报酬率;(2)收入稳定性;(3)债务偿还(利息保障倍数);(4)积累盈利(资产减负债/总资产);(5)流动比率;(6)资本化率(普通股权益/总资本);(7)规模(总资产的对数)ZETA模型的分类准确度与Z计分模型的比较:提高准确度,在破产前5年即可有效划分出将破产的企业ZETA模型的最佳临界值(3)信用评分模型的优点和不足优点:相对客观且量化;对借款人信用品质进行综合评定不足:线性判别函数描述能力有限;基于历史财务数据;未将非财务指标纳入其中缺乏对信用品质的细致识别线性多元判别模型的技术局限模型的严格假定:不同群组可以用线性函数来有效区别;自变量在组内服从多元正态分布;两组的协方差矩阵相等误判代价是已知的——与现实不符合(二)基于财务变量的统计回归分析模型——线性概率模型、Logit模型、Probit模型基本思路:利用统计回归分析,估算信用等级(违约事件)与财务指标之间的相关系数在该线性回归模型中:Y——信用品质变量(比如信用等级,可设为正常1,危机0)Xj——第j项影响信用品质的自变量(如,企业规模、盈利性等财务指标)βj——Xj对信用品质的影响程度ε——随机干扰项该模型描述的是给定X的取值下Y的条件概率分布1、线性概率模型(LPM)为了得到Y的无偏估计,假定E(ε)=0,因此得到:E(Y|X)=XB其中,B表示回归系数向量(β0……βK)假设Y=1的概率为P,Y=0的概率为1-P,则有E(Y)=0×(1-P)+1×P=P换言之,E(Y|X)=XB=P由此可以估算出给定X值(财务指标水平)的情况下,Y(信用等级)会发生的条件概率,即:P(Y|X)βj——Xj每变动一单位,特定事件(如企业信用等级变化或破产)发生的概率增减βj单位实例J.Cappelleri建立的债券评级预测模型(数据:1961-66,200种AA与BBB债券数据,Moody评级)iiiiiiuXXXXY5544332221Y=1,债券评级为AAY=0,债券评级为BBBX2,负债/资本X3,利润/净资产X4,利润率的标准差(企业收益波动性)X5,净资产规模利用OLS(普通最小二乘法)估计,得到:iiiiXEXXY54322i)7(378.00572.00486.00.0179X-0.6860ˆ0.378E-7表示0.0000000378对回归模型的解释:当财务指标为给定水平时,预测企业债券评级为AA的概率对回归系数的先验估计一般会认为X2和X4的系数应为负,但样本估计值的X4为正值(其背后的含义?)线性概率模型的局限技术局限性:(1)无法保证0≤E(Yi/Xi)≤1——计算出的条件概率时而大于1,时而小于0,违反了概率必须介于0与1之间的定义(2)干扰项的非正态性——ε只取两个值,不符合正态分布假定,而是遵循二项分布(不过,OLS点估计仍然是无偏的,而且随样本无限增大,OLS估计量一般都趋于正态分布,故仍可沿用正态假定下的OLS程序)(3)干扰项的异方差性——VAR(εi)=Pi(1-pi),即依赖于Y的条件期望值,进而依赖于X。因而,OLS估计不具有最小方差性质(通过数据变换,即加权最小二乘法(WLS),将模型等式两边同除以[Pi(1-Pi)]1/2,可以使ε具有同方差性)经济含义的局限性:——假设X与y之间的关系呈线性,不论x值如何,其对条件概率的边际影响都是恒定的,不符合现实(比如:购房决策与收入水平?)2、累积概率模型线性概率模型被累积概率模型取代为避免线性概率模型对条件概率的估计值可能落在[0,1)之外的缺点,研究者改为指定事件发生概率服从某种累积概率分布函数,即可确保条件概率估计值落在[0,1)内,并且可以解决事件概率与解释变量之间的非线性关系问题(S形的概率分布曲线)Ohlson(1980)发现多元判别分析的局限性,并首先使用Logit模型最常应用的累积概率分布有两种:Logistic分布与正态分布——假设事件发生的概率服从累积Logistic分布的条件概率模型称为Logit模型——假设事件发生的概率服从累积正态分布的条件概率模型称为Probit(或Normit)模型——Logit对数单位模型假定Y为二分类变量:分布函数:则上式可表达为:0<P<1,即P代表的累积概率密度不会超乎0与1的范围之外在此函数中,P与X、B之间已非线性关系,原本不适用OLS(最小二乘)估计法,但是稍加处理,即可转换成线性函数:等式两边取对数:即,将条件概率转换成一个“胜算比”(或称机会比率,oddratio)(发生概率相对于不发生概率的强度,或者破产概率相对于正常营运概率的强度),再取对数,就可以转换成线性函数——因变量变为“胜算比”的对数,并成为解释变量的线性函数——βj表示Xj每变动一单位,“胜算比”的对数增减βj单位实例iiiiiiXXXXpp54232200000092.09041.06248.03158.06622.11ln给定X22=9.67%,X3=7.77%,X4=0.5933%,X5=4329(000),胜算比的对数是-0.4206,则企业被评为AA级的概率是39.64%——Probit概率单位模型(略)——累积概率模型的局限:须指定事件发生的概率型态,是否符合真实概率分布存在疑问——判别模型与概率模型的比较当自变量为正态分布时,二者相近,当自变量不是正态分布时,概率模型优于判别模型概率模型难以将定性指标(如企业家能力、雇员素质、外部环境等)纳入其中——判别模型与概率模型的共同局限模型的变量须由研究者主观决定,可能存在遗漏;模型中各变量可能存在自相关问题;对错误资料的输入不具容忍性,无法自我学习调控;线性多元判别分析、线性概率模型、累积概率模型均具有先天技术缺陷(三)对传统统计模型的突破——类神经网络技术与模糊分析1、类神经网络技术(NN)基本思路:模拟生物神经系统,结合相关知识,建立简化的神经系统模式,以期拥有类似人类大脑平行计算及自我学习的能力(自我学习:利用不断重复的训练过程,使系统本身能够累积经验,达到学习效果)类神经网络的基本架构(拓朴图):输入层:接收外部信息隐藏层:处理输入层传来的信息,并转化成中间结果传递给输出层输出层:将传来的讯息与门槛值比较,得到系统最后的结果,并将结果输出类神经网络的学习模式:学习——针对网络输出值与实际值的差距状况,调整权值与门槛值的过程学习模式:—固定权重型—监督式学习将网络结果与实际(正确)结果比较,不断调整神经元联结强度,以降低实际输出值与目标输出值之间的差距,直到此差距小于一定临界值为止分为前向传递式与倒转传递式—无监督式学习类神经网络技术的特点:优点:与传统统计方法最大差异在于具有学习能力,可以依据新样本与环境动态调整,并容忍错误及资料遗失。对于无法以线性模型区别群组的问题,尤其能发挥优势局限:学习过程的“黑箱操作”2、模糊分析基本思路:根据模糊逻辑,利用模糊数学进行分析模糊数学:将数学应用的范围从精确现象扩大到模糊现象,利用精确的运算符号与演算法则,以处理不精确性、不确定性、模糊性的问题二、融合传统信用分析与统计分析的客户信用评级体系基于统计判别技术的百分制计分法基于统计回归模型的评级方法(一)基于统计判别技术的百分制计分法——计算机技术辅助下的信用评分系统关键:评价指标设置(财务指标、非财务指标);权重分配;评分标准;临界值该系统的两个基本前提预设:企业过去的行为能很好地预示其将来的行为;具有类似特征的企业的还贷行为也是类似的(二)基于统计回归模型的评级方法1)筛选关键指标(keydrivers)估算备选指标对事后违约频率的敏感系数方法:决策树法、多元回归分析、因素递减技术(兼顾专家意见)2)计算初步违约概率(PD)方法:回归分析模型(线性概率模型LPM、Logit模型、Probit模型)3)调整违约概率引入定性指标(兼顾专家意见)4)确认客户风险等级(三)贷款预期违约损失EL=PD×LGDPD:来自客户评级LGD:来自债项评级