-1-贝叶斯判别、费希尔判别法的计算机操作及结果分析一、实验内容、目标及要求(一)实验内容选取140家上市公司作为样本,其中70家为由于“财务状况异常”而被交易所对其股票实行特别处理(SpecialTreatment,简称ST)的公司,另外70家为财务正常的公司。为了研究上市公司发生财务困境的可能性,以“是否被ST”为分组变量,选择资产负债率、总资产周转率和总资产利润率几个财务指标作为判别分析变量,这三个指标分别从上市公司的偿债能力、资产管理能力和获利能力三个不同的角度反映了企业的财务状况。(二)实验目标贝叶斯判别、费希尔判别法的计算机操作及结果分析。(三)实验要求要求学生能熟练应用计算机软件进行判别分析并对结果进行分析,培养实际应用能力。二、实验准备(一)运行环境说明电脑操作系统为WindowsXP及以上版本,所需软件为SPSS16.0。(二)基础数据设置说明将数据正确导入SPSS,设置相应的变量值。-2-三、实验基本操作流程及说明(一)系统界面及说明同实验一。(二)操作步骤1.选择菜单项Analyze→Classify→Discriminate,打开DiscriminateAnalysis对话框,如图4-1。将分组变量st移入GroupingVariable列表框中,将自变量x1-x3选入Independents列表框中。选择Enterindependentstogether单选按钮,即使用所有自变量进行判别分析。若选择了Usestepwisemethod单选按钮,则可以根据不同自变量对判别贡献的大小进行变量筛选,此时,对话框下方的Method按钮被激活,可以通过点击该按钮设置变量筛选的方法及变量筛选的标准。图4-1DiscriminateAnalysis对话框2.单击DefineRange按钮,在打开的DefineRange子对话框中定义分组变量的取值范围。本例中分类变量的取值范围为0到1,所以在Minimum和Maximum输入框中分别输入0和1。单击Continue按钮,返回主对话框。3.如果不想使用全部的样本进行分析,单击Select按钮,则DiscriminateAnalysis对话框下方会跳出一个SelectionVariable列表框,将一个选择变量移入SelectionVariable列表框,并单击Rule按钮,设置选择条件。这样,只有满足选择条件的观测才能参与判别分析。4.单击Statistics按钮,在跳出的Statistics子对话框中指定输出的描述统计量和判别函数系数。该对话框中各选项的含义如下:Descriptives选项栏:输出原始数据的描述性统计量Means:输出各类中所有自变量的均值、组内标准差以及总样本的均值和标准差;UnivariateANOVA:进行单因素方差分析,检验的原假设为不同类别中自变量的均值不存在显著差异;Box’sM:对各类的协方差矩阵是否相等进行检验。Matrices选项栏:输出各种不同的协差阵和相关系数矩阵Within-groupscorrelationmatrix:平均组内相关系数矩阵,它是由平均组内协差阵-3-计算得到的;Within-groupscovariancematrix:平均组内协差阵,它是由各组的协差阵平均后得到的;Separate-groupscovariancematrix:分别输出各个类的协差阵;Totalcovariancematrix:总体协差阵。FunctionCoefficients选项栏:输出不同的判别函数系数Fisher’s:给出Bayes线性判别函数的系数。(注意:这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fisher’s,是因为按判别函数值最大进行归类这种思想是由Fisher提出来的。这里极易混淆,请读者注意辨别。)Unstandardized:给出未标准化的Fisher判别函数(即典型判别函数)的系数。(SPSS默认给出标准化的Fisher判别函数系数)这里我们仅选择FunctionCoefficients选项栏中的两个选项Fisher’s和Unstandardized,以便得到所需要的Bayes判别函数和Fisher判别函数,其余选项均不作选择。图4-2Statistics子对话框5.单击Classify按钮,打开Classification子对话框,如图4-3。对话框中各选项的含义如下:PriorProbabilities选项栏:用于设定在Bayes判别法中各类的先验概率,其中Allgroupsequal表示各类先验概率相等,Computefromgroupsizes表示用样本频率代替先验概率;UseCovarianceMatrix选项栏:用于指定计算判别函数所使用的协差阵,其中Within-groups表示使用平均协差阵计算判别函数,而Separate-groups表示计算判别函数时使用各组自身的协差阵;Display选项栏:Casewiseresult选项表示输出一个判别结果表,该表中给出了每个样品的判别分数、后验概率、实际类和预测类编号等;Summarytable选项表示输出错判矩阵;Leave-one-outcalssification选项表示输出每个样品的分类结果,这里的分类所依据的判别函数是由除该样品之外的其它样品导出的,因此也称为“交互校验”;Plots选项栏:可以指定输出几种直观地展现分类结果的统计图。这里,我们仅选择Display选项栏中的Summarytable选项,即要求输出错判矩阵,以便从总体上把握模型的判别功效,其余均保持默认选项。-4-图4-3Classification子对话框6.单击Save按钮,打开Save子对话框,如图4-4,指定在数据文件中生成代表判别分类结果和判别函数值的新变量。生成的新变量的含义如下:Predictedgroupmembership:存放判别样品所属类别的值;Discriminantscores:存放Fisher判别函数值的值,有几个典型判别函数就有几个判别函数值变量;Probabilitiesofgroupmembership:存放样品属于各类的Bayes后验概率值,总体分为几类就生成几个后验概率变量。将对话框中的三个复选框均选中,单击Continue按钮返回。图4-4Save子对话框7.返回判别分析主界面,单击OK按钮,运行判别分析过程。(三)结果分析1.Fisher判别法的相关输出结果表4-1是Fisher判别函数的特征值表。Eigenvalues为相应Fisher判别函数的特征值,等于判别函数值组间平方和与组内平方和之比,该值越大表明判别函数效果越好。特征值的个数与Fisher判别函数的个数相等,由于本例中总体只有两类,所以至多有一个Fisher判别函数。CanonicalCorrelation为典型相关系数,等于组间平方和与组内平方和之比的平方根。表4-2给出了Fisher判别函数有效性检验结果。该检验的原假设是不同组的平均Fisher判别函数值不存在显著差异。从表中给出的p值来看,0.000.05p,说明在0.05的显-5-著性水平下有理由拒绝原假设,即应认为不同组的平均Fisher判别函数值存在显著差异,这意味着判别函数是有效的。表4-1Fisher判别函数特征值Eigenvalues.746a100.0100.0.654Function1Eigenvalue%ofVarianceCumulative%CanonicalCorrelationFirst1canonicaldiscriminantfunctionswereusedintheanalysis.a.表4-2Fisher判别函数有效性检验Wilks'Lambda.57376.0943.000TestofFunction(s)1Wilks'LambdaChi-squaredfSig.表4-3和表4-4分别给出了标准化的Fisher判别函数和未标准化的Fisher判别函数。标准化的Fisher判别函数是由标准化的自变量通过Fisher判别法得到的,所以要得到标准化的Fisher判别函数值,代入该函数的自变量必须是经过标准化的。而未标准化的Fisher判别函数系数由于可以将实测的样品观测值直接代入求出判别函数值,所以该系数使用起来比标准化的系数要方便一些。由表4-4可知,Fisher判别函数为:123()1.0632.9631.06811.856UXXXX表4-5给出了类中心处的Fisher判别函数值,该函数值是根据未标准化的Fisher判别函数计算的。这样,只要根据Fisher判别函数计算出各样品的函数值后,再比较它们分别离各类中心的距离,就可以得知它们的分类了。表4-3标准化的Fisher判别函数系数StandardizedCanonicalDiscriminantFunctionCoefficients-.451.329.721资产负债率总资产周转率总资产利润率1Function表4-4未标准化的Fisher判别函数系数CanonicalDiscriminantFunctionCoefficients-2.9631.06811.8541.063资产负债率总资产周转率总资产利润率(Constant)1FunctionUnstandardizedcoefficients表4-5类中心处的Fisher判别函数值-6-FunctionsatGroupCentroids.858-.858是否st非STST1FunctionUnstandardizedcanonicaldiscriminantfunctionsevaluatedatgroupmeans2.Bayes判别法的相关输出结果表4-6给出了各类总体的先验概率。由于我们在Classification子对话框的PriorProbabilities选项栏中选择了默认的Allgroupsequal选项,所以系统自动给每类分配了0.5的先验概率。表4-6各类的先验概率PriorProbabilitiesforGroups.5007070.000.5007070.0001.000140140.000是否st非STSTTotalPriorUnweightedWeightedCasesUsedinAnalysis表4-7给出了Bayes线性判别函数的系数。表中的每一列表示样品判入相应类的Bayes判别函数系数。在本例中,各类的Bayes判别函数如下:第一组:11235.59917.2504.60912.214yXXX第二组:21237.42322.3332.7778.118yXXX将各样品的自变量值代入上述两个Bayes判别函数,得到两个函数值。比较这两个函数值,哪个函数得出值比较大就可以判断该样品判入哪一类。例如,本例中第一个待判样品公司——“国投电力”的自变量值分别为:1230.0551.835-0.044xxx,,将其代入判别函数,得到:123.273-0.748yy,比较两个值,可以看出13.273y最大,据此得出第一个待判样品应该属于第一组,即非ST类。表4-7Bayes判别函数-7-ClassificationFunctionCoefficients17.25022.3334.6092.77712.214-8.118-5.599-7.423资产负债率总资产周转率总资产利润率(Constant)非STST是否stFisher'slineardiscriminantfunctions3.模型的判别功效表4-8给出了模型的错判矩阵。从表中可以看到,在70家实际被ST的公司中,有59家被正确地判别,11家被错判为财务正常的,正确率为84.3%;在70家财务正常的公司中,有61家被正确预测,9家被错判,正确率为87.1%;模型总的预测正确率为85.7%,说明模型的判别效果比较理想,但比二项Logistic回归模型的判别功效(87.9%)稍差。从表中还可