东华大学管理学院研究生课程--应用统计期末案例1目录1研究概要........................................................21.1背景介绍......................................................21.2数据选择......................................................21.3统计方法......................................................22SPSS统计分析结果................................................32.1描述统计——两行业特征的比较.................................32.2两个独立样本的非参数检验——银行业与证券业各指标分布的差异....42.3相关分析——指标间的相关性....................................52.4多元线性回归分析——资产利润率的决定..........................62.5主成分分析——财务指标的归类.................................72.6聚类分析——银行的分类.......................................112.7判别分析—深发银行与华夏银行的类目判别.......................142.8方差分析——中国银行和宁波银行的盈利水平差异.................152.9多维尺度分析——银行相似度分析...............................162.10时间序列——股价的随机性验证................................193结论...........................................................204总结...........................................................21附录.............................................................22东华大学管理学院研究生课程--应用统计期末案例2银行业和证券业的统计分析——从上市公司的角度1研究概要1.1背景介绍随着中国金融市场的逐步完善与繁荣,越来越多的人开始关注这个领域。而作为金融市场重要组成部分的证券市场,理所应当地吸引了人们最多的眼球。本次统计大作业的研究中心选择也正是基于这种考虑。在行业类型的选择上,我们结合了小组成员的专业和兴趣,确定了金融行业的两大主要组成部分——银行业与证券业。以期通过SPSS统计软件进行相应的统计分析,寻找这些公司间的共性与特性,为投资者的投资提供有用的参考。1.2数据选择我们从A股上市的银行和券商中分别选取十家,根据其2009年6月30日的半年报计算出九个主要的财务指标:股东权益比、负债权益比、主营收入增长率、管理费用比例、总资产周转率、资产负SPSS统计软件债率、每股收益、经营净利率和资产利润率。数据见附表1。1.3统计方法通过上述财务指标比较分析银行业与证券业的差异、盈利水平以及股价的变动等方面。我们运用到的统计方法包括描述统计、相关分析、多元线性回归、方差分析、两个独立样本的非参数检验、主成分分析、聚类分析、判别分析、多维尺度分析、时间序列分析。东华大学管理学院研究生课程--应用统计期末案例32SPSS统计分析结果2.1描述统计——两行业特征的比较我们分别对银行和券商这两个行业的十组数据进行统计描述,以求对两行业之间的特征能有个大致的掌握。结果如下所示:(1)银行业:DescriptiveStatistics102.89038.81325.4629201.7949295101034.22713359.69861917.5398677.671496810-14.180920.24631.43253012.19339921019.791342.244631.1914307.088499210.0114.0172.013950.00184351091.148297.106794.4869101.806937010.16151.2446.491950.33110681033.486052.292841.5019005.695424510.5743.8506.726730.092742410股东权益率负债权益比主营收入增长率管理费用比例总资产周转率资产负债率每股收益经营净利率资产利润率ValidN(listwise)NMinimumMaximumMeanStd.Deviation(2)券商:DescriptiveStatistics1016.588849.392232.0929109.225886910101.7958499.8393238.482430115.087983110-50.8686220.486524.49437075.16175131023.725050.127635.9664407.270932610.0526.0919.074830.01177641050.279277.943764.4972908.809501610.1371.7452.405870.19140901035.167959.348647.1747307.8281807103.70245.93194.452020.698998110股东权益率负债权益比主营收入增长率管理费用比例总资产周转率资产负债率每股收益经营净利率资产利润率ValidN(listwise)NMinimumMaximumMeanStd.Deviation通过上表可以看出(1)券商的股东权益比均值为32.09291远大于银行的5.46292,说明证券行业风险较大要求券商有较强的抵御外部风险的能力;(2)银行的负债权益比1917.5398相较证券业的238.48243高,说明银行的负债比例较高,这主要是由于银行吸收存款的特性造成的;东华大学管理学院研究生课程--应用统计期末案例4(3)从主营收入增长率来看,银行业发展比较稳定,而券商的成长能力较强。(4)比较两个行业的盈利水平,可以发现券商的资产管理能力,资产的利用率相对较高,善于改善生产经营管理,降低成本费用,有利于利润总额的增加2.2两个独立样本的非参数检验——银行业与证券业各指标分布的差异通过对两个独立样本(银行业与证券业)的均值、中位数、离散趋势、偏度等进行差异性检验,分析它们是否来自相同分布的总体。样本变量的Mann-WhitneyU统计量的值分别为0、0、39、33、0、45、26、0;WilcoxonW统计量的值分别为55、55、94、88、55、55、100、81、55;Z统计量值分别为-3.78、-3.78、-0.832、-1.285、-3.781、-3.78、-0.378、-1.814、-3.78,负值说明实际观测的秩和比期望观测的秩和要小。股东权益比、负债权益比、总资产周转率、资产负债率和资产利润率比的Sig值比0.05小,说明银行业与证券业的这些指标有显著差异。而主营收入增长率、管理费用比例、每股收益和经营利润率的Sig值比0.05大,说明这些指标在银行业与券商业中差异不大。为了验证前面得出的结论,用K-SZ方法来检验同一个问题,上表为分析结果。K-SZ的值分别为2.236、2.236、0.894、0.894、2.236、2.236、0.447、1.118和2.236,其所对应的双边渐进显著性水平分别为小于0.01、小于0.01、0.4、小于0.01、小于0.01、0.988、0.164和小于0.01。即主营收入增长率、东华大学管理学院研究生课程--应用统计期末案例5管理费用比例、每股收益和经营利润率不显著;而其他指标显著。这种方法与前面的方法在判别变量时相一致,再一次证明了之前的结论。2.3相关分析——指标间的相关性我们使用券商的财务指标数据,对这9个财务指标做一个相关分析,来看他们之间的相关性是怎样的。说明:例如,资产利润率和股东权益率的相关系数是0.853,说明两者高度相关;资产利润率和负债权益比的相关系数是-0.857,说明两者高度负相关;资产利润率和主营收入增长率的相关系数是0.356,说明两者低度直线相关;资产利润率和管理费用比例的相关系数是0.251,说明两者不存在直线相关;资产利润率和总资产周转率的相关系数是0.980,说明两者高度相关;资产利润率和资产负债率的相关系数是-0.853,说明两者高度负相关。东华大学管理学院研究生课程--应用统计期末案例62.4多元线性回归分析——资产利润率的决定我们根据相关分析的结果,将资产利润率作为因变量,其他财务指标作为自变量,分析他们之间存在着怎样的线性关系,为预测盈利水平提供一个依据。说明:表中显示模型拟合优度为R=0.994,可见模型的显著性相当好。表明应变量资产利润率和自变量股东权益率,负债权益比,主营收入增长率,管理费用比例,总资产周转率,资产负债率之间存在极为显著的线性相关关系。此表中,前四个模型存在回归系数不显著的变量,所以第五个模型是最终模型,从而得到我们的结论:资产利润率=2.625-0.074*管理费用比例+60.031*总资产周转率……东华大学管理学院研究生课程--应用统计期末案例72.5主成分分析——财务指标的归类我们为了对银行的样本进行指标的归类,采用主成分分析的方法。结果如图:说明:1、KMO检验用于研究变量之间的偏相关性,计算偏相关性时由于控制了其他因素的影响,所以会比简单相关系数来得小。KMO值为0.649,说明适合做因子分析。2、球形检验的Sig小于0.05,证明变量之间显著,即相互独立。方差解释能力表证明所选择的4个主成分可以解释总方差接近95%,其余5个成分只占5%,可以说这4个主成分解释了总方差的绝大部分。“提取平方和载入”一栏表示在未经旋转时,被提取的2个公因子各自的方差贡献信息,它们和“初始特征值”栏的前2列取值一样,说明前2个公因子可以解释总方差接近75%。最后一栏的“旋转平方和载入”表示经过因子旋转后得到的新公因子的方差贡献值、方差贡献率和累计方差贡献率,和未经旋转相比,每个因子的方差贡献值有变化,但最终的累计方差贡献值不变。东华大学管理学院研究生课程--应用统计期末案例8说明:通过特征碎石图可以看出前四个特征值之间的差异较大,其余的变化较小,特征值均小于1,所以取前四个因素作为主成分是合理的。说明:四个主成分Z1=0.95X1+0.938X2+0.933X3-0.932X4-0.918X5+0.248X6+0.566X7-0.318X8+0.416X9其中股东权益比、负债权益比和资产负债率的系数较大,表明Z1描述的是企业的偿债能力;Z2=-0.58X1+0.38X2-0.203X3+0.074X4+0.104X5-0.881X6+0.784X7+0.046X8+0.3东华大学管理学院研究生课程--应用统计期末案例991X9其中管理费用比例、总资产周转率均为负相关,且系数较大,表明Z2描述的是企业的经营效率;Z3=0.154X1+0.072X2+0.093X3-0.006X4-0.206X5-0.191X6+0.077X7+0.812X8-0.559X9其中每股收益的系数较大,表明Z3描述的是企业的盈利能力;Z4=0.135X1-0.136X2+0.171X3+0.195X4+0.152X5+0.267X6-0.002X7+0.478X8+0.593X9其中主营收入增长率系数较大,表明Z4描述的是企业的发展潜力。说明:因子方程X1=-0.955F1+0.017F2+0.025F3+0.078F4X2=0.942F1+0.036F2+0.238F3+0.048F4