主成分分析论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

-1-应用统计分析论文姓名:学号:班级:-2-我国部分上市公司财务绩效的主成分分析摘要为了全面地科学地评价我国2011年4月份部分上市公司的财务绩效状况,我们将借助SAS软件对其进行主成分分析分析。选取6项经济指标,对上市公司的财务绩效进行综合分析,并提出了目前我国上市公司存在的问题并给出提高财务绩效的相关措施。【关键词】财务绩效主成分分析上市公司存在问题相关措施一、研究意义上市公司的财务绩效是指上市公司在一定期间的盈利能力、资产质量、债务风险和经营增长四个方面的有关信息。了解了不同上市公司的财务绩效,有利于投资者等信息使用者据以评价企业盈利能力、预测企业成长潜力、进而做出更加准确的相关经济决策。二、相关研究成果由于主成分分析方法能浓缩信息,简化指标的结构,使分析问题的过程简单、直观、有效,故广泛应用于各个领域。人们经常利用主成分分析方法综合评价企业或事业单位的经济效益、技术进步状况,并收到了良好的效果。它的主演研究成果有:1.有时可通过因子负荷的结论,弄清变量间的某些关系。2.多维数据的一种图形表示方法。我们知道当维数大于3时便不能画出几何图形,多元统计研究的问题大都多于3个变量。要把研究的问题用图形表示出来是不可能的。然而,经过主成分分析后,我们可以选取前两个主成分或其中某两个主成分,根据主成分的得分,画出n个样品在二维平面上的分布况,由图形可直观地看出各样品在主分量中的地位,进而还可以对样本进行分类处理,可以由图形发现远离大多数样本点的离群点。3.由主成分分析法构造回归模型。即把各主成分作为新自变量代替原来自变量x做回归分析。4.用主成分分析筛选回归变量。回归变量的选择有着重的实际意义,为了使模型本身易于做结构分析、控制和预报,好从原始变量所构成的子集合中选择最佳变量,构成最佳变量集合。用主成分分析筛选变量,可以用较少的计算量来选择量,获得选择最佳变量子集合的效果。三、方法介绍(一)主成分分析,又称主分量分析,是指将原始的多个变量,通过线性组合,提炼出较少几个彼此独立的新变量的一种多元统计分析方法。在用统计分析方法研究这个多变量的问题时,由于变量个数太多会增加解决该问题的复杂性。在大多情况下,变量之间存在一定的相关性,可以解释为这两个变量在反映此问题的信息时有一定的重叠。人们希望变量个数较少而得到的信息较多,主成分分析就是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映问题的信息方面尽可能多地保留原有的信息。(二)主成分分析的基本思想:在实证问题研究中,为了全面、系统地分析-3-问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。(三)主成分分析的基本原理:主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向样本点散布最开的p个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。它的数学模型如下:1.原始指标数据的标准化采集p维随机向量x=(x1,X2,...,Xp)T)n个样品xi=(xi1,xi2,...,xip)T,i=1,2,…,n,n>p,构造样本阵,对样本阵元进行如下标准化变换:其中,,得标准化阵Z。2.对标准化阵Z求相关系数矩阵其中,。3.解样本相关矩阵R的特征方程得p个特征根,确定主成分按确定m值,使信息的利用率达85%以上,对每个λj,j=1,2,...,m,解方程组Rb=λjb得单位特征向量。4.将标准化后的指标变量转换为主成分U1称为第一主成分,U2称为第二主成分,…,Up称为第p主成分。-4-5.对m个主成分进行综合评价对m个主成分进行加权求和,即得最终评价值,权数为每个主成分的方差贡献率。四、指标的选取财务绩效评价要依靠财务指标,而财务指标企业总结和评价财务状况和经营成果的相对指标。中国《企业财务通则》中为企业规定的三种财务指标为:偿债能力指标、营运能力指标和盈利能力。因此我们选择了对于上市公司来说具有意义的指标:每股收益(元/股)、每股净资产(元/每股)、每股经营现金流量(元/每股)、主营业务增长率(%)、主营利润增长率(%)和毛利润(元)。分别记x1、x2、x3、x4、x5、x6。相关指标解释如下:每股收益(x1):即每股盈利(EPS),指税后利润与股本总数的比率。每股收益通常被用来反映企业的经营成果,衡量普通股的获利水平及投资风险,是投资者等信息使用者据以评价企业盈利能力、预测企业成长潜力、进而做出相关经济决策的重要的财务指标之一。计算公式为:每股收益=(本期毛利润-优先股股利)/期末总股本。每股净资产(x2):是指股东权益与总股数的比率。这一指标反映每股股票所拥有的资产现值。计算公式为:每股净资产=股东权益÷总股数。每股现金流量(x3):指本期现金净流量与股本总额的比值,如该比值为正数且较大时,派发的现金红利的期望值就越大,若为负值派发的红利的压力就较大。计算公式:每股经营现金流量=经营活动现金流量净流量÷流通在外普通股数量。主营业务收入增长率(x4):可以用来衡量公司的产品生命周期,判断公司发展所处的阶段。计算公式:主营业务收入增长率=(本期主营业务收入-上期主营业务收入)/上期主营业务收入*100%。主营利润增长率(x5):是主营业务利润与主营业务收入的百分比。计算公式:主营利润增长率=主营业务增加利润额÷主营业务收入额*100%。毛利润(x6):是指主营业务收入只减主营业务成本。看主要经营项目的盈利水平。计算公式:毛利润=收入-成本。五、实例分析SAS能对多变量资料进行较完善的主成分分析,下面我们就用实例来分析主成分分析的方法、过程和结果。【例】对我国2011年4月份部分上市公司的财务绩效状况进行主成分分析,选择的财务指标共有以下6个:每股收益(x1)、每股净资产(x2)、每股经营现金流量(x3)、主营业务增长率(x4)、主营利润增长率(x5)和毛利润(x6),有关-5-数据见下表(资料来源于证券之星网站):表1数据证券名称X1X2X3X4X5X6山东药玻0.156.930.1811.25-5.6226.98恒丰纸业0.146.09-0.29.00-4.3425.00上海凯宝0.217.260.0271.41119.7482.63鼎汉技术0.09976.75-0.5418.0640.4446.84通达股份0.1710.19-1.510.9521.3313.12三维工程0.1210.73-0.1813.4114.6348.48诺普信0.225.76-1.0229.8081.8440.46佛塑股份0.1032.26-0.24920.0785.5714.89莱茵置业0.01421.9942-0.9915-41.85-81.2022.03马应龙0.346.51-0.0711.278.1145.02酒钢宏兴0.185.430.2726.62150.7812.39神州泰岳0.238.31-0.2622.8527.1671.56贵糖股份0.082.87-0.5618.14%-4.5119.21亿阳通信0.02632.6824-0.3438-12.72%-34.8868.35新联电子0.1611.24-0.9174.67%1436.1344.53多氟多0.2713.14-0.3664.05%89.3927.95S*ST光明2.140.210.126-100.00%87.7325.78(数据来源:证券之星)采用主成分分析方法,程序如下:Datajixiao;Inputname$x1-x6;Cards;山东药玻0.156.930.1811.25-5.6226.98恒丰纸业0.146.09-0.29.00-4.3425.00……;Run;Procprincompout=prinStandard;Varx1-x6;run;Procprintdata=prin;Varprin1-prin6;run;程序说明:调用PRINCOMP过程对数据进行主成分分析。程序结果分析表2相关系数矩阵X1X2X3X4X5X6X11.00000.36140.25040.50830.34280.4049X20.36141.0000-.04560.28760.03490.3732X30.2504-.04561.00000.45020.34570.2435X40.50830.28760.45021.00000.81490.5929X50.34280.03490.35470.81491.00000.1485-6-X60.40490.37320.24350.59290.14851.0000由表2看到我们可以看到,毛利润(x6)和主营业务增长率(x4)的相关系数最大,为0.5929,其次为每股收益(x1)和主营业务增长率(x4)的相关系数0.5083,而其他的相关系数却很小。表3相关矩阵的特征值及其累计贡献率特征值相邻特征值之差贡献率(%)累计贡献率(%)12.82591.57160.47100.471021.25430.49810.20910.680130.75620.16000.12600.806140.59620.08110.09940.905550.51500.46280.08580.991360.05210.00871.0000表3给出了各样本相关系数矩阵的特征值,相邻两个特征值之间的差,每个特征值所解释的方差比率和累积比率。这里第一、第二、第三、第四主成分累计比率为90.55%,大于85%。可见,在本例中,只要选择第一、第二、第三和第四主成分就可以了。如果是按照特征值大于1的标准来考虑,那么只要选择第一、第二主成分就可以了,因为第三主成分的特征值为0.7562,小于1。表4主成分特征向量X1X2X3X4X5X6X10.41920.2177-.07640.7230-.49800.0118X20.25330.6699-.16840.09150.6670.0762X30.3232-.41850.67220.29720.41890.0676X40.5576-.1416-.1658-.27730.0124-.7513X50.4264-.4358-.5378-.11870.09190.5626X60.40360.34450.4441-.5380-.35110.3293表4对应的是每个特征值的特征向量。第一、第二、第三、第四主成分的表达式为:PRIN1=0.4192x1+0.2533x2+0.3232x3+0.5576x4+0.4264x5+0.4036x6PRIN2=0.2177x1+0.6699x2-0.4185x3-0.1416x4-0.4358x5+0.3445x6PRIN3=-0.0764x1-0.1684x2+0.6722x3-0.1658x4-0.5378x5+0.4441x6PRIN4=0.7230x1+0.0915x2+0.2972x3-0.2773x4-0.1187x5-0.5380x6为了对我国2011年4月份部分上市公司的财务绩效进行综合评价以个主成分的方差贡献率作为权数,以前4个主成份变量组成一个综合评价函数。具体函数为:Y=0.4710PRIN1+0.2091PRIN2+0.1260PRIN3+0.0994PRIN5将个主成分得分代入上式,我们就可以得到我们要的结果。我们添加以下程序:Datazonghe;setprin;Y=0.471

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功