1基于因子分析的我国经济发展状况实证分析摘要:选取了2013年我国31个省、直辖市、自治区经济发展的10项指标作为研究对象,运用因子分析的方法,利用spss对数据进行计算,依据因子分析的结果对我国各省的经济发展做出综合评价,得出了这31各省份经济发展状况的综合排名,广东、江苏、山东、浙江、北京排在前5位,是中国各省、直辖市、自治区沿海经济发展较好的地区;甘肃、海南、青海、宁夏、西藏排在后5位,是西部地区经济发展较落后的地区,较为客观反映了中国各省、直辖市、自治区的综合经济实力,为中国各省、直辖市、自治区今后的经济发展提供了理论依据。关键词:经济发展;因子分析;综合评价;主成分法一、引言我国地域辽阔,由于历史、地理位置及经济基础等原因,各地经济发展水平差异很大。改革开放以来,特别是实施西部大开发、振兴东北地区等老工业基地、促进中部地区崛起、鼓励东部地区率先发展的区域发展总体战略以来,各地经济社会发展水平有了很大提高,人民生活也有了很大改善。但区域发展不协调、发展差距拉大的趋势仍未根本改变。本文从我国31个省市自治区经济的发展视角入手,运用对应分析方法对我国各地区经济发展状况进行统计分析,用以说明我国各地区经济发展不协调的现状。由于衡量各地区经济发展的指标有很多,故选取了比较有代表性的十个指标。二、相关统计指标与数据的选取本文运用了因子分析的方法对我国31个省、直辖市、自治区的经济发展状况进行评价。选取了10项经济指标:第一产业增加值(X1);第二产业增加值(X2);第三产业增加值(X3);地方财政预算收入(X4);地方财政预算支出(X5);固定资产投资额(X6);社会消费品零售总额(X7);货物进出口总额(X8);在岗职工平均工资(X9);城乡居民储蓄年末余额(X10)。X2,X3,X4反映的是经济总量中构成三大产业的不同增加值;X5,X6反映的是地方财政预算收支;X7反映的是居民的购买能力;X8反映的是对外贸易;X9,X10反映的是居民的收入与储蓄。本文数据资料来源于《中国统计年鉴》(2013年),具体数据资料见表1。表1各地区经济发展状况(2013)地区X1X2X3X4X5X6X7X8X9X10北京11.63293.031316.503661.114173.666847.068375.104289.9693997.0023086.41天津16.85612.86846.572079.072549.219130.254470.431285.0268864.007612.312河北313.76758.53654.112295.624409.5823194.2310516.75549.1242532.0023357.17山西75.4961.12352.801701.623030.1311031.895139.29157.9147417.0013339.37内蒙古150.83282.69518.281720.983686.5214217.385114.16119.9551388.007455.17辽宁165.811038.971026.443343.815197.4225107.6610581.441144.7846310.0019659.51吉林97.23481.46463.531156.962744.819979.265426.43258.3243821.007745.33黑龙江403.13-119.39407.611277.403369.1811453.086251.17388.7942744.0010058.60上海1.48173.001245.924109.514528.615647.798051.964412.6891477.0020486.25江苏227.791972.082903.666568.467798.4736373.3220796.525508.0257984.0033823.90浙江116.741130.331656.093796.924730.4720782.1115225.543357.8957310.0028922.97安徽169.36999.12658.342075.084349.6918621.906542.42455.1948929.0012924.91福建159.601127.36770.902119.453068.8015327.448275.351693.2149328.0011847.25江西116.26728.79544.571621.243470.3012850.254576.11367.4743582.009725.17山东460.931686.742523.424559.956688.8036789.0722294.842665.3247652.0029796.08河南289.441134.191132.922415.455582.3126087.4612426.60599.5738804.0020232.12湖北249.39978.461190.192191.224371.6519307.3310885.94363.8044613.0015507.03湖南95.021010.931241.492030.884690.8917841.409018.64251.7543893.0014539.68广东200.251726.523169.287081.478411.0022308.3925453.9310915.8153611.0049891.35广西171.20615.61556.091317.603208.6711907.675133.08328.2742637.009118.91海南44.9366.82179.17481.011011.172697.93992.89149.8545573.002465.38重庆76.73422.74747.621693.243062.2810435.244599.77686.9251015.009622.31四川128.401245.751013.822784.106220.9120326.1110561.45645.7549019.0022597.30贵州137.14566.16451.291206.413082.667373.602366.2082.9049087.005919.05云南240.79508.62662.031611.304096.519968.304004.56253.0444188.008969.81西藏6.4450.0750.1395.021014.31876.00293.2033.1964409.00496.03陕西155.89837.77597.871748.333665.0714884.154999.54201.2848853.0012249.36甘肃98.87220.95297.99607.272309.626527.942173.83102.3644109.005878.47青海30.68111.9764.86223.861228.052361.09544.0814.0352105.001504.17宁夏23.58105.5994.60308.34922.482651.14610.5132.1852185.001887.23新疆147.72284.41422.801128.493067.127732.302108.15275.6149843.005884.503三、数据分析过程(一)相关性分析用SPSS21.0数据处理系统将10项经济指标处理后,得到相关系数矩阵、巴特利特球度检验和KMO检验方法进行分析。分析结果见表2和表3。表2相关矩阵X1X2X3X4X5X6X7X8X9X10X110.4720.390.3130.5380.7020.5460.077-0.5050.403X20.47210.8290.7660.8460.8870.8580.536-0.1630.772X30.390.82910.9590.8950.7580.9550.8460.1990.923X40.3130.7660.95910.9050.7180.9230.8860.3150.951X50.5380.8460.8950.90510.8540.920.6830.0190.918X60.7020.8870.7580.7180.85410.860.378-0.2630.748X70.5460.8580.9550.9230.920.8610.7640.0340.953X80.0770.5360.8460.8860.6830.3780.76410.4450.846X9-0.505-0.1630.1990.3150.019-0.2630.0340.44510.173X100.4030.7720.9230.9510.9180.7480.9530.8460.1731根据表2原有变量的相关系数矩阵,可以看到:大部分的相关系数都较均大于0.3,各变量呈较强的线性关系,能够从中提取公共因子,适合进行因子分析。表3KMO和Bartlett的检验取样足够度的Kaiser-Meyer-Olkin度量。.740Bartlett的球形度检验近似卡方541.977df45Sig..0004Bartlett检验的F值等于541.977,F值显著,Sig.(显著性)小于0.005,表明所取的数据满足正态总体分布;KMO值等于0.74,大于0.7,说明变量之间的相关性可以被其他变量解释,因此适合做因子分析。(二)提取主因子根据原有变量的相关系数矩阵,采用主成分分析法提取因子并选取大于1的特征值,得出公因子差和分析结果如下表4。表4公因子差初始提取X11.000.768X21.000.826X31.000.959X41.000.983X51.000.923X61.000.918X71.000.973X81.000.886X91.000.843X101.000.944从表中可以看出,10个变量的共同度基本都在80%以上,即这些变量的信息丢失较少,变量都能被因子解释,本次因子提取的总体效果较理想。一般情况下,确定因子个数时,累计贡献率达到85%以上,本文提取特征值大于1的特征值,得到2个主因子代替原来的10个因子累计贡献率达90.22%,因此取出的2个主因子基本上包括了X1~X10的大量信息。分析结果见表5。表5解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%17.06870.68170.6817.06870.68170.6816.84268.41768.41721.95419.54190.2221.95419.54190.2222.18021.80590.2223.3973.97194.1934.2912.91297.1065.1221.22198.3276.074.74399.07057.049.48599.5558.032.32399.8789.008.07899.95610.004.044100.000由表5可知,第一个公因子的方差贡献率为70.681%,前两个公共因子的累计方差献率已达到90.22>85%,即前两个公共因子已代表了原始数据的绝大部分信息。因子分析效果较理想。在因子旋转后总的累计方差贡献率没有改变,没有影响到原有变量的共同度,但重新分配了各个因子解释原有变量的方差,改变了各因子的方差贡献,使得因子更易于理解。图1图1中,横坐标为因子数目,纵坐标为特征值。可以看到:第一个因子的特征值较高,对解释变量的贡献最大;第三个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此提取两个因子适合的。(三)因子旋转及公因子命名因为因子意义不明显,对初始因子进行旋转。本文采用旋转因子模型的方法是方差6最大正交旋转,旋转后,得到因子载荷矩阵(见表6)。由旋转后的因子载荷矩阵可以看出,第1主因子第二产业增加值(X2)、第三产业增加值(X3)、地方财政预算收入(X4)、