基于SPSS因子分析的全国各省市经济发展水平摘要随着经济的发展,传统的三大经济地带分类已不能满足现状。虽然我国各地经济发展取得较大进展,但东西部之间贫富差距急剧扩大,因此缩小地区间差距,实现各地区协调发展有着重要的政治、经济、社会意义。本文通过选取除港、澳、台之外的31个省市为样本,基于能够综合反映经济状况的多个指标,采用SPSS的因子分析的方法,选取了对社会发展状况影响较大的几个指标,对我国除台湾、香港、澳门在外的31个省市自治区的社会发展状况进行了分析与比较。通过因子分析的方法可以从不同角度了解各省的人均GDP分布差异,从而体现出我国的综合经济实力,便于我们去寻找一些省市的特点和规律,从而了解各地发展优势所在和劣势所在,为了进一步更好地去改善和改革提供了一点可供参考的价值,也在此提出来一些看法和建议。关键词:中国各省市;发展状况,因子分析引言改革开放以来,中国经济迅速发展。中国作为世界经济的重要组成部分、近年来在经济建设中取得重大成就,但省内部却存在由北至南经济发展不平衡的现象,如何客观、定量的对全国各地区经济差异做出评价,提出有效解决国内经济发展不平衡的政策建议,促进全国全面经济协调发展,是目前有待解决的问题。虽然我国的国民收入在全世界名列前茅,总体水平非常可观,面对我国十三亿的庞大人口,平均下来就是一个非常小的数目了,人均水平在世界中排在了后面。比如一些贫富差距,卫生医疗方面,教育的投入方面投入不均,导致了诸多的问题。本文通过利用因子分析方法对全国31个地区进行城市综合竞争力评价,讨论省市经济发展的特点,针对国内区域经济发展不平衡的问题,找出原因,并且利用所学知识,对全国区域经济协调发展提出政策建议。改革开放以来,经济的快速发展带动力我国社会各方面的快速发展,但是由于我国国土辽阔,各地区所处自然环境、所拥有的自然资源不尽相同,各地区的经济发展的基础也不尽相同,因此我国各省市的社会发展状况也出现了较大的差异。因而寻找一种方法来衡量各省市社会发展状况,从而使各地区依照各地的发展程度来科学制定发展战略就显得越来越有必要。本文利用因子分析的方法,综合考虑影响社会经济发展状况的各项指标,给出了一种衡量社会经济发展状况的方法,希望能为各地区制定相应的发展战略提供一些科学依据。一直以来,我国各省之间由于历史累积、资源、禀赋、经济基础、政策倾斜等方面存在差异,造成了经济发展不平衡的问题。因此,对各省经济发展水平层次的分析显得尤为重要,以便准确识别区域经济的现状、变化,从而因地制宜,制订出适合区域经济发展的政策。根据《中国统计年鉴》的数据,本文利用因子分析对其进行研究。一、因子分析方法概述1.1因子分析基本思想在比较各地区社会发展状况的过程中,为了综合考虑各方面因素而选取的指标较多。而且各指标间可能还具有一定的相关性,这就需要一种既能克服指标之间的相关性、重叠性。又能将较多的变量综合为较少的变量的分析的方法。而因子分析正是处理这类问题的较好方法。因子分析的基本思想是根据相关性的大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组变量间的相关性较低。因子分析模型是利用降维的思想,根据原始变量相关矩阵内的依赖关系把复杂关系变量归结为几个少数因子的一种多变量的统计分析方法。即把原来多个变量化为少数几个综合指标的一种统计方法,使用因子分析法可以损失较小的信息,减少评价指标。针对主因子进行分析,使综合经济实力评价结果更为合理有效。因子分析还可以用于对变量的数据代入表达式的分类处理,我们在得出因子分析的表达式之后,还可以把原始数据代入表达式得出因子得分值,由因子得分在因子所构成的空间中把变量或点画出来就可以既形象又直观的达到分类的目的。1.2因子分析原理及模型因子分析是用较少个数的公共因子的线性函数和特定因子之和来表达原来观测的每个变量,从研究相关矩阵内部的依赖关系出发,把一些具有错综复杂的变量归纳为少数几个综合因子的一种多变量统计分析方法。当这几个公共因子(或综合因子)的累计方差和(即贡献率)达到80%或90%以上时,就说明这几个公共因子集中反映了研究问题的大部分信息,而彼此之间又不相关,信息不重叠。因子分析法的应用主要有两个方面:(1)寻求基本结构,简化观测系统,减少变量维;(2)对指标或样本进行分类。因子分析的一般模型为:其中,X1,X2,......,Xm为实测变量;αij(i=1,2,......,m,j=1,2,......,n)为因子荷载,即实测变量Xi与公共因子Fj的相关系数,反映了实测变量Xi对公共因子Fj的依赖程度和实测变量在公共因子Fj上的重要性;Fj(j=1,2,......,n)为公共因子;εi(i=1,2,......,m)为特殊因子。1.3因子分析基本步骤(1)原始数据的标准化原始数据的标准化包括指标正向化合和无量纲化处理两方面。在多指标的评价中,有些指标数值越大,评价越好;有些指标数值越小,评价越好,这种指标称为逆向指标;还有些指标数值越靠近某个具体数值越好,这种指标称为适度指标。根据不同类型的指标需要将逆向指标、适度指标转化为正向指标,此过程称为指标的正向化。指标正向化过程既可以在无量纲化前处理也可以在无量纲化时处理。逆向指标可以选用公式'maxmaxmin()/()iiXXXXX。其中,maxX、minX分别为指标的最大与最小值。适度指标方面,叶宗裕认为正向化可以采用指标值减去适度值的绝对值的相反数。公式为||xyxyYXM。其中xyY为正向后数据,xyX为原始数据,M为适度值。指标的无量纲化则是通过标准化处理,将不同的指标通过数学变换转化为统一的相对值,消除各个指标不同量纲的影响。常用的无量纲化包括:标准化法、均值法和极差正规化法。本文采用最常见的标准化法进行无量纲化处理,公式处理如下:(X是X的期望值,X是X的标准差)(2)计算相关矩阵R的特征值和特征向量根据特征方程||0RE,计算相关相关矩阵的特征值及对应的特征向量A,的大小描述了各个因子在解释对象所起的作用的大小。(3)计算因子贡献率及累积贡献率,确定公共因子个数因子贡献率表示每个因子的变异程度占所有因子变异程度的比率,公式为:,iC表示方差贡献率。当累积贡献率达到80%以上或者特征根不小于1,即确定了公因子的个数。(4)求解初始因子载荷矩阵X=AF,因子载荷矩阵A并不唯一,软件则是运用不同的参数估计方法求出相应的估计矩阵,参数估计方法主要包括:最小平方法、极大似然法、主成分法、主因子法、多元回归法。(5)因子载荷矩阵的旋转若因子载荷较为平均,初始的因子载荷矩阵描述的经济含义不太明显,难以判断与各个因子的关系时,就需要进行因子旋转。通过因子旋转,使使旋转后公共因子的贡献更加分散,并对主因子进行命名,确定经济含义。因子旋转主要有正交旋转法和斜交旋转法。(6)计算样本的综合得分通过因子载荷矩阵,可以得出因子的因子得分系数矩阵B。然后计算出每个因子的得分F=BZ,最后以各因子的方差贡献率占因子总方差的贡献率的比重作为权重加权汇总,得到应变综合得分1iPiiiCXXXZ二、我国各省份城市经济发展水平实例研究2.1数据的来源及指标的选取本文选取了《中国统计年鉴》中2013年我国31个省市基础数据(不包括台湾省、香港特别行政区、澳门特别行政区3个地区)。根据各省的具体情况,选取了如下几个方面具有代表性的指标。第三产业占GDP的比重(%)X1、规模以上工业企业数(个)X2、普通高等学校(所)X3、各地区研究与试验发展经费投入强度(%)X4、地区生产总值(万元)X5、医院(个)X6、各地区研究与试验发展人员全时当量(人)X7、规模以上工业总产值规模以上工业总产值(万元)X8、人口状况(人)X9。图2.1.1、.1.2各省市综合发展情况的部分数据截图。城市省份名称第三产业占GDP的比重规模以上工业企业数普通高等学校试验发展经费投入强度北京市76.073740895.82天津市46.165013552.49河北省34.3911570117.76山西省36.68367476.98内蒙古自38.13358043.55辽宁省38.27169131151.56吉林省36.95470255.87黑龙江省34.093310831.19上海市58.059962661.81江苏省42.47433801262.07浙江省42.9834511941.78安徽省32.13124361091.32福建省38.3915667851.16江西省31.04645677.92山东省38.24358201761.72河南省29.3218025113.91湖北省37.5095681181.65湖南省35.53122541041.16广东省47.34382791391.76图2.1.1数据前四个指标部分数据截图城市省份名称地区生产总值医院各地区研究与试验发展人员全时当量规模以上工业总产值人口状况北京市1625193005222172551422549772485天津市113072800255742931903015221813河北省2461156941123730251418753638648山西省111489646116347355575056804503内蒙古自14234263946927604621603792853辽宁省246790794829809772496546986149吉林省109234250560448151100870273378黑龙江省13704879091866599830294775148上海市1919569002961485003201366592770江苏省495125525111434276550627350310428浙江省3172904556522536872686903796275安徽省156553492710810871401437508787福建省176437864411968841203910264475江西省11521090650237517665151865664山东省461414148131922860839456722512400河南省268476584119311804112923128013303湖北省1846218006141139201609599916870湖南省198262773768857831154418718222广东省555906768106441080582335974012007图2.2.2数据后5个指标部分数据截图2.2SPSS上机操作的具体步骤(1)在SPSS的变量视图中,建立“地区”变量,表示各个省市,建立“第一产业占GRP的比重”、“第二产业占GRP的比重”、“第三产业占GRP的比重”、“规模以上工业企业数”、“普通高等学校”、“各地区研究与试验发展经费投入强度”、“地区生产总值”、“医院”、“各地区研究与试验发展人员全时当量”、“规模以上工业总产值规模以上工业总产值(万元)”、“人口”变量,表示各省经济发展衡量指标。(2)在SPSS活动数据文件中的数据视图中,把相关数据输入到各个变量中。(3)打开数据文件,进入SPSSSatatistics数据编辑器窗口,在菜单栏中依次单击“分析”“降维”“因子分析选项卡”,将“第一产业占GRP的比重”、“第二产业占GRP的比重”、“第三产业占GRP的比重”、“规模以上工业企业数”、“普通高等学校”、“各地区研究与试验发展经费投入强度”、“地区生产总值”、“医院”、“各地区研究与试验发展人员全时当量”、“规模以上工业总产值规模以上工业总产值(万元)”、“人口”变量选入“变量”列表。(4)单击“描述”按钮,勾选“原始分析结果”复选框和“KMO与Bartlett球形度检验”复选框,单击“继续”按钮,保存设置结果。(5)单击“抽取”按钮,勾选“碎石图”复选框,其他为系统默认选择,单击“继续”按钮,保存设置结果。(6)单击“旋转”按钮,勾选“最大方差法”复选框,其他为系统默认选择,单击“继续”按钮,保存设置结果。(7)单击“得分”按