多元统计分析大作业—基于因子分析的各省份城镇居民消费结构研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2014~2015学年第二学期期末考试论文题目基于因子分析的各省份城镇居民消费结构研究课程名称多元统计分析任课教师学号姓名学院专业考试时间成绩基于因子分析的各省份城镇居民消费结构研究【摘要】经济发展的差异导致了我国各省份的居民消费结构的不同。搜集了全国31个省市某年城镇居民月平均消费数据,采用因子分析法对数据进行分析,得出各省市居民消费结构的差异,北京、广东、上海已经处于较高消费水平,各方面消费能力都较高,消费重心已经从购买商品支出转变为享受型的非商品支出;而天津、江苏、浙江等6省(市)处于中等消费水平,生存型得分较低,发展型消费因子得分较高,消费结构有很大优化空间;最后剩余的22个省(市)处于低消费水平,生存型消费因子得分最低,消费结构还没有脱离传统模式,结构较单一,并在此基础上对改善我国城镇居民消费结构提出了几点建议。【关键词】因子分析消费结构城镇居民随着居民生活水平的不断提高以及经济发展方式的转变,居民的消费结构也在逐步转变。现如今国内经济将主要以内需为主,最终体现出消费率提升和内需消费市场的活跃。因此,居民的消费水平是内需的主要来源,消费结构也会影响到各地区经济的持续稳定快速发展以及经济结构的突出转变,只有看清楚各地区居民的消费水平结构,合理进行规划,才能推动经济发展和经济结构向合理方式的转变[1]。本文在这个大前提下,为了减小各个省份在诸多方面的差异,选取各地区城镇居民家庭全年人均的消费性支出作为研究数据,根据某年31个省、市、自治区城镇居民月平均消费数据的统计数据结果,运用因子分析法对全国居民消费结构进行分析。1.因子分析简介1.1因子分析的基本原理因子分析是将多个实测变量转换为少数几个新的不可观测的而且相互无关的综合指标(因子)的多元统计分析方法。这些少量的综合指标涵盖了原始指标带有的绝大部分信息,并且根据相关性的大小把原始指标重新分组,使得同组内的指标之间相关性较高,但不同组的指标相关性较低。而且,该方法在减少分析指标的同时,能尽量减少原指标包含信息的损失。1.2因子分析的具体步骤运用因子分析建立评价模型的一般步骤为:先将各数据标准化,求解初始因子载荷矩阵,建立因子模型,并对因子载荷矩阵进行旋转变换。然后,根据因子分析中较为重要的因子其方差贡献较大的原理,用第k个特征根来衡量第k个因子的重要程度。以此为权重建立相应的评价模型,最后计算综合得分并排序。设有n个样本,每个样本有m个数据指标,可得到一数据矩阵,记为x(n,m)。具体步骤如下:(1)对x(n,m)的数据进行标准化变换,得标准化矩阵,记为x'(n,m);(2)计算指标变量的相关系数矩阵,进行主成分分析,计算R的特征值;(3)确定主因子个数,计信息贡献率。选取主成分的原则是:当前k个主因子的累计贡献率超过85%时,或者特征值大于1时,取前k个主因子代替原来的m个指标;(4)求因子载荷,计算因子载荷矩阵,并计算各因子得分;(5)按因子得分系数及贡献率的大小,计算综合得分并根据综合得分进行排序。本方法的整个计算求解过程采用SPSS统计分析软件来进行。2.全国各省城镇居民消费结构特征的实证分析用多元统计分析中的因子分析法,给出城镇居民消费结构的因子分析模型,并以全国各省城镇居民的消费支出数据为例,对全国各省的城镇居民消费结构特征进行对比分析,研究当前全国各省城镇居民消费结构的差距。首先居民消费结构的八项指标在人均生活消费支出分别记为:x1人均粮食支出(元/人)x5人均衣着支出(元/人)x2人均副食支出(元/人)x6人均日用杂品支出(元/人)x3人均烟、酒、饮料支出(元/人)x7人均水电燃料支出(元/人)x4人均其他副食支出(元/人)x8人均其他非商品支出(元/人)2.1对原始数据进行判断在做因子分析前首先要检验数据是否适合做因子分析。KMO用于检查变量间的偏相关性,取值在0-1之间。KMO值越接近于1,变量间的偏相关性就越强,因子分析效果就好。KMO值0.9以上极适合做因子分析,0.8以上适合做因子分析,0.7以上尚可,0.6以上勉强可以,0.5以上不适合,0.5以下非常不适合。实际运用中,在0.7以上,效果比较好;在0.5以下时,不适合应用因子分析。表1数据显示KMO值为0.844,因此适合做因子分析。Bartlett球形检验,用于判断相关矩阵是否是单位阵,即各变量是否有较强的相关性。表1中P值为0.000,显著小于0.05,不服从球形检验,应拒绝各变量独立的假设,即变量间有较强相关可以做因子分析。表1KMOandBartlett's检验Kaiser-Meyer-OlkinMeasureofSamplingAdequacy..844Bartlett'sTestofSphericityApprox.Chi-Square160.986df28Sig..0002.2提取因子由表2可知,当提取3个因子时,方差贡献率达到了81.395%,保留了原是变量的绝大部分信息。同时结合碎石图可知,当提取3个因子时,折线趋于平缓,因此提取3个因子是合适的。表2总方差分解ComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsRotationSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%Total%ofVarianceCumulative%DIMENSION014.20652.57652.5764.20652.57652.5762.76034.50434.50421.39017.36969.9451.39017.36969.9452.16727.09161.5953.91611.45081.395.91611.45081.3951.58419.80081.3954.7299.10990.5045.3804.74595.2496.1952.44097.6887.1171.46099.1498.068.851100.0002.3因子旋转及命名为了使提取的因子能够更好的解释现实的经济现象,我们对因子进行了旋转。对比表3和表4,可发现旋转后的因子载荷更接近于0或者更加远离0,这有利于因子命名。由表4可知,因子1主要解释了人均副食支出、人均水电燃料支出、人均其他非商品支出、人均日用杂品支出,结合原始数据可知,这几个指标在居民消费支出中所占的比重很大,因此将其命名为生存型消费因子。因子2主要解释了人均衣着支出和人均其他副食支出。随着消费水平的提高,居民不再满足于吃饱穿暖,开始追求时尚、讲究服装的质地和款式,在吃上也开始注重品质和口感。因此这两个指标在居民消费支出中的地位也不容小觑,将其命名为享乐型消费因子。因子3主要解释了人均粮食支出和人均烟、酒、饮料支出。粮食支出虽然是居民日常生活中必不可少的一部分,但它所占居民消费支出的比例却不大,因此将其命名为发展型消费因子。表3旋转前因子载荷Component123人均其他副食支出.918.091-.190人均其他非商品支出.890-.252-.254人均日用杂品支出.781-.202-.205人均副食支出.708-.435.408人均烟、酒、饮料支出.695.550.206人均衣着支出.600.568-.407人均水电燃料支出.569-.564.055人均粮食支出.542.379.629表4旋转后的因子载荷Component123人均副食支出.826-.069.413人均水电燃料支出.803.002.019人均其他非商品支出.789.544.054人均日用杂品支出.679.477.070人均衣着支出-.008.900.193人均其他副食支出.566.701.274人均粮食支出.140.126.893人均烟、酒、饮料支出.102.567.7042.4各地区因子得分情况先利用回归法计算各地区因子得分情况,再以每个因子的方差贡献率做为权重计算综合得分。各地区的因子得分及排名请况如表5所示。由表5可知,高消费地区,如上海、广东等各方面的消费能力都较高,其主要因子得分排名均比较靠前。低消费地区的发展型消费因子排名有靠前的倾向,如西藏在发展型消费因子上排名第一,云南排名第三。而享乐型消费因子在各类地区中的排名比较分散,既有高消费地区排名靠前的,如北京,也有低消费地区排名靠前的,如西藏。表5因子得分与排名城市得分排名生存因子得分享乐因子得分发展因子得分综合得分综合得分排名生存因子得分排名享乐因子得分排名发展因子得分排名广东3.03-1.120.261.4311288上海1.971.30.321.32236北京1.382.98-0.61.1734129浙江0.942.02-0.060.8446210福建1.46-1.521.710.753302天津1.18-0.290.30.665237西藏-0.841.074.280.2372341江苏0.340.52-0.530.2189724辽宁0.24-0.650.960.13910264重庆0.090.37-0.550.051011927广西0.68-1.5-0.510.041172920湖南0.010.06-0.27-0.0112121215山东-0.110.79-1.11-0.041314631吉林-0.04-0.28-0.34-0.1114132116湖北-0.12-0.14-0.51-0.1515151621贵州-0.25-0.07-0.55-0.216181526海南0.39-2.11-0.75-0.251783130四川-0.24-0.51-0.34-0.2518172417河北-0.29-0.29-0.49-0.2619192219江西-0.2-0.6-0.51-0.2720162522陕西-0.52-0.19-0.39-0.3521201718宁夏-0.630.07-0.52-0.3822211123内蒙古-0.950.82-0.23-0.382329514黑龙江-0.76-0.22-0.16-0.4624222012安徽-0.94-0.220.6-0.472528195甘肃-0.890.38-0.54-0.472626825云南-0.98-0.681.3-0.482730273青海-0.86-0.22-0.09-0.528241811新疆-0.91-0.02-0.18-0.529271313河南-0.89-0.05-0.59-0.5430251428山西-1.310.320.07-0.623131109观察图2,可知散点图很明显的分为三个部分。但是仅依据此图进行分类与实际情况并不相符,如江苏与西藏等地区的消费水平显然不再同一个水平上。由表5可知江苏、重庆、湖南等地区主要是在发展型消费因子上得分较低才导致其综合得分排名较后,联系实际认为应将这三个地区归为中等消费水平。图2综合得分2.5通过因子分析可得出如下分析结果结合图2和表5,最终的分类结果如表6所示。处在第一类高消费水平的是北京、上海、广东,其在各方面的消费能力都较高,并且其主要因子得分均是最高的。由于主要因子得分中非商品性支出占了很大的比例,因此可以看出其消费重心已由原来的购买商品支出转变为享受文化服务和生活服务等非商品支出。第二类地区为中等消费水平,包括天津、江苏、福建、浙江、重庆、湖南。相较于高消费水平地区,这些地区的生存型消费因子得分较低,同时发展型消费因子得分较高,而享乐型消费因子得分居中。说明这些地区的居民消费结构逐优化的空间还很大,应该进一步加大享乐型因子的消费,减少发展型消费因子的比重,使消费结构趋于合理。第三类地区包括了河北、山西、内蒙古、辽宁等22个城市。这类地区在生存型消费因子的得分上要远低于高消费水平地区,而其中很多地区的居民消费支出中,发展型消费因子所占比重却居于前列。可知,低消费水平地区的消费结构还没有脱离传统模式,结构较单一。表6分类表类别省市个数高消费水平北京、上海、广东3中等消费水平天津、江苏、福建、浙江、重庆、湖南6低消费水平河北、山西、内

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功