多元统计分析实践论文院系:理学院专业:统计学年级:2010姓名:樊恩泽学号:20101004005我国城镇居民人均消费支出的多元统计分析樊恩泽摘要:本文本文综合了主成分因子分析与系统聚类分析,先进行主成分因子分析,再用进行聚类分析。采用2011年我国31个省、市、自治区城镇居民人均消费支出数据,首先利用主成分因子分析的方法,找出影响我国城镇居民人均消费支出的主成分,计算各样本的主成分得分;其次运用系统聚类分析法,对各地区人均消费水平进行分类,结果表明,系统聚类分析法得到的结果也较好;最后对于扩大国内消费提出相关建议。关键词:主成分分析聚类分析居民人均消费支出1、引言人均消费支出指居民用于满足家庭日常生活消费的全部支出,包括购买实物支出和服务性消费支出。消费支出按商品和服务的用途可分为食品、衣着、家庭设备用品及服务、医疗保健、交通和通讯、娱乐教育文化服务、居住、杂项商品和服务等八大类。人均消费支出是社会消费需求的主体,是拉动经济增长的直接因素,是体现居民生活水平和质量的重要指标。本文选取2011年我国城镇居民人均消费支出数据,主要利用三种统计方法进行分析:主成分分析法、聚类分析法。将全国31个省、市、自治区进行分类和排序,并与人们实际观察到的情况进行比较。1.1主成分分析主成分分析是将分量相关的原始变量,借助于一个正交变换转化为不相关的新变量,并以方差作为信息量的测度,对新变量进行降维,取累计贡献率大的若干成分作为主成分。这些主成分能够反映原始变量的绝大部分信息,它们通常表示为原始变量的某种线性组合。1.2聚类分析聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同的类的分析技术。在市场研究领域,聚类分析主要应用方面是帮助我们寻找目标消费群体,运用这项研究技术,我们可以划分出产品的细分市场,并且可以描述出各细分市场的人群特征,以便于客户可以有针对性的对目标消费群体施加影响,合理地开展工作2、数据来源及处理2.1统计思想主成分因子分析的基本思想是通过对变量相关系数矩阵内部结构的研究,找出能控制所以变量的少数几个随机变量去描述多个变量之间的相关关系,并依据相关性的大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组代表一个基本结构,这个基本结构成为公共因子。对于所研究的问题试图用最小个数的不可观测的所谓公共因子的线性函数与特殊因子之和来描述原来可观测的每一个变量。下表是要进行处理的31个省市的城镇居民人均消费支出的相关原始数据,数据来源于《2011中国统计年鉴》。X1:食品x2:衣着x3:居住x4:家庭用品x5:交通通信x6:文教娱乐x7:医疗保健表12.2主成分分析表2:因子解释原始变量方差的情况该表显示了各主成分解释原始变量总方差的情况,主成分几乎包含了各个原始变量至少90.517%的信息,可见效果比较好。表3:该表为7个成分的相关系数表4:因子载荷矩阵的成分图该表给出了标准化原始变量用求得的主成分线性表示的近似表达式,用prin1,prin2来表示各个主成分,则有该表可以得:标准化的rin20.470prin10.862x1p标准化的prin20.322-prin10.899x2标准化的prin20.022-prin10.921x3表5:主成分得分表6:因子得分系数矩阵该表由公式517.90/)2622.51895.84(FFF所得,显示了各个主成分的因子得分和主成分得分。图1主消费因子F1得分前五名地区依次是上海、广东、浙江、北京、福建,远远高于其他地区,说明上海、广东主要城镇居民人均消费支出远远高于其他地区,与实际情况比较接近。主消费因子F1最后五名地区依次是新疆、河南、青海、甘肃、黑龙江,这些地区经济发展相对落后,人均消费支出低,其主要消费支出也低,但与实际情况还存在差距,贵州城镇居民消费应比黑龙江消费要低,黑龙江不应划为最低人均消费地区。次消费因子F2得分前五名地区依次是北京、内蒙古、吉林、天津、黑龙江;次消费因子F2最后五名地区依次是福建、贵州、广西、西藏、海南,衣着人均消费,在实际消费过程中,人们不容易观察到,这个结论还缺乏一定依据;综合得分F前五名地区依次是上海、北京、广东、浙江、天津;这五个地区经济都发达,人均收入和消费支出都高,将这些地区分为一类比较切合实际。综合得分F最后五名地区依次是新疆、云南、甘肃、贵州、青海,这些地区人口稀少,经济发达相当落后,人民收入和消费水平均处于全国最低水平,与人们观察到的实际情况比较接近,将这些地区分为一类,其他地区则分为另外一类,这样一来就可以将31个省、市、自治区就分为三类,第一类为因子综合得分前五名地区,第三类为因子综合得分最后五名地区,其余地区则划分为第二类。这种分类结果比较切合实际情况。2.3聚类分析表7表8图2结果表明:我国各类地区城镇居民人均消费支出分类效果较好,且不同地区的消费结构有着各自的特点。综合考虑将我国各地区城镇居民人均消费分为四类,较好地反映了人们观察到的实际情况,第一类为上海,2011年人均消费支出最高。该地区的食品支出、交通和通信支出、教育文化娱乐服务支出远远高出全国平均水平。第二类为北京、天津、福建、浙江、广东,在这些地区中,北京的娱乐教育文化服务支出在全国31个省份中名列前茅,北京的科研机构多,高等院校云集,教育发达,娱乐设施先进齐全,这些都是导致北京在该项支出比例高的原因。第四类为西藏,其余地区为第三类。第三类中的样本数量较多,情况较为复杂。其中山东、江苏等地区经济一直较为发达,而湖北、湖南、安徽等地区虽经济发展处于中等水平,但近年来在医疗保健和教育文化娱乐等方面的支出比例明显增大,说明其居民消费结构逐渐合理化,已与很多经济发达地区趋同,使得跃居第三梯队。然而,甘肃、贵州、四川、云南等地区城镇居民收入水平较低,这些地区的经济发展仍应引起国家重视,需要加大扶持力度。3、总结本文根据2011年我国城镇居民人均消费支出数据,利用系统主成分因子分析法和系统聚类分析法,对各地区31个省、市、自治区城镇居民人均消费进行分类,首先利用主成分因子分析法进行分析,根据综合得分对我国各地区城镇居民人均消费支出进行排序和分类,并进行综合评价,结果表明,分为三类较好地反映实际情况,然后利用系统聚类分析法,分类结果显示,系统聚类分析法得出的结果也较好,但同时也存在一定缺陷,对于聚类分析法,它是一种比较好的排序方法,但需要指出的是,本文没有对我国城镇居民人均消费支出结构进行详细探讨,仅仅是进行分类和排序。4、优缺点4.1优点1.主成分因子分析方法充分提取了大量的信息;2.利用系统聚类分析得出我国各类地区城镇居民人均消费支出分类效果较好。4.2缺点1.系统聚类分析法得出的结果较好,但同时也存在一定缺陷;2.本文没有对我国城镇居民人均消费支出结构进行详细探讨,仅仅是进行分类和排序。5、建议根据上面两种统计分析表明:经济发展较好的地区,居民的消费水平较高,消费结构也越合理。而且,居民收入水平是影响居民消费需求最直接、最根本的因素,并最终决定着居民的消费层次和消费结构。但是,除收入水平外,还有很多因素影响居民消费结构,如:价格水平、消费习惯、消费环境、消费心理预期等等,因而,政府也要继续出台切实有效的政策措施,增加居民消费积极性,并引导居民消费结构向更健康、合理的方向演进,以此全面提高我国各地区城镇居民的生活质量。鉴于此,提出以下几点建议:1、提高居民收入水平,增强扩大消费的基础。2、改善收入分配结构,增强中低收入人群的消费能力,提高劳动报酬在国民收入分配中的比重,建立健全工资正常增长机制,提高居民的资本分配参与度,划拨部分国有股充实个人养老金账户,完善和落实促进农民增收减负的政策措施,将所得税征收重点放在高收入人群,减少中低收入人群的税负,增加城镇居民人均可支配收入。3、刺激消费,积极培育新的消费热点。4、加快中西部发展,缩小地区相对差异。参考文献:[1]中国统计年鉴2011年.中国统计出版社.[2]何晓群编著.《多元统计分析》.中国人民大学出版社2004年版.[3]闫新华,王华.我国城镇居民消费水平的实证研究[J].统计与信息论坛,2003.[4]卢纹岱.SPSSforWindows统计分析[M].北京:电子工业出版社,2000.[5]宇传华编.《SPSS与统计分析》.电子工业出版社2007年版.[6]罗积玉邢瑛.经济统计分析方法与预测[M].北京:清华大学出版社,1990.[7]朱建军.我国城镇居民消费结构主成分分析[J].无锡商业职业技术学院学报,2009(02).[8]吴异光.对我国居民消费的统计分析[J].北京工商大学学报(社会科学版),2002(03).附录数据来源于《中国统计年鉴2011》2011年我国各地区城镇居民家庭平均每人全年消费性支出