江苏省历年农村居民家庭平均每人生活消费支出分析一.背景介绍及问题提出1.背景介绍近年来,全国上下认真贯彻落实科学发展观,以农业增产、农民增收为目的,加大各项惠农政策措施落实力度,多措并举做好农村劳动力转移就业工作,克服金融危机和严重干旱等自然灾害带来的不利影响,使全市农村经济保持了稳定发展的良好态势,农民现金收入持续增长,生活消费水平继续提高。我国是一个农业大国,至今仍有9亿农村人口,占全国人口总数的70%,农民是我国最大的群体,农村消费能力的提升直接关系到国民经济的全局。从农村市场看,中国有近六成人口生活在农村。农村城镇化的进程对经济增长的带动作用是非常明显的,世界上还没有哪个国家有规模如此巨大的城镇化。农村居民的收入虽然低于城市居民,但是基数巨大,且农村人口的收入也在稳定增长。随着经济的发展,我国农民的收入水平和消费水平的结构也发生了很大变化,农民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。但从总体来看,农民消费水平仍然较低,调查显示有的地区都不及城市居民人均消费支出的三分之一。而且消费结构不合理,局限于食品类等生存基本需求品,消费在衣着装饰等方面的极少。而影响农民消费水平的根本原因是农民的收入。农民生活消费支出主要包括食品、衣着、医疗卫生、教育文化、家庭设备、交通等方面,对农民消费支出的分析有助于我们更清晰的了解农村近年的发展,为以后的发展体更多的建议。2.提出问题从江苏省统计局我们找到了11年的农村居民家庭平均每人生活消费支出,现对各种消费支出进行综合评价分析。分析之前我们要提出几个问题:(1)消费支出的项目很多,每项支出只能反应支出的一个方面,因此要综合分析,如果指标体系构造不合理,势必会影响到评价结果的准确性和科学性。(2)不同的消费项目每年的数据是不一样的,这就可能导致分析时,难以直接得出结论,因此要选择科学的综合评价方法。二.解决方案1.确定评价指标体系本案例中评价的内容较多,因此分析时有十三个指标,即生活消费支出,食品,主食,副食及其他食品,在外饮食,衣着,居住,住房装饰,家庭设备用品及服务,交通和通讯,文化教育娱乐用品及服务,医疗保健和其他商品和服务,以此构建一个综合指标体系。2.综合评价方法的确定本题中评价的指标数目较多,因此要综合考虑各种指标的特点,制定一个综合的评价体系。三.聚类分析1.数据生活消费支出食品主食副食及其他食品在外饮食衣着居住#住房装饰家庭设备用品及服务交通和通讯文化教育娱乐用品及服务医疗保健其他商品和服务20095804.452275.28359.61453.3462.4306.62969.76205.55286.37691.56818.45322.99133.420085328.42202.6343.81446.8412276.4860.4178.1250.1614.2713.2290.9120.620074791.71994.63341277.6383251.3752.7158.6228.5543.9642.5263.9114.320064135.21729322.81112.6293.6223.3641.1124.6199.5465.2544.1232.3100.720053567.11569.3307.21031.2230.9191.1512.599.5168363.8478.9198.58520043035.1171341.364333.16809.61191.11163.529467.6172114.9862141.4265163.1626293.0693392.479672.4685820032704.41118.6268.8691.8149.6140.6441.973.7137.7142.1268.5379.275.920022625.21050.4258.9648.3135.5137.6552.760.8129.4203.9327.1142.581.720012374.71011.9275628.3100.5127.9439.162.8114.2176.8278.414779.520002337.51017.6259.7757.887.7126.7441.653.66115155.5269129.582.6199519381061.4412.3649.126.7126.8344.613352.3139.249.131.61990787411.681330.657.9193.253.31034.722.73.62.分析过程(1)录入数据(2)输出结果并分析①ClusterCaseProcessingSummary(a,b)CasesValidMissingTotalNPercentNPercentNPercent1083.3216.712100.0aSquaredEuclideanDistanceusedbAverageLinkage(BetweenGroups)从上述表格中可以看出,总共12个样本,只有10个样本进入了聚类分析,另外两个数据丢失,没有进入聚类分析。也就是说,1990,1995以及2000-2009中,有十年进入了聚类分析,另外两年多数据丢失。②该表格是SPSS层次聚类分析各变量的距离矩阵。从中可以看出各个变量之间的距离。从表中可以清晰的看出各个年份之间的距离。③AverageLinkage(BetweenGroups)该表格是层次聚类分析的凝聚状态表,该表格的第一行表格表示第9和第10个变量先进行了聚类,变量间的相关为19534.290,第2到第9行以此类推,后面则表示二者之间的距离。第五第六列则表示参与聚类的是样本还是类,0代表样本,数字n表示第n步产生的类参与了本次聚类。④该表格表示聚类分析的冰柱图。该表格的第一列表示类数。和Q型聚类一样,从表格的最后一行开始观察。最后一行中,类的数目为9,即变量积成9类,其中10.2和9.2用X连在一起,表示两个变量首先聚成一类,其余每个变量构成一类。倒数第二行,类的数目为8,即变量积成8类,其中10.2和9.2用X连在一起,其中8.2和7.2用X连在一起,其余每个变量构成一类。每一行一次类推。从冰柱图中可以清楚的看到各个变量的归属情况。⑤这个图是层次聚类分析的树形图。从图中可以看出,各个聚类之间的距离在25的坐标内。从树形图可以很直观的看出整个聚类的过程和结果。四.因子分析1.录入数据2.输出结果并分析①该表格列出了14个原始变量的描述统计结果,包括平均值、标准差和分析的个案数目,这和Univariatedescriptives项的输出结果一样。从表中我们可以清楚地看到生活消费支出,食品,主食等变量的均值,标准差和个案数目。②(注:两张表系一张表,太大了,分成两部分)该表格给出了14个原始变量的相关矩阵,即从表中我们可以看出生活消费支出,食品,主食等14个消费支出之间的相关度的大小。表格的下面给出了相关系数矩阵的行列式值,Determinant=0.000③这是因子分析的初始结果,该表格列出了14个原始变量名:第二列是根据因子分析初始解计算出的变量共同度。利用主成份分析得到14个特征值,他们是因子分析的初始解,可以利用这14个初始解和对应的特征向量计算出因子载荷矩阵。由于每个原始变量的所有方差都能被因子变量解释掉,因此每个原始变量的共同度都为1。第三列是根据因子分析最终解计算出的变量共同度。根据最终提取的m个特征值和对应的特征向量计算出因子载荷矩阵。这时由于因子变量个数少于原始变量的个数,因此每个变量的共同度必然小于1,例如第一行的0.999表示m个因子变量共同解释掉原变量“生活消费支出”方差的99.9%。从第三列可以看出,“主食”变量在因子分析后,能被m个因子变量解释的方差最少,只有89.5%。④该表格表示因子分析后的因子提取和因子旋转的结果。第一到四列描述了因子分析初始解对原有变量总体描述情况。第一列是因子分析第14个初始解序号。第二列是因子变量的方差贡献,它是衡量因子重要程度的指标。例如第一行中特征值为12.556,表示第一个因子描述了原有变量总方差14中的12.556,后面因子描述的方差依次减少。第三列是各因子变量的方差贡献率,表示因子描述的方差占原有变量总方差的比例。第四列是因子变量的累计方差贡献率,表示前m个因子描述的总方差占原有变量的总方差比例。第五列到第七列则是从初始解中按照一定标准(前面分析中,设定了提取因子的标准是特征值大于一)提取了3个公共因子后对原变量总体的描述情况。第八到第十是旋转以后得到的因子对原有变量的刻画情况。⑤该图公共因子碎石图。它的横坐标为公共因子的特征值,可见前三个因子的特征值变化非常明显第四个开始特征值变化趋于平缓。因此说明提取3到4个公共因子可以对原变量的信息描述有显著作用。可见,农村居民前三年的消费波动比较大,可能是由于经济的发展,居民消费有了更多的选择余地。⑥该表格是因子的得分矩阵。这是根据回归算法计算出来的因子得分函数的系数,根据这个表格可以得到下面的因子得分函数:F1=0.076x1+0.070x2+......-0.113x14F2=0.025x1+0.044x2+......+0.109x14年份Fac1-1Fac2-1综合得分排名20091037.248850.4141943.830812008958.4096758.7318858.570722007858.8221695.1592776.990732006736.7877597.9232667.355542005637.2479538.1691587.708552004461.4199366.5076413.963772003400.1215310.1441355.1328102002460.4232372.6034416.513362001410.391339.8714375.131282000419.2463327.1717373.20991995348.7455275.8865312.316111990147.037661.717104.377312两个因子加权综合后即表示主要因子各项消费的综合评价,综合得分较高的都是后几年,因此可见近些年来农村居民的平均消费有了显著提高。⑦该表格是按照前面设定的方差极大法对因子载荷矩阵旋转后的结果。为进过旋转的载荷矩阵中,因子变量在许多变量上都有较高的载荷。经过旋转以后,因子变量的含义更加清楚。第一公因子在“交通和通讯上”有较大负荷,第二公因子在“医疗保健上”有较大负荷,因此可以定义评价每年各项消费支出的综合因子;这两个因子的性质及其顺序较好的体现了其所代表的各个消费项目对提取的主要因子对消费支出的综合评价,也完全符合消费支出的内在规律,即农村对提高生活质量方面的消费有所增加而对生活必需品的消费比例有所减少。⑧该部分是因子旋转矩阵表明因子提取的方法是主成份分析,旋转的方法是方差极大法。⑨该部分是载荷散点图,这里是二维因子载荷散点图,以两个因子为坐标,给出各个原始变量在该坐标中的载荷散点图。该图是旋转后因子载荷矩阵的图形化表示,如果因子载荷矩阵比较复杂,则通过该图容易解释。从图中可以看出,农村居民的消费还是主要集中在衣食住方面,提高生活质量的消费支出很少,从图中的医疗保健就可以看出。⑩该部分是因子变量的协方差矩阵。在前面已经说明,所得到的因子变量应该是正交、不相关的。从协方差的矩阵看,不同因子之间的数据为0,因而也证实了2个因子变量之间是不相关的。五.结论和建议通过以上分析,我们不难看出,近些年来,农村居民的平均消费支出不断增加,这得益于近些年的经济发展,商品经济迅速发展,生产能力大幅提高,农村居民有了更多的消费选择。衣食方面的投入有所降低,其他方面的消费有所上升,而且每年消费水平呈上升趋势。但是,我们不难看出,虽然农村居民的消费整体有了提高,可主要集中在衣食住,即时食物较以往降低了,可见农村的消费还是比较保守的。尤其是生活质量方面的消费,比较低,可见我国的社会保障体系尚未建立完善,未来发展中,政府