多元统计分析期末论文题目:基于聚类分析的农村居民家庭人均生活消费支出的研究姓名:侯璐瑶学号:1007114019学院:国际商学院专业:信息管理与信息系统年级:2010级班级:10708班2013年12月30号基于聚类分析的农村居民家庭人均生活消费支出的研究I中文摘要随着社会经济的快速发展和新农村建设的不断推进,我国农村经济社会得到了又好又快的发展,农民生活水平也得到了很大的提高,但是,由于我国各省市的经济背景、社会背景和环境背景等都存在着这样或那样的差异,从而导致了生活消费水平也参差不齐。为了客观的了解我国农村居民的总体消费水平和生活现状,本文运用spss软件中的各种分析方法对我国农村居民的人均消费情况进行科学的分析。关键字:消费支出;频数分析;参数检验;聚类分析;基于聚类分析的农村居民家庭人均生活消费支出的研究IIABSTRACTWiththerapiddevelopmentofsocialeconomyandthecontinualconstructionofnewcountryside,China'sruraleconomicandsocialdevelopmenthasbeenfast,withpeople’slivingstandardshavebeengreatlyimproved.However,duetothedifferencesineconomy,societyandenvironmentbetweenprovincesandcities,theconsuminglevelsarealsodifferent.Inordertoobjectivelyunderstandtheoverallconsumptionlevelsandlivingstatusofruralresidents,thepaperusesavarietyofanalyticalmethodsofferedbyspsssoftwaretogivescientificanalyzeforpercapitaconsumptionsituationofruralresidents.KeyWords:Consumerspending;frequencyanalysis;parametrictests;clusteranalysis基于聚类分析的农村居民家庭人均生活消费支出的研究III目录一、引言....................................................................................................1二、研究目的和意义................................................................................1三、现状分析............................................................................................1四、聚类分析的原理及步骤....................................................................2(一)聚类分析原理............................................................................................2(二)基本步骤....................................................................................................2五、引入变量建立聚类模型....................................................................2(一)引入变量....................................................................................................2(二)建立模型....................................................................................................3六、参数检验—单样本t检验................................................................6七、结论....................................................................................................7八、建议和意见........................................................................................7(一)加大价格监管力度,保证正常生活........................................................7(二)加强合理引导,促进消费增长................................................................8参考文献:.................................................................................................9基于聚类分析的农村居民家庭人均生活消费支出的研究1基于聚类分析的农村居民家庭人均生活消费支出的研究一、引言我国是一个农业大国,至今仍有9亿农村人口,占全国人口总数的70%,农民是我国最大的消费群体,农村消费能力的提升直接关系到国民经济的全局。从农村市场看,中国有近六成人口(约8亿)生活在农村。农村城镇化的进程对经济增长的带动作用是非常明显的,世界上还没有哪个国家有规模如此巨大的城镇化。农村居民的收入虽然低于城市居民,但是基数巨大,且农村人口的收入也在稳定增长。据测算,目前1个城镇居民的消费水平大体相当于3个农民的消费;城市化率提高1个百分点,就会有100万~120万人口从农村到城市。由于城市人口的消费是农村的2.7~3倍,约拉动最终消费增长1.6个百分点。随着经济的发展,我国农民的消费水平和结构也发生了很大变化,农民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。但从总体来看,农民消费水平仍然较低,调查显示有的地区都不及城市居民人均消费支出的三分之一。而且消费结构不合理,局限于食品类等生存基本需求品,消费在衣着装饰等方面的极少。而影响农民消费水平的根本原因是农民的收入。二、研究目的和意义改革开放以来,中国经济的发展迅速,在社会主义市场经济的运作过程中,消费不仅可以满足人的多方面的欲求,而且,也会促进生产的发展,它所表现出的历史规定性,可以折射出不同社会阶段中消费关系的本质特征。我国人口众多,而且一半以上的人口在农村,农村居民的消费水平逐渐成为了制约我国经济发展的重要影响因素,因此,加强对农村居民的消费水平和消费结构的研究,不仅有利于改善我国农村居民的消费现状,而且对拉动我国经济增长有重要意义。三、现状分析目前,我国不同地区农村居民消费水平差异显著,东西部发展的差距尤为明显;尽管农村居民消费水平正在逐步提高,但与城镇居民相比仍然偏低,经济发基于聚类分析的农村居民家庭人均生活消费支出的研究2展水平仍有待提高;近年来,农村居民消费率持续下降,与城镇居民的差距正在拉大;另外,农村居民的消费结构仍以食品、衣着、住房为主。四、聚类分析的原理及步骤(一)聚类分析原理聚类分析就是将未知数据按相似程度分到不同的类或簇的过程。其实质就是寻找一种能客观反映元素之间亲疏关系的统计量,然后根据这种统计量把元素分成若干类。常用的聚类统计量有距离系数和相似系数两类。聚类分析的基本思想是在样品之间定义距离,在变量之间定义相似系数,距离或相似系数代表样品之间的相似程度。按相似程度的大小将样品逐一归类,直到所有样品都聚类完毕,形成一个表示亲疏关系的谱系图,依次按照某些要求对样品进行分类。(二)基本步骤1.选择描述事物对象的变量(指标)。2.建立样品数据资料矩阵。3.确定数据是否要标准化。4.确定表示对象距离或相似程度的统计量。5.选择适当的聚类方法,进行聚类。五、引入变量建立聚类模型(一)引入变量随着经济的发展,我国农民的收入水平和消费水平的结构也发生了很大变化,农民生活水平的提高和消费的增加对于实现国民经济又好又快发展、正确处理好内需和外需的关系至关重要。但从总体来看,农民消费水平仍然较低,调查显示有的地区都不及城市居民人均消费支出的三分之一。而且消费结构不合理,局限于食品类等生存基本需求品,消费在衣着装饰等方面的极少。而影响农民消费水平的根本原因是农民的收入。农民生活消费支出主要包括食品、衣着、医疗卫生、教育文化、家庭设备、交通等方面,本文只挑选了四种典型的消费支出作为代表来分析农村居民的消费基于聚类分析的农村居民家庭人均生活消费支出的研究3结构。(二)建立模型数据表如图(本数据来自于天津市统计年鉴2012年)具体步骤如下:1.确定组数:k=1+ln(n)/ln2=1+ln31/ln2=62.确定组距:组距=(最大值-最小值)/组数=(8844.88-1913.71)/6=1155.20基于聚类分析的农村居民家庭人均生活消费支出的研究43.频数分析基于聚类分析的农村居民家庭人均生活消费支出的研究5利用spss先前已经对数据做好的分组,通过频数分析,可以进一步了解分组后的消费支出合计取值的状况,进而准确的把握数据的分布特征。分析结果如下:表1-2(a)分组后的消费支出合计频率百分比有效百分比累积百分比有效1.001858.158.158.12.00929.087.13.0013.23.290.34.0013.23.293.55.0013.23.296.86.0013.23.2100.0合计31100.0100.0表1-2(b)表1-2(c)已知,全国31个省市按照消费合计总共被分成了6组,从表1-2(b)中可以得出:第一组的省市最多,共有18个,所占比率为58%;第二组有9个,所占比率为基于聚类分析的农村居民家庭人均生活消费支出的研究629%;而剩下的组都只有1个省市,所占比率均为3.2%。由于在表格中不存在缺失值,因此频数分布表中的百分比和有效百分比相同。从此次分析中可以看出,我国农村家庭居民人均消费的总体水平比较集中,大约在2000元-3000元之间,还有少数省市的消费水平处在中等阶段,而只有上海、北京、浙江等一些经济较发达的地区的农村家庭居民人均消费达到了6000元以上。也就是说,我国农村家庭消费总水平还处在比较低的阶段。六、参数检验—单样本t检验由表1-3可知,分组后,全国31个省市的农村家庭居民平均每人生活消费支出合计,大约有18个城市都集中在第一组,数额主要1913.71元-3065.44元之间,因此可推断,全国农村家庭居民平均每人生活消费支出的平均数应该在1913.71元-3065.44元之间,假设为2600元,由于该问题涉及的是单个总体,且要进行总体均值检验,同时农村家庭居民平均每人消费的总体可近似认为服从正态分布,因此,应采用单样本t检验来分析推断全国农村家庭居民人均消费的平均值是否为2600元。分析结果如下:单个样本统计量N均值标准差均值的标准误生活消费支出合计313376.30871499.61216269.33830表1-3(a)单个样本检验检验值=2600tdfSig.(双侧)均值差值差分的95%置信区间下限上限生活消费支出合计