应用数理统计(论文)中国区域经济类型的聚类和判别分析指导老师:冯伟院系名称:材料科学与工程学号:SY1401211姓名:刘桎东2014年12月20日摘要区域经济发展的指标体系,包括人口总数、第一产业总产值、第二产业总产值、第三产业总产值、财政收入、社会消费品零售总额、货物进出口总额、平均工资、人均可支配收入和居民消费水平等。本文主要通过系统类聚的方法,将全国31个省市(自治区)的2013年经济发展状况进行归类分析,得出全国区域经济发展水平的一些基本情况,并进行了相应的判别分析,为我国经济在快速发展的前提下,做好协调发展提供一些启示。关键字:区域经济聚类分析判别分析中国区域经济类型的聚类和判别分析3目录1引言.........................................................................................................................42数据收集.................................................................................................................53聚类分析.................................................................................................................83.1聚类分析概述..............................................................................................83.2聚类分析过程及结果输出..........................................................................83.3讨论............................................................................................................124判别分析...............................................................................................................144.1判别分析概述............................................................................................144.2判别分析过程及结果输出........................................................................144.3讨论............................................................................................................175结论.......................................................................................................................18参考文献......................................................................................................................19应用数理统计(论文)41引言在制定国民经济和社会发展规划时,通常需要按照行政区域进行经济类型的划分,这有助于对不同地区经济发展存在的差异进行宏观调控,从而因地制宜出台相应的经济政策,促进各地区经济的协调发展,为国民经济持续协调健康发展奠定了坚实基础。明确当前我国发达地区和落后地区的区间格局,对于进一步的研究和分析我国各区域间经济发展的状况,并探求切实可行的区域协调发展政策以实现我国经济的可持续发展有着极为重要的现实意义。在多元统计分析中,常常使用聚类分析和判别分析来解决样本的分类问题。在事先并不知道应将样品或指标分为几类的情况下,可以使用聚类分析根据样本或指标的相似程度,将样本或指标归组分类;而在事先已经建立了样品分类,需要将新样本归入到已知分类的样本组中时,就可以使用判别分析。本文试图通过聚类分析的方法,分析2013年中国31个省市(区域)经济发展发展状况和差异情况,从中寻找一些有用的信息,提出对我国经济如何在快速发展的基础上,做到协调发展的一些思考。本文采用多元统计分析方法,对我国区域经济发展指标进行聚类分析,客观地反映当前各地区的经济类型。中国区域经济类型的聚类和判别分析52数据收集分区指标是表征分区单位的特征因子,它的确定合理与否是分区成败的关键。由于经济是与科技以及人民生活状况等因素直接联系的,为反映全国经济系统的全貌,评价或分析系统时必须充分考虑这三个方面的水平和状态,这是本文选择指标的理论依据,实际选择指标时还要考虑指标与目标的一致性和取得指标数据的可能性。本文选取2013年大陆31省市的10项与经济相关的指标来衡量一个地区的经济发展水平:人口总数(万人)、第一产业总产值(亿元)、第二产业总产值(亿元)、第三产业总产值(亿元)、财政收入(亿元)、社会消费品零售总额(亿元)、货物进出口总额(亿元)、平均工资(元)、人均可支配收入(元)和居民消费水平(元)。上述数据来源于《中国统计年鉴2014》,如表2.1所示。选取33个省市作为聚类的变量。表2.1数据收集地区国内生产总值(亿元)总人口(万人)在岗职工平均工资(元)社会商品零售总额(亿元)货物进出口总额(百万美元)北京21330.831333.41034009638415538.1天津15726.931016.66738394738.7160846.6太原2531.09369.74577711450.210671.05呼和浩特2894.05237.88504691256.12195沈阳7098.71730.84565903570.115800.29长春5342.43754.55569772217.520728.75哈尔滨5340.07987.29515543070.96807.96上海23567.71438.691006239303.5466622.3南京8820.75648.72772864167.257220.77杭州9206.16715.76708234201.567997.75宁波7610.28583.78702282992104704.1合肥5157.97712.81596481666.820087福州5169.16674.94588383062.934663.17厦门3273.58203.44630621072.383553.11南昌3667.96517.73518481304.912226.43济南5770.6621.61623233087.610500.14青岛8692.1780.64620973361.779888.33应用数理统计(论文)6郑州6776.99937.8497562913.646430.9武汉10069.48827.31606244369.326428.87长沙7824.81671.41618473162.112561.3广州16706.87842.42742467144.5130589.8深圳16001.82332.21734924844487765南宁3148.3729.66543301616.94814.1海口1091.7165.3150653541.33400.9重庆14262.63375.2568525710.795450.24成都10056.591210.74632014468.955844.39昆明3712.99550.5581531905.929394.32拉萨347.4552.7372468180.32076.29西安5492.64815.29540983093.924982.97兰州2000.94374.6754008944.94556.49西宁1065.78202.6454914414.11596.74银川1388.6219659080382.54500乌鲁木齐2461.47266.916161710708284.58表2.1数据收集省份社会消费品零售总额(亿元)货物进出口总额(亿元)平均工资(元)人均可支配收入(元)居民消费水平(元)北京8375.1428995819300640321.033337天津4470.4128501796777332293.626261河北10516.754911574150122580.311557山西5139.315790984640722455.612078内蒙古5114.211994575072325496.717168辽宁10581.4114478194550525578.220156吉林5426.425831744284622274.613676黑龙江6251.238879094079419597.012978上海8052.0441268229090843851.439223江苏20796.5550802275717732537.523585浙江15225.5335788715657137850.824771安徽6542.445518974780623114.211618福建8275.3169320904853830816.417115江西4576.136746634247321872.711910山东22294.8266531534699828264.116728河南12426.659956873830122398.011782湖北10885.936380084389922906.413912湖南9018.625175314272623414.012920广东25453.91091581445331833090.023739广西5133.132827504139123305.411710中国区域经济类型的聚类和判别分析7海南992.914985434497122928.911712重庆4599.868692165000625216.115270四川10561.464574664796522367.612485贵州2366.28290104736420667.19541云南4004.625303564244723235.511224西藏293.23319415777320023.46275陕西4999.520128064744622858.413206甘肃2173.810236114283318964.89616青海544.11402745139319498.512070宁夏610.53217695047621833.313537新疆2108.227561394906419873.811401应用数理统计(论文)83聚类分析3.1聚类分析概述聚类分析的基本思想认为所研究的样品或指标之间存在着程度不同的相似性,于是根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。研究怎样对事物进行合理分类(归类)的统计方法称为聚类分析。依据分类对象的不同可以把聚类分析再分成Q型聚类和R型聚类,Q型聚类是指对样品进行聚类,R型聚类是指对变量进行聚类。聚类分析的基本原理是把某种性质相似的对象归于同一