基于聚类分析的各地区经济发展水平的评价武冬冬1210110057摘要:运用K均值法进行聚类分析,从第一产业,第二产业,第三产业3个方面,对我国2012年31个省自治区和直辖市三个产业产值进行聚类分析。分析表明我国各地区经济发展水平存在显著差异,这种差异反映了各地区各产业产值发展不协调的现状。在保证我国经济平稳发展的基础上,给欠发达地区给予政策上的帮助还是很有必要的。关键词:聚类分析;产业产值;K均值法;协调发展1引言改革开放以来,我国从一个贫穷落后的国家逐步发展为世界第二大经济强国。我国经济的快速发展离不开各省自治区直辖市的贡献。而各省经济发展水平存在显著差异,为了缩小这种差距保持经济的平稳增长,离不开政府政策上的支持。本文通过对2012年31个省自治区和直辖市三个产业产值进行聚类分析,把他们分为三大类,发达地区,中等发达地区,欠发达地区。这可以给政府制定相关政策提供参考,争取实现资源的合理配置,缩小各地区经济发展水平。实现国民经济的协调发展,不仅要求优化产业结构,而且还要求建立合理的地区经济结构。地区经济结构,是指国民经济中各地区之间的发展关系和结合状况。优化地区经济结构,就是要求生产要素在各个地区之间的合理配置,使各个地区在国民经济整体活动中,能够充分发挥各自的特点和优势,并相互补充,相互配合,共同协调一致地发展。我国地域辽阔,各地条件差异很大,经济发展不平衡。按照经济的发达程度不同,目前大致可以分为东、中、西三大经济地区。东部地区是我国经济发达地区,物质技术基础雄厚,科技教育比较发达,管理水平较高,交通便利,城市规模和城镇密度较大,经济处于“成熟”型阶段。中部地区工农业有比较雄厚的基础,拥有大批科技人才,水电资源和矿产资源极为丰富,是全国最重要的煤、油、电基地和化工、钢铁、有色金属等原材料基地,经济处于“成长”型阶段。西部地区自然条件较差,交通不便,经济文化比较落后,但资源丰富,发展前景可观,经济处于“开发”型阶段。地区间经济发展不平衡是各个大国经济发展进程中的普遍现象。我国地域辽阔,自然条件、地理环境、历史文化背景差异极大,经济总体发展水平低,交通运输条件差。所以,地区经济发展的不平衡更为突出。东部沿海属于经济比较发达地区,中部属于经济次发达地区,西部属于经济不发达地区。而且这种经济发展不平衡还在继续扩大。我国不发达地区又主要是在老革命根据地,少数民族聚居区和我国的边疆地区。所以,发展地区经济,优化地区经济结构具有十分重要的经济意义和政治意义。这主要是:(1)地区经济协调发展是整个国民经济发展的重要条件。只有发挥各地区的特点和优势,充分利用各地区的自然资源、人力资源、物质技术条件加速地区经济发展,从而才能促进整个国民经济的发展。(2)地区经济的发展可以使各地更好地互相补充、互相协作,协调发展,发挥国民经济整体优势。(3)地区经济协调发展是我国消灭贫困,使全国各族人民的生活达到小康水平,最终实现共同富裕的必不可少的条件。(4)加快不发达地区,特别是少数民族地区经济的发展,对于保持社会安定,加强民族团结,巩固国防具有特别重要的意义。2研究方法2.1K均值聚类分析的基本思想原理K均值法(又称快速聚类法),是由MacQueen于1967年提出的,它将数据看成K维空间上的点,以距离作为测度个体“亲疏程度”的指标,并通过牺牲多个解为代价换得高的执行效率。但是,K均值法只能产生指定类数的聚类结果,而类数的确定离不开实践经验的积累。2.2K均值聚类分析的步骤K均值法的具体算法至少包括以下三个步骤:(1)将所有的样品分成K个初始类;(2)通过欧几里得距离将某个样品划入离中心最近的类中,并对获得样品与失去样品的类,重新计算中心坐标;(3)重复步骤(2),直到所有的样品都不能再分配时为止。2.3聚类分析的主要应用商业:聚类分析被用来发现不同的客户群,并且通过购买模式刻画不同的客户群的特征。聚类分析是细分市场的有效工具,同时也可用于研究消费者行为,寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。经济:聚类分析能对各地区的经济发展水平进行分类,为城市经济排名提供理论依据。生物:聚类分析被用来动植物分类和对基因进行分类,获取对种群固有结构的认识。地理:聚类能够帮助在地球中被观察的数据库商趋于的相似性。保险行业:聚类分析通过一个高的平均消费来鉴定汽车保险单持有者的分组,同时根据住宅类型,价值,地理位置来鉴定一个城市的房产分组。因特网:聚类分析被用来在网上进行文档归类来修复信息。电子商务:聚类分析在电子商务中网站建设数据挖掘中也是很重要的一个方面,通过分组聚类出具有相似浏览行为的客户,并分析客户的共同特征,可以更好的帮助电子商务的用户了解自己的客户,向客户提供更合适的服务。3基于聚类解决。3.1问题描述我国各地区经济发展总体平稳,但各地区三次产业产值明显存在差距。给各个地区一个合理的定位很有必要,这是国家政策制定的需要,也是消除社会财富两极分化的基础。根据2012年31个省自治区和直辖市三个产业产值,用一种合理的方法把他们分为三类。3.2问题分析对31个地区的经济水平进行分类,用聚类分析的方法解决比较合理。系统聚类计算量比较大,而且占据大量计算机内存空间。在已知分类数目的基础上运用K均值法,可以快速聚类,而且这种方法得到的结果简单易懂,对计算机的性能要求不高,因此应用比较广泛。3.3调用SPSS的程序模块操作步骤和截图(1)打开数据,如图1。图1(2)打开分析、分类、K-均值聚类出现如图所示对话框,如图2。图2(3)将第一产业,第二产业,第三产业,移到K-均值聚类的变量选项。在K均值聚类对话框中选择聚类数为3,迭代里选择默认选项,保存中勾选全部选项,选项里统计量栏勾选全部如图3.图3(4)运行程序,结果如下表。表2表3表14结果与讨论4.1结果描述由表1,表2,表3可知我们可以看到31个地区被分成3类。第一类有江苏,山东,广东三个省。这一类的类中心三个产业产值分别为3515.8亿元,26852.88亿元,23344.49亿元,他们属于三个产业都比较发达的地区。第二类有北京,天津,辽宁,上海,浙江,福建,河南,湖南,湖北,四川十个省。这一类的类中心三个产业产值分别为2198.5亿元,11735.74亿元,10238.43亿元,他们属于中等发达的地区。第三类有天津,山西,内蒙古,吉林,黑龙江,安徽,江西,广西,海南,重庆,贵州,云南,西藏,陕西,甘肃,青海,宁夏,新疆十八个省。这一类的类中心三个产业产值分别为1102.3亿元,4874.03亿元,3672.88亿元,他们三个产业都比较落后,属于欠发达的地区。4.2结果分析由表2可知,发达地区的第二产业与第三产业产值明显高于其他地区第二,三产业产值。而发达地区,中等发达地区,欠发达地区的第一产业相差并不大,特别是欠发达地区第二,三产业都远远低于发达地区和中等发达地区。所以要提高欠发达地区经济发展水平,重点发展第二,三产业很有必要。而经济的发展也需要依据各个地区特有的优势,不能单纯为了为了经济的发展而做出违背自然规律的决策。由表3可知,我国比较发达的地区只有三个,中等发达的有10个,欠发达地区达到18个,几乎占到总省份一半。由此可知我国各地区经济发展水平面临两极分化的现象。发达只是少数,大部分都是欠发达和中等发达的水平。所以让发达地区带动欠发达的地区发展经济也是一个不错的选择。5参考文献[1]基于因子和聚类分析对河南省18地区的综合经济实力评价,陈金曼(河南财经政法大学金融学院,郑州450002)[2]中国统计年鉴,2012[3]朱建平主编应用多元统计分析北京:科学出版社,2006[4]何晓群编著应用多元统计分析北京:中国统计出版社,2010.06[5]高惠璇编著.应用多元统计分析.北京:北京大学出版社,2005.01