文章编号:中国省区城市化动力水平的定量分析***摘要:首先选取2010年全国31个省区城市的27个城市化动力的指标,应用SPSS(StatisticalProductandServiceSolutions:是IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务)对此进行了主成分分析;然后结合主成份分析结果,利用聚类分析方法得到了全国省区城市化动力水平的谱系图,在此基础上,探讨全国省区城市化动力水平的相似性和差异性。结果表明:利用主成份分析和系统聚类方法分析中国省区城市化动力水平,科学,合理,与实际情况相符合。关键词:城市化动力水平、主成份分析、系统聚类、中国省区城市1.引言城市化是目前社会经济发展的重要问题,所谓城市化是指随着一个国家或地区社会生产力的发展、科学技术的进步以及产业结构的调整,其社会由以农业为主的传统乡村型社会向以工业(第二产业)和服务业(第三产业)等非农产业为主的现代城市型社会逐渐转变的历史过程。从产业结构和制度的角度论述城市化的动力机制,主要有以下四个方面:1)现代化的农业是城市化的先决条件。2)工业是城市化发展的根本力量。3)第三产业是城市化进程中的加速器。4)制度是城市化进程中的助推器。本文选取了2010年中国31个省区城市27个指标城市化动力指标,应用SPSS统计软件对此进行主成份分析;然后结合主成份分析结果,利用聚类分析方法得到全国省区城市化动力水平的谱系图;最后探讨了全国省区城市化动力水平的相似性和差异性。试图分析2010年全国省区城市化的动力机制,为推进城市化发展探寻影响因素。表1指标的选取社会经济发展指标产业结构指标制度和政策指标教育和科技指标X1:人均GDP(元)X9二三产业与第一产业的比值(%))X21人均外贸进出口总额(元)X26科技支出所占比重(%)X2人均住宅建设投资总额(元)X10第一产业增加值占GDP的比值(%)X22人均利用外资(元)X27人均公共教育经费(元)X3人均社会固定投资(元)X11第一产业就业所占比重(%)X23非农产业就业比重与城市化水平之差(%)X4人均邮电业务量(元)X12人均农业总产值(元)X24非国有经济就业人数占城镇总就业人数的比重(%)X5交通运输能力指数(公里/每平方公里)X13农民人均纯收入(元)X25财政支出占GDP比重(%)X6每千人口有医生数(人)X14第二产业增加值占GDP比重(%)X7人均城乡储蓄存款余额(元)X15工业生产总值占工农业总产值的比重(%)X8居民人均消费水平(元)X16第二产业就业所占比重(%)X17人均工业总产值(元)X18第三产业增加值占GDP比重(%)X19第三产业就业比重(%)X20邮电业务总量/GDP(%)2.全国省区城市化动力水平的“降维”分析2.1指标选取按照城市化的内涵和指标构建原则,结合上述产业结构和制度机制对城市化的影响,可把影响城市化发展的动力因素评价指标体系概括为四大类:经济发展指标、产业结构转化指标、制度和政策指标、教育科技指标。1)社会经济发展指标,城市化的发展水平由一个国家地区的社会经济发展水平所决定,社会经济的发展构成了城市化的根本动力,社会经济的发展水平越高,城市化水平就越高。2)产业结构指标,城市化的实质表现为农业人口非农业化,产业结构之间的转变,故产业结构的不同直接反映了城市化的不同水平,构成了城市化的直接动力。3)制度和政策指标,一国的社会保障和福利机制越完善,一个国的开放程度越高,越能更好的促进要素在地区间的流动,从而促进城市化。4)教育和科技指标,反映了一国的受教育水平和科研水平,在城市化中,受教育水平越高,其经济能力和素质往往也越高;发达的科技水平除了直接促进城市化进程之外还提高了一国城市化的潜在水平。所以在本文选取了这四大类指标里的27个指标(见表1)作为变量,并对这些指标做主成分(降维)分析。2.2指标间的相关性分析利用SPSS软件对原始数据做标准化处理,然后计算得出各指标间的相关系数矩阵,其结果见表2和表3。由表2和表3不难看出,原始变量数据中,有些要素之间有着密切的相关关系,例如X1(人均GDP)和X8(居民人均消费水平)、X13(农民人均纯收入);X4(人均邮电业务量)和X7(人均城乡储蓄存款余额)、X21(人均外贸进出口总额);X7(人均城乡储蓄存款余额)和X8(居民人均消费水平)、X21(人均外贸进出口总额);X8(居民人均消费水平)和X21(人均外贸进出口总额)、X26(科技支出所占比重);X11(第一产业就业所占比重)和X12(人均农业总产值);X13(农民人均纯收入)和X26(科技支出所占比重);X21(人均外贸进出口总额)和X26(科技支出所占比重),而有些要素之间,相关系数几乎为零,例如X11(第一产业就业所占比重)和X14(第二产业增加值占GDP比重);X14(第二产业增加值占GDP比重)和X24(非国有经济就业人数占城镇总就业人数的比重);X23(非农业就业比重与城市化水平之差)和X26(科技支出所占比重),另外,还有的变量之间的相关系数为负值,例如X1(人均GDP)和X10(第一产业增加值占GDP的比值)、X11(第一产业就业所占比重)、X12(人均农业总产值)。2.3主成分贡献率及其主成分载荷分析通过SPSS软件计算得到主成分特征值、贡献率、累计贡献率(见表4)。由表4可知,前四个主成分的累计贡献率为87.886%(理论上为80%-85%),所以选取前四个主成分,就可以综合代表27个指标所反映的中国各个城市化动力的特征和基本情况。主成分载荷矩阵(表5)表明:第一主成分(贡献率为46.039%)在人均邮电业务量、人均城乡储蓄存款余额、二三产业与第一产业的比值、第三产业增加值占GDP比重、第三产业就业比重、人均外贸进出口总额、人均公共教育经费上具有很大的正载荷(0.901、0.916、0.897、0.924、0.930、0.892、0.974),这7个指标反映了经济发展指标、产业结构转化指标、制度和政策指标、教育科技指标这四类指标是中国大部分城市的城市化推进的主要动力,可以说明第一主成分在某种程度上代表着中国城市化水平的整体状况;第二主成分(贡献率为22.149)在邮电业务总量/GDP上具有较大的负载荷(-0.836),这说明第二主成分在一定程度上代表了产业结构对城市化的影响;第三主成分(贡献率为13.989%)在交通运输能力指数上有一定的正载荷(0.947),这说明第三主成分代表了交通运输能力的强弱,在一定程度上可以反应城市化的进程;第四主成分(贡献率为5.709)在非农业就业比重与城市化水平之差上存在很大的正载荷(0.947),这可以说明制度和政策在一定程度上决定着城市化进程的快慢。表4主成分特征值、贡献率、累计贡献率Table4Theeigenvalue,contributionrateandaccumulativecontributionrateofPC特征值贡献率%累积贡献率%112.43046.03946.03925.98022.14968.18833.77713.98982.17641.5415.70987.8863.全国省区城市化动力水平的区域相似性和差异性分析系统聚类分析方法是定量地研究地理事物分类问题和地理分区问题的重要方法。因此我们采用系统聚类分析方法对中国各省区城市的城市化动力水平的相似性和差异性作综合和系统的分析。3.1基于欧氏距离的聚类计算首先采用标准差标准化方法对四个主成分得分的数据进行处理;然后采用欧式距离测度样本间距离;最后计算出8种系统聚类分析方法的结果,通过比较选出Ward法计算类间的距离并对样本进表5主成份载荷矩阵aTable5TheloadmatrixofPCA1234X1.808.454.327-.072X2.692.403.280-.175X3.489.746.047-.181X4.901.147.279-.047X5.337.293.743.153X6.764.410-.229-.153X7.916.242.249-.042X8.822.290.446-.049X9.897.151.224-.066X10-.598-.636-.123-.300X11-.697-.487-.434-.230X12-.640-.658-.209-.136X13.774.331.487.036X14-.559.764.106.152X15.323.759.319.063X16.143.643.610.362X17.449.713.415-.045X18.924-.294-.018.057X19.930.086.039-.020X20-.001-.836-.282.047X21.892.115.388-.005X22.643.405.283-.223X23-.141.033.133.947X24.398.248.686.204X25.098-.524-.639.301X26.821.183.494.027X27.974.081.005.086行分类,从而得到全国省区城市化动力水平的谱系图(见图1)。3.2全国省区城市化动力水平的区域相似性和差异性分析当按如图1所示的两条长竖线切开时,可以将中国31个省区城市划分为五个类和十二个亚类。第一类:上海、北京2个城市,其中上海为一亚类,北京为一亚类。这2个城市都是城市化水平相当高的城市,远高于全国平均水平,但是相比来说,北京是政治色彩浓重的城市,而上海则是经济更为发达的城市。所以这两个城市的城市化动力又很多相似之处,却也存在些许差异。第二类:内蒙古、天津、辽宁、吉林、黑龙江5个城市,其中内蒙古、天津、辽宁为一亚类,吉林、黑龙江为一亚类。这5个城市都基本都属于东北老工业基地,城市化动力很大程度上来源于工业,面对目前的老工业基地惨淡的状况,各界人士都在想办法,提出转型等方法,所以,目前这些城市的城市化核心动力尚未稳定。第三类:海南、云南、广西、湖南4个城市,其中海南为一亚类,云南、广西、湖南为一亚类。这四个城市的城市化水平处于一般状态,相对而言,海南的城市化动力更多的取决于服务业的发展,例如旅游,而其他三个城市还主要靠农业来推进城市化。第四类:西藏、贵州、新疆、甘肃、陕西、宁夏、山西、青海8个城市,其中西藏为一亚类,贵州、新疆、甘肃、为一亚类,陕西、宁夏、山西、青海为一亚类。农业主要是这8个城市的城市化最主要的动力,工业的发展对于城市化的推动作用也在稳步上升,有望在未来成为推进这些地区城市化的重要力量。第五类:广东、福建、江苏、浙江、山东、安徽、河南、重庆、四川、湖北、河北、江西12个城市,其中广东、福建为一亚类,江苏、浙江为一亚类,山东、安徽、河南、重庆、四川、湖北、河北、江西为一亚类。这12个城市主要的城市化动力来源于工业和农业,广东和福建的经济相对比其他几个发达,主要原因在于外资对城市化的作用逐渐增强;江苏和浙江推进城市化的主要动力来自服务业的发展、经济与社会基础和资本等;而山东、安徽、河南、重庆、四川、湖北、河北、江西这8个城市的城市化动力处于波动状态,各种影响城市化的因素之间此消彼长,说明其城市化核心动力尚未稳定。4.结论通过主成份分析将选用的用于分析全国省区城市化动力水平的27个指标,“降维”成了4个综合的、独立的、且功能明确的主成分,避免了27个斜交的、相关的指标在分析问题上造成的偏差。这4个主成分累计贡献率达87.886%;由主成分载荷可知,X5(交通运输能力指数)、X18(第三产业增加值占GDP比重)、X19(第三产业就业比重)、X27(人均公共教育经费)对全国省区城市化动力水平的影响作用突出。系统聚类分析结果(谱系图),揭示出了全国省区城市化动力水平在各个城市的相似性与差异性的特点和规律。城市化发展的过程不论是产业结构的改变还是制度创新引起的农村人口向城市人口的转变都将体现在城市的吸引力和农村的离心力上即拉力和推力上,城市生活的优越是主动的表现为对城市生活的向往,农村生活的落后,是被动的,表现为迫使人们对农村生活