毕业设计(论文)华东六省GDP总量的聚类分析及灰色预测系别:数学与物理系专业(班级):数学与应用数学2011级2班作者(学号):方玲(51105012013)指导教师:孙西超(博士)完成日期:2015年5月7日蚌埠学院教务处制目录中文摘要……………………………………………………………………………………………………1英文摘要………………………………………………………………………………………21引言………………………………………………………………………………………31.1聚类分析研究的背景及意义……………………………………………………………31.2灰色预测研究的背景及意义……………………………………………………………………51.3本文研究的主要内容……………………………………………………………………62预备知识…………………………………………………………………………………62.1聚类分析原理……………………………………………………………………………62.1.1聚类分析基本概念………………………………………………………………………62.1.2聚类分析方法计算步骤…………………………………………………………………62.2灰色预测模型数学理论…………………………………………………………………72.2.1灰色预测原理……………………………………………………………………………72.2.2灰色预测方法计算步骤………………………………………………………………103华东六省GDP总量的聚类分析………………………………………………………123.1问题的提出……………………………………………………………………………123.2指标体系的选择…………………………………………………………………………123.3聚类分析模型的建立及求解……………………………………………………………123.3.1原始数据的录入………………………………………………………………………123.3.2原始数据标准化………………………………………………………………………133.3.3各分量距离的计算……………………………………………………………………133.3.4样本的聚类……………………………………………………………………………144灰色预测结果的分析检验……………………………………………………………164.1问题的提出………………………………………………………………………………164.2灰色预测模型的建立与求解……………………………………………………………164.2.1原始数据的录入………………………………………………………………………164.2.2华东六省GDP总量的灰色预测……………………………………………………174.3灰色预测结果的分析检验……………………………………………………………174.3.1残差检验………………………………………………………………………………184.3.2关联度检验……………………………………………………………………………194.3.3后验差检验……………………………………………………………………………205结论………………………………………………………………………………………22谢辞…………………………………………………………………………………………23参考文献……………………………………………………………………………………24附录…………………………………………………………………………………………25蚌埠学院本科毕业设计(论文)-1-华东六省GDP总量的聚类分析及灰色预测摘要:本文主要研究聚类分析算法及灰色预测模型的实际运用,首先应用聚类分析法对华东六省的经济发展状况(GDP)进行分析,然后应用灰色预测方法深入研究华东六省GDP的走势,预测出新的一年各个省GDP的总量,并对预测结果进行分析检验。通过对华东地区各省经济总量(GDP)的聚类分析研究,将华东六省分为两大经济发展阵营,即山东省地处北部独立为一个经济区,其余五省地处南部归为一个经济区。通过对华地区各省经济总量(GDP)的灰色预测研究,进一步提出华东六省的经济发展的建议和策略,使本地区的经济有一个快速的发展。关键词:聚类分析;灰色预测;相关系数;经济总量方玲:华东六省GDP总量的聚类分析及灰色预测-2-ClusteringanalysisandgrayforecastineastChinasixprovincesofGDPAbstract:Inthispaper,westudythepracticalapplicationofclusteranalysisalgorithmandgreypredictionmodelmaninly,applicationofclusteringanalysisinthefirstplace,economicdevelopmentofsixprovincesinEastChina(GDP)analysis,thentheapplicationofgreyforecastingwayisstudiedinsixprovincesinEastChinaGDPtrend,predicttotalnewyearofeachprovinceofGDP,andtheforecastanalysisofinspection.IneastChinaprovinceseconomy(GDP)clusteringanalysisResearch,eastChinasixprovincesisdividedintotwomajoreconomicdevelopmentcamp,theShandongprovinceislocatedinthenorthasanindependenteconomiczone.Therestfiveprovincesislocatedinthesouthasaeconomicregion.AndputforwardthesuggestionsandStrategiesofthesixprovincesofeasternChina'seconomicdevelopment,theregion'seconomicdirectiontowardsfast.Keywords:Clusteranalysis;grayprediction;correlationcoefficient;totaleconomy蚌埠学院本科毕业设计(论文)-3-华东六省GDP总量的聚类分析及灰色预测1引言1.1聚类分研究的背景及意义聚类分析11起源于分类学。由于人类技术科学的高度发展,分类的要求也就越来越严格,有时候凭着经验和专业的知识都难以正确的将其分类,所以人们渐渐地就在分类学中运用到了聚类分析,这样就造就了数值分类学,此后又因为多元分析技术的引入形成了聚类分析。聚类分析涉及的内容很广泛,从现实应用的方面来看,聚类分析与数据挖掘有很大的关联。而且聚类分析作为一个独立使用的方法,可以根据这个方法得到分布数据的结果,观察数据的每一项特点,然后在对特定的一项进一步地分析,就可以达到聚类的效果。有时其他算法也将聚类分析作为预处理步骤,由于多元分析的深入,聚类分析慢慢形成了自己的特点,最后从数值分类学中隔离了出来,单独形成了一门科学。2008年谢昆青,雷小锋,林帆]4[等推算出一种以K-Means局部最优性为基础的高效聚类性算法。在同一年,孙亮,岳峰]5[等把聚类分析运用到了基因表达中。在社会经济领域中包含着大量分类问题。比如若对一个大学进行评估考察,而考察方面很多,有毕业率,就业率,考研率,学习氛围等等,就要对其分类,总之,在生活中存在分类的问题有千千万,所以聚类分析这种方法受到人们的重视也就毋庸置疑了。1.2灰色预测研究的背景及意义以灰色系统理论为基础而形成的动态预测模型,可是说是灰色预测,其中用的最多的的算是GM(1,1)序列预测模型,这个模型很多学者都喜欢拿来研究。邓聚龙]1[教授自从提出GM(1,1)模型以来,正因为它的俩个优势,一个是所需要的样本量少,二个是计算比较简单,所以它在社会、经济、生态、农业等各个领域都有大量的运用。为了增加GM(1,1)预测模型的适用范围和预测精度,很多数学研究者做了大量的准备,这些研究者有对数据进行大量处理的,也有促进求解模型中参数和计算方法的简便性的。1991年雏卫星]2[提出了电力负荷预测的灰色模型,随后在2003年刘建齐]3[把灰色预测GM(1,1)模型使用到了道路交通事故中。灰色预测模型(GrayForecastModel)是在数学建模研究中最常使用的一类预测方方玲:华东六省GDP总量的聚类分析及灰色预测-4-式,这种预测只要建立在很少的、不完整的信息上就可以。当我们在使用自己的思维模式来解决实际生活的问题时,要制定发展方向和策略、进行重大问题的决定时,都一定要对未来发展作出科学有效的预测。所谓什么叫做预测,那就是根据已经存在的现象和现在的发展趋势,在运用科学有效的预测方法,让我们知道未来大致的未来发展路线,在其基础上作出相应的应对措施和改革。灰色系统理论在解决灰色系统中存在的问题起到了至关重要的作用,是灰色系统阐述、建模、测定、计划和掌握的基础。对灰色系统做出的预测主要是灰色预测。现在我们常用的预测有很多,都要在巨大的数据的基础啊上,计算起来计较复杂。而且样本量不够的话,就会存在较大误差,使预测目标偏离实际。正因为灰色预测模型在数据上的要求不多,计算也不是很繁杂,建模精度又高,在预测领域中运用的越来越广阔,在小样本的预测问题上也表现出更大的有效性。蚌埠学院本科毕业设计(论文)-5-1.3本文研究的主要内容本文主要研究聚类分析算法及灰色预测模型的实际应用,首先应用聚类分析法对华东六省的经济发展状况(GDP)进行分析,将华东六省的经济发展状况并结合各省地理位置划分经济区,然后应用灰色预测方法深入研究华东六省GDP的走势,预测出新的一年各个省GDP的总量,并对预测结果进行分析检验。方玲:华东六省GDP总量的聚类分析及灰色预测-6-2预备知识2.1聚类分析原理2.1.1聚类分析基本概念怎样把样品(或指标)对其规整分类,这就要探讨样品之间的联系。比如说对样品的相似系数进行运算,得到的结果绝对值越接近1,表现了样品之间的性质越类似。反之,得到的结果绝对值越接近于零,表示样品之间性质越无关。相似的样品规整在一类,不怎么相似的规整为一类。这就是相似系数的运用。还有就是将一个样品当作P维空间的一个点,然后在定义距离作为空间里的参照量,离点较近的整理作为同一类,离点较远的整理为不同一类。这种距离的方法,和上面的相似系数又有丰富的定义,而不同的定义产生的变量类型也是不同的,它们之间的关系极大。下面就阐述一下变量的类型。假如有n个样品,每个样品有p项指标,将其用矩阵表示如下pXXXnpnnppnxxxxxxxxxXXXX2121222211121121其中pjnixij,,1,,,1是第i个样品的第j个指标的观测数据。第i个样品iX为矩阵X的第i行的描述,所以任何两个样品KX与LX之间的相似性,可以将矩阵X中的第K行和第L行的类似大小来归类。2.2聚类分析方法计算步骤(1)定义样品之间的距离,运算样品两两之间的距离,从而得到一段距离阵标记为0D,开始时每个样品自然成为一类,显而易见此时ijijdD。(2)找到0D的非对角线中最小的元素设为pqD,就把pG和qG合并当作一个新类,表示为rG,则是qprGGG,。(3)下面是运算新类和其它类的距离公式:kqkpkrDDD,min把0D中第q、p行及q、p列用上面公式并成一个新行新列,新行新列对应rG,所得到的矩阵表示为1D。蚌埠学院本科毕业设计(论文)-7-(4)对1D重复上述对0D的(2)、(3)两步得2D;如此下去,直到所有的元素并成一类为止。如果某一步kD中非对角线最小的元素不止一个,则对