多元统计分析论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

关于各地区固定资产投资价格指数的分析摘要:本文主要通过主成分分析、聚类分析和判别分析对全国30多个省的固定资产投资指数、建筑安装工程指数、设备工器具购置指数、其他费用指数进行分析。关键词:主成分分析、欧氏距离、系统聚类分析、判别分析Summary:Thisarticlemainlythroughtheprincipalcomponentsanalysis,theclusteranalysisandthedistinctionanalysistothenationalmorethan30provinceinvestmentinthefixedassetsindices,constructionandinstallationtheprojectindex,theequipmentlaborappliancepurchaseindex,otherexpenseindexcarriesontheanalysis.Keywords:PrincipalComponentsAnalysis、Euclideandistance、Discriminantanalysis一、导言:注意微量信息引起的巨变,蝴蝶效应就是微量信息在一定条件下发生作用的过程。在我们的经济活动中,每天的信息是大量的,这就要求我们从中发现那些对经济能产生最大影响的信息,有些是微量信息,有些是次级别的信息,本文的各地区固定资产投资价格指数就是一个非常值得深入发觉的信息。该指数可以准确地反映固定资产投资中涉及的各类投资品和取费项目价格变动趋势和变动幅度,消除按现价计算的固定资产投资指标中的价格变动因素,真实地反映固定资产投资的规模、速度、结构和效益,为国家科学地制定、检查固定资产投资计划并提高宏观调控水平,为完善国民经济核算体系提供科学的、可靠的依据。本文通过对中国2007年的30个省份各地区固定资产投资价格指数的分析,通过对固定资产投资指数、建筑安装工程指数、设备工器具购置指数、其他费用指数,应用主成分分析的方法设法将原来具有一定相关性的四个指标,重新组合成一组新的相互无关的综合指标来代替原来的指标;通过系统聚类方法将其中的27个省份聚成3类;通过聚类的结果来建立判别函数来判别剩余的青海、宁夏、新疆等3个省份属于哪一类。二、固定资产投资价格指数的概述:是反映一定时期内固定资产投资品及取费项目的价格变动趋势和程度的相对数。固定资产投资额是由建筑安装工程投资完成额、设备工器具购置投资完成额和其他费用投资完成额三部分组成的。编制固定资产投资价格指数应首先分别编制上述三部分投资的价格指数,然后采用加权算术平均法求出固定资产投资价格总指数。三、主成分分析的概述及主要方法主成分分析也称主分量分析,旨在利用降维的思想,把多指标转化为少数几个综合指标。在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的统计数据反映的信息在一定程度上有重叠。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行定量分析的过程中,涉及的变量较少,得到的信息量较多。主成分分析正是适应这一要求产生的。主成分分析法是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分,第二变量的方差次大,并且和第一变量不相关,称为第二主成分。主成分的数学模型:设X'=(X1,X2,…..,XP)是p维随机向量,它的主成分为:其中:Y1是一切Y=e'X中方差最大者,Y2是一切Y=e'X中方差次大者,…….,Yp是一切Y=e'X中方差最小者;且它们互不相关。因此P个变量的P个主成分就是这P个变量的P个线性组合,其中线性组合的系数向量是单位向量。表达式:F=a1*X1+a2*X2+a3*X3+a4*X4COV(F1,F2)=0四、聚类分析的主要原理及方法聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法。所谓类,通俗地说,就是指相似元素的集合,严格的数学定义是较麻烦的,在不同的问题中类的定义是不同的。聚类分析起源于分类学,随着生产技术和科学的发展,人类的知识不断加深,分类越来越细,要求也越来越高,有时光凭经验和专业知识是不能进行确切分类的,往往需要定性和定量分析结合起来分类,于是数学工具逐渐被引进分类学中,形成了数值分类学,后来随着多元分析的引进,聚类分析又逐渐从数值分类学中分离出来而形成一个相对独立的分支。聚类分析的方法:系统聚类法、模糊聚类法、k-均值法、有序样品聚类等。五、判别分析的主要原理及方法判别分析是在已知研究对象分成若干类型(或组别)并已取得各种类型的一批已知样品的观测数据,在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分类。判别分析的方法有很多,按判别的组数来区分,有两组判别分析和多组判别分析;按区分不同总体的所用的数学模型来分,有线性判别和非线性判别;按判别时所处理的变量方法不同,有逐步判别和序贯判别等。六、主成分分析过程:以下是2007年各地区固定资产投资价格指数:地区固定资产投资建筑安装工程设备工具器购置其他费用北京102.8104.198.9102.1天津102.6103.599.1103.6河北103.8105.4100.7102.4山西104.1106.0100.6102.4内蒙古103.8104.6100.3105.2辽宁104.3106.1100.2104.2吉林103.9105.299.9105.9黑龙江104.5105.599.9109.1上海103.5104.699.4104.1江苏104.9107.899.7104.5浙江104.4105.6100.5105.2安徽105.4107.4100.4103.7福建105.9107.199.6109.2江西105.4106.9100.5106.2山东104.0105.5100.8104.6河南104.6106.3101.4101.9湖北104.1104.9101.5104.2湖南105.8107.6101.4103.4广东102.4103.899.5100.5广西102.3103.0101.0101.1海南106.1109.9100.2102.2重庆105.5106.0100.2107.8四川104.7106.4101.0103.4贵州103.5105.4100.2100.9云南104.2104.5100.5107.0陕西104.0105.6100.6100.6甘肃102.8103.9101.8102.3青海104.2104.6102.9102.6宁夏103.2104.1100.4101.0新疆104.4105.5101.6102.8将这些数据导入到spss16.0分别点击analyze-datareduction-factor进行主成分分析得到以下结果:表6.1:分析:从上表中我们可以看出主成分提取原来的信息都达到了90%以上。表6.2;分析:输出结果则显示了各个主成分解释原始变量总方差的情况,我们可以看出本文保留三个主成分即可,而这三个主成分包含了99.286%的信息,远大于所要求的85%标准。输出表6.3:分析:我们将输出结果成分矩阵标准化,求得的三个主成分线性表示的表达式:F1=0.134085688*X1+0.122717851*X2-0.000410886*X3+0.083409789*X4F2=0.029885616*X1+0.035083114*X2+0.167619323*X3-0.098938094*X4F3=-0.001942858*X1-0.094471477*X2+0.10394291*X3+0.142314358*X4其中F1表示第一主成分,F2表示第二主成分,F3表示第三主成分,X1表示固定资产投资,X2表示建筑安装工程,X3表示设备工具器购置,X4表示其他费用。同理我们可以运用spss16.0对数据处理得以下的各主成分得分表:地区第一主成分第二主成分第三主成分北京-0.96774-0.77483-1.89467天津-1.45252-0.01671-1.56841河北-0.12977-0.583180.174556山西0.267344-0.68290.024854内蒙古-0.676770.723274-0.10931辽宁0.2787240.035968-0.37吉林-0.401990.857798-0.60736黑龙江-0.275532.224866-0.46884上海-0.649560.114238-1.22529江苏1.286618-0.17819-1.06432浙江0.0012920.6129830.078681安徽1.344897-0.28318-0.17574福建1.0382882.076775-0.83609江西0.9151880.8908370.078253山东-0.188490.3628030.374051河南0.596054-0.798670.961132湖北-0.423410.416381.253142湖南1.555599-0.283150.999537广东-1.18379-1.36984-1.26086广西-1.7339-0.784720.580872海南2.868203-1.37984-0.6585重庆0.4599191.736661-0.10618四川0.588733-0.219750.54523贵州-0.09927-1.31461-0.48949云南-0.709521.5810520.238218陕西0.199418-1.37115-0.00048甘肃-1.286-0.310331.50559青海-0.48167-0.019322.873168宁夏-0.81465-1.0119-0.1419新疆0.074292-0.251351.290153七、聚类分析过程:我们将原来27组数据导入到spss16.0中去依次点击analyze-classify-hierarchical进行系统聚类分析得以下结果:输出表7.1:输出表7.2:分析:输出表7.1是反映每一阶段聚类的结果,coefficients表示聚合系数,第2列和第3列表示聚合的类,比如第一阶段时第3组(河北)和第4组(山西)聚为一类;第24组(贵州)和第26组(陕西)聚成一类。输出表7.2反映了整个27个省得聚类的结果,由表7.2可看到当阀值取略小于20时可得到三类结果。将此聚类结果输入到表格中得到以下数据:地区固定资产投资建筑安装工程设备工具器购置其他费用聚类结果北京102.8104.198.9102.11天津102.6103.599.1103.61河北103.8105.4100.7102.41山西104.1106.0100.6102.41内蒙古103.8104.6100.3105.21辽宁104.3106.1100.2104.21吉林103.9105.299.9105.91黑龙江104.5105.599.9109.12上海103.5104.699.4104.11江苏104.9107.899.7104.51浙江104.4105.6100.5105.21安徽105.4107.4100.4103.71福建105.9107.199.6109.22江西105.4106.9100.5106.21山东104.0105.5100.8104.61河南104.6106.3101.4101.91湖北104.1104.9101.5104.21湖南105.8107.6101.4103.41广东102.4103.899.5100.51广西102.3103.0101.0101.11海南106.1109.9100.2102.23重庆105.5106.0100.2107.82四川104.7

1 / 10
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功