多元统计论文-(1)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

主成分分析的应用摘要:改革开放以来,随着经济体制改革的深化和经济的快速增长,人们生活水平质量大幅提高,经济指标成为行业兴旺重要指针,本文是在课程《实用多元统计分析》基础知识为基石,从青海德令哈市工业部门13个行业的8项重要经济指标着手,运用主成分分析的方法,对这些年份的生活能源消费量进行比较.我们首先用SPSS16.0软件对初始数据进行计算,并对输出的结果分析得到两个主成分,然后分析了,并从实际出发提出相应的对策和建议。关键词:,多元统计分析生活能源消费量,我国能源消费现状,主成分分析一、理论知识基础我们在罗文强老师课堂上讨论了主成分计算从协方差矩阵Σ出发的,其结果受变量单位的影响。不同的变量往往有不同的单位,对同一变量单位的改变会产生不同的主成分,主成分倾向于多归纳方差大的变量的信息,对于方差小的变量就可能体现得不够,也存在“大数吃小数”的问题。为使主成分分析能够均等地对待每一个原始变量,消除由于单位的不同可能带来的影响,我们常常将各原始变量作标准化处理,即令*()()iiiiXEXXDX1,,ip(6.25)显然,***1(,,)pXXX的协方差矩阵就是X的相关系数矩阵R。实际应用中,X的相关系数矩阵R可以通过(2.13)式,利用样本数据来估计。这里我们需要进一步强调的是,从相关阵求得的主成分与协差阵求得的主成分一般情况是不相同的。实际表明,这种差异有时很大。我们认为,如果各指标之间的数量级相差悬殊,特别是各指标有不同的物理量纲的话,较为合理的做法是使用R代替∑。对于研究经济问题所涉及的变量单位大都不统一,采用R代替∑后,可以看作是用标准化的数据做分析,这样使得主成分有现实经济意义,不仅便于剖析实际问题,又可以避免突出数值大的变量。结合老师所讲总结了利用主成分分析处理实际问题的基本简要步骤主成分分析的具体步骤可以归纳为:(1)将原始数据标准化;(2)建立变量的相关系数阵;(3)求R的特征根为**10p,相应的特征向量为***12,,,pTTT;(4)由累积方差贡献率确定主成分的个数(m),并写出主成分为*()iiYTX,1,2,,imSPSS没有提供主成分分析的专用功能,只有因子分析的功能。但是因子分析和主成分分析有着密切的联系。因子分析的重要步骤——因子的提取最常用的方法就是“主成分法”。利用因子分析的结果,可以很容易地实现主成分分析。具体来讲,就是利用因子载荷阵和相关系数矩阵的特征根来计算特征向量。即:ijijjaz其中,ijz为第j个特征向量的第i个元素;ija为因子载荷阵第i行第j列的元素;j为第j个因子对应的特征根。然后再利用计算出的特征向量来计算主成分。二、利用理论分析实例德令哈市是蒙古语,意为“金色的世界”。它位于举世闻名的柴达木盆地东北边缘,1988年4月,经国务院批准,德令哈市撤镇建市,德令哈的发展从此又翻开了新的一页。经过全市各族人民的辛勤努力,一座高原新城巍然屹立于八百里瀚海戈壁上。该市下辖蓄集、郭里木、宗务隆、戈壁、怀头他拉5个乡,全市总人口将近7万,共有19个民族,各兄弟民族团结和睦、携手共进,正用勤劳的双手描绘着这个民族大家庭光辉的蓝图。在中国现今工业几乎是一个城市繁荣的最重要保证,通过网络获得了该区的工业部门8项重要经济指标的数据,现利用所学知识对其进行评价。表1是青海德令哈市工业部门13个行业的8项重要经济指标的数据,这8项经济指标分别是:X1:年末固定资产净值,单位:万元;X2:职工人数据,单位:人;X3:工业总产值,单位:万元;X4:全员劳动生产率,单位:元/人年;X5:百元固定资产原值实现产值,单位:元;X6:资金利税率,单位:%;X7:标准燃料消费量,单位:吨;X8:能源利用效果,单位:万元/吨。表1青海德令哈市市工业部门13个行业8项指标X1X2X3X4X5X6X7X8冶金9034252455101091192728216.11974350.172电力4903197320351031334.27.15920770.003煤炭6735211393767178036.18.27263960.003化学4945436241815572250498.125.93482260.985机器1391902035052158981060993.212.61395720.628建材122151621910351638262.58.71458180.066森工23726572810312329184.422.2209210.152食品11062230785493523804370.441654860.263纺织17111239075210821796221.521.5638060.276缝纫12063930612615586330.429.518400.437皮革21505704620010870184.21289130.274造纸525161551038316875146.427.5787960.151文教1434113203193961469194.617.863541.574我们要考虑的是:如何从这些经济指标出发,对各工业部门进行综合评价与排序?从标准化数据出发我们先计算这些指标的主成分,然后通过主成分的大小进行排序。表2和表3分别是特征根(累计贡献率)和特征向量的信息。利用主成分得分进行综合评价时,从特征向量我们可以写出所有8个主成分的具体形式:****11234****56780.4760.4730.4240.2130.3880.3520.2150.055YXXXXXXXX****21234****56780.2960.2780.3780.4510.3310.4030.3770.273YXXXXXXXX……表2特征根和累计贡献率序号特征根方差贡献率%累计贡献率%13.104938.811438.811422.897436.218075.029430.930211.627786.657140.64218.026594.683650.30413.801198.484760.08661.082599.567270.03220.402399.969580.00240.0305100.0000表3特征向量特征向量1特征向量2特征向量3特征向量4特征向量5特征向量6特征向量7特征向量810.4770.2960.1040.045-0.184-0.0660.7580.24520.4730.2780.163-0.1740.305-0.048-0.5180.52730.4240.3780.1560.0590.0170.099-0.174-0.7814-0.2130.451-0.0090.516-0.5390.288-0.2490.2205-0.3880.3310.321-0.1990.4500.5820.2330.0316-0.3520.4030.1450.2790.317-0.7140.056-0.04270.215-0.3770.1400.7580.4180.1940.0530.04180.0550.273-0.8910.0720.3220.1220.067-0.003我们以特征根为权,对8个主成分进行加权综合,得出各工业部门的综合得分,从而对13个行业进行综合评价和排序:812888128111iiiiiiYYYY表4各行业主成分得分及排序行业Y1Y2……Y8综合得分排序冶金1.4750.759……0.0040.9112电力0.498-2.592……0.067-0.65412煤炭1.056-3.226……-0.024-0.62911化学0.4601.184……-0.0520.6183机器4.5282.262……0.0232.5891建材0.330-1.774……-0.067-0.60210森工-1.103-0.318……-0.035-0.5739食品-2.1952.244……-0.0520.1554纺织-0.8410.896……-0.0010.0335缝纫-2.0320.825……0.073-0.4768皮革-0.713-0.756……-0.030-0.65913造纸-1.2010.030……0.079-0.4377文教-0.2630.464……0.015-0.2766三、结果分析与实际建议从表4可以看出,机器行业在海德令哈市的综合评价排在第一,这一点在我们当今社会也是有目共识的,机器的出现可谓是人类发展史上最伟大的飞跃,就算在现在社会机器也是行业的领头羊,几乎任何行业都需要机器的推动。利用SPSS的主成分分析我们清晰地看见了,其在与其他行业的对比中占的优势,这一点原始数据也反映出机器行业存在明显的规模优势,另外从前两个主成分得分上看,该行业也排在第一位,同样存在效益优势。特别是在青藏高原上坐落的一座一个小城市更显的重要;而排在最后三位的分别是皮革行业、电力行业和煤炭行业。面对这样的结果,我们应该有些思考,在这个追求效益的时代一个地区要想有较快的速度发展,就必须重视机器的更新,与时代接轨。这一点不仅能对机器这个行业有帮助,对于其他行业同样有着助推作用,其实此案例几个样本之间应该存在一些联系,但由于知识有限不能将其表征出来。参考文献(1)向东进李宏伟刘小雅实用多元统计中国地质大学出版社2005年9月(2)朱建平应用多元统计分析。北京科学出版社2010年8月(3)中华人民共和国统计年鉴(网上参考)(4)王力宏应用多元统计分析:模型,案例及SPSS应用北京经济科学出版2010年3月

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功