1第五章主成分分析一、填空题1.主成分分析就是设法将原来众多的指标,重新组合成一组新的的综合指标来代替原来指标。2.主成分分析的数学模型可简写为,该模型的系数要求。3.主成分分析中,利用的大小来寻找主成分。4.第k个主成分ky的贡献率为,前k个主成分的累积贡献率为。5.确定主成分个数时,累积贡献率一般应达到,在spss中,系统默认为。6.主成分的协方差矩阵为_________矩阵。7.原始变量协方差矩阵的特征根的统计含义是________________。8.原始数据经过标准化处理,转化为均值为____,方差为____的标准值,且其________矩阵与相关系数矩阵相等。9.在经济指标综合评价中,应用主成分分析法,则评价函数中的权数为________。10.SPSS中主成分分析采用______________命令过程。二、判断题1.主成分分析就是设法将原来众多具有一定相关性的指标,重新组合成一组新的相互无关的综合指标来代替原来指标。()2.主成分y的协差阵为对角矩阵。()3.pxxx,,,21的主成分就是以的特征向量为系数的一个组合,它们互不相关,其方差为的特征根。()4.原始变量ix的信息提取率miV表示这m个主成分所能够解释第i个原始变量变动的程度。()5.在spss中,可以直接进行主成分分析。()6.主成分分析可用于筛选回归变量。()7.SPSS中选取主成分的方法有两个:一种是根据特征根≥1来选取;另一种是按照累积贡献率≥85%来选取。()8.主成分方差的大小说明了该综合指标反映p个原始观测变量综合变动程度的能力的大小。()9.主成分表达式的系数向量是协方差矩阵的特征向量。()10.主成分ky与原始变量ix的相关系数ikxy,反映了第k个公共因子对第i个原始变量的解释程度。()三、简答题1.简述主成分的概念及几何意义。2.主成分分析的基本思想是什么?3.简述主成分分析的计算步骤。4.主成分有哪些性质?5.主成分主要应用在哪些方面?四、计算题1.假设3个变量1x、2x和3x的协方差矩阵为:2000530322要求用此协差阵和相应的相关阵对这3个变量进行主成分分析,根据计算结果说明应选取多少个主成分以代表原来的3个变量,并说明理由。2.在一项研究中,测量了376只鸡的骨骼,并利用相关系数矩阵进行主成分分析,见下表:Y1Y2Y3Y4Y5Y6头长x1头宽x2肱骨x3尺骨x4股骨x5胫骨x60.350.330.440.440.430.440.530.70–0.19–0.25–0.28–0.220.76-0.64-0.05-0.02-0.06-0.05-0.050.000.530.48–0.51–0.48-0.040.000.19–0.15–0.67–0.700.00–0.040.59–0.630.480.15特征值4.570.710.410.170.080.06(1)解释6个主成分的实际意义。(2)计算前三个主成分各自的贡献率和累积贡献率。(3)对于y4,y5,y6的方差很小这一点,你怎样对实际情况作出推断。3.假设某商场棉鞋1x、凉鞋2x、布鞋3x三种商品销售量的协方差矩阵如下:200052021试求各主成分,并对各主成分的贡献率和各个原始观测变量的信息提取率进行讨论。4.对某市15个大中型工业企业进行经济效益分析,经研究确定,从有关经济效益指标中选取7个指标作分析,即固定资产产值率(X1),固定资产利税率(X2),资金利润率(X3),资金利税率(X4),流动资金周转天数(X5),销售收入利税率(X6)和全员劳动生产率(X7)。数据资料如下:企业及编号固定资产产值率X1固定资产利税率(X2)资金利润率(X3)资金利税率(X4)流动资金周转天数(X5)销售收入利税率(X6)全员劳动生产率(X7)康佳电子1茂名石化2华空空调3三星集团4数源科技5中华电子6南方制药7中国长城8白云制药9五羊自行10广发卷烟11岭南通信1253.2559.8246.7834.3975.3266.4668.1856.1359.2552.4755.7661.1950.4167.9551.0716.6819.7015.207.2929.4532.9325.3915.0519.8221.1316.7515.8316.5322.2412.9218.419.216.244.7643.6833.8727.5614.2120.1726.5219.2317.4320.6337.0012.5426.7527.5623.408.9756.4942.7837.8519.4928.7835.2028.7228.0329.7354.5920.8255556562695063767162586169636631.8432.9432.9821.3040.7447.9833.7627.2133.4139.4129.6226.4032.4931.0525.121.752.871.531.632.142.602.431.751.831.731.521.601.311.571.833华南冰箱13潮州二轻14稀土高科15根据下面SPSS软件的输出信息,回答:(1)这个数据的7个变量可以用几个综合变量(主成分)来表示?(2)这几个综合变量(主成分)包含有多少原来的信息?(3)写出这几个综合变量(主成分)的模型。TotalVarianceExplainedComponentInitialEigenvaluesExtractionSumsofSquaredLoadingsTotal%ofVarianceCumulative%Total%ofVarianceCumulative%14.63566.21966.2194.63566.21966.21921.28518.35884.5771.28518.35884.5773.5878.38992.9664.3905.57698.5425.0871.24399.7856.013.18299.9677.002.033100.000ExtractionMethod:PrincipalComponentAnalysis.ComponentMatrix(a)Component12固定资产率.888.213固定资产利税率.984-.028资金利润率.943.272资金利税率.909.315流动资金周转天数-.284.833销售收入利税率.860-.139全员劳动生产率.585-.594ExtractionMethod:PrincipalComponentAnalysis.a2componentsextracted.五、证明题主成分有三个重要性质:⑴F的协差阵为对角阵;⑵11ppiiiii;⑶,kikkiiiuFX;试分别加以证明。六、SPSS操作题1.下面是8个学生两门课程的成绩表:412345678英语x1数学x2100659085707070908585554555554565(1)求出两个特征根及其对应的单位特征向量;(2)求出主成分,并写出表达式;(3)求出主成分的贡献率,并解释主成分的实际意义;(4)求出两个主成分的样本协方差矩阵;(5)第1个样本主成分与第2个变量样本之间的相关系数为多少(6)求出8个学生第一主成分得分并进行排序2.某中学十二名女生的身高x1,体重x2的数据如下:123456789101112身高体重155481534615748154451584915246160481564515851157471594816150(1)两个变量的协方差矩阵与相关系数阵;(2)两个特征根及其对应的单位特征向量;(3)主成分的表达式并解释各贡献率的大小意义和主成分的实际意义;(4)如果舍弃主成分y2,则哪一个原变量的信息损失量最大;(5)画出全部样本的主成分散点图。3.根据下列某地区11年数据X1(总产值)X2(存储量)X3(总消费)y(进口额)1234567891011149.3161.2171.5175.5180.8190.7202.1212.4226.1231.9239.04.24.13.13.11.12.22.15.65.05.10.7108.1114.8123.2126.9132.1137.7146.0154.1162.3164.3167.615.916.419.019.118.820.422.726.528.127.626.3(1)计算地区总产值、存储量和总消费的相关系数矩阵。(2)求特征根及其对应的特征向量。(3)求出主成分及每个主成分的方差贡献率;(4)利用主成分方法建立y与x1,x2,x3的回归方程(取两个主成分)。