1多元统计分析复习题一、填空题1、设有n个一维数据:12,,...,nxxx,则均值x=________,方差2_____________s。若将它们从小到大记为(1)(2)(),,...,nxxx,中位数M=______________________,极差R=______________。2、请指出下面SPSS软件操作分别代表多元统计分析中什么分析:(1)Analysis→Classify→Discriminant(2)Analysis→DataReduction→Factor3、系统聚类法是在聚类分析的开始,每个样本自成________;然后,按照某种方法度量所有样本之间的亲疏程度,并把最相似的样本首先聚成一小类;接下来,度量剩余的样本和小类间的___________,并将当前最接近的样本或小类再聚成一类;如此反复,直到所有样本聚成一类为止。4、设12(0,1),,,...,inN且相互独立,则n21n212_______;________iiii。5、在线性回归模型中,设因变量Y与自变量121,,...,pXXX的n组观测数据为共页,第页21,1(;,...,)(1,2,...,iiipyxxin),记11niiyyn,线性拟合值0111,1ˆˆˆˆ...iipipyxx,则总离差平方和___________SST,残差平方和___________SSE,回归平方和__________SSR,三者之间关系为___________________。6、设x,y是来自均值向量为,协方差矩阵为的总体G的两个样品,则x,y之间的马氏平方距离2(,)______________dxy;x与总体G的马氏平方距离2(,)______________dxG。7、常见的两类聚类法分别为:__________________和________________。8.因子分析中aij的统计意义是________________________________。22121212121~(,),(,),,),,1____XNXxxxxxx9、设其中则Cov(,)=.103110~(,),1,,10,()()_________iiiiXNiWXX、设则=服从。12344311,492,3216_______________XxxxR、设随机向量且协方差矩阵则它的相关矩阵。312、2113,1,,16(,),(,)15[4()][4()]~___________ippXiNXANTXAX、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。14、若),2,1(),,(~)(nNXp且相互独立,则样本均值向量X服从的分布为:__________________。15、判别分析是判别样品_______________的一种统计方法,常用的判别方法有_______________、_______________、_______________、_______________。16、Q型聚类是指对________________进行聚类,R型聚类是指对_______________进行聚类。17、设~(,)pXN,则1sdBx的分布为:_____。18、设是总体1(,,)mXXX的协方差阵,的特征根(1,,)iim与相应的单位正交化特征向量(1,,)iaim,则第一主成分为:_________。19、设(,)nXN,()(1,2,,)tXtn是X的样本,则u最大似然估计为,123设X=xxx的相关系数矩阵通过因子分析分解为211____,Xh的共同度111____,X的方差21____Xg1公因子f对的贡献。121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R4________________,最大似然估计为________________。二、简单题1、描述多元线性回归模型2、描述主成分分析与因子分析的关系3、.叙述p维正态分布的4种定义方式。4、叙述Wishart分布、Hotelling2T分布、Wilks分布的定义。三、计算题1、设三维随机向量),(~3NX,其中200031014,问1X与2X是否独立?),(21XX和3X是否独立?为什么?解:因为1),cov(21XX,所以1X与2X不独立。把协差矩阵写成分块矩阵22211211,),(21XX的协差矩阵为11因为12321),),cov((XXX,而012,所以),(21XX和3X是不相关的,而正态分布不相关与相互独立是等价的,所以),(21XX和3X是独立的。11262(90,58,16),82.04.310714.62108.946460.2,(5)(115.6924)14.62103.17237.14.5XS0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。其中0.010.010.0137608.946437.376035.5936(0.01,(3,2)99.2,(3,3)29.5,(3,4)16.7)FFF501001121000.02::8.02.2,1.54.310714.62108.9464(23.13848)14.62103.17237.37608.946437.376035.5936()()670.0741420.445HHXSTnXSXF0、假设检验问题:,经计算可得:构造检验统计量:由题目已知10010.01(3,3)29.535(3,3)147.530.012TFH2.0,由是所以在显著性水平下,拒绝原设即认为农村和城市的周岁男婴上述三个指标的均值有显著性差异12124122411362190.5,L(21),L(12)35qqeeBayesX12、设已知有两正态总体G与G,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?1112122112123321()()exp[()()]exp(424)()39124211ˆ(),,()411624283(1|2),()exp(2)5(2|1)35TBayesfxWxxxxfxqCdeWxdeqCX3、由判别知其中,2G61234411(,,,)~(0,),0111TXXXXXN4、设,协方差阵(1)试从Σ出发求X的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。121341123114013,1111101111112222111222xxxxZXXX1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分411121395%40.95410.9333X234(2)第一个主成分的贡献率为得5、设抽了五个样品,每个样品只测了一个指标,它们分别是1,2,4.5,6,8。若样本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。7样品与样品之间的明氏距离为:025.36705.14505.25.30105432154321)0(xxxxxxxxxxD样品最短距离是1,故把21XX与合并为一类,计算类与类之间距离(最长距离法)得距离阵025.3705.1505.30},{},{5432154321)1(xxxxxxxxxxD类与类的最短距离是1.5,故把43XX与合并为一类,计算类与类之间距离(最长距离法)得距离阵05.3705),{0},{},{},{5432154321)2(xxxxxxxxxxD类与类的最短距离是3.5,故把543},{XXX与合并为一类,计算类与类之间距离(最长距离法)得距离阵07},,{0},{},,{},{5432154321)3(xxxxxxxxxxD6、设变量123,,XXX的相关阵为1.000.630.450.631.000.35,0.450.351.00RR的特征值和单位化特征向量分别为8111.96,0.63,0.59,0.51;Tl20.68,20.22,0.49,0.84;Tl30.37,30.75,0.64,0.18Tl(1)取公共因子个数为2,求因子载荷阵A。(2)计算变量共同度2ih及公共因子jF的方差贡献,并说明其统计意义。解:因子载荷阵68.084.096.151.068.049.096.159.068.022.096.163.0A变量共同度:2221)68.022.0()96.163.0(h=2222)68.049.0()96.159.0(h=2223)68.084.0()96.151.0(h=公共因子jF的方差贡献:2221)96.151.0()96.159.0()96.163.0(S2222)68.084.0()68.049.0()68.022.0(S7、设三元总体X的协方差阵为600030001,从出发,求总体主成分123,,FFF,并求前两个主成分的累积贡献率。解:特征方程0||E,得特征根:1,3,632161的特征方程:0000030005321xxx,得特征向量1001u31的特征方程:0300000002321xxx,得特征向量0102u911的特征方程:0500020000321xxx,得特征向量0013u31xF22xF13xF前两个主成分的累积贡献率9.0109四、操作题为研究三类地理环境问题,选定4个指标X1、X2、X3、X4,序号1-12的地理已分成3类,13-15的待定(下表6列为原始数据)。序号X1X2X3X4实际类Function1Function2预测类150331421-9.029-.5071246361021-10.428-2.4441348311621-8.045.1541449361411-10.615.350155524371021.3891.891266731471522.7932.316275630411321.