22121212121~(,),(,),(,),,1XNXxxxxxx1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________iiiiXNiWXX、设则=服从。1234433,492,3216___________________XxxxR、设随机向量且协方差矩阵则它的相关矩阵4、__________,__________,________________。215,1,,16(,),(,)15[4()][4()]~___________ippXiNXANTXAX、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。12332313116421(,,)~(,),(1,0,2),441,2142XxxxNxxxxx、设其中试判断与是否独立?,123设X=xxx的相关系数矩阵通过因子分析分解为211Xh的共性方差111X的方差21Xg1公因子f对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R11262(90,58,16),82.04.310714.62108.946460.2,(5)(115.6924)14.62103.17237.14.5XS0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。其中0.010.010.0137608.946437.376035.5936(0.01,(3,2)99.2,(3,3)29.5,(3,4)16.7)FFF12124122411362190.5,(21),(12)35qqCeCeBayesX12、设已知有两正态总体G与G,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?1234411(,,,)~(0,),0111TXXXXXN4、设,协方差阵(1)试从Σ出发求X的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。1212111221225(,),(,),100000010.950()00.9510000100TTXXXXYYXZYZ、设为标准化向量,令且其协方差阵V,求其第一对典型相关变量和它们的典型相关系数?1,()XEXX、设随机向量的均值向量、协方差矩阵分别为、试证:。'2~(,),,~(,)PrXNNAbAArpr1、设随机向量又设Y=AX+b试证:Y。1、02、W3(10,∑)3、211342113611146R4、0.87211.7435、T2(15,p)或(15p/(16-p))F(p,n-p)2312131231112213312121,2,10021021210001102231642100102xxyyxxxxxxyxxyxxxyEyyVy、令则01-101-101-11234411002141021061661620162040210616(1,61620)3162040yyN01-1故,的联合分布为故不独立。01001121000.02::8.02.2,1.54.310714.62108.9464(23.13848)14.62103.17237.37608.946437.376035.5936()()670.0741420.445HHXSTnXSXF0、假设检验问题:,经计算可得:构造检验统计量:由题目已知10010.01(3,3)29.535(3,3)147.530.012TFH2.0,由是所以在显著性水平下,拒绝原设即认为农村和城市的周岁男婴上述三个指标的均值有显著性差异1112122112123321()()exp[()()]exp(424)()39124211ˆ(),,()411624283(1|2),()exp(2)5(2|1)35TBayesfxWxxxxfxqCdeWxdeqCX3、由判别知其中,2G121341123114013,1111101111112222111222xxxxZXXX1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分411121395%40.95410.9333X234(2)第一个主成分的贡献率为得1122112211122111222211122120.1010,0100.10.10001000.950.1000010.95000.01000100.9025000.902500.90250.9025,TTTTTT----5、由题得===求的特征值,得211112111111112221112111100.95000.9025,00.90250.100001111000.9501100.100100.95,0.54,0.95TTTeeeVXWYVW的单位正交化特征向量为第一典型相关变量,且()为一对典型相关系数。1()[()()]()()()()()VXEXEXXEXEXXEXEXEXXEXX、证明:=故''2()()()()()()~(,)rYEYEAXbAEXbAbVYVAXbAVXAAAYNAbAA、证明:由题可知服从正态分布,故。一、填空题:1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法.2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著.3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为Q型聚类和R型聚类。4、相应分析的主要目的是寻求列联表行因素A和列因素B的基本分析特征和它们的最优联立表示。5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。6、若()(,),PxN=1,2,3….n且相互独立,则样本均值向量x服从的分布为_x~N(μ,Σ/n)_。二、简答1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。2、简述相应分析的基本思想。相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A和因素B具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A、B的联系。3、简述费希尔判别法的基本思想。从k个总体中抽取具有p个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数系数:确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p个指标值代入线性判别函数式中求出值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。5、简述多元统计分析中协差阵检验的步骤第一,提出待检验的假设和H1;第二,给出检验的统计量及其服从的分布;第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域;第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。协差阵的检验检验0ΣΣ0pHΣI:/2/21exp2npnetrnSS00pHΣΣI:/2/2**1exp2npnetrnSS检验12kΣΣΣ012kHΣΣΣ:统计量/2/2/2/211iikknnpnnpkiiiinnSS6、在进行系统聚类分析时,不同的类间距离计算方法有何区别?请举例说明。设dij表示样品Xi与Xj之间距离,用Dij表示类Gi与Gj之间的距离。(1).最短距离法,minikjrkrijXGXGDdmin{,}kpkqDD(2)最长距离法,maxipjqpqijXGXGDd,maxikjrkrijXGXGDdmax{,}kpkqDD(3)中间距离法其中错误!未找到引用源。ijGXGXijdDjjii,min22222121pqkqkpkrDDDD(4)重心法2()()pqpqpqDXXXX)(1qqpprrXnXnnX22222pqpqkrkpkqpqrrrnnnnDDDDnnn(5)类平均法221ipjjpqijXGXGpqDdnn221ikjrkrijXGXGkrDdnn22pqkpkqrrnnDDnn(6)可变类平均法其中是可变的且1(7)可变法22221()2krkpkqpqDDDD其中是可变的且1(8)离差平方和法1()()tntittitttSXXXX错误!未找到引用源。2222kpkqkkrkpkqpqrkrkrknnnnnDDDDnnnnnn7、比较主成分分析与因子分析的异同点。相同点:①两种分析方法都是一种降维、简化数据的技术。②两种分析的求解过程是类似的,都是从一个协方差阵出发,利用特征值、特征向量求解。因子分析可以说是主成分分析的姐妹篇,将主成分分析向前推进一步便导致因子分析。因子分析也可以说成是主成分分析的逆问题。如果说主成分分析是将原指标综合、归纳,那么因子分析可以说是将原指标给予分解、演绎。主要区别是:主成分分析本