09计统-多元统计分析期末考一、填空(5*2=10)1、书P21定理2.2(1)2、Q型(样品);R型(变量)3、书P100利用主成分分析进行综合评价Wi=()4、典型相关分析是研究两组变量之间的(相关关系)的一种多元统计方法5、多变量的可视化分析:(三个空:折线图、散点图、条形图、雷达图、星座图,五选三即可)【坑爹了,考前说11章不考的。==】二、证明(10)证:P维随机向量X的每个分量之间相互独立,已知协差阵为对角阵。(P26思考与练习2.4)(方法:算各个分量的边际密度函数,全部相乘得P维随机向量X的密度函数即证得)三、简答(3*10=30)1、简述系统聚类的基本思想和步骤2、简述相应分析基本思想3、简述典型相关分析基本思想和典型变量四、计算(5*10=50)1、(1)P11例2.1(2)算X、Y均值、方差、协方差【高数好好学啊!求导积分不能忘啊!否则第二小题用分部积分法弄就会悲剧鸟。】2、判别分析(1)距离判别(2)Bayes判别【和A、B卷里那两道题极其相似,只是综合成了一道题】3、聚类分析最长距离法【B卷原题啊!】4、因子分析【和A、B卷那题极其相似】(1)算因子载荷阵A【取前两个因子构造3*2矩阵】(2)计算变量共同度hi^2和公因子Fj的方差贡献gj^2,并说明统计意义5、主成分分析(1)给3阶矩阵算特征根和单位化特征向量【注意:T是正交矩阵,3个向量之间还要正交化,我就悲剧在这儿了。T-T】(2)算前两个主成分的累积贡献度多元感想:考试果然比想象中的简单很多很多啊…和A、B卷题型难度很像,计算题聚类、判别、因子、主成分掌握到比卷子再高一些熟练点就足够了。如果单纯高效复习备考的话,不需要在数学推导上研究太长时间。(当然,想好好学或者不放心的。比如我这种为了稳妥起见,还是把每个数学推导都认真研究推导了下…最后几章那几个很难很坑爹啊!构造目标函数啥的计算是正常人想出来的么。==)A、B卷非常重点!八九章果然是那两道文科简答题,把课后作业背好准备好,八九章就搞定了。我好不容易把整整一页纸的所有统计量检验背的滚瓜烂熟,尼玛第三章多元正态分布均值向量和协差阵的检验竟然不考啊!想刷高分的平时还是要好好学细读下多元,毕竟填空题考的还有点细。多元应该算是学到目前最实用的一门课了吧,统赛用SPSS以后统计工作啥的都能用得上,基本思想和方法都很朴素简单,就是数学推导很多不好玩。牛逼的学术帝学术妹想虐数学的话,可以在这边下些功夫。0-022121212121~(,),(,),(,),,1XNXxxxxxx1、设其中则Cov(,)=____.10312~(,),1,,10,()()_________iiiiXNiWXX、设则=服从。1234433,492,3216___________________XxxxR、设随机向量且协方差矩阵则它的相关矩阵4、__________,__________,,123设X=xxx的相关系数矩阵通过因子分析分解为211Xh的共性方差111X的方差21Xg1公因子f对的贡献121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R________________。215,1,,16(,),(,)15[4()][4()]~___________ippXiNXANTXAX、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。12332313116421(,,)~(,),(1,0,2),441,2142XxxxNxxxxx、设其中试判断与是否独立?11262(90,58,16),82.04.310714.62108.946460.2,(5)(115.6924)14.62103.17237.14.5XS0、对某地区农村的名周岁男婴的身高、胸围、上半臂围进行测量,得相关数据如下,根据以往资料,该地区城市2周岁男婴的这三个指标的均值现欲在多元正态性的假定下检验该地区农村男婴是否与城市男婴有相同的均值。其中0.010.010.0137608.946437.376035.5936(0.01,(3,2)99.2,(3,3)29.5,(3,4)16.7)FFF12124122411362190.5,(21),(12)35qqCeCeBayesX12、设已知有两正态总体G与G,且,,,而其先验概率分别为误判的代价;试用判别法确定样本属于哪一个总体?1234411(,,,)~(0,),0111TXXXXXN4、设,协方差阵(1)试从Σ出发求X的第一总体主成分;(2)试问当取多大时才能使第一主成分的贡献率达95%以上。1212111221225(,),(,),100000010.950()00.9510000100TTXXXXYYXZYZ、设为标准化向量,令且其协方差阵V,求其第一对典型相关变量和它们的典型相关系数?1,()XEXX、设随机向量的均值向量、协方差矩阵分别为、试证:。'2~(,),,~(,)PrXNNAbAArpr1、设随机向量又设Y=AX+b试证:Y。1、02、W3(10,∑)3、211342113611146R4、0.87211.7435、T2(15,p)或(15p/(16-p))F(p,n-p)2312131231112213312121,2,10021021210001102231642100102xxyyxxxxxxyxxyxxxyEyyVy、令则01-101-101-11234411002141021061661620162040210616(1,61620)3162040yyN01-1故,的联合分布为故不独立。01001121000.02::8.02.2,1.54.310714.62108.9464(23.13848)14.62103.17237.37608.946437.376035.5936()()670.0741420.445HHXSTnXSXF0、假设检验问题:,经计算可得:构造检验统计量:由题目已知10010.01(3,3)29.535(3,3)147.530.012TFH2.0,由是所以在显著性水平下,拒绝原设即认为农村和城市的周岁男婴上述三个指标的均值有显著性差异1112122112123321()()exp[()()]exp(424)()39124211ˆ(),,()411624283(1|2),()exp(2)5(2|1)35TBayesfxWxxxxfxqCdeWxdeqCX3、由判别知其中,2G121341123114013,1111101111112222111222xxxxZXXX1234、(1)由得特征根为解所对应的方程得所对应的单位特征向量为故得第一主成分411121395%40.95410.9333X234(2)第一个主成分的贡献率为得1122112211122111222211122120.1010,0100.10.10001000.950.1000010.95000.01000100.9025000.902500.90250.9025,TTTTTT----5、由题得===求的特征值,得211112111111112221112111100.95000.9025,00.90250.100001111000.9501100.100100.95,0.54,0.95TTTeeeVXWYVW的单位正交化特征向量为第一典型相关变量,且()为一对典型相关系数。1()[()()]()()()()()VXEXEXXEXEXXEXEXEXXEXX、证明:=故''2()()()()()()~(,)rYEYEAXbAEXbAbVYVAXbAVXAAAYNAbAA、证明:由题可知服从正态分布,故。1、设X与Y是从协差阵为Σ的总体G中抽取的样品,则X与Y之间的马氏距离的具体表现形式是什么?它与欧氏距离有什么区别?2、判别分析的实质问题是什么?3、常用的判别分析方法有哪些?请简述它们的思想。4、在什么情况下距离判别是Bayes判别的特例?5、对样品和变量进行聚类分析时,所构造的统计量分别是什么?简单说明为什么要这样构造?6、简述判别分析的步骤。7、简述主成分分析的思想。8、试述主成分分析的几何意义。9、分别说明由协差阵和相关阵出发求解主成分的适用情形。一般的,两种情形下得到的主成分相同吗?为什么?10、简述主成分分析和因子分析的联系和区别。11、因子载荷阵是唯一的吗?证明之。并说明因子载荷的统计意义。12、设因子载荷矩阵为A,称第i行元素的平方和,即,2211,2,,miijjhaip为变量iX的共同度。说明变量共同度2ih的统计意义。13、列举聚类分析中常用的方法,并简述每种方法的主要思想。14、为什么要进行因子旋转?因子旋转的方法有哪些?15、什么是相应分析?16、相应分析的基本思想。17、简述相应分析的步骤。18、距离判别是Bayes判别的一种特例吗?为什么?19、设有两个正态总体1G和2G,已知:(1)(2)1210201812207,,,,1525123275μμΣΣ试用距离判别法判断:样品:2020X,应归属于哪一类?20、下面是5个样品两两间的距离矩阵(0)0406901710063580D试用最长距离法作系统聚类,并画出谱系聚类图。21、金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布),今测得两个总体的若干数据,并由这些数据得到62ˆ124ˆ2