多元统计分析模拟考题及答案

无名手心
1 ℃
2020-04-06

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

-1-一、判断题（对）112(,,,)pXXXX的协差阵一定是对称的半正定阵（对）2标准化随机向量的协差阵与原变量的相关系数阵相同。（对）3典型相关分析是识别并量化两组变量间的关系，将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。（对）4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。（错）5),(~),,,(21ppNXXXX，,XS分别是样本均值和样本离差阵，则,SXn分别是,的无偏估计。（对）6),(~),,,(21ppNXXXX，X作为样本均值的估计，是无偏的、有效的、一致的。（错）7因子载荷经正交旋转后，各变量的共性方差和各因子的贡献都发生了变化（对）8因子载荷阵()ijAa中的ija表示第i个变量在第j个公因子上的相对重要性。（对）9判别分析中，若两个总体的协差阵相等，则Fisher判别与距离判别等价。（对）10距离判别法要求两总体分布的协差阵相等，Fisher判别法对总体的分布无特定的要求。二、填空题1、多元统计中常用的统计量有：样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵．2、设是总体1(,,)mXXX的协方差阵，的特征根(1,,)iim与相应的单位正交化特征向量12(,,,)iiiimaaa，则第一主成分的表达式是11111221mmyaXaXaX，方差为1。3设是总体1234(,,,)XXXXX的协方差阵，的特征根和标准正交特征向量分别为：'112.920(0.1485,0.5735,0.5577,0.5814)U'221.024(0.9544,0.0984,0.2695,0.0824)U'330.049(0.2516,0.7733,0.5589,0.1624)U'440.007(0.0612,0.2519,0.5513,0.7930)U，则其第二个主成分的表达式是-2-212340.95440.09840.26950.0824yXXXX，方差为1.0244.若),(~)(pNX，（n,,2,1）且相互独立，则样本均值向量X服从的分布是(,)pNn．5.设(,),1,2,,16ipXNi，X和A分别是正态总体的样本均值和样本离差阵，则2115[4()][4()]TXAX服从215(15,)(,)16pTpFpnpp或6设3(,),1,2,,10iXNi，则101()()iiiWXX服从3(10,)W7.设随机向量123(,,)XXXX，且协差阵4434923216，则其相关矩阵R=2313821136311868.设122(,)(,),XXXN，其中212(,),11，则1212,)XXXXCov(09设X,Y是来自均值向量为，协差阵为的总体G的两个样品，则X，Y间的马氏平方距离2(,)dXY1()()XYXY10设X,Y是来自均值向量为，协差阵为的总体G的两个样品，则X与总体G的马氏平方距离2(,)dXG=1()()XX11设随机向量123(,,)XXXX的相关系数矩阵通过因子分析分解为121330.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.1032013R-3-则1X的共性方差21h0.9342=0.872，其统计意义是：描述了全部公因子对变量X1的总方差所作的贡献，称为变量X1的共同度，反映了公共因子对变量X1的影响程度。标准化变量X1的方差为1，公因子f1对X的贡献21g0.9342+0.4172+0.8352=1.74312.对应分析是将Q型因子分析和R型因子分析结合起来进行的统计分析方法13典型相关分析是研究两组变量间相关关系的一种多元统计方法14.聚类分析中，Q型聚类是指对样本进行聚类，R型聚类是指对指标进行聚类。15Spssforwindows中主成分分析由DataReduction-FactorAnalysis过程实现。16设,kkUV是第k对典型变量则()1,()1(1,2,,)kkDUDVkr(,)0,(,)0()ijijCovUUCovVVij0(,1,2,,)(,)0()0()iijijirCovUVijjr17.在多维标度分析中，当D是欧几里得距离阵时，X是D的一个构图三、简答题（答案见平时习题）1简述多元统计的主要内容与方法（10分）可对比一元统计列出多元统计的主要内容与方法（从随机变量及其分布、数字特征、四大分布（正态分布密度（1分）、)(2n与威沙特分布),(nWp（1分）、t分布与Hoteling2T分布（1分）、F分布与威尔克斯分布),,(21nnp（1分））、抽样分布定理、参数估计和假设检验、统计方法（2分）2.请阐述距离判别法、贝叶斯判别法和费希尔判别法的基本思想和方法，比较其异同3请阐述系统聚类法、K均值聚类法、有序样品聚类法的基本思想和方法，比较其异同4请阐述主成分分析和因子分析的基本思想、方法步骤和应用，比较其异同5请阐述相应分析、多维标度法、典型相关分析和多变量的可视化分析的基本思想和应用四、计算题1设三维随机向量33(,2)XNI，已知321000.510.510,010,,0.500.520001IAd，求YAXd的分布-4-解：正态分布的线性组合仍为正态，故只需求112()()1210.50.512131()10101110.50.5EYEAXdAEXdDYDAXdADXA所以3((),())YNEYDY另解：123131231312313123130.50.510.50.52(0.50.51)2(0.50.52)1(0.50.51)3(0.50.52)1(0.50.51,0.50.52)1XXXYAXdXXEXXXEXXDXXXDXXCOVXXXXX故3((),())YNEYDY2.设三维随机向量3(,)XN，已知21113,1321122，求12332YXXX的分布解：正态分布的任意线性组合仍正态，故Y的分布是一维正态分布，只需求12322123121332()3()2()()13()3()2()()2(3,2)2(3,)2(,2)9EYEXEXEXDYEXEXEXCovXXCovXXCovXX故(13,9)YN3设有两个二元总体和，从中分别抽取样本计算得到,,假设，试用距离判别法建立判别函数和判别规则。样品X=（6，0）’应属于哪个总体？解：=，=，==-5-即样品X属于总体4设已知有两个正态总体12,GG,且12122411,,6219，而其先验概率分别为120.5,qq误判的代价4L(2|1),(1|2)eLe，试用贝叶斯判别法确定样本35X属于哪个总体？解：由Bayes判别知，11122()()exp[()()]()fxWxxfx其中1211224311()624229121,1148321(1|2)(2|1)qCdeqC123()5xWxWWdx故35X属于G2总体5表1是根据某超市对不同品牌同类产品按畅销（1）、平销（2）和滞销（3）的数据，利用SPSS得到的Bayes判别函数系数表，请据此建立贝叶斯判别函数，并说明如何判断新样品（x1,x2,x3）属于哪类？ClassificationFunctionCoefficientsgroup123-6-x1-11.689-10.707-2.194x212.29713.3614.960x316.76117.0866.447(Constant)-81.843-94.536-17.449Fisher'slineardiscriminantfunctions表1Bayes判别函数系数解：根据判别分析的结果建立Bayes判别函数：Bayes判别函数的系数见表4.1。表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下：Group1：3761.162297.121689.11843.811XXXYGroup2：3086.172361.131707.10536.942XXXYGroup3：3447.62960.41194.2449.173XXXY将新样品的自变量值代入上述三个Bayes判别函数，得到三个函数值。比较这三个函数值，哪个函数值比较大就可以判断该样品判入哪一类。6.对某数据资料进行因子分析，因子分析是从相关系数阵出发进行的，前两个特征根和对应的标准正交特征向量为'112.920(0.1485,0.5735,0.5577,0.5814)U，'112.920(0.1485,0.5735,0.5577,0.5814)U(1)取公因子个数为2，求因子载荷阵(2)用F1F2表示选取的公因子，12,为特殊因子，写出因子模型，说明因子载荷阵中元素ija的统计意义7在一项对杨树的形状研究中，测定了20株杨树树叶，每个叶片测定了四个变量1234,,,XXXX分别代表叶长，叶子2/3处宽，1/3处宽，1/2处宽，这四个变量的相关系数矩阵的特征根和标准正交特征向量分别为：'112.920(0.1485,0.5735,0.5577,0.5814)U'221.024(0.9544,0.0984,0.2695,0.0824)U-7-'330.049(0.2516,0.7733,0.5589,0.1624)U'440.007(0.0612,0.2519,0.5513,0.7930)U若按一般性原则选取主成分个数，请写出主成分表达式，并计算每个主成分的方差贡献率解：选取主成分的一般原则是特征值大于1或累积贡献率达到80%以上。据题选取两个主成分，其表达式和贡献率分别是：1123410.14850.57350.55770.5814,2.920yXXXX贡献率为2123420.95440.09840.26950.0824,1.024yXXXX贡献率为8下表是进行因子分析的结果,试根据表中信息写出每个原始变量的因子表达式，并分析是否需要对因子载荷旋转。ComponentMatrixComponent123X1.969-1.084E-02.205X2.911.321-.102X3.847-.120.323X4.941.281-2.693E-02X5.899.215-1.963E-02X6-.313.839.305X7-.6666.280E-02.679X8.575-.580.367ExtractionMethod:PrincipalComponentAnalysis.a3componentsextracted.解：由表F1F2F3X1.969-1.084E-02.205X2.911.321-.102X3.847-.120