1《多元统计分析》课程试卷答案A卷2009年秋季学期开课学院:理考试方式:√闭卷、开卷、一纸开卷、其它考试时间:120分钟班级姓名学号题号一二三四五六七八九十总分得分阅卷人说明:本试卷后附有两张白纸,后一张为草稿纸,可以撕下,但不得将试卷撕散,散卷作废。一、(15分)设,~3321NxxxX,其中132,221231111,1.求32123xxx的分布;2.求二维向量21aaa,使3x与213xxax相互独立。解:1.32123xxxCXxxx321123,则CCCNCX,~。(2分)其中:C13132123,9123221231111123CC。(4分)所以32123xxx9,13~N(1分)2.2133xxaxx=AXxxxaa321211100,则AAANAX,~2。(1分)其中:订线装2A132113211002121aaaa,(1分)2422322222110022123111111002121222121212121aaaaaaaaaaaaaaAA(2分)要使3x与213xxax相互独立,必须02221aa,即2221aa。因为2221aa时2422321212221aaaaaa0。所以使3x与213xxax相互独立,只要21aaa中的21,aa满足2221aa。(4分)二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为3861096X,给定显著性水平05.0,1.求均值向量和协方差矩阵的无偏估计2.试检验,38:H0.38:H1(已知F分布的上分位数为19)2,2(F,5.199)1,2(F,51.18)2,1(F0.050.050.05)解:1、68Xn1Xn1ii(3分)9334)XX()XX(1-n1Sin1ii(3分)2、,38:H0.38:H1…(1分)3在原假设成立的条件下,检验统计量为:)38X()n/S()38X(T12(3分)由68Xn1Xn1ii,)9334()XX()XX(1-n1Sin1ii4)3868()3/93-34()3868(T12…………………………(2分)5.199)1,2(F1Tp)1n(pnF05.02……………………………….(1分)所以接受原假设。(1分)三、(20分)据国家和地区的女子田径纪录数据,数据如下表:表3.1国家和地区的女子田径纪录数据国家和地区100米(秒)200米(秒)400米(秒)800米(分)1500米(分)3000米(分)马拉松(分)阿根廷11.6122.9454.502.154.439.79178.52澳大利亚11.2022.3551.081.984.139.08152.37奥地利11.4323.0950.621.994.229.34159.37比利时11.4123.0452.002.004.148.88157.85…………………………………………美国10.7921.8350.621.963.958.50142.72苏联11.0622.1949.191.893.878.45151.22西萨摩亚12.7425.8558.732.335.8113.04306.00基于相关矩阵对上述数据进行因子分析,利用SPSS软件所得部分运算结果如下:表3.2DescriptiveStatisticsMeanStd.DeviationAnalysisN100米(秒)11.6185.4522155200米(秒)23.64161.1110655400米(秒)53.40582.6783455800米(分)2.0764.10822551500米(分)4.3255.33243553000米(分)9.4476.8243455马拉松(分)173.253330.4295455表3.3KMOandBartlett'sTestKaiser-Meyer-OlkinMeasureofSamplingAdequacy..8384Bartlett'sTestofSphericityApprox.Chi-Square605.335df21Sig..000表3.4ComponentMatrixComponent12100米(秒).888.396200米(秒).880.434400米(秒).919.199800米(分).927-.1261500米(分).938-.2913000米(分).937-.281马拉松(分).884-.298表3.5RotatedComponentMatrix表3.6ComponentScoreCoefficientMatrixComponent12100米(秒)-.288.555200米(秒)-.328.597400米(秒)-.084.333800米(分).247-.0381500米(分).417-.2263000米(分).406-.214马拉松(分).417-.240求:1.写出正交因子模型;2.给出表3.3中Bartlett'sTestofSphericity的原假设和备择假设,对此结果做出解释;3.根据上述运算结果,试填写下表原始变量旋转因子载荷共同度Component12100米(秒).400.886200米(秒).370.909400米(秒).555.760800米(分).776.5221500米(分).894.4053000米(分).887.413马拉松(分).859.3645*1f*2f100米(秒)200米(秒)400米(秒)800米(分)1500米(分)3000米(分)马拉松(分)累积贡献率并对两个旋转因子的含义做出解释;4.解释共同度及累计贡献率的含义;5.写出两个旋转因子的因子得分表达式。解:1.(5分)2.ppIHIH:,:10,由P值05.0,所以拒绝原假设,即相关矩阵不是单位矩阵。(2分)3.(7分)原始变量旋转因子载荷共同度*1f*2f100米(秒).400.8860.94536200米(秒).370.9090.962756400米(秒).555.7600.884162800米(分).776.5220.9269291500米(分).894.4050.9645253000米(分).887.4130.95693马拉松(分).859.3640.87026fX221,,,0)(E0,CO0ppkkdiagfVIfDfE的协方差阵令:pxxX1p1kfff1p1kpij—特殊因子—因子载荷矩阵6累积贡献率0.5044270.922777*1f表示长跑耐力因子,*2f表示短跑速度因子。4.共同度表示提取的前k个公因子反映第i个原始变量的信息程度。累计贡献率表示提取的前k个公因子对所有原始变量的解释程度。(2分)5.42954.302533.173X417.082434.04476.9X406.033243.03255.4X417.010822.00764.2X247.067834.24058.53X084.011106.16416.23X328.045221.06185.11X288.0f7654321*142954.302533.173X240.082434.04476.9X214.033243.03255.4X226.010822.00764.2X038.067834.24058.53X333.011106.16416.23X597.045221.06185.11X555.0f7654321*2(4分)四、(20分)文件Poverty.sav是美国1960-1970年随机选择的30个城市的人口调查结果,其中Y表示该郡低于贫困线的家庭比例,X1表示1960-1970年间人口变化,X2表示从事农业人口数,X3表示居住与农场税率,X4表示住宅电话拥有率,X5表示农村人口比率,X6表示人口年龄中位数。利用spss进行多元线性回归分析,结果如下:表4.1DescriptiveStatisticsMeanStd.DeviationNY23.0106.426630X17.86710.332330X21548.66672038.3863330X3.7187.2027030X474.833310.0071830X570.72724.021630X630.2802.884830表4.2ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.733.538.5214.44562.836.699.6773.6532表4.3ANOVAModelSumofdfMeanFSig.7SquaresSquare1Regression644.3461644.34632.603.000Residual553.3812819.764Total1197.727292Regression837.3812418.69031.372.000Residual360.3462713.346Total1197.72729表4.4CoefficientsModelUnstandardizedCoefficientsStandardizedCoefficientstSig.CorrelationsBStd.ErrorBetaZero-orderPartial1(Constant)58.2596.2269.357.000X4-.471.082-.733-5.710.000-.733-.7332(Constant)52.4965.3369.837.000X4-.366.073-.569-4.993.000-.733-.693X1-.270.071-.434-3.803.001-.649-.591求:1.解释表4.2中“R”,“RSquare”及“AdjustedRSquare”的含义;2.写出表4.3Model2所检验的原假设和备择假设,当显著性水平05.0时,给出检验的结论;3.给定检验的显著性水平05.0,多元线性回归方程的回归系数t检验是否显著,解释原因;4.当X1=10.7,X2=1850,X3=0.93,X4=74,X5=70.6,X6=28.7时,写出y的预测值;5.解释表4.4中偏相关系数的含义,并对Model2中偏相关系数的结果进行解释。解:1.R的线性关系的大小。与为一个整体的为复相关系数,衡量作YXXXp,,21RSquare称为判定系数或决定系数,它反映了回归方程的拟合程度,其值越大,说明回归方程的拟合程度越高,反之,拟合程度越低。总离差平方和回归平方和SSTSSRRSquareR2。AdjustedRSquare为)1()1(