2019/12/191第三章多元正态均值向量和协方差矩阵的检验内容第一节单个总体均值向量的推断第二节单个总体均值分量间结构关系的检验第三节两个总体均值的检验第四节两个总体均值分量间结构关系的检验第五节多个总体均值的比较检验(多元方差分析)第六节正态总体协方差矩阵的检验第七节在SAS多元假设检验过程2019/12/1922019/12/193一、均值向量的检验设是取自多元正态总体的一个样本,,现欲检验n21xxx,,,),(pN00μμ:0H0μμ:1H由于总体的协方差矩阵可能未知或已知,所以在检验时必须采用有不同的的统计量,所以我们分成两种情况来讨论。第一节单个总体均值向量的推断2019/12/194由于是来自多元正态总体的简单随机样本n21xxx,,,),,,(12111pxxx1x),,,(222122pxxxx),,,(21pnnnnxxxx),,,(21p1、总体协方差矩阵已知时2019/12/195)var(),cov(),cov(),cov()var(),cov(),cov(),cov()var()(2122121211pppppxxxxxxxxxxxxxxxVarx2019/12/196由于样本均值,所以有)1,(~npNx)(1)(0120xx0nT)()(01xx0n服从自由度为p的卡方分布。当原假设为真时,服从自由度为p的中心卡方分布。所以,我们用作为检验的统计量,对显著性水平,检验的规则为:)()(0120xx0nT)()(0120xx0nT2019/12/197时,接受原假设;当)(220pT时,拒绝原假设。当)(220pT则接受原假设。值所计算出的样本统计量,)({2pPp则拒绝原假设;值所计算出的样本统计量,)({2pPp2019/12/1982、总体协方差矩阵未知时总体的协方差矩阵未知,用样本的协方差矩阵11()()(1)niiinSxxxx替代中的总体协方差,得霍特林(Hotelling)统计量)()(0120xx0nT2T120()()Tn0xSx2019/12/199在原假设为真时对显著性水平,检验的规则为:当,拒绝原假设;当,接受原假设。),(~)1(2pnpFTnppn),()1(2pnpFTnppn),()1(2pnpFTnppn【例】人的出汗多少与人体内的钠和钾的含量有一定的关系,今测量了20位成年女性的出汗量、钠含量和钾含量。试检验:2019/12/191010504:00μμH2019/12/1911例在企业市场结构研究中,起决定作用的指标有市场份额X1,企业规模(资产净值总额的自然对数)X2,资本收益率X3和总收益增长率X4。为了研究美国市场的变动,夏菲尔德抽取了美国231个大型企业,调查这些企业某十年的资料。假设以前企业市场结构的均值向量为(20,7.5,10,2)’,该调查所得的样本均值向量和样本协方差矩阵如下。2019/12/1912(20.928.0611.781.090)x0.260.081.6390.1560.081.5130.2220.0191.6390.22226.6262.2330.1560.0192.2331.346Σ试问企业的市场结构是否发生了变化?注:似然比统计量在数理统计中关于总体参数的假设检验,通常还可以利用最大似然原理导出似然比统计量进行检验。设p维总体的密度函数为2019/12/1913(,)fxθ其中是未知参数,参数空间。θθΘ有如下假设:2019/12/191410:HθΘ00:HθΘ现在从总体中抽出容量为n的样本12n...xxx()()(),,,样本的联合密度函数为(1)(2)()()1,,...,;)(;)nniiLfxxxθxθ(引入似然比统计量2019/12/19150(1)(2)()(1)(2)()max,,...,;)max,,...,;)nnLLθθxxxθxxxθ((由于,所以统计量取值在0到1之间。0由极大似然比原理,如果取值太小,说明H0为真的时观测到此样本的概率要小得多,故有理由认为假设H0不成立。可以证明当样本容量很大时2019/12/19160(1)(2)()(1)(2)()max,,...,;)-2ln-2lnmax,,...,;)nnLLθθxxxθxxxθ((近似服从自由度为f的卡方分布,其中自由度为的维数减0的维数。下面我们讨论2019/12/19170010:=:HHμμμμ;的似然比检验。/222,0max(,)(2)nnpnpLenμΣAμΣ其中1()()niiiAX-XX-X原假设成立时,有2019/12/1918/202200max(,)(2)nnpnpLenΣAμΣ其中0001()()niAX-μX-μ22002nnnAAAA我们来讨论一下,似然比检验的统计量和霍特林的T平方统计量的关系。2019/12/19190001()()niiiAXXXμXXXμ001()()()()niiinXXXXXμXμ00()()nAXμXμ有2019/12/1920000()()nAAXμXμ1001()()nAXμAXμ00()()nnAXμXμI012001111()()11nTnAAXμAXμ三个统计量是等价的,有2019/12/192122TTFF2019/12/1922例设x1,x2,…,xn取自该总体Np(,)的样本,=(1,2,…p),检验H0:1=2=…=p=H1:至少存在一对i和j,使ij第二节单个总体均值分量间结构关系的检验2019/12/1923100101010011C令则与上面的原假设等价的假设为0:0CH0:1CH例假定人类的体形有这样的一般规律:身高、胸围和上臂围平均尺寸比例为6:4:1。检验身高、胸围和上臂围平均尺寸比例是否符合这一规律。2019/12/192432104161:H至少有两个不相等。3211,41,61:H601032C则上面的假设可以表达为;0C:0H0C:1H2019/12/1925设取自多元正态总体的一个样本。前面,我们已经利用样本,检验均值向量是否等于一个指定的向量。在实际问题中,我们也需要检验均值向量的分量之间是否存在某一指定的结构关系,即检验n21xxx,,,),(pNC:0HC:1H其中C为一已知的kp阶矩阵,kp,rank(C)=k,为已知的k维向量。根据多元正态分布的性质可知),,(~CCCCxkN,)(krankCC0CSC2019/12/1926~(,),kNnΣCxCCC~(,)kCWnCCSCΣ(1)~(,)pnWnSΣ~(,),knNnCxCCΣC12TnCxCCSCCxC2019/12/1927为了检验H0:C=,可以用统计量12()()TnCCxCSCx当为真时H0:C=时对给定的显著性水平,检验的规则当时,拒绝原假设;当时,接受原假设。),(~)1(2knkFTnkkn),()1(2knkFTnkkn),()1(2knkFTnkkn2019/12/1928特别当=0,即检验H0:C=0,H1:C0,则12()()TnCCxCSCx11()()(1)niiinSxxxx2019/12/1929在例中,假定人类的体形有这样一个一般规律的身高、胸围和上臂围平均尺寸比例为6:4:1。检验比例是否符合这一规律。检验:012311:64H112311:,,64H至少有两个不等2019/12/1930某地区农村男婴的体格测量数据如下编号身高(cm)胸围(cm)上半臂长(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0检验三个指标的均值是否有关系12311642019/12/1931012311:64H112311:,,64H至少有两个不相等26247.143=18.8572(1)2(61)nkFTkn2()~(,1)TnTkn1Cx)CSC(Cx2019/12/1932第三节两个总体均值的检验一、两个独立样本的情形与一元随机变量的情形相同,常常我们需要检验两个总体的均值是否相等。设从总体和中各自独立地抽取样本),(1pN),(2pN和),,,(121nxxxx),,,(221nyyyy,且0。pnn21,考虑假设;210:H211:H2019/12/19331111ninixx2121niniyy根据两个样本可得1和2的无偏估计量为2019/12/1934))11(,(~2221nnNpYX因为两个总体的协方差矩阵相等,所以我们可以用样本的联合协方差矩阵来估计1212(1)(1)~(2,)pnnWnn12ESS1111()()1niin1iSxxxx22121()()1niiniSyyyy211212~(,)pnnNnnXY2019/12/1935霍特林(Hotelling)统计量为:2T12121212()()(2)nnTnnnnExyxy当原假设为真的条件下,统计量)1,(~)2(12122121pnnpFTnnppnn检验的规则为:当时,拒绝原假设;当时,接受原假设。22121)2(1Tnnppnn)1,(21pnnpF22121)2(1Tnnppnn)1,(21pnnpF2019/12/1936二、成对试验的统计量2T前面我们讨论的是两个独立样本的检验问题,但是不少的实际问题中,两个样本的数据是成对出现的。例如检验男女职工的工资收入是否存在差异;一种新药的疗效等。设(xi,yi),i=1,2,3,…,n(np),是成对的试验数据,总体X和y均服从p维正态分布,且协方差相等。令di=xi-yi,则di=xi-yi服从正态分布,。),(~dpNid21检验假设210:H211:H0:0H0:1H2019/12/1937dSd1dnT2检验的统计量其中yxdniiin1))((11ddddSd当原假设为真时,统计量服从自由度为和的分布。02)1(TnppnppnF检验规则为:当时,拒绝原假设,否则接受原假设。2)1(Tnppn),(pnpF2019/12/1938中小企业的破产模型为了研究中小企业的破产模型,首先选定了X1总负债率(现金收益/总负债),X2收益性指标(纯收入/总财产),X3短期支付能力(流动资产/流动负债)和X4生产效率性指标(流动资产/纯销售额)4个经济指标,对17个破产企业为“1”和正常运行企业“2”进行了调查,得资料如下。如果这些指标是用来做判别分析和聚类分析的变量,他们之间没有显著性差异是不恰当的,所以检验所选择的指标在不同