多元统计分析人大何晓群第二章.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/1/3中国人民大学六西格玛质量管理研究中心1多元统计分析何晓群中国人民大学出版社2020/1/3中国人民大学六西格玛质量管理研究中心2第二章均值向量和协方差阵的检验目录上页下页返回结束•§2.1均值向量的检验•§2.2协方差阵的检验•§2.3形象分析•§2.4有关检验的上机实现2020/1/3中国人民大学六西格玛质量管理研究中心3第二章均值向量和协方差阵的检验目录上页下页返回结束2以做检验。2020/1/3中国人民大学六西格玛质量管理研究中心4第二章均值向量和协方差阵的检验目录上页下页返回结束2020/1/3中国人民大学六西格玛质量管理研究中心5目录上页下页返回结束§2.1均值向量的检验§2.1.1一个指标检验的回顾§2.1.2多元均值检验§2.1.3两总体均值的比较§2.1.4多总体均值的检验(2.1)分位点的上为从而拒绝域为服从正态分布统计量当假设成立时为样本均值。其中2/)1,0(,||),1,0(~,12/2/10aNuuuNuuxnxnxuaaini2020/1/3中国人民大学六西格玛质量管理研究中心6目录上页下页返回结束§2.1.1一个指标检验的回顾2020/1/3中国人民大学六西格玛质量管理研究中心7目录上页下页返回结束§2.1.1一个指标检验的回顾2.2)(,)1()(,022122nSxtnxxSini用统计量的估计作为用未知时当||t),2/(1nt分为点。的上为2/)2/(11nntt2020/1/3中国人民大学六西格玛质量管理研究中心8目录上页下页返回结束§2.1.1一个指标检验的回顾(2.3))())((01202xSxnt2020/1/3中国人民大学六西格玛质量管理研究中心9目录上页下页返回结束§2.1.2多元均值检验2020/1/3中国人民大学六西格玛质量管理研究中心10目录上页下页返回结束§2.1.2多元均值检验2020/1/3中国人民大学六西格玛质量管理研究中心11目录上页下页返回结束§2.1.2多元均值检验)',,(1)(pXXX2020/1/3中国人民大学六西格玛质量管理研究中心12目录上页下页返回结束§2.1.2多元均值检验(ⅰ)协方差阵Σ已知类似于(2.3)的统计量(注意(2.3)的形式)是)5.2()()(01'020xxn可以证明,在假设为真时,统计量遵从自由度为p的分布;事实上由§1.50H202,有布的性质成立时,由多元统计分知当4X00),1,0(~:HnNp)p(~)X()X(n)X()n1()X(201'001'02020/1/3中国人民大学六西格玛质量管理研究中心13目录上页下页返回结束§2.1.2多元均值检验统计量实质上是样本均值与已知平均水平之间的马氏距离的倍,这个值越大,μ与相等的可能性就越小,因而,在备择假设成立时,有变大的趋势,所以拒绝域应取为值较大的右侧部分。式中是样本均值,是样本容量。nn020X01H2020X当给定显著性水平后,由样本值可以算出的值,当20)()()(201'020pxxn时,便拒绝零假设,说明均值μ不等于,其中是自由度为P的分布的分为点。即0H0)(2p2)}({220pP2020/1/3中国人民大学六西格玛质量管理研究中心14目录上页下页返回结束§2.1.2多元均值检验(ⅱ)协方差阵Σ未知此时Σ的无偏估计是,类似于式(2.3)的统计量是:)1(nL)())(1()()(01'001'02xLxnnxΣxnT可以证明,统计量遵从参数为p,n-1,,的分布,即。统计量实际上也是样本均值与已知均值向量之间的马氏距离再乘以n(n-1),这个值越大,μ与相等的可能性就越小。2T21,2npTT2TX002020/1/3中国人民大学六西格玛质量管理研究中心15目录上页下页返回结束§2.1.2多元均值检验因而,在备择假设成立时,的值有变大的趋势,所以拒绝域可取为值较大的右侧部分。因此,当给定显著性水平后,由样本的数值可立即算出值,当2T2T2T)7.2()(21,2npTT时,便拒绝零假设。0H分布的5%及1%的分位点已列成专表,由网上下载,为的上分位点。21,npT2T)(21,npT2020/1/3中国人民大学六西格玛质量管理研究中心16目录上页下页返回结束§2.1.2多元均值检验由§1.5,将统计量乘上一个适当的常数后,便成为F统计量,也可用F分布表获得零假设的拒绝域。即2T(2.8))}()1({,2pnpFTpnpn关于、的合理性及推证见参考文献[3]2T20T在实际工作中,一元检验与多元检验可以联合使用,多元的检验具有概括和全面考察的特点,而一元的检验容易发现各指标之间的关系和差异,能帮助我们找出存在差异的侧重面,提供了更多的统计分析信息。2020/1/3中国人民大学六西格玛质量管理研究中心17目录上页下页返回结束§2.1.3两总体均值的比较在许多实际问题中,往往要比较两个总体之间的平均水平有无差异。例如,两所大学新生录取成绩是否有明显差异;研究职工工资总额的构成情况,若按国民经济行业分组,就是例如要研究工业与建筑业这两个行业之间,是否有明显的不同之处;同理,可按工业领导关系(中央、省、市、县属工业)分组;也可按工业行业分组。组与组之间的工资总额构成有无显著差异,本质上就是两个总体的均值向量是否相等,这类问题,通常也称为两样本问题。两总体均值比较的问题,又可分为两总体协方差阵相等与两总体协方差阵不等两种情形。2020/1/3中国人民大学六西格玛质量管理研究中心18目录上页下页返回结束§2.1.3两总体均值的比较1.协方差阵相等的情形进行检验。与前面类似的统计量的形式是:设为来自p元正态总体的容量为的样本,是来自p元正态总体容量为的样本,且两样本之间相互独立,假定两总体协方差阵相等,但未知,现对假设),,1(2n),,1()',,,(121)(nXXXpX),(1pN1n)',,,(21)(pYYYY),(2pN2npnpn21,)9.2(,:000H2020/1/3中国人民大学六西格玛质量管理研究中心19目录上页下页返回结束§2.1.3两总体均值的比较;,1,1)(ˆ)(21;12111/2121221是样本容量其中nnynxnnnnnTiniiniYX(2.10)YXΣYX的估计量;是协方差阵,)2()(21nnLLyx.,))((,))((211'1'样本离差阵是两个总体的niiiyniiixyyyyLxxxxL2020/1/3中国人民大学六西格玛质量管理研究中心20目录上页下页返回结束§2.1.3两总体均值的比较从而成立时当假设,~,:22,221021nnpTTH(2.11)~)2(11,2212121pnnpFTpnnpnn,:成立时当备择假设211H,)2(1*22121有变大的趋势FTpnnpnn因为的值与总体均值的马氏距离成正比例,此值愈大,说明两总体的均值很接近的可能性就愈小,因而拒绝域可以取为值较大的右侧区域,即当给定显著性水平的值时,若时,拒绝,否则没有足够理由拒绝。2T)(ˆ)'(1YXΣYXF(2.12))(1,21pnnpFF0H0H2020/1/3中国人民大学六西格玛质量管理研究中心21目录上页下页返回结束§2.1.3两总体均值的比较2.协方差阵不相等情形设从两个总体和,分别抽取容量为和的两个样本,,假定两总体协方差阵不相等,我们考虑对假设(2.9)作检验。这是著名Behrens—Fisher问题。长期以来,统计学家用许多方法试图解决这个问题。当与相差较大时,统计量的形式是:1n)',,,(21)(pXXXX),(11pN),(22pN2n)',,,(21)(pYYYY),,1(1n),,1(2n.,21pnpn1Σ2Σ2T2020/1/3中国人民大学六西格玛质量管理研究中心22目录上页下页返回结束§2.1.3两总体均值的比较2/11122/1()()()(1)(1)()()(2.13)yxLLTnnnnXYXYXYSXY21321/1141112321/114222()()()()1()()()(1)xyLfnnTnLnnTnXYSSXYXYSSXY式中,的统计含义与前相同,再令1122*(1)(1)yxLLnnnnSyxLLYX和,,2020/1/3中国人民大学六西格玛质量管理研究中心23目录上页下页返回结束§2.1.3两总体均值的比较(2.14)1,2~))1((pfpFTpfpf2221,),min(pTnn近似于时当当假设(2.9)的成立时,可以证明(见文献[3])近似遵从第一自由度为、第二自由度为的F分布,即p1pf21Tfppf0H2020/1/3中国人民大学六西格玛质量管理研究中心24目录上页下页返回结束§2.1.4多总体均值的检验在许多实际问题中,我们要研究的总体往往不止两个。例如,要对全国的工业行业的生产经营状况做一比较时,一个行业可以看成一个总体,此时要研究的总体就达几十甚至几百个之多。这类问题的研究就需要多元方差分析的知识。多元方差分析是一元方差分析的直接推广,为了易于理解多元方差分析的方法,我们先回顾一元的方差分析。2020/1/3中国人民大学六西格玛质量管理研究中心25目录上页下页返回结束§2.1.4多总体均值的检验2212(1)(1)211(2)(2)212()()21,,~(,),,~(,),,~(,)rnnrrnrXXNXXNXXN假设r个总体的方差相等,要检验的假设就是jirjiHH使得至少存在,:,:110.nnn,均值是,Xn1X的均值个k是第Xn1X式中;)X(XSST:总平方和;)X(XSSE:组内平方和;)XX(nSS(TR):组间平方和r1(k)jn1jr1kk(k)jn1jkk2k(k)jn1jr1k2k(k)jn1jr1k2Kkr1kkkkk总组2020/1/3中国人民大学六西格玛质量管理研究中心26目录上页下页返回结束§2.1.4多总体均值的检验这个检验的统计量与下列平方和密切相关2020/1/3中国人民大学六西格玛质量管理研究中心27目录上页下页返回结束§2.1.4多总体均值的检验)(零假设的拒绝域为:的分布,记为)()统计量遵从自由度为(当假设为真的,rn1rFFrn1rFF1,,,~rn,rF1(1)(1)11()()1(),,~(,),,~(,){,1,,;1,,}rnprrnprkjkNNkrjnXXμΣXXμΣX样本相互独立,要检验的假设就是2020/1/3中国人民大学六西格玛质量管理研究中心28目录上页下页返回结束§2.1.4多总体均值的检验)(使得至少存在2.15110jir,ji:H,:H用类似于一元方差分析的办法,前面所述的三个平方和变成了矩阵,形式如下:XXXXW(2.16)XXXXEXXXXB11111/)k(j)k(jnjrk/k)k(jk)k(jnjrk/kkkrk))((SST))((SSE))((n)TR(SSkk很显然W=B+E关于的检验可用WilksΛ分布,再化为F分布,详细参考1.5节2020/1/3中国人民大学六西格玛质量管理研究中心29目录上

1 / 98
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功