概率论与数理统计第二十一讲主讲教师:程维虎教授北京工业大学应用数理学院利用样本方差S2是2的一个无偏估计,且(n-1)S2/2~χ2n-1的结论。8.3.1单个正态总体方差的χ2检验设X1,X2,…,Xn为来自总体N(,2)的样本,和2未知,求下列假设的显著性水平为的检验。思路分析:1.H0:2=02;H1:2≠02§8.3正态总体方差的检验当原假设H0:2=02成立时,S2和02应该比较接近,即比值S2/02应接近于1。所以,这个比值过大或过小时,应拒绝原假设。合理的做法是:找两个合适的界限c1和c2,●当c1(n-1)S2/02c2时,接受H0;●当(n-1)S2/02≤c1或(n-1)S2/02≥c2时,拒绝H0。由于当原假设H0:2=02成立时,有上述检验法称为χ2检验法。.12/)1(2/12120221nnSnPc1与c2的确定,~/)1(21202nSn.2)1(21)1(21202212020nnSnSnH或的拒绝域为故,2.H0:2=02;H1:202同理,当H0:2=02成立时,有,.)1(212020nSnH的拒绝域为所以,.)()1(21202nSnP此检验法也称χ2检验法。3*.H0:2≤02;H1:202(同2.)例1:某公司生产的发动机部件的直径(单位:cm)服从正态分布,并称其标准差0=0.048。现随机抽取5个部件,测得它们的直径为1.32,1.55,1.36,1.40,1.44.取=0.05,问:(1).能否认为该公司生产的发动机部件的直径的标准差确实为=0?(2).能否认为≤0?解:(1).的问题就是检验H0:2=02;H1:2≠02.其中,n=5,=0.05,0=0.048.故,拒绝原假设H0,即认为部件直径标准差不是0.048cm。经计算,得S2=0.00778,.0.484)0.975()2/1(11.143)0.025()2/(242124212nn,分布表,得查.11.14351.13048.000778.0)1(51)(2202Sn算得故,拒绝原假设H0,即认为部件的直径标准差超过了0.048cm。(2).的问题是检验H0:2≤02;H1:202.,分布表,得查488.9)0.05()(24212n.9.48851.131)(202Sn而该检验主要用于上节中实施两样本t检验之前,讨论12=22的假设是否合理。8.3.2两正态总体方差比的F检验1.H0:12=22;H1:12≠22.设X1,X2,…,Xm和Y1,Y2,…,Yn分别为抽自正态总体N(1,12)和N(2,22)的样本,欲检验当H0:12=22成立时,12/22=1,作为其估计,S12/S22也应与1相差不大。当该值过分地大或过分地小时,都应拒绝原假设成立。合理的思路是:找两个界限c1和c2,●当c1S12/S22c2时,接受H0;●当S12/S22≤c1,或S12/S22≥c2时,拒绝H0。思路分析:因两总体N(1,12)和N(2,22)的样本方差S12和S22分别为12和22的无偏估计。所以,直观上讲,S12/S22是12/22的一个好的估计。根据定理6.4.1,有c1与c2的确定且二者独立。,,~1)(~1)(212222212121nmSnSm.~)1(1)()1(1)(11,2222212122222121nmFSSnSnmSm所以,特别地,当H0:12=22成立时,S12/S22~Fm-1,n-1..)2/()2/1(11,11,2221nmnmFFSSP,从而,.2/2/11,122211,122210nmnmFSSFSSH或的拒绝域为所以,2.H0:12=22;H1:1222同理,当H0:12=22成立时,有S12/S22~Fm-1,n-1,.)(11,2221nmFSSP.1,122210nmFSSH的拒绝域为所以,例2:甲乙两厂生产同一种电阻,现从甲乙两厂的产品中分别随机地抽取12个和10个样品,测得它们的电阻值后,计算出样本方差分别为S12=1.40,S22=4.38。3.H0:12≤22;H1:1222结论同2。以上检验都用到了F分布,因此称上述检验为F检验。假设两厂生产的电阻的电阻的阻值分别服从正态分布N(1,12)和N(2,22)。在显著性水平=0.10下,是否可接受:(l).12=22;(2).12≤22.解:(1).的问题是检验H0:12=22;H1:12≠22.其中,m=12,n=10,α=0.10,S12=1.40,S22=4.38,S12/S22=0.32。利用第六章学过的)2/(1)2/1(11,11,mnnmFF及P237的附表5,有Fm-1,n-1(1-/2)=F11,9(0.95)=1/[F9,11(0.05)]=1/(2.90)=0.34.因S12/S22=0.320.34,所以,无须再考虑Fm-1,n-1(/2)的值,就可得到拒绝12=22的结论。查P237附表5,因查不到F11,9(0.10),改用F10,9(0.10)和F12,9(0.10)的平均值近似之,得F11,9(0.10)=[F10,9(0.10)+F12,9(0.10)]/2≈[2.42+2.38]/2=2.40.因S12/S22=0.322.40,故接受12≤22.(2).问题是检验H0:12≤22;H1:1222..1101122221,检验的拒绝域为FSS在前面的讨论中,我们总假定总体的分布形式是已知的。例如,假设总体分布为正态分布N(,2),总体分布为区间(a,b)上的均匀分布,等等。然而,在实际问题中,我们所遇到的总体服从何种分布往往并不知道。需要我们先对总体的分布形式提出假设,如:总体分布是正态分布N(,2),总体分布是区间(a,b)上均匀分布等,然后利用数据(样本)对这一假设进行检验,看能否获得通过。§8.4拟合优度检验这是一项非常重要的工作,许多学者视它为近代统计学的开端。解决这类问题的方法最早由英国统计学家K.Pearson(皮尔逊)于1900年在他发表的一篇文章中给出,该方法后被称为Pearsonχ2检验法,简称χ2检验。设F(x)为一已知的分布函数,现有样本X1,X2,…,Xn,但我们并不知道样本的总体分布是什么。现在试图检验H0:总体X的分布函数为F(x);(1)对立假设为H1:总体X的分布函数非F(x)。如果F(x)形式已知,但含有未知参数θ或参数向量θ=(θ1,θ2,…,θr),则记其为F(x,θ)。这种检验通常称为拟合优度检验。不妨设总体X是连续型分布。检验思想与步骤如下:(1).将总体X的取值范围分成k个互不重叠的小区间I1,I2,…,Ik,.](](](12101212101kkkkkaaaaaaaIaaIaaI,,,,,,,(2).计算各子区间Ii上的理论频数。如果总体的分布函数为F(x,θ),那么每个点落在区间Ii上的概率均为,k.,,iaFaFpiii21),,(),()(1)ˆ(inpn个点中,理论上有npi(θ)个点落在Ii上,(称为理论频数)。当分布函数中含有未知参数θ时,理论频数也未知,要用来估计npi(θ),其中为θ的极大似然估。ˆ(3).计算各子区间Ii上的实际频数fi。fi=﹟{X1,X2,…,Xn∈Ii},i=1,2,…,k.计数符号,取集合中元素的个数)2()ˆ()]ˆ([122,kiiiinpnpf(4).计算理论频数与实际频数的偏差平方和。可以证明:在H0成立,且n→∞时,和式中的影响力。频数比较大的那些项在理论去除的其目的是:缩小每一项用)ˆ(inp)3(212,k-r-122是参数个数。是子区间数,分布,的由度为统计量的分布收敛到自即rkrk(5).H0的显著性水平为α的检验的拒绝域为)4()(212,k-r-注意:该检验方法是在n充分大时使用的,因而,使用时要注意n必须足够地大,以及npi不能太小这两个条件。在实用上,一般要求n≥50,以及所有npi≥5。如果初始子区间划分不满足后一个条件,则适当地将某些子区间合并,可使npi满足上述要求。例1:为检验棉纱的拉力强度X(单位:千克)服从正态分布,从一批棉纱中随机抽取300条进行拉力试验,结果列在表8.2中。给定α=0.01,检验假设H0:拉力强度X~N(μ,σ2).解:本例中,并未给出各观测值Xi的具体值,只给出了各观测值的取值范围,这样的数据称为区间数据。样本均值与样本方差可通过下列式计算:.211211221211kiiiikiiiiXnaannSaannX,.26.01ˆ41.1ˆ),(22222SnnσXμσσμN,为极大似然估计的和,对正态总体(1).先将数据Xi分成13组,每组落入一个区间,区间的端点为:.18.278.064.01312210aaaaa,,,,,(2).计算数据落入各子区间的理论频数。因分布中含有两个未知参数,所以,理论频数只能近似地估计。落入第i个子区间Ii的理论频数的估计为,其中.132126.041.126.041.1)ˆˆ(ˆˆ12,,,,,iaappiiiiipnˆ,,,,因0.46ˆ1.85ˆ1.85ˆ0.46ˆ131221pnpnpnpn。见表最后两组合并成一组我们将前两组和所以,,均大于,,而8.3)(5ˆˆ113pnpn(3).计算数据落入各子区间上的实际频数fi。fi=﹟{X1,X2,…,Xn∈Ii},i=1,2,…,10..15.22ˆ]ˆ[122kiiiipnpnf(4).计算检验统计量的值因为k=10,r=2,所以上述χ2分布的自由度为k-r-1=7。由.48.18)(15.22212rk(5).H0的显著性水平为α的检验于是,拒绝原假设,即认为棉纱拉力强度不服从正态分布。孟德尔在关于遗传问题的研究中,用豌豆做实验。豌豆有黄和绿两种颜色,在对它们进行两代杂交之后,发现一部分杂交豌豆呈黄色,另一部分呈绿色。其数目的比例大致是3:1。χ2检验的一个著名应用例子是孟德尔豌豆实验。奥地利生物学家孟德尔在1865年发表的论文,事实上提出了基因学说,奠定了现代遗传学的基础。他的这项伟大发现的过程有力地证明了统计方法在科学研究中的作用。因此,我们有必要在这里将这一情况介绍给大家。这只是一个表面上的统计规律。但它启发孟德尔去发展一种理论,以解释这种现象。他大胆地假定存在一种实体,即现在我们称为“基因”的东西,决定了豌豆的颜色。这基因有黄绿两个状态,一共有四种组合:孟德尔把他的实验重复了多次,每次都得到类似结果。(黄,黄),(黄,绿),(绿,黄),(绿,绿).(黄,黄),(黄,绿),(绿,黄),(绿,绿).孟德尔认为,前三种配合使豆子呈黄色,而第四种配合使豆子呈绿色。从古典概率的观点看,黄色豆子出现的概率为3/4,绿色豆子出现的概率为1/4。这就解释了黄绿颜色豆子之比为什么总是接近3:1这个观察结果。孟德尔这个发现的深远意义是他开辟了遗传学研究的新纪元。下面的例子就是用χ2检验来检验孟德尔提出黄绿颜色豌豆数目之比为3:1的论断。例2:孟德尔