第八章假设检验第五节非正态总体均值及0-1分布比率的假设检验一、非正态总体均值的假设检验问题1.单个总体均值的大样本假设检验设非正态总体X的均值为μ,方差σ2为已知,为总体X的一个样本,样本均值为12,,nXXX,,X样本方差为S2,则当充分大时,由中心极限定理知,XUn近似地(0,1).N所以对μ的假设检验可以用前述的U检验法.具体见下表.00/2uu≥0≤0uu≥0≥0uu≤原假设H0备择假设H1H0的近似拒绝域非正态总体均值的U检验法如果方差σ2未知,可以用样本标准差S来代替σ,即当n充分大时,由中心极限定理知,XUSn近似地(0,1).N以其为检验统计量,检验法准则见上表.例1设某段高速公路上汽车限制速度的标准差为σ=13.4km/h,现检验n=85辆汽车的样本,测出平均车速为106.7xkm/h,已知总体标准差为σ=13.4km/h,但不知总体是否服从正态分布.在显著性水平α=0.05下,试检验高速公路上的汽车是否比限制速度104.6km/h显著地快?解设高速公路上的车速为随机变量X,近似有2(,)XN13.4(km/h)要检验假设001:104.6,:104.6HH解设高速公路上的车速为随机变量X,近似有2(,)XN13.4(km/h)要检验假设001:104.6,:104.6HH由于样本容量较大,可近似地采用U检验法,已知0.05,85,n查表得0.051.645,uu近似拒绝域为0/xWuun106.7,x13.4,0104.6,85,n由已知106.7,x13.4,0104.6,85,n由已知0.05106.7104.61.441.64513.4/85uu计算统计量的观测值,有所以接受H0,即在α=0.05显著性水平下,的证据说明汽车行驶速度快于限制速度.没有明显及样本方差分别为2.两个总体均值的大样本假设检验设有两个独立的总体X,Y,它们的分布是任意的,其均值及方差(均未知)分别为1,EX2,EY21,DX22,DY从两个总体中分别抽取样本容量为n1,n2(均大于100)的大样本112,,,nXXX,212,,,nYYY,,X,Y21,S22.S两样本的样本均值由中心极限定理知,当n1,n2充分大时,有12221122()XYSnSn近似地(0,1).N对于检验问题012112:,:HH选取检验统计量221122XYUSnSn在H0成立的条件下,上述统计量近似服从标准正态分布,对于给定的显著性水平α,此检验法的拒绝域为2Wuu≥其它的情形见下表:1212/2uu≥12≤12uu≥12≥12uu≤原假设H0备择假设H1H0的近似拒绝域非正态总体均值差的U检验法例2为比较两种小麦植株的高度(单位:cm),在相同条件下进行高度测定,算得样本均值与样本方差分别如下:甲小麦:乙小麦:1100n28x2135.8s2100n26y2232.3s在显著性水平α=0.05下,这两种小麦株高之间有无显著差异(假设两个总体方差相等)?解这是属于大样本情形下两个总体分布未知、两个总体方差未知且相等的均值的差异性检验.要检验的假设为:012112:,:.HH解这是属于大样本情形下两个总体分布未知、两个总体方差未知且相等的均值的差异性检验.要检验的假设为:012112:,:.HH/21.96,u因α=0.05,查标准正态分布表,得计算检验统计量的观测值,得2211222.4236xyusnsn||1.96,u否定H0,可认为两种小麦株高之间有显著差异.由于在显著性水平α=0.05下二、0-1分布总体比率的假设检验问题1.单个0-1分布总体比率的检验设总体~(1,),Xbp12,,nXXX,是取自X的一个样本,比率p为未知,,EXp(1),DXppˆ(1)/ppppn记p的点估计为ˆ,npX当n足够大时,由中心极限定理知,(0,1)N近似地又又因为ˆnpX是p的一致估计量,从而有ˆˆˆ(1)/ppppn(0,1)N近似地(1)设0p01是已知常数,对于检验问题0010:,:HppHpp检验统计量为00ˆ(1)/ppUppn对于给定的显著性水平α,上述检验问题的近似拒绝域为0200ˆ(1)/ppuppn≥(2)右边检验问题.检验假设0010:,:HppHpp对于给定的显著性水平α,在H0为真时,对于足够大的n有0ˆˆˆˆˆˆ(1)/(1)/ppppppnppn≤(0,1)N近似地0ˆˆˆˆˆˆ(1)/(1)/ppppPuPuppnppn≥≤≥从而,上述右边检验问题的拒绝域为0ˆˆˆ(1)/ppWuppn≥(3)左边检验问题0010:,:HppHpp检验假设对于给定的显著性水平α,近似拒绝域为0ˆˆˆ(1)/ppWuppn≤例3一项调查结果声称,某市老年人口的比重为15.2%.该市老年人口研究会为了检验该项调查结果是否可靠,随机抽选了400名居民,发现其中有62位老年人.问调查结果是否支持该市老年人口比重为15.2%的看法(α=0.01)?例3一项调查结果声称,某市老年人口的比重为15.2%.该市老年人口研究会为了检验该项调查结果是否可靠,随机抽选了400名居民,发现其中有62位老年人.问调查结果是否支持该市老年人口比重为15.2%的看法(α=0.01)?解设该市老年人口的比重为p,检验假设为01:0.152,:0.152HpHp引入随机变量1,X抽得的居民是老年人,0,抽得的居民不是老年人,~(1,)Xbp显然解设该市老年人口的比重为p,检验假设为01:0.152,:0.152HpHp引入随机变量1,X抽得的居民是老年人,0,抽得的居民不是老年人,~(1,)Xbp显然当H0成立时,0.152~(0,1).0.152(10.152)/400XUN近似查表,得/20.0052.58,uu近似拒绝域为{||2.58}.Wu当H0成立时,0.152~(0,1).0.152(10.152)/400XUN近似查表,得/20.0052.58,uu近似拒绝域为{||2.58}.Wu由题设,624000.155,x代入求得U的观测值为0.167,u因||2.58,u故接受原假设H0.2.两个0-1分布总体参数的检验1~(1,)Xbp,2~(1,)Ybp,设12,,nXXX,是来自总体X的样本,12,,mYYY,是来自总体Y的样本,假设两样本独立.1ˆ,npX2ˆmpY分别是比率p1,p2的点估计量,111ˆnniipXXn211ˆmmjjpYYm111(1),ppNpn222(1),ppNpm近似地近似地当n,m足够大时,由中心极限定理,有由正态分布的性质知112212(1)(1),ppppNppnm12ˆˆpp近似地(1)对于假设检验问题012112:,:HppHpp在H0为真时,记1122(1)(1)11(1)ppppppnmnm所以近似地有12,ppp则有110,(1)Nppnm12ˆˆpp近似地所以近似地有110,(1)Nppnm12ˆˆpp近似地由于两样本独立,取p的点估计量为121212ˆˆ1ˆ()nmnpmppXXXYYYnmnm取检验统计量12ˆˆ11ˆˆ(1)ppUppnm取检验统计量12ˆˆ11ˆˆ(1)ppUppnm当n,m足够大时,在H0成立的条件下有U(0,1)N近似地对于给定的显著性水平α,上述双边检验问题的拒绝域为2Wuu≥(2)对于假设012112:,:HppHpp≤当n,m足够大时,在H0成立的条件下,近似地有12121211221122ˆˆˆˆ()()~(0,1)ˆˆˆˆˆˆˆˆ(1)(1)(1)(1)ppppppUNppppppppnmnm≤对于给定的显著性水平α上述右边检验问题的拒绝域为Wuu≥(3)对于假设012112:,:HppHpp≥类似地可得此左边检验问题的拒绝域为Wuu≤-例4在A县调查n=1500个农户,其中有中小型农业机械的农户μn=300户;在B县调查m=1800户,其中有中小型农业机械的农户μm=320户.试在显著性水平α=0.05下检验两个县有中小型农户的比率有无差异?解由于n=1500,m=1800,这是大样本情况下两个0—1总体的概率检验问题.待检验假设为012112:,:HppHpp已知1500,n1800,m300,n320,m计算得1ˆ0.200,p2ˆ0.178,pˆ0.188,p012112:,:HppHpp已知1500,n1800,m300,n320,m计算得1ˆ0.200,p2ˆ0.178,pˆ0.188,p12ˆˆ0.161,ˆˆ(1)(11)ppuppnm由α=0.05,查标准正态分布表,得/21.96,u因/2||,uu故在显著性水平α=0.05下接受H0,即可以认为两个县有中小型农业机械的农户所占比率无明显差异.