章假设检验节基本概念假设检验参数假设检验非参数假设检验这类问题称作假设检验问题.总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题在本讲中,我们将讨论不同于参数估计的另一类重要的统计推断问题.这就是根据样本的信息检验关于总体的某个假设是否正确.某工厂生产10欧姆的电阻.根据以往生产的电阻实际情况,可以认为其电阻值X~N(,2),标准差σ=0.1.现在随机抽取10个电阻,测得它们的电阻值为:9.9,10.1,10.2,9.7,9.9,9.9,10,10.5,10.1,10.2.试问:从这些样本,我们能否认为该厂生产的电阻的平均值为10欧姆?例1(一)一个例子确定总体:记X为该厂生产的电阻的测量值.根据假设,X~N(,2),这里=0.1.明确任务:通过样本推断X的均值μ是否等于10欧姆.Hypothesis:上面的任务就是要通过样本去检验“X的均值μ=10”这样一个假设是否成立.(在数理统计中把“X的均值μ=10”这样一个待检验的假设记作“H0:μ=10”称为“原假设”或“零假设”问题怎么建立:原假设的对立面是“X的均值μ≠10”记作“H1:μ≠10”称为“对立假设”或“备择假设”.把它们合写在一起就是:H0:μ=10H1:μ≠10解决问题的思路分析:∵样本均值是μ的一个良好估计.∴如果μ=10,即原假设成立时,那么:10X应该比较小.反之,如果它过于大,那么想必是原假设不成立.10X的大小可以用来检验原假设是否成立.这里的问题是,我们如何确定常数c呢合理的思路是找出一个界限c,细致的分析:根据定理6.4.1,2(,)XNn~(0,1)0.1/10XN~∵n=10=0.1时,我们就接受原假设H0,10Xc当10Xc而当时,我们就拒绝原假设H0.于是,当原假设H0:μ=10成立时,有:为确定常数c,现在我们考虑一个相当小的正数(理由下面讲).例如=0.05.于是,当原假设H0:μ=10成立时,有:10(0,1)0.1/10XN~/2100.1/10XPZ/210(0.1/10)PXZ即/2(0.1/10)cZ取我们就拒绝原假设H0:μ=10.我们就接受原假设H0:μ=10.现在我们就得到检验准则如下:10Xc当时10Xc而当时/2(0.1/10)cZ其中/2/210.0.1/1010(0.1/10)10.0.1/10XXZXZ称为检验统计量该检验的也即称为拒绝域用以上检验准则处理我们的问题./21010.051.5810.1/100.051.96XXZ计算得查表得∴接受原假设H0:μ=10.我们的原假设是H0:μ=10由上面分析,当H0成立时,有:/210(0.1/10)PXZ一般地,很小.这就是说:如果H0这个假设是正确的话,检验统计量落入拒绝域就是一个发生的概率很小的事件.过去我们提到过,通常认为:小概率事件在一次试验中基本上是不会发生的.(II)道理那么如果小概率事件发生了,即:我们就拒绝,这时我们说:“H0不成立.”这很符合人们的逻辑,实际上这种思维也叫:带概率性质的反证法/210(0.1/10).XZ发生了(III)两类错误与显著性水平检验一个H0时可能犯以下两类错误:H0事实上是正确的,但被我们拒绝了,称犯了“弃真”的(或称第一类)错误.H0事实上是不正确的,但被我们接受了,称犯了“采伪”的(或称第二类)错误.假设检验的两类错误H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误P{拒绝H0|H0为真}=,P{接受H0|H0不真}=.犯两类错误的概率:为犯第一类错误的概率.在统计学中,通常控制犯第一类错误的概率.一般事先选定一个数,(01),要求犯第一类错误的概率≤.称为假设检验的显著性水平,简称水平.由于犯第二类错误的概率的研究与计算超出了本书的范围,因此不作讨论.说明(VI)显著性水平给定后,再解释确定c的方法的理由分析:∵当原假设H0:μ=10成立时,有:10(0,1)0.1/10XN~/210(0.1/10)PXZ从而0:10PH也就是拒绝可见我们所确定的c,保证了所构造的检验具有给定显著性水平.如果根据旧经验我们很相信H0是对的.要使人乐意放弃这个信念就要有十分过硬的依据,此时应取得很小.注这本节需要明确:(1)根据问题写出原假设H0与对立假设H1(2)需要告诉显著性水平,它的含义—犯第一类错误的概率.(3)需要选取检验统计量(4)确定拒绝原假设H0的拒绝域,c的含义第八章第二节正态总体均值的假设检验一、单个正态总体N(,2)均值的检验(I)H0:μ=μ0H1:μ≠μ0设X1,X2,,Xn为来自总体N(,2)的样本.求:对以上假设的显著性水平为的假设检验.方差2已知的情况根据第一节例1,当原假设H0:μ=μ0成立时,有:0(0,1)/XNn~于是当原假设H0:μ=μ0成立时,有:0/2/XPZn0/20/2(/)(/)PXZnXZn即拒绝域为方差2未知的况根据定理6.4.1,1/nXtSn~01/nXtSn~以上检验法叫检验法.n=10,=0.05,0=10t10-1(/2)=t9(0.025)=2.2622nXPtS/n012nnSPXtnSXtn0101即2拒绝域为2以上检验法叫t检验法.例1(用例8.1.1数据,但未知)上一段H0:μ=μ0H1:μ≠μ0中H1:μ≠μ0叫双边对立假设,上一段我们学习的叫双边检验.X.,S.,S.SX.,..SX.210050050224100052262016010即未落入拒绝域为10226210∴接受原假设H0:μ=10.(II)单边检验H0:μ=μ0H1:μμ0问题的来源:而H0:μ=μ0H1:μμ0中我们要处理的假设检验叫右边检验.类似,H0:μ=μ0H1:μμ0中我们要处理的假设检验叫左边检验.这种形式的假设检验问题叫单边检验.它们也很有实用意义.例如:工厂生产的一种产品的某项指标平均值为μ0,采用了新技术或新配方后,被认为产品质量提高了,该指标的平均值应该随之上升.我们想看看是否有显著上升.于是问题就是检验:H0:μ=μ0━━即新技术或新配方对于提高产品质量无效果.还是H1:μμ0━━即新技术或新配方确实有效,提高了产品质量.解决问题的思路:如果μ=μ0,即原假设成立时,那么:就不应该太大.反之,如果它过于大,那么想必是原假设不成立.0X方差2已知的情况求解:根据定理6.4.1,XN(,)/n~01∴当原假设H0:μ=μ0成立时,有:0(0,1)/XNn~0/XPZn这时00(/)(/)PXZnXZn即拒绝域为于是当原假设H0:μ=μ0成立时,有:方差2未知的情况根据定理6.4.1,1/nXtSn~01/nXtSn~01/nXPtSn有0101nnSPXtnSXtn即拒绝域为某厂生产一种工业用绳,其质量指标是绳子所承受的最大拉力.假定该指标服从正态分布.原来该厂生产的这种绳子平均最大拉力μ0=15公斤.现在采用了一种新的原材料,厂方称这种原材料提高了绳子的质量,也就是说绳子所承受的最大拉力μ比15公斤大了.为了检验该厂的结论是否真实,从其新产品中随机抽取50件,测得它们承受的最大拉力的平均值为15.8公斤,样本标准差S=0.5公斤.取显著性水平=0.01.例2问从这些样本看,我们能否接受厂方的结论,即新原材料是否确实提高了绳子的质量?问题归结为检验如下假设H0:μ=15H1:μ15(方差2未知)此处n=50,=0.01,标准差S=0.5.解:01490.5150.0150nSXtnXt拒绝域就是∴我们拒绝原假设,认为新的原材料确实提高了绳子所能承受的最大拉力.查不到t49(0.01),利用性质:给定,tn()关于自由度n是单调下降的.我们查t45(0.01)=2.41,则t49(0.01)t45(0.01)=2.4145490.51515.8150.82.41500.50.50.010.015050Xtt二、两个正态总体N(1,12)和N(2,22)均值的比较在应用上,我们经常会遇到两个正态总体N(1,12)和N(2,22)均值的比较问题.譬如:欲比较甲、乙两厂生产的某种产品的质量.我们把两厂生产的产品的质量指标分别看成两个正态总体N(1,12)和N(2,22).比较它们的产品质量指标的问题,就变为比较这两个正态总体的均值1和2的问题.欲考察一项新技术对提高产品质量是否有效.我们把新技术实施前后生产的产品质量指标分别看成一个正态总体N(1,12)和N(2,22).这时,我们所考察的问题,就归结为检验这两个正态总体的均值1和2是否相等的问题.设X1,X2,,Xm.Y1,Y2,,Yn分别为来自正态总体N(1,12)和N(2,22)的样本.考虑检验假设:根据定理7.5.1(I)H0:1=2H1:1≠2(1)方差12和22已知的情况122212(0,1)XYNmn~∴当H0:1=2为真时2212(0,1)XYNmn~/22212XYPZmn∴当H0:1=2为真时∴拒绝域为/22212XYZmn(2)方差12=22=2但2未知的情况根据定理5.1∴当H0:1=2为真时12211mnXYtSmn~211mnXYtSmn~2211mnXYPtSmn从而2211mnXYtSmn2212(1)(1)2mSnSSmn∴拒绝域为其中:假设有A,B两种药,欲比较它们在服用2小时后血液中的含量是否一样.对药品A,随机抽取8个病人,他们服药2小时后,测得血液中药的浓度(用适当的单位)为:1.23,1.42,1.41,1.62,1.55,1.51,1.60,1.76.对药品B,随机抽取6个病人,他们服药2小时后,测得血液中药的浓度为:1.76,1.41,1.87,1.49,1.67,1.81.假定这两组观测值抽自于具有共同方差的两个正态总体.在显著性水=0.10下,试检验病人血液中这两种药的浓度是否有显著不同?例3∴接受原假设.即认为病人血液中这两种药浓度无显著差异.解:问题就是从总体X~N(1,2)和Y~N(2,2).分别抽取样本X1,X2,,X8和Y1,Y2,,Y6.其样本均值,样本方差分别算得为:22121.51,0.03;1.66,0.21XSYS8620.10111.78,0.151.780.31286tXYS2212(1)(1)8,6,0.332mSnSmnSmn与(I)分析完全类似,得到:(II)单边检验H0:1=2H1:12方差12和22已知的情况,拒绝域为:2212XYZmn方差12=22=2但2未知的情况,拒绝域为:211mnXYtSmn作业:自己推导出拒绝域两个正态总体与成对数据的区别两个正态总体━━假定来自这两个