1数理统计2第八章假设检验关键词:假设检验正态总体参数的假设检验分布拟合检验秩和检验3§1假设检验统计推断的另一类重要问题是假设检验问题。它包括(1)已知总体分布的形式,但不知其参数的情况,提出参数的假设,并根据样本进行检验.(2)在总体的分布函数完全未知的情况下,提出总体服从某个已知分布的假设,并根据样本进行检验.4例1设某种清漆的9个样品,其干燥时间(以小时计)分别为:6.05.75.56.57.05.85.26.15.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?例2一种摄影药品被其制造商声称其贮藏寿命是均值180天、标准差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗?例3孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?5参数的假设检验问题处理步骤•1.根据实际问题的要求,提出原假设和备择假设;•2.根据样本X_i,确定检验统计量T(X_i)以及拒绝域(拒绝原假设的区域)的形式;•3.给定显著性水平,按照“在原假设H0成立时,拒绝原假设的概率不大于显著性水平”这一原则,确定拒绝域;•4.根据样本观测值作出决策,接受原假设还是拒绝原假设。1H0H6例1设某种清漆的9个样品,其干燥时间(以小时计)分别为:6.05.75.56.57.05.85.26.15.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?1:6.0:6.0HH0原假设,备择假设,6.0.XXc检验统计量为检验拒绝域的形式为,解:设分别表示干燥时间总体的均值和标准差,由于作出决策的依据是一个样本,因此,可能出现“实际上原假设成立,但根据样本作出拒绝原假设”的决策。这种错误称为“第一类错误”,实际中常常将犯第一类错误的概率控制在一定限度内,即事先给定较小的数α(0α1)(称为显著性水平),使得0(6.0)HPXc70.02565.87,0.671.96.0.26xxzxx根据样本得即不落在拒绝域内,与的差异不显著,因此接受原假设,认为干燥时间的均值与以往无显著差异。20.0256.01.960.2Xzz拒绝域为:220.690.05,~(6.0,0.6),~(6.0,)XNXN给定显著性水平当原假设成立时,总体因此,6.0(6.0)()0.630.63XcPXcP上述检验法则符合实际推断原理。8注释1:假设检验中的4种可能结果通常,犯第一类错误的概率、犯第二类错误的概率、样本容量可以看作为“三方拔河”。决策原假设H0真的假的不拒绝H0拒绝H0正确决策第二类错误第一类错误正确决策第一类错误:原假设H0成立时,作出拒绝原假设的决策;第二类错误:备择假设H1成立时,作出接受原假设的决策。9这是一对矛盾,要同时减少犯第一、第二类错误,只有增大样本容量。5.425.42226.0()0.25.4(33)(3)0.2XPzXPzzz第二类错误的概率5.4例如,设显著性水平为,计算上例中犯第一类错误的概率和时犯第二类错误的概率:626.0()0.2XPz解:第一类错误的概率2222(3)(3),,zzzz从中可以看出,当样本量固定时,,,;反之,。10注释2:假设检验与区间估计的比较。即拒绝域可以这样得到:将置信区间不等号反向,将原假设成立时的值代入到参数中即可。2~(,0.6)XN在上例中,若总体的均值未知,即12922,,...,,10.20.2XXXXzXz对于样本设置信度为-,则置信区间为:,210.2XPz即:001:6.0,:6.0,HH对于假设检验问题26.00.2Xz显著性水平为的检验拒绝域为:,0000221,,0.20.2XXPzPz26.00.2Xz接受域为:11§2正态总体均值方差的假设检验2,N一单个正态总体均值的检验2212,,,,,,nXXXNXS来自和分别为样本均值和方差显著性水平为010:,:HH021已知时0~0,1XHNn0在为真时,0Xcn检验拒绝域形式为:02,XPzn根据犯第一类错误概率不大于即02.XZzZn拒绝域为:检验法12010:,:HH0右边检验00~0,1,XHNn在为真时,(),kkznn故只要即便可,0.XZz因此,拒绝域为:n0010::,:.HH思考题左边检验请给出检验的拒绝域00::,(0):XkkXzn解答拒绝域形式为拒绝域为0,.XXk检验统计量为检验拒绝域的形式为0000PHHPXk当为真拒绝00kXPnn01()kn00(),kn0()kn由于是的增函数,21已知时1322未知时0~1XtnSn当原假设成立时,02:1XPtnSn拒绝域满足0XSn拒绝域的形式为:c,02(1)XttntSn因此,拒绝域为:检验法0t1220t0010:,:HH2(1)tn2(1)tn0,.XXk检验统计量为检验拒绝域的形式为20Xn由于未知,故不能用来确定拒绝域了。0SXtSn用的估计量代替,采用作检验统计量。14010:,:HH000~(1)XtnSn当时,(1)ktnSn即0(1).XttnSn因此,拒绝域为:0010::,:.HH思考题请给出检验的拒绝域00::,(0):(1)XkkXtnSn解答拒绝域形式为拒绝域为0,.XXk检验统计量为检验拒绝域的形式为0000PHHPXk当为真拒绝00kXPSnSn0XStSn由于未知,用估计量代替,采用作检验统计量。0XkPSnSn00XkPSnSn22未知时15例2某种元件的寿命X(以小时记)服从正态分布均未知。现测得16只元件的寿命如下:159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225(小时)?(取显著性水平为0.05)2(,),N2,01:225:225.HH0解:按题意需检验,0(1).XttnSn拒绝域为:0.0516,(15)1.7531.241.5,98.7259ntxs00.050.66851.7531(15).XttSn计算得:t没有落在拒绝域内,故接受原假设,认为元件的平均寿命不大于225小时。16例3要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?01:1000:1000.HH0解:按题意需检验,0(1).XttnSn拒绝域为:0.0525,(24)1.7109.950,100ntxs00.052.51.7109(24).XttSn计算得:t落在拒绝域内,故拒绝原假设,认为这批元件的平均寿命小于1000小时,不合格。17221122,,,NN二两个正态总体均值差的检验12212112212222221,,,,,,,,,,,,,,,,.nnXXXNYYYNXYSS来自来自,分别为第一二个总体的样本均值和方差显著性水平为未知12112:,:.()HH0为已知常数1212~211wXYttnnSnn在原假设成立时,1211wXYkXYcSnn检验拒绝域的形式为:即等价于21212211wXYttnntSnn检验拒绝域为:检验法221122221211,2其中18222212,未知121212211wXYtnnSnn当时,~221122221211,2其中012112:,:HH1211wXYcSnn检验拒绝域形式为:1212(2)11wXYttnnSnn从而,拒绝域为:19222212,未知121212211wXYtnnSnn当时,~221122221211,2其中012112:,:HH1211wXYcSnn检验拒绝域形式为:1212(2)11wXYttnnSnn从而,拒绝域为:20例4:某厂使用两种不同的原料A,B生产同一类型产品。各在一周的产品中取样分析。取用原料A生产的样品220件,测得平均重量为2.46(公斤),样本标准差s=0.57(公斤)。取用原料B生产的样品205件,测得平均重量为2.55(公斤),样本标准差为0.48(公斤)。设两样本独立,来自两个方差相同的独立正态总体。问在水平0.05下能否认为用原料B的产品平均重量较用原料A的为大。1122220,2.46,0.57205,2.55,0.48nxsnys;01HH1212解:检验假设:,:1212(2)11wXYtnnSnn拒绝域为:0.050.0512114231.645,0.535,0.097wtzsnn121.7331.64511wXYSnn计算得:,从而拒绝原假设。21基于成对数据的检验例5:为了试验两种不同谷物种子的优劣,选取了十块土质不同的土地,并将每块土地分为面积相同的两部分,分别种植这两种种子。设在每块土地的两部分人工管理等条件完全一样。下面给出各块土地上的产量。土地12345678910种子A(xi)23352942392937343528种子B(yi)26393540382436274127di=xi-yi-3-4-621517-61问:以这两种种子种植的谷物产量是否有显著的差异(取显著性水平为0.05)?2212111222212,),,),...,,),,,...,,,,...,(,).nnnnnDDYYYDXYDXYDXYDDDN12n分析:本题中每对数据的差异仅是由这两种种子的差异造成的,将每对数据作差就能排除其它因素的影响,从而能比较种子产量的差异。一般,设有n对独立的观测结果:(X(X(X令则相互独立,服从同一分布,设为1:0,:0DDHH0解:检验假设21,DdtnSn拒绝域为:0.0251092.2622,0.2,4.442,DntdS,查表得:0.1422.26