第七章假设检验假设检验是统计推断的另一种形式,根据样本所提供的信息,推断事先给出的关于未知的总体的一个假设是否合理,这就是假设检验。§7·1假设检验的基本思想和概念例1工厂中自动打包机打包,每包重量每包重应为50kg,由于机器存在误差,打包重量并不50kg,现从中任取9包,测得问:打包机工作是否正常?),(~2N例2某次学生的考试成绩是否服从正态分布?5.25.482nSkgx痊愈者未痊愈者合计未服药者4852100服药者5644100合计10496200例3某研究所推出一种感冒特效药,为证明其疗效,选择200名患者为志愿者。将他们均分为两组,分别不服药或服药,观察三日后痊愈的情况,得出下列数据:问:新药是否有效?例1:假设0H:1H)打包机正常工作(kg50)50(kg打包机工作不正常:0H服从正态分布总体例2)),(~(2N例3:0H新药无效:1H新药有效一基本概念1统计假设假设检验参数的假设检验(总体分布已知,参数未知)非参数的假设检验(总体分布未知)2.原假设备择假设原假设:要去检验是否为真的假设0H备择假设:与原假设相对应的假设1H二假设检验的基本思想小概率事件在一次试验中几乎是不可能发生的。2.假设检验的基本思想1.小概率原理若需检验某假设,首先假定正确,在此假设下,寻找一个小概率事件,进行一次试验,若发生了,否定,反之接受。0H0HAA0H0H成立0HA构造发生A不发生A0H拒绝0H接受样本值三、接受域否定域检验函数将样本空间分成两个不相交的集合10WW接受域接受当10101,),(),,(WHWWxxn检验函数01111),,(0),,(1),,(WxxWxxxxnnn四、两类错误第一类错误:“以真为假”的错误}),,{((00100成立正确)拒绝HWxxPHHPn犯第一类错误的概率:(第Ⅰ类风险)拒绝域拒绝当0001,,),,(WHWxxn第二类错误:“以假为真”犯第二类错误的概率:(第Ⅱ类风险)}),,{((01100不成立不成立)接受HWxxPHHPn注:(3)Neyman—Person原则在控制犯第一类错误的条件下,使犯第二类错误的概率尽量小。(4)显著性检验显著性水平(1)当n增大时,可使犯两类错误的概率同时减小.(2)当n固定时,降低一种犯错误的概率,往往使另一种增大。五、假设检验的基本步骤【例】在例1中若假设,问打包机是否正常?)4,(~N)05.0(xpo)(21u)(21ux221cc}96.1/50),,{(1nxxxWn拒绝域:Step1º:根据问题提出原假设和备择假设1H),,(ntT1Step2º:选取检验统计量且其抽样分布中不含任何未知参数,可以查表或通过计算得其分位数(临界值)onHWxxt,拒绝01),,(}),,{(01WPnStep3º:对于给定的显著性水平找临界值,从而确定拒绝域,使Step4º:判定。若onHWxxt,接受01),,(0H§7·2参数的假设检验),(2N假设总体服从正态分布01002::,),,(~1HvsHN检验已知0100::1HvsHo)1,0(~200NnUo取检验统计量一、U检验法,321uo值查正态分布表,得临界,对于给定的}{21uUP例2在上节例1中,取=0.01检验打包机的工作是否正常?04Uo计算认为有显著性差异。拒绝,210oHuU认为无显著性差异。接受oHuU210从而得拒绝域}:),,{(2110uUxxWn01002::,),,(~2HvsHN检验已知检验步骤与1相同(单尾检验)例3假设某次考试数学分数~N(98.7,4),随机抽查市一中的16名学生其平均成绩为101.85分,试判断该校的数学成绩是否优于全市平均水平?(=0.05)xpo1ux1二、T检验法01002::,),,(~1HvsHN检验未知)1(~1T0ntnS检验统计量),1(21ntt分布表,得临界值查,对于给定的}{21tTPoxxp22)1(21nt)1(21nt例4从经验知,灯泡的寿命服从正态分布,现从一批灯泡中随机抽取20个,算得平均寿命,样本标准差,检验该批灯泡的平均寿命是否为2000h?()hx1999hs49001.021121021222211::,,,),(~),,(~2HHNN检验未知)2(~1n12121nntnST检验统计量时当nnn21T检验法2212222112nnSnSnS其中,)22(~12221ntnSST例6在漂白工艺中,要考察湿度对针织品断裂强度的影响,在70℃与80℃下分别作了八次实验,测得断裂强度数据如下:70℃:20.518.819.820.921.519.521.021.280℃:17.720.320.018.819.021.120.119.1据经验针织品地断裂强度服从正态分布,问:70℃下的断裂强度与80℃下的断裂强度有无显著性差异?例4(教材例7.4)检验法三、2202120202::),(~1HvsHN检验未知)1(~)(220220122nnSnnii检验统计量拒绝域)}1({222nW)}1({2122n202120202::),(~2HvsHN已知,检验,)(~)(220122nnii检验统计量拒绝域)}({222nW)}({2122n例7某砖厂生产的红砖质量比较稳定,抗压强度的方差为64,今从一批新砖中任抽10块作抗压强度试验,得数据如下:578572570568572570572596584570问是否可相信这批砖的抗压强度的方差也为64?222102122222111:,),,(~),,(~HNN检验未知,)1,1(~)1()1(:2122212112nnFSnnSnnF检验统计量202120202::),(~3HHN检验未知)}1({212nW四、F--检验法2221SSF2xo2)1,1(2112nnFxp)1,1(212nnF)}1,1({212nnFFW拒绝域)}1,1({2112nnFF例8在十块土地上,试种甲、乙两种作物,所得产量分别为,假设作物产量服从正态分布,并计算得样本均值,若取=1%,问两个品种的产量有无显著性的差异?),,,(),,,(10211021yyyxxx97.21,97.30yx1.12,7.2621ss检验法一U010022::),(~1HHN检验已知)1,0(~00NnU检验统计量010022::,),,(~2HHN检验已知检验法二T)1(~0ntnSUn检验统计量0022:),(~1HN检验未知21022212122222111:,),(~),(~2HNN检验但未知2)1()1(212211222nnSnSnS)2(~)(21112121nntSTnn检验统计量222102122222111:,),,(~),,(~HNN检验未知,)1,1(~212122nnFSSF检验统计量检验法三2202120202::,),,(~1HHN检验未知202120202::,),,(~2HHN检验已知202120202::,),,(~3HHN检验未知四、F--检验法正态总体参数的假设检验表假设条件检验统计量分布拒绝域单个总体0H1H),(2N00已知2nU00)1,0(N210uU0010uU0010uU000000未知2nSU0)1(nt210tt10tt10tt202202未知20122)(nii)1(2n2120222022022022120正态总体参数的假设检验表假设条件检验统计量分布拒绝域两个总体0H1H21222121未知,2111nnST)2(21nnt210tt10tt2221未知21,2221SSF)1,1(21nnF21FF),(222N),(211N21212122212FF课外练习某药厂生产一种新的止痛片,厂方希望验证服用新药片后只开始作用的时间间隔较原有止痛片至少缩短一半,为此厂方提出须检验的假设:2112102:2:HvsH§7·3参数的区间估计一置信区间的定义定义:)1(1)},,(ˆ),,(ˆ{1211nnP111ˆˆ),,(ˆn置信下限212ˆˆ),,(ˆn置信上限置信度1二置信区间的一般求法),,,(ˆ[11nxx)],,(ˆ12nxx置信区间的观测值例1设为样本未知,已知,,),,(),(~122nN的置信区间的置信度为求1结论:的置信区间为:的置信度为1)nunu2211(求置信区间的一般步骤:Step1º:寻找一个适合下列条件的样本函数),,(ng1(1)g中含有待估参数,但不含有其它未知参数。(2)g的分布是已知的,且不依赖于任何未知参数。(3)不等式:211),(ng可等价变形为:),,(ˆ2111n),,(ˆ2112n,使,确定对于给定的置信度21,12ostep1}),,({211ngP上式变为:ostep3121122111)},,(ˆ),,,(ˆ{nnP置信区间为:的从而得1)},,,(ˆ),,,(ˆ(21122111nn三、正态总体下的区间估计下为样本,在置信度,1),,(),(~.112nN求的区间估计已知2)1(的置信区间为:的1)nunu2211(未知2)2(的置信区间为:的1)nStnStnn2211(例2假设初生婴儿的体重服从正态分布,随即抽取12名初生男婴,测得其体重为(单位:g):310025203000300030003160356033202880260034002540试以95%的置信度求初生男婴的平均体重的置信区间。进行区间估计对下为样本,在置信度2121),,(),(~2nN已知)2(的置信区间为:的12))1()1(,)1()1((2212222nSnnSnnn未知)1(的置信区间为:的12))()(,)()(212211222nnniinii(例3某厂生产的零件中来那个服从正态分布从该厂生产的零件中抽取9个,测得其质量为(单位:g)45.345.445.145.345.545.745.445.345.6试求总体标准差的0.95置信区间.