第七章假设检验(TestsofHypotheses)•假设检验的基本原理•一个总体参数的假设检验•两个总体参数的假设检验•假设检验中的其他问题§7.1假设检验的基本思想•假设的陈述•假设检验中的两类错误•检验统计量与拒绝域•假设检验的基本思想•假设检验的基本步骤7-3•统计假设:对总体参数的数值所作的陈述。•零假设(nullhypothesis):研究者想收集证据予以反对的假设,记为H0。•备择假设(alternativehypothesis):研究者想收集证据予以支持的假设,记为H1。•例:检验一批新进口的薄钢板是否符合平均厚度为5毫米的质量标准。•双侧假设:备择假设未指定偏离H0的特殊方向,并含有“≠”的假设检验,对总体参数是否从任何方向偏离假设值感兴趣。mm:H,mm:H5510双侧检验一、假设的陈述7-4•例:在制定一项新的安全计划之前,某工厂每天在工作岗位上发生的平均事故数为4.5,欲确定这项安全计划是否有效。•假设检验的惯例是在H0中只写“=”•单侧假设:备择假设具有方向性,并含有“<”或“>”的假设检验。单侧检验5.4:,5.4:10HH单侧检验5.4:,5.4:10HH545410.:H,.:H右侧检验左侧检验5.4:,5.4:10HH7-5•假设检验的目标是作出某种决策,特别是要对是否拒绝H0并倾向H1作出决策。但决策是建立在样本信息基础上,即由部分来推断总体,因而假设检验必然犯两种错误。•决总体情况策H0为真H0为假接受H0决策正确—1-α第Ⅱ类错误—β拒绝H0第Ⅰ类错误—α决策正确—1-β二、假设检验中的两类错误7-6•第Ⅰ类错误(TypeⅠerror):当零假设H0为真时拒绝H0的错误。•犯第Ⅰ类错误的(平均)概率或风险,通常记为α。•第Ⅱ类错误(TypeⅡerror):当零假设H0为假时接受H0的错误。•犯第Ⅱ类错误的(平均)概率或风险,通常记为β。•两类错误的关系:在样本容量n一定时,当增大α时,β减少;当β增大时,α减少。使α、β同时减少的唯一方法,就是增加样本容量n。P{拒绝H0/H0为真}=αP{接受H0/H0为假}=β7-701222x)(xf),(2nNx~接受域拒绝域拒绝域):::02101100HHH(H0为真H1为真nz20nz207-8•显著性水平(LevelofSignificance):假设检验中犯第Ⅰ类错误的概率α。•人们常常把错误拒绝H0看得比错误地接受H0更重要—即首先控制犯第Ⅰ类错误的概率α。•α值是事先由研究者规定的,典型的α值是0.01,0.05和0.10。当样本容量n固定时,随着α的减少,拒绝域临界值离零假设中的总体参数值越远。•问题⒈:为何不能毫无必要地选择太小的显著性水平α?•问题2:为何在决策时避免使用“接受零假设H0”,而使用“不能拒绝H0”这样的措词?7-9•零假设与备择假设的确定:•(1)将零假设代表一种久已存在的状态,而备择假设则反映改变—检验研究中的假设。•例如,某产品研究小组评估新型设计的汽化器是否可以提高油料的燃烧效率,平均效率超过每加仑24公里。•(2)将不能轻易否定的事件作为零假设—检验某项声明的有效性。•例如,某饮料制造商声称,其容量为2升的产品中内容物的含量平均至少为67.6盎司。24:;24:10HH控制α7-10•如果该制造商产品质量一贯较好,我们将声明为真作为零假设。•如果该制造商产品质量不稳定,我们将声明为假作为零假设。•(3)将研究者想收集证据予以反对的假设,记为H0;将研究者想收集证据予以支持的假设,记为H1。6.67:;6.67:10HH6.67:;6.67:10HH控制α控制α7-11•检验统计量(TestStatistics):根据实际检验问题,利用样本信息计算获得的样本统计量作为对原假设和备择假设的检验统计量。•检验统计量一般是总体参数的点估计,通常用标准化的检验统计量进行检验判断。•标准化的依据:①原假设H0为真;②点估计量的抽样分布;③其它条件,如总体的分布形式、总体其他参数是否已知、抽取的是大样本还是小样本,等等。•检验统计量是一个随机变量,称为检验统计量的抽样分布。而标准化的检验统计量通常为z分布、t分布、χ2分布和F分布。12(,,,)nTfxxx三、检验统计量与拒绝域7-12•将检验统计量(或其标准化形式)的全部可能值分割成两个集:拒绝域(rejectionregion)与补集(接受域)。检验统计量值落在拒绝域内,则拒绝H0,否则不能拒绝H0。•拒绝域就是在检验统计量分布中由显著性水平α围成的区域,其它区域(1-α)称为接受域。•对于假设检验•试对检验统计量的下列值分别指出你能作出何种决策?727210:H;:H7359110x.cx.bx.a7-13•双侧检验:两个拒绝域•以正态总体N(μ,σ2),σ2已知,总体参数μ的假设检验为例说明。0100::HH接受域拒绝域拒绝域0221x)(xfnz20nz20检验统计量为真020HnzxP),(2nNx~7-14•检验统计量的标准化形式0100::HH接受域拒绝域拒绝域221)z(f2zz02zxnxz0为真02HzzPz值给出了我们一种用来衡量所观察到的偏离H0为真时的期望值多少个标准差的量度。x标准化的检验统计量7-15•左侧检验:拒绝域在分布的左侧•左侧检验适用于担心样本统计量会显著地低于假设的总体参数的情况。接受域拒绝域00100::HHx)(xfnz0为真00HnzxP),(2nNx~7-16•检验统计量的标准化形式接受域拒绝域0100::HHz)z(fz为真0HzzPnxz00x7-17•右侧检验:拒绝域在分布的右侧•右侧检验适用于担心样本统计量会显著地高于假设的总体参数的情况。接受域拒绝域0x)(xf0100:H:Hnz0为真00HnzxP),(2nNx~7-18•检验统计量的标准化形式nxz0x接受域拒绝域z)z(f0100:H:Hz为真0HzzP07-19首先假设H0为真,考虑在H0成立的条件下,已经观察到的样本信息出现的概率。如果这个概率很小,说明一个小概率事件在一次试验中发生了。小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,也就是说如果小概率事件在一次试验中发生了,就说明事先的假设H0为真是不正确的,因此拒绝H0;否则不能拒绝H0。假设检验的特点:①假设检验所采用的逻辑推理方法是“反证法”。②“合理性”所依据的是“小概率原理”。四、假设检验的基本思想7-20•①根据实际问题的要求,明确提出原假设H0和备择假设H1;•②选择适当的检验H0的统计量;•③规定显著性水平α,根据α和统计量的分布,确定接受域和拒绝域的临界值;•④收集样本数据计算检验统计量的值;•假设检验的统计量是总体参数的点估计量;•⑤作出统计决策。检验统计量值落在拒绝域内,则拒绝H0,否则不能拒绝H0。五、假设检验的基本步骤§7.2一个总体参数的假设检验•总体均值的检验•总体比率的检验•总体方差的检验7-22(1)正态总体,方差已知(或总体非正态,大样本n30时,根据中心极限定理)(2)正态总体,方差未知(大样本n≥30)2),(Nnxz10~单侧—双侧—拒绝域临界值zz200:H),(Nnsxz10~单侧—双侧—拒绝域临界值zz200:H2一、总体均值的检验7-23•(3)正态总体,方差未知时(小样本n30)2)n(tnsxt1~单侧—双侧—拒绝域临界值自由度)()(12dftdftndf00:H7-24•例:国际航空运输联合会通过调查商务旅行者,来评定跨太平洋通道的机场级别,最大可能的级别为10。一本商务旅行方面的杂志决定按照他们所收集的级别数据来对机场进行划分。级别的总体均值超过7的机场将被命名为提供了高级服务的机场。假定选取12名商务旅行者组成一个简单随机样本,要求他们对伦敦的Heathrow机场评定等级,所得到的12个级别数据为:7、8、10、8、6、9、6、7、7、8、9和8。(假定总体级别近似服从正态分布)•解:确定假设•α=0.05,df=12-1=11,•拒绝H0。可以有95%的把握认为Heathrow是可以提供高级服务的机场。7.7572.141.7961.21512cxtsn2151757.s.x7:;7:10HH796.1)11(05.0t7-25•设总体比率为p,从总体中随机抽取容量为n的随机样本,并计算样本比率。•根据中心极限定理,若满足np5,n(1-p)5条件,则可以把二项分布问题转换为正态分布问题近似求解,有npppNp)1(,ˆ~00pp:H)10()1(,Nnppppˆz~pˆ单侧—双侧—拒绝域临界值zz2注意:分母与区间估计不同二、总体比率的检验7-26•例:在过去的几个月中,某俱乐部高尔夫运动者中20%为女性,为了增加女性运动者的比率,俱乐部以特价方式吸引更多的女性参加高尔夫运动。一周以后,由400名高尔夫运动者组成的一个随机样本表明,其中有300人为男性,100人为女性。俱乐部管理者想根据这些数据来确定能否得出女性运动者比率上升的结论。•解:确定假设•显著性水平α=0.05,•n=400,np0=80>5,n(1-p0)=320>5•拒绝H0,俱乐部管理者可以有95%的把握认为女性运动者比率上升了。20.0:;20.0:10pHpH20064510050.p,.z.250400100.pˆ000ˆ0.250.202.51.645(1)0.200.80400cppzppn7-27•设总体)1()1(2222nsn~),(2NX~2020:H右侧检验—左侧检验—双侧—、拒绝域临界值自由度)()()()(121222212dfdfdfdfndf三、总体方差的检验7-28•例:某纺纱车间纺出细纱的支数服从正态分布,其总体标准差为1.2支。从某日纺出的一批细纱中,随机抽出16缕进行支数测量,得到样本标准差为2.1支,问该日纱的均匀度与平时有无显著差异(取α=0.05)。•解:提出假设:•根据题意:•查表:•检验统计量值:•检验统计量值落入拒绝域中,拒绝H0,说明这一天细纱均匀度与往日相比有显著差别。2.1s222200:(1.2);:(1.2)HH2220.02520(1)45.94(15)csn20.975(15)6.26220.025(15)27.4880.0516n01.2§7.3两个总体参数的假设检验•两个总体均值之差的检验:独立样本•两个总体均值之差的检验:配对样本•两个总体比例之差的检验:独立样本•两个总体方差之比的检验:独立样本7-30•两个总体均值之差的检验:•同理,两个总体比率之差的检验。•两个总体方差之比的检验:012112112112::::HHHH012112112112:0:0:0:0HHHH220122211222112221122::::HHHH22012221122211222112:1:1:1:1HHHH7-31•(1)两个正态总体,方差已知•(或总体非正态,两个大样本n130,n230)2221,)1,0()()(222121212221