中国人民大学出版社Allrightsreserved统计学第七章假设检验第七章假设检验假设检验:也称显著性检验。是抽样推断中运用甚广的一种统计推断方法。基本步骤:•对研究总体的参数或分布形式提出假设•根据抽样分布原理,利用样本实际资料计算相关统计量的取值•检验所作假设是否合理分类:•参数假设检验,简称参数检验;•非参数检验或者自由分布检验。第七章假设检验§1假设检验基本问题§2一个总体参数的检验§3二个总体参数的检验§1假设检验基本问题§1.1假设检验的统计思想§1.2基本概念及检验步骤§1.3关于值§1.4两类错误§1.5假设的建立问题p§1.1假设检验的统计思想统计思想:•小概率原理•反证法思想主要表现:1、主要理论依据是“小概率事件在现实中是不可能发生的”这一概率思想。2、采用的逻辑推理方法是反证法。§1.2基本概念及检验步骤1.原假设与备择假设原假设:待检验的假设,也称为零假设。备择假设:原假设的对立面,否定原假设后可供选择的假设。例:某种饮料包装上注明“净含量500ml”,是否可信?该假设可以表达为:其中,字母表示假设,下标0表示原假设,下标1表示备择假设。0:500Hml1:500HmlH§1.2基本概念及检验步骤零假设与备择假设并不一定完全对称。假设的形式:双侧检验:单侧检验•左侧检验:(或者≥;)•右侧检验:(或者≤;)00:H10:H00:H10:H00:H10:H0:H010:H0:H010:H§1.2基本概念及检验步骤2.检验统计量检验使用的统计量称为检验统计量检验统计量的构造形式为:样本统计量被假设参数检验统计量=分布标准差§1.2基本概念及检验步骤3.显著性水平与临界值显著性水平是为真却被拒绝的概率,它也是假设检验统计思想中所指的小概率。给定了显著件水平,可由统计量的概率分布确定其临界值,临界值将统计量的所有可能取值区间分为两个互不相交的部分,即原假设的拒绝域和接受域。0H§1.2基本概念及检验步骤4.接受域与拒绝域接受域:使原假设不能被拒绝的统计量所在区域。拒绝域:使原假设能够被拒绝的统计量所在区域。也称否定域。这两个区域是互补的关系,即检验统计量的实际值必落入且只能落入其中一个区域,它们之间的分界线即临界值。对于不同形式的假设,的接受域和拒绝域不同。0H§1.2基本概念及检验步骤如果是只需判断有无显著差异的情况,则采用双侧检验。双侧检验的接受域为检验统计量分布曲线上两临界值之间的区域,而拒绝域分别位于两端;§1.2基本概念及检验步骤左侧检验右侧检验左侧检验的拒绝域位于接受域的左侧;右侧检验的拒绝域位于接受域的右侧。如果需要判断参数是否偏大(偏小)的情况,则采取左侧(右侧)检验。§1.2基本概念及检验步骤5.假设检验的具体步骤(1)建立假设。(2)确定检验统计量,并确定该统计量的分布情况,然后依据样本信息计算该检验统计量的实际值。(3)设定检验的显著性水平,并确定临界值。(4)将检验统计量的实际值与临界值进行比较,做出是否拒绝原假设的决策。§1.3关于p值值:当零假设为真时,所得到样本观察结果或更极端结果的概率。值越小,样本观测结果出现的可能性越小,拒绝原假设理由就越充分。值能够反映出某一样本观测结果与原假设不一致的的精确程度。利用值进行假设检验的准则:将值与事先确定的检验显著性水平进行比较,若值小于,小概率事件发生,拒绝原假设;若值大于,小概率事件未发生,不能拒绝原假设。ppppppp§1.4两类错误进行假设检验时会犯两种错误:①零假设正确却被拒绝,称之为“第I类错误”;②零假设不正确却没有被拒绝,称之为“第II类错误”。§1.4两类错误犯第I类错误的概率记为,即前面提到的显著性水平。犯第II类错误的概率记为。在一定样本容量下,减少会引起增大,减少会引起的增大。假设检验中人们普遍执行同一准则:首先控制弃真错误(错误)。§1.5假设的建立问题实践中一般采取“原假设处于被保护地位”的原则,即将没有充分理由便不能拒绝的命题作为原假设,其对立面作为备择假设。一般将已有的、固有的、经验的命题作为原假设,将想要证明成立的命题作为备择假设,这样做可以有效减小犯第一类错误的概率。§2一个总体参数的检验§2.1总体均值的检验§2.2总体比例的假设检验§2.3正态总体的方差检验§2.1总体均值的检验§2.1.1.大样本情况下样本均值的抽样分布均为正态分布,其数学期望为总体均值,方差为,其中为总体方差。检验统计量服从标准正态分布,即:x2n20xzn0~0,1xzNn§2.1总体均值的检验根据检验统计量计算公式计算检验统计量样本值,当显著水平为时,查分布表:在双侧检验中,如果≥,则拒绝原假设;反之,则不能拒绝原假设。在左侧检验中,如果,则拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,如果,则拒绝原假设;反之,则不能拒绝原假设。zZz12Z0H1zZ1zZ§2.1总体均值的检验【例7.1】某车间用一台包装机包装成品食盐,已知袋装食盐的净重服从正态分布,且当机器正常时,其均值为0.5公斤,标准差为0.005公斤。某日开工后要检验包装机是否正常运作,随机抽取了40袋,称得净重如下(单位:公斤):请检验机器是否处于正常运作状态?()0.05§2.1总体均值的检验解:首先设立原假设与备择假设:;已知该总体服从正态分布及总体的标准差,故本题可以采用检验。由题中样本数据及已知条件得到:,,,,,本题属于双侧检验,根据正态分布,有:不能拒绝原假设,即认为包装机器运作正常。00:0.5H10:HZ0.4989x00.50.00540n0.05121.96Z0120.49890.51.3911.960.0140xZn§2.1总体均值的检验【例7.2】某灯具厂生产一种白炽灯泡,根据长期观察,得知该灯泡使用寿命服从正态分布,平均使用时间为1500小时,标准差为10小时。现准备采用新技术延长灯泡寿命,引用该生产技术后抽检了16个灯泡进行试验,使用寿命分别为:试以0.05的显著性水平判断该种新技术是否显著提高灯泡的使用寿命。§2.1总体均值的检验解:显然,本题属于单侧检验(右侧检验),首先设立原假设与备择假设:;由题中样本数据及已知条件得到:,,,,检验统计量因此,拒绝原假设,即认为该种新技术显著提高灯泡的使用寿命。0:1500H1:1500H1507.625x01500100.0511.645Z01507.62515003.051.6451016xzn0H§2.1总体均值的检验§2.1.2.小样本情况下1.正态总体,已知•采用统计量对样本均值进行检验2.正态总体,未知•检验统计量服从自由度为()的分布,由于未知,一般用样本标准差来代替总体标准差,即:220ˆxtn1nts0~1xttnsn20xzn§2.1总体均值的检验对于给定的显著性水平,查分布表:在双侧检验中,当时,拒绝原假设;反之,则不能拒绝原假设。在左侧检验中,当时,拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,当时,拒绝原假设;反之,则不能拒绝原假设。/21ttn1ttn1ttnt§2.1总体均值的检验【例7.3】(续例7.1)若其它条件不变,但抽查样本量减为10,且事先并不知道机器正常时的标准差信息。试检验机器是否处于正常运作状态?()0.05解:首先设立原假设与备择假设:;由题中样本数据及已知条件得到:,,,,因此,不能拒绝原假设,即不能认为包装机器运作不正常。00:0.5H10:H0.4983x00.50.00655s0.05292.26t020.49830.50.82192.260.0065510xttsn0H§2.1总体均值的检验【例7.4】(续例7.2)若没有灯泡寿命标准差的经验数据,试检验判断该种新技术是否显著提高灯泡的使用寿命。()解:首先确定原假设与备择假设不变,但检验统计量换为。由题中样本数据及已知条件得到:,,,,检验统计量拒绝原假设,即认为该种新技术显著提高灯泡的使用寿命。0xtsn1507.625x0150010.404s0.05151.753t01507.62515002.9321.75310.40416xtsn0H0.05§2.1总体均值的检验§2.1.3.选择统计量的总结如何选择检验统计量大样本(§2.1总体均值的检验§2.1.4.计算机实现结果例:SPSSSPSS软件中对原始数据(样本数据)是否服从正态分布、方差是否已知并没有太多的条件限制,对于均值检验采用的统计量均为t统计量。§2.2总体比例的假设检验总体服从二项分布,样本量足够大且满足时,比例的抽样分布可用正态分布近似。的数学期望为,的方差为,样本比例经标准化后的随机变量则服从标准正态分布,即n515npnppp()Epp(1)()Varpn~(0,1)(1)pzNn§2.2总体比例的假设检验检验未知的总体比例等于某一假设值设;(或;)检验统计量逼近正态分布,因未知的真实值,用样本比例来代替,因此检验统计量调整为:其中,为待检验的总体比例。0P00:HP10:HP10:HP10:HP0pPznp0(1)pPzppn0P§2.2总体比例的假设检验【例7.5】某研究机构估计本市居民家庭的电脑拥有率为75%。现随机抽查了200个家庭,其中157个家庭拥有电脑。试问估计的该市居民家庭电脑拥有率是否可信?()解:首先根据题意建立原假设与备择假设:;(),,,不能拒绝原假设,即认为该研究机构估计的该市居民家庭电脑拥有率是可信的。0:0.75H1:0.75H00.75P1570.785200p200n00.7850.751.205(1)0.78510.785200pPzppn0.05121.96Z0.05§2.3正态总体的方差检验检验方法——检验法。原假设形式为:双侧检验:;左侧检验:;(或者≥;)右侧检验:;(或者≤;)检验统计量为:其中,为样本方差,为待检验的假设方差。22200:H2210:H2200:H2210:H20:H202210:H2200:H2210:H20:H202210:H22220(1)~(1)nsn2s20§2.3正态总体的方差检验对于给定的显著性水平,查分布表:在双侧检验中,首先确定临界值和,当或者时,拒绝原假设;反之,则不能拒绝原假设。在左侧检验中,确定临界值,当时,拒绝原假设;反之,则不能拒绝原假设。在右侧检验中,确定临界值,当时,拒绝原假设;反之,则不能拒绝原假设。2212(1)n22(1)n2212(1)n222(1)n21(1)n221(1)n2(1)n22(1)n§2.3正态总体的方差检验【例7.6】根据某饮料厂长期生产资料可知:该厂饮料灌装线灌装的饮料净含量服从正态分布,标准差为0.20ml。某天进行生产线检查,从灌装线上随机抽取20瓶饮料,测得样本标准差为0.35ml。试判断该条灌装线的波动与平日有无显著差异?()解:本题为双侧检验,首先设立原假设与备择假设:;根据条件已知:,,则检验统计量查分布表,由于,拒绝原假设,即该条灌装线的波动与平日有显著差异。21:0.20H20:0.20H20.35s200.200.0522202010.35(1)33.250.20ns222233.25(1)32.85n