第八章假设检验§8.1假设检验的基本思想和概念§8.2总体均值的假设检验§8.3正态总体方差的假设检验§8.4单边检验§8.1假设检验的基本思想和概念8.1.1基本思想•假设检验是对总体的分布函数的形式或分布中某些参数做出某种假设,然后通过抽取样本,构造适当的统计量,对假设的正确性进行判断的过程.•并不需要估计某个参数的具体值而只需验证它是否满足某个条件,这就是统计假设检验问题.假设检验参数假设检验非参数假设检验这类问题称作假设检验问题.总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题在本章中,我们将讨论不同于参数估计的另一类重要的统计推断问题.这就是根据样本的信息检验关于总体的某个假设是否正确.•检验法则的建立原则上依赖于小概率事件.其思想是先假设H0是正确的,在H0正确的假设下构造一个事件A,使A在H0正确的条件下发生的概率很小,即P{A|H0}很小,而一般认为“一个概率很小的事件在一次试验中是几乎不可能发生的”,进行一次试验,若A竟然发生,则H0的正确性值得怀疑,因而决定拒绝原假设H0.•统计假设检验问题的一般提法是:在给定备择假设H1下对原假设H0作出判断,若拒绝原假设H0,则接受备择假设,否则就接受原假设H0.•在H0对H1的检验问题中要作出某种判断,必须从样本(X1,X2,...,Xn)出发制定一个法则,一旦样本观察值(x1,x2,...,xn)确定,可利用所构造的法则作出判断:拒绝H0还是拒绝H1.这种法则称为H0对H1的一个检验法则,简称为一个检验法则,或一个检验.•检验法则本质上就是把样本空间划分为两个互不相交的子集C和C*,使得当样本(X1,X2,...,Xn)的观察值(x1,x2,...,xn)∈C时,将拒绝原假设H0,若(x1,x2,...,xn)∈C*,则接受原假设.这样的划分构成一个准则,称样本空间的子集C为检验的临界域(或拒绝域).让我们先看一个例子.这一讲我们讨论对参数的假设检验.例:某工厂生产10欧姆的电阻.根据以往生产的电阻实际情况,可以认为其电阻值X~N(,2),标准差σ=0.1.现在随机抽取10个电阻,测得它们的电阻值为:9.9,10.1,10.2,9.7,9.9,9.9,10,10.5,10.1,10.2.试问:从这些样本,我们能否认为该厂生产的电阻的平均值为10欧姆?确定总体:记X为该厂生产的电阻的测量值.根据假设,X~N(,2),这里=0.1.明确任务:通过样本推断X的均值μ是否等于10欧姆.假设:上面的任务就是要通过样本去检验“X的均值μ=10”这样一个假设是否成立.(在数理统计中把“X的均值μ=10”这样一个待检验的假设记作“H0:μ=10”称为“原假设”或“零假设”问题怎么建立:原假设的对立面是“X的均值μ≠10”记作“H1:μ≠10”称为“对立假设”或“备择假设”.把它们合写在一起就是:H0:μ=10H1:μ≠10解决问题的思路分析:∵样本均值是μ的一个良好估计.∴如果μ=10,即原假设成立时,那么:|10|X应该比较小.反之,如果它过于大,那么想必是原假设不成立.|10|X的大小可以用来检验原假设是否成立.这里的问题是,我们如何确定常数K呢合理的思路是找出一个界限K,细致的分析:∵n=10=0.1当KX|10|时,我们就接受原假设H0.当KX|10|时,我们就拒绝原假设H0.)1,0(~/NnXU由于)1,0(~10/1.0NXU于是,当原假设H0:μ=10成立时,有:为确定常数K,现在我们考虑一个相当小的正数(理由下面讲).例如=0.05.于是,当原假设H0:μ=10成立时,有:)1,0(~10/1.010NXU2/10/1.010uXP10/1.0102/uXP10/1.02/uK取我们就拒绝原假设H0:μ=10.我们就接受原假设H0:μ=10.现在我们就得到检验准则如下:时当KX10时当KX1010/1.02/uK其中下面我们指出这很符合人们的逻辑,实际上这种思维也叫:带概率性质的反证法带概率性质的反证法的逻辑是:如果假设H0是正确的话,出现一个概率很小的事件,则以很大的把握否定假设H0.通常的反证法设定一个假设以后,如果出现的事实与之矛盾,(即如果这个假设是正确的话,出现一个概率等于0的事件)则绝对地否定假设.例:用精确方法测量某化工厂排放的气体中有害气体的含量服从正态分布X~N(23,4),现用一简便方法测量6次得一组数据23,21,19,24,18,18(单位:十万分之一),问用简便方法测得的有害气体含量是否有系统偏差?分析:用简便方法测得有害气体含量X~N(μ,4)为了判断用简便方法测得的有害气体含量是否有系统偏差,提出两个相互对立的假设H0:μ=μ0=23,H1:μ≠23若H0成立,则若取α=0.05,则P{|U|uα/2}=α,即P{|U|1.96}=0.05一般认为:小概率事件在一次实验中是不会发生的将样本观测值代入U得06.3/223nxu小概率事件在一次实验中发生了,故假设不合情理,即:否定原假设,简便方法测得均值有系统偏差.)1,0(~/0NnXU•定义:任何一个关于总体分布的假设称为统计假设,简称假设.•若总体的分布类型已知,只要对一个或几个未知参数作出假设,就可以完全确定总体的分布.•定义:只涉及到总体分布的未知参数的统计假设称为参数假设.•在实际问题中,我们有时不知总体分布的类型,需要对未知分布函数或者它的某些特征提出假设.•定义:对总体的未知分布函数或者它的某些特征提出的统计假设,称为非参数假设.8.1.2统计假设的概念•一类错误是,当H0为真时,因为尽管事件{A|H0}是小概率事件,但仍有可能发生,即样本观察值(x1,x2,...,xn)∈C时,按检验法则将拒绝原假设H0,这种错误称为第一类错误.犯第一类错误的概率即为我们选定的小概率事件的概率P{A|H0}=α,称为犯第一类错误的概率或拒真概率.即•根据检验法则,若A发生则拒绝H0,否则接受H0.这不免要犯两类错误.8.1.3两类错误P{拒绝H0|H0为真}=P{A|H0}=P{(x1,x2,...,xn)∈C|H0为真}=α•另一类错误是,当原假设H0不真,即H1为真时,A也有可能不发生,即样本观察值(x1,x2,...,xn)∈C*,按检验法则将接受原假设H0,这种错误称为第二类错误.犯第二类错误的概率P{Ā|H1}=β,称为犯第二类错误的概率或受伪概率.即P{接受H0|H1为真}=P{Ā|H1}=P{(x1,x2,...,xn)∈C*|H1为真}=β假设检验的两类错误P{拒绝H0|H0为真}=αP{接受H0|H0不真}=β犯两类错误的概率:显著性水平α为犯第一类错误的概率.H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误【练习166】•设H0为假设检验的原假设,则显著性水平等于().•A.P{接受H0|H0不成立}•B.P{拒绝H0|H0成立}•C.P{拒绝H0|H0不成立}•D.P{接受H0|H0成立}B【解】P{拒绝H0|H0为真}=αH0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-第二类错误(b拒绝H0第一类错误(功效(1-b假设检验就好像一场审判过程统计检验过程•我们当然希望独两类错误的概率α与β都很小,但在样本容量n固定时是无法做到的.基于这种情况,且因为人们常常把拒绝H0比错误地接受H0看得更重些.因此人们希望在控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率β小,但这也是不容易的,有时甚至是不可能的.于是人们不得不降低要求,只对犯第一类错误的概率α加以限制,而不考虑犯第二错误的概率,在这种原则下,寻找临界域C时只涉及原假设H0,而不涉及备择假设H1,这种统计假设问题称为显著性检验问题.•对给定的犯第一类错误的概率α称为显著性水平.•(1)根据问题的要求建立原假设H0和备择假设H1;8.1.43假设检验的方法步骤•(2)选取一个适当的统计量T(X1,X2,...,Xn),要求T不含任何参数,以便计算H0为真时的条件概率;•(3)给定显著性水平α,求出使P{T∈C|H0}≤α的临界域C;•(4)若样本观察值T(x1,x2,...,xn)∈C,则拒绝原假设H0,否则接受H0.双侧检验与单侧检验(假设的形式)假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠000双侧检验(原假设与备择假设的确定)1.双侧检验属于决策中的假设检验。也就是说,不论是拒绝H0还是接受H0,我们都必需采取相应的行动措施2.例如,某种零件的尺寸,要求其平均长度为10厘米,大于或小于10厘米均属于不合格3.建立的原假设与备择假设应为•H0:10H1:10双侧检验(确定假设的步骤)•1.例如问题为:检验该企业生产的零件平均长度为4厘米•2.步骤–从统计角度陈述问题(=4)–从统计角度提出相反的问题(4)•必需互斥和穷尽–提出原假设(=4)–提出备择假设(4)•有符号•提出原假设:H0:=4•提出备择假设:H1:4该企业生产的零件平均长度是4厘米吗?(属于决策中的假设)双侧检验(例子)双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平例1某车间为了提高零件的强度进行了技改,已知零件强度X(单位:kg/mm2)服从正态分布N(52.8,0.82),其中μ0=52.8kg/mm2是零件强度,现进行了技改后,抽取n=16的样本,测得强度为:(kg/mm2)51.953.452.954.353.852.453.754.052.452.553.551.354.952.854.552.9假设2=0.82不变,试问技改后零件强度是否发生了实质性变化?我们的问题就是:已知总体,且要求检验下面的假设:通常把H0称为原假设或零假设,把H1称为备择假设或对立假设。从取样结果看,样本均值与总体均值之间存在差异,这种差异是因为抽样的随机性导致的不可避免的误差,还是因为技改而导致的实质性差异?),(~200uNX22028.08.52:00H8.52:1H2.53xx8.520为了回答这个问题,首先给定一个小概率,称为显著性水平,通常取较小的值,如0.05,0.01。在本例中,我们选取。选取统计量,它包含待检验参数,当H0为真时,它的分布是已知的,本例中,选取于是有05.0)1,0(~/0Nnxz202/znxPzzP其中,Z/2为临界值,查表得Z0.025=1.96。|z|的拒绝域为:(1.96,)将抽样值代入4-1式得:|z|落入拒绝域中,即小概率事件竟然出现,于是否定假设H0,认为技改后零件强度发生了变化。96.1216/8.08.522.53/025.00znxz应当注意的是,上面例1的结论是在显著性水平的情况下得出的,如果,则,代入观察值,则会得出,技改后零件强度无实质变化的相反结论。可见,原假设取舍与否与的取值直接相关,当我们倾向于不要轻易否定H0时,可取小一些;反之,取大一些。05.001.058.2005.02/zz005.02zz§8.2总体均值的假设检验1.方差已知时,单个正态总体均值检验0100202221:,:,