第3章总体特征数的假设检验张晓峒(2009-8)南开大学数量经济研究所所长、博士生导师nkeviews@yahoo.com.cn(南开大学经济学院数量经济研究所)第3章总体特征数的假设检验3.1假设检验的基本思想与方法3.1.1假设检验的原理与分类图3-1假设检验原理示意图先假定假设成立若是合理结果若是不合理结果原假设成立原假设不成立依据某种判别准则看会得出什么结果。图3-2假设检验过程示意图10件中有4件次品的概率是0.0004。依据小概率原理概率是0.0004的事件在一次实验中出现不合理。设“次品率为4%”正确原假设不成立设“次品率为4%”正确这个判断过程需要二个前提,(1)选取适当统计量并知其概率分布。(2)依据“小概率原理”判断结果是否合理。小概率原理指的是概率很小的随机事件,在一次试验中几乎不可能发生。那么小到什么程度才算是小概率事件呢?通常取概率小于0.05或0.01的事件为小概率事件,并用表示。在假设检验中,称作检验水平,1-称作置信水平或置信度。假设分为两类。一类称作原假设或零假设,即含有等号的假设,用H0表示(如总体均值=0)。另一类称作备择假设,即与原假设相反的假设,常用H1表示(如总体均值0)。注意,H0与H1应保证相互对立且完备。假设检验一般分为两类:(1)双侧(双边、双端,双尾)假设检验;例如原假设和备择假设分别是H0:=0,H1:0。(2)单侧(单边、单端,单尾)假设检验。其中又分为左单侧检验和右单侧检验。左单侧检验的原假设和备择假设分别是H0:0,H1:0。右单侧检验的原假设和备择假设分别是H0:0,H1:0。0是原假设设定的值。原假设和备择假设的设定应根据实际检验所提出的要求决定之。假设检验与上一章介绍的置信区间估计有着密切联系。比如用根据样本计算的平均数x构造一个相应统计量U的95%的置信区间如下:-u1-/2U=nx/0u1-/2UH0拒绝域H0接受域H0拒绝域图3-3假设检验示意图-4-2240.10.20.30.4u1-/2-u1-/2H0:=0U的分布0或表示为x的置信区间如下0–u1-/2nx0+u1-/2nxH0拒绝域H0接受域H0拒绝域图3-4假设检验示意图-4-2240.10.20.30.4x的分布0H0:=0213.1.2假设检验的两类错误表3-1假设检验的4种可能结果检验结论真实情况H0:=0正确H1:0正确接受H0:=0检验结论正确检验结论错误(取伪错误)接受H1:0检验结论错误(弃真错误)检验结论正确弃真错误也称作第Ⅰ类错误,即原假设H0为真条件下,检验结论却是拒绝原假设(接受备择假设)所犯的错误。犯弃真错误的概率常用表示。定义是P(弃真)=P{拒绝H0|H0真实}=取伪错误也称作第Ⅱ类错误,即原假设H0不为真条件下,检验结论却是接受原假设(拒绝备择假设)所犯的错误。犯取伪错误的概率常用表示。定义是P(取伪)=P{接受H0|H0不真实}=图3-5两类错误示意图x21H0:=1H1:=23.1.3p值p值即概率值。计算的是当统计量取值大于等于用样本计算的统计量的值的概率。以统计量U做双侧检验为例,若样本计算的统计量的值用U0表示,那么p值的定义是P{UU0}=p大多数计算机软件的输出结果报出的都是p值。p值和检验水平是什么关系呢?是人为设定的。p值是用样本计算出来的,相当于精确的显著性水平。当p时,统计量的值位于原假设的拒绝域,所以检验结论是在水平上拒绝原假设;当p时,统计量的值位于原假设的接受域,所以结论是在水平上接受原假设。0.511.522.50.20.40.60.8临界值1.36p3.1.4检验功效在假设检验文献中常常看到检验功效这个词。检验功效(testpower)也称作检验能力指的是当备择假设H1为真时,能够得出检验结果是接受H1的概率。以图3-5为例,检验功效指的是确定条件下,(1-)的概率。图3-5两类错误示意图本章主要介绍总体均值、总体方差、总体比率和总体分布律的假设检验方法。常用的统计量是U=nx/,t=nsx/,2=22)1(sn,V=kiiiinpnpf12)(等。H0:=1H1:=212x3.2.1情形1:总体服从正态分布,总体方差2已知,样本大小无限制,检验=0。例3-1设某炼铁厂铁水含碳量服从N(,0.1082)分布。现测量5炉铁水,其含碳量分别为4.28,4.40,4.42,4.35,4.37已知总体标准差无变化,在=0.05水平下,能否认为=4.40?解:根据本题要求,此检验属于双端检验。首先建立假设,H0:=4.40,H1:4.40。用xi表示铁水含碳量随机变量。在原假设成立条件下,有xiN(4.40,0.1082)。根据第2章结论(2-3),有xN(4.40,0.1082/5)。把x标准化,U=5/108.040.4xN(0,1)因为这是一个双侧假设检验问题。所以求出两个临界值2/1u=u0.975=1.96。若根据样本计算出的U统计量的值位于[-1.96,1.96]之间,则为一合理现象,导致接受H0。若U1.96,则U统计量值的出现属于小概率事件。依据小概率原理,这是一个不合理现象(即一次抽样中不应发生的随机事件),导致拒绝H0。例3-1利用样本计算x=(4.28+4.40+4.42+4.35+4.37)/5=4.364。U=5/108.040.4364.4=-0.745因为用样本计算的U值位于原假设的接受域[-1.96,1.96]之内,所以接受H0,即认为=4.40,xiN(4.40,0.1082)。H0的接受域与拒绝域见图3-6。把上面的检验过程总结如下:(1)建立原假设与备择假设H0:=0,H1:0。(2)根据已知条件,选用统计量U=nx/,在H0成立条件下有U=nx/0N(0,1)。(3)根据给定的确定临界值u1-。(4)建立判别规则,若U2/1u,则接受H0;若U2/1u,则拒绝H0。(5)利用样本计算U的值。按上述判别规则做出结论。图3-6双侧均值假设检验示意图-0.745N(0,1)U注意:(1)当用样本计算的U值位于临界值附近时,不要急于下结论,应再抽一次样本,重新做一次检验。(2)假设检验也可以在x轴上进行。建立H0:=0,H1:0。在原假设成立条件下,有xN(0,n/2)。根据P{nx/0u1-/2}=1-,用样本平均数x表示的H0的接受域是[0-2/1un/,0+2/1un/]若x位于上述区间之外,则拒绝H0。结合例3-1,x的两个临界值计算如下,1=0-2/1un/=4.40-1.965/108.0=4.3052=0+2/1un/=4.40+1.965/108.0=4.495与H0相对应的x的取值区间是[4.305,4.495]。因为用样本计算的x=4.364,位于用x表示的H0的接受域[4.305,4.495]之间,所以假设检验的结论是接受H0:=4.40。(3)H0接受域的中点是H0成立时的点。若以U为数轴进行检验,则中点是U=0;若以x为数轴进行检验,则中点是x=4.40。(4)此检验常称作U检验,也有的文献称作Z检验。4.364xx的分布3.2.3情形3:总体服从正态分布,总体方差2未知,小样本(n30),检验=0。例3-2用某仪器间接测量温度5次,记录温度值(°C)如下:1250,1265,1245,1260,1275已知温度真值是1277°C,假定该温度测量值xi服从正态分布,问:该仪器间接测量的温度有无系统偏差,(取=0.05)。解:如果用样本值计算的温度平均值与真值1277°C不存在显著性差异,则说明该仪器间接测量的温度无系统偏差;如果样本温度平均值与真值1277°C存在显著性差异,则说明该仪器间接测量的温度存在系统偏差。根据给定的条件,该温度测量值xi服从正态分布,总体方差2未知,样本容量n=5,属于小样本。应该选用t统计量进行假设检验。这种情形在实际统计推断中更常见。首先计算样本平均值x和样本方差s2,x=(1250+1265+1245+1260+1275)/5=1259°Cs2=[(1250-1259)2+(1265-1259)2+(1245-1259)2+(1260-1259)2+(1275-1259)2]/4=142.5=(11.9)2因为无论温度值大于或者小于1277°C,都属于该仪器测量的温度存在系统偏差,所以根据题意,这是一个双端检验问题。建立原假设和备择假设如下:H0:=1277°C(该测温仪无系统偏差),H1:1277°C(该测温仪存在系统偏差)选择统计量t=nsx/,在H0成立条件下,t=nsx/=5/9.111277xt(4)查附表4,t/2(n–1)=t0.025(4)=2.78,则[-2.78,2.78]为H0接受域。利用样本计算t=5/9.1112771259=-3.37t=-3.37位于H0接受域[-2.78,2.78]之外,所以t=-3.37是一个小概率事件。依据小概率原理,在一次试验中不应该发生,所以检验结论是拒绝H0,即认为该仪器测量温度存在偏差。检验过程见图3-8。总结t检验步骤如下:(1)建立原假设和备择假设H0:=0,H1:0。(2)选用统计量t=nsx/,H0成立条件下,有t=nsx/0t(n–1)。(3)按给定的检验水平求临界值t/2(n–1)。(4)制定判别规则。若样本计算的tt/2(n–1),则接受H0;若样本计算的tt/2(n–1),则拒绝H0。(5)用样本计算t统计量的值,并按判别规则判定之。图3-8双端t检验示意图t总体均值假设检验的EViews操作:打开数据窗口(样本观测值),点击View选TestsforDescriptiveStats,SimpleHypothesisTests功能。在打开的对话窗中,以本例为例,在Mean选择窗键入1277。如果已知总体标准差,可以在Enters.d.ifknown选择窗填入总体标准差的值,这相当于做U检验(EViews称Z检验)。如果未知总体标准差,在Enters.d.ifknown选择窗处保持空白,这相当于做t检验(EViews也称t检验),如图3-9所示。点击OK键,得t检验结果如图3-10。因为-3.37对应的p值等于0.028,小于0.05,结论是拒绝原假设。图3-9总体均值假设检验对话窗图3-10关于总体均值的t检验结果注意:(1)如果在图3-9的Enters.d.ifknown选择窗填入总体标准差的值,这相当于做U检验(EViews称Z检验)。EViews在报告U检验结果的同时,同样报出t检验结果,即利用样本标准差s按t检验报告检验结果。概率0.028表示的是P{t3.37}=0.028。(2)EViews只能做双侧检验,不能做单侧检验。上面介绍的方法是以t统计量构造H0的接受域和拒绝域,下面介绍以样本平均数x构造H0的接受域和拒绝域。在H0成立条件下有t=5/9.111277xt(4),则有1)4(5/9.1112772/txP由上式大括号中不等式推导出用x表示的H0的接受域是[1277-t/2(4)59.11,1277+t/2(4)59.11]在=0.05条件下,两个临界值是1=0-t0.025(4)59.11=1277-2.7859.11=1277-14.8=1262.2(°C)2=0+t0.025(4)59.11=1277+2.7859.11=1277+14.8=1291.8(°C)用x表示的H