第十二章假设检验假设检验的基本原理显著水平检验法与正态总体检验1感谢你的观看2019年8月23第十二章假设检验假设检验是对总体的分布函数的形式或分布中某些参数做出某种假设,然后通过抽取样本,构造适当的统计量,对假设的正确性进行判断的过程.前面我们讨论了在总体分布已知的情况下,如何根据样本去得到参数的优良估计.但有时,我们并不需要估计某个参数的具体值而只需验证它是否满足某个条件,这就是统计假设检验问题.2感谢你的观看2019年8月23第十二章假设检验假设检验参数假设检验非参数假设检验总体分布已知,检验关于未知参数的某个假设总体分布未知时的假设检验问题3感谢你的观看2019年8月23第一节检验的基本原理一、检验问题的提法假设检验是既同估计密切联系,但又有重要区别的一种推断方法。例如:某种电子元件寿命X服从参数为λ的指数分布,随机抽取其中的n件。测得其寿命数据,问题⑴,这批元件的平均寿命是多少?问题⑵,按规定该型号元件当寿命不小于5000(h)为合格,问该批元件是否合格?问题⑴是对总体未知参数μ=E(X)=1/λ作出估计。回答“μ是多少?”,是定量的。问题⑵则是对假设“这批元件合格”做出接受还是拒绝的回答,因而是定性的。4感谢你的观看2019年8月23对上述例子,还可做更细致考察,设想如基于一次观察数据算出μ的估计值,我们能否就此接受“这批元件合格”的这一假设呢?尽管但这个估计仅仅是一次试验的结果,能否保证下一次测试结果也能得到μ的估计值大于5000呢?也就是说从观察数据得到的结果与参考值5000的差异仅仅是偶然的呢?还是总体均值μ确实有大于5000的“趋势”?)(5001ˆh),(5000ˆh5001ˆ这些问题是以前没有研究过的。一般而言,估计问题是回答总体分布的未知参数是多少?或范围有多大?而假设检验问题则是回答观察到的数据差异只是机会差异,还是反映了总体的真实差异?因此两者对问题的提法有本质不同。第一节检验的基本原理5感谢你的观看2019年8月23下面通过一个例子介绍原假设和备择假设二.原假设和备择假设第一节检验的基本原理6感谢你的观看2019年8月23例1(酒精含量)一种无需医生处方即可达到的治疗咳嗽和鼻塞的药。按固定其酒精含量为5﹪.今从一出厂的一批药中随机抽取10瓶,测试其酒精含量得到的10个含量的百分数:5.01,4.87,5.11,5.21,5.03,4.96,4.78,4.98,4.88,5.06如果酒精含量服从正态分布N(μ,0.00016),问该批药品的酒精含量是否合乎规定?任务:通过样本推断X的均值μ是否等于5.假设:上面的任务就是要通过样本去检验“X的均值=5”这样一个假设是否成立.(在数理统计中把“X的均值μ=5”这样一个待检验的假设记作“H0:μ=5”称为“原假设”或“零假设”.表明数据的“差异”是偶然的,总体没有“变异”发生.7感谢你的观看2019年8月23原假设的对立面是“X的均值μ≠5”记作“H1:μ≠5”称为“对立假设”或“备择假设”.表明数据的“差异”不是偶然的,是总体“变异”的表现.把它们合写在一起就是:H0:μ=5H1:μ≠5原假设H0表明含量符合规定,这个5﹪也称之为期望数,尽管10个数据都与5﹪有出入,这只是抽样的随机性所致;备择假设H1表明总体均值μ已经偏离了期望数5﹪,数据与期望数5﹪的差异是其表现.假设检验的任务必须在原假设与备择假设之间作一选择8感谢你的观看2019年8月23检验统计量是构造一个适当的能度量观察数与原假设下的期望数之间的差异程度的统计量,此统计量为检验统计量.特点:在原假设H0下分布是完全一致或者说可以计算.因而通过标准化可得到检验统计量1000016.0,0~5NXXX三.检验统计量本例的观察数通过样本平均表示,它是μ的一个无偏估计,而在H0下的期望数为μ=5,在H0下0001605X10n.期望数观察值Z9感谢你的观看2019年8月23从试验数据判断是否导致一个矛盾的结果,一个重要的依据是小概率事件的实际推断原理.看例1,由观察数据,可算得的观察值为4.989,代入统计量Z的表达式,得Z的观察值为四.否定论证及实际推断原理7509.201265.00348.000016.0011.010Z否定论证是假设检验的重要推理方法,其要旨是:先假定原假设H0成立,如果从试验观察数据及此假定将导致一个矛盾的结果,则必须否定这个原假设;反之,如果不出矛盾的结果,就不能否定原假设.X10感谢你的观看2019年8月23在H0下,Z服从标准正态分布,对于特定的一次试验,统计量Z取得观察值-2.7509,是十分罕见的,以至于实际不会发生.事实上,当H0成立时,事件96.1Z发生的机会只有5﹪(如图)这是一个小概率事件.今从试验数据得到Z=-2.7509,由于表明这一小概率事件在该次试验中发生,这与实际推断原理矛盾.因此否定原假设.至此本例已获得解答,即基于数据该批药品的酒精含量不符合规定.96.17509.2注意:在否定论中最终能否得出矛盾的结果,取决于数据.2221ze02.5﹪1.961.96-2.750911感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验一.假设检验的两类错误一类错误是,当H0为真时,因为尽管事件{A|H0}是小概率事件,但仍有可能发生,即样本观察值(x1,x2,...,xn)∈R时,按检验法则将拒绝原假设H0,这种错误称为第一类错误.根据检验法则,若A发生则拒绝H0,否则接受H0.这不免要犯二类错误.12感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验一.假设检验的两类错误另一类错误是,当原假设H0不真,即H1为真时,A也有可能不发生,即样本观察值(x1,x2,...,xn)∈R*,按检验法则将接受原假设H0,这种错误称为第二类错误.13感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验正确正确H0为真H0为假真实情况所作判断接受H0拒绝H0第一类错误(弃真)第二类错误(取伪)注意:不可能消除这两种错误,而只能控制发生这两类错误之一的概率.一.假设检验的两类错误14感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验我们当然希望这两类错误的概率都很小,但在样本容量n固定时是无法做到的.基于这种情况,且因为人们常常把拒绝H0比错误地接受H0看得更重些.因此人们希望在控制犯第一类错误的概率α的条件下,尽量使犯第二类错误的概率小,但这也是不容易的,有时甚至是不可能的.于是人们不得不降低要求,只对犯第一类错误的概率α加以限制,而不考虑犯第二错误的概率,在这种原则下,寻找临界域C时只涉及原假设H0,而不涉及备择假设H1,这种统计假设问题称为显著性检验问题.对给定的犯第一类错误的概率α称为显著性水平.15感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验二.显著水平检验法显著水平检验法:在数据收集之前就已经设定好一个检验规则,即文献上称之为拒绝域R,使得当样本观察值落入R就拒绝H0.对拒绝域R的要求是:在H0下{样本落入R}为一小概率事件,即对预先给定的0α1有P({样本落入R}|H0)≤α此时称R所代表的检验为显著水平α的检验16感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验(1)根据问题的要求建立原假设H0和备择假设H1;假设检验的方法步骤(2)选取检验统计量T(X1,X2,...,Xn),要求T不含任何参数,以便计算H0为真时的条件概率;(3)给定显著性水平α,求出使P{T∈R|H0}≤α的临界域C;(4)若样本观察值T(x1,x2,...,xn)∈R,则拒绝原假设H0,否则接受H0.17感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验1).方差已知时总体均值的假设检验0100202221:,:,,),(),...,,(HHNXXXn要检验假设为已知常数的样本是取自正态总体设}|{|,,:,00000KXRXHX所以临界域应有形式太远波动而不偏离附近随机地应在则样本均值为真如果原假设的无偏估计为由于样本均值1两个正态总体的假设检验18感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验)1,0(~/00NnXU由于nxuxxxn/),...,,(0021算出再根据样本观察值}|{|}|{|,,2/2/2/uURuUPu这样就得到了临界域使可查出相应的临界值下于是在给定显著性水平19感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验找临界值uα/2示意图0/2u/2/2u/220感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验..,;.:,||,0002/率恰好等于此时犯第一类错误的概异原假设无差认为此时的总体均值与否则接受原假设有明显差异认为总体的均值此时与则拒绝原假设即若HHuuRu21感谢你的观看2019年8月23作为未知参数μ的点估计,因此偏小应该拒绝H0.若H0成立,269XX302,269~2NX例3某降价盒装饼干,其包装上的广告上称每盒质量为269g.但有顾客投诉,该饼干质量不足269g。为此质检部门从准备出厂的一批盒装饼干中,随机抽取30盒,由测得的30个质量数据算出样本平均为268.假设盒装饼干质量服从正态分布N(μ,22),以显著水平α=0.05检验该产品广告是否真实.解:依题意,可设原假设H0:μ=269备择假设H1:μ269则有226930XZ则在H0下Z~N(0,1),即Z的分布已知,因而Z可以做检验统计量,偏小等价于Z偏小,从而得到拒绝域的形式如下kXR226930其中k待定,称之为临界值.22感谢你的观看2019年8月23α=0.05,为求显著水平0.05的检验,只需选取k使得645.195.0k05.0|0HkZP查表可得因而得到水平0.05检验的拒绝域645.1226930XR代入数据得Z=-2.74,显然小于临界值-1.645,因而依据检验规则应该拒绝H0,即该盒装广告不真实.23感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验01002221:,:,,),(),...,,(HHNXXXn要检验假设为未知常数的样本是取自正态总体设}|{|,,:,00000KXRXHX所以临界域应有形式太远波动而不偏离附近随机地应在则样本均值为真如果原假设的无偏估计为由于样本均值2).方差未知时总体均值的双侧假设检验24感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验)}.1(|{|)}1(|{|),1(,,)(11)1(~/,2/2/2/12200nttRnttPntXXnSntnSXtHnii这样就得到了临界域使可查出相应的临界值下于是在给定显著性水平其中为真时当nsxtxxxn/),...,,(021算出再根据样本观察值25感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验找临界值tα/2示意图0/2/2t/2(n1)t/2(n1)26感谢你的观看2019年8月23第二节显著水平检验法与正态总体检验..,;.:),1(||,0002/率恰好等于此时犯第一类错误的概无差异原假设认为此时的总体均值与否则接受异原假设有明显差认为总体的均值此时与则拒绝原假设即若HHnttRt27感谢你的观看2019年8月23其中σ未知.今用S*代替σ,得到t的统计量)29(~tT例4.在例3中,若盒装饼干重量服从正态分布N(μ,σ2),μ与σ2均未知,已知样本平均,修正样本标准差为S*=1.8,求解相同的问题.解:此时不能使用Z作为统计量,因为标准化变量为由正态总体抽样分布