第六章假设检验第一节假设检验的基本思想预先对未知总体作出假设,再根据实测样本的信息去检验假设的合理性,作出对假设的判断,这种关于总体的假设称为统计假设。处理假设的统计方法称为统计假设检验(hypothesistesting)。例子作用强烈的某种药物,按规定每片的有效成分含量服从N(0.5,0.012)。某厂生产这种药品,问如何监控这个药厂生产的药品是否符合要求?解:检验假设H0:μ=0.5在原假设成立的条件下)1,0(~12/01.05.0/NXnXU例子查表得:05.0)96.1|(|UP把样本观测值代入统计量的:1477.2||1477.212/01.05.04938.0uu一次试验使得小概率事件发生,我们认为这是不可能的。问题出在哪里?显然数学推理没有错误,错误出在原假设。因此拒绝原假设,即认为该厂生产的药片平均片重不符合规定。一、小概率原理小概率事件在一次试验中不会发生。二、假设检验步骤1、提出原假设H0和备择假设H12、在原假设成立的条件下,构造一个分布已知的统计量用于检验原假设的合理性的统计量称为检验统计量,简称检验。如S=f(X1,X2,…,Xn)使得P(S∈S0)=α,即S∈S0是一个小概率事件。称S0为拒绝域或临界域。它是实数轴的一部分。当拒绝域位于数轴两端时,即:相应的假设检验称为双侧检验。当拒绝域位于数轴一端时,即:相应的假设检验称为单侧检验。a,b称为临界值。当统计量S服从标准正态分布、方分布、t分布和F分布时,分别称为u-检验、检验、t-检验和F-检验。),[],(0baS),[],(00bSaS或223、对于给定的α值作出检验结论,并给以专业解释先由样本值计算检验量S的值s,称为检验统计量的观测值,按如下原则作出检验结论:若s∈S0,则拒绝H0;否则不能拒绝H0。根据具体问题给出专业解释。注:拒绝原假设H0:μ=0.5时,正确的说法是“在α=0.05的水平下数学期望μ与0.5有显著性差异”或“在α=0.05的水平下μ与0.5的差异有统计学意义”。不能说“μ不等于0.5”。三、两类错误记称α为犯第一类错误的概率,β为犯第二类错误概率。判断实际情况H0为真H0不真接受H0正确第二类错误拒绝H0第一类错误正确)|()|(1000为真为真HSsP,HSsP第二节假设检验的常用方法第三节正态总体数学期望的假设检验一、已知的正态总体均数的U检验设X1,X2,...,Xn是来自正态总体N(,2)的样本,且已知,原假设H0:=0;H1:0;在原假设成立的条件下检验统计量:1、临界值法2、置信区间法3、P值法)1,0(~/0NnXU例子例:从总体N(,0.0282)中取得一组样本观察值:1.98,1.88,2.06,2.00,1.80,2.04。试用三种方法判断=2是否成立?1、临界值法(1)提出原假设H0:=2,备择假设H1:2(2)计算样本值:已知=0.028,=1.96,在原假设成立的条件下检验统计量的样本值为x4993.36/028.0296.1/0nxu(3)给定求临界值:取=0.05,查表得u0.05/2=1.96,由于|u|1.96,故在显著性水平=0.05下拒绝H0。(2)给定求置信区间:取=0.05,查表得u0.05/2=1.96,=0.028,=1.96,则:置信下限:置信上限:置信区间:(1.94,1.98)94.16028.096.196.12/nux98.16028.096.196.12/nuxx2、置信区间法(1)提出原假设H0:=2,备择假设H1:2(3)作出判断结论:因为在H0成立的条件下95%的置信区间不包含0=2,故在显著水平=0.05下拒绝H0。1、P值法(1)提出原假设H0:=2,备择假设H1:2(2)计算样本值:已知=0.028,=1.96,在原假设成立的条件下检验统计量的样本值为x4993.36/028.0296.1/0nxu(3)求出P值:以|u|=3.4993作为双侧临界值up/2,在H0成立的条件下有:0004815.0/4993.3/2/00punxPnxPp(4)作出结论:p0.001,在显著性水平=0.001下拒绝H0。二、未知的正态总体均数的t检验(一)单个正态总体数学期望t检验设X1,X2,...,Xn是来自正态总体N(,2)的样本,且未知,原假设H0:=0;H1:0;例:按规定,作用强烈的某和药片的平均片重为0.5,且服从正态分布。现从某厂随机抽取25片检查,称得平均片重为0.47毫克,标准差为0.08毫克。试问这批药片的平均片重符合要求否?)1(~/0ntnsxt检验统计量:采用临界值法。(1)提出原假设H0:=0.5,备择假设H1:0.5(2)计算样本值:把0=0.5,=0.47,s=0.05,n=25代入检验统计量,在原假设成立的条件下检验统计量的样本值为x325/05.05.047.0/0nsxt(3)给定求临界值:由=0.01及df=25-1=24,查表得t0.01/2(24)=2.797,由于|t|2.797,故在显著性水平=0.01下拒绝H0。即该厂生产的这批药片不符合规定。采用P值法。(1)提出原假设H0:=0.5,备择假设H1:0.5(2)计算样本值:把0=0.5,=0.47,s=0.05,n=25代入检验统计量,在原假设成立的条件下检验统计量的样本值为x325/05.05.047.0/0nsxt(3)由=0.01及df=25-1=24,查表得P(|t|3)=p0.01,拒绝H0(0.001p0.01)。即该厂生产的这批药片不符合规定。(二)两个正态总体的检验1、配对比较与成组比较(1)配对比较t检验在医药实验研究中,常把研究对象按某种特征配成对子,把同对中的一个对象分配到处理组(实验组),另一个分配到对照组,称为配对设计。这种设计得到的两组数据不是相互独立的,我们可以把各对数据的差值d的随机变化看成为由大量、微小、独立的随机因素综合作用的结果,可认为d~N(d,d2),其中d未知。一、配对T检验原假设H0:d=0检验统计量:)1(~/ntnsdtdd例14例冠心病患者给以高压氧治疗,治疗前后作同位数冠状循环指数测定,结果见表,试问高压氧治疗前后冠状循环指数有无显著性差异?注意在原假设成立的条件下有d=0病例号治疗前治疗后差值dd212345678910111213140.5770.4720.6980.5691.1290.6940.4870.7920.6480.5830.6540.4020.8560.6062.0671.0001.0660.8803.0440.7860.8330.9611.0440.5841.0160.6191.4990.6271.4900.5280.3680.3111.9150.0920.3460.1690.3960.0010.3620.2170.6430.0212.2200.2790.1080.0973.6670.0090.1200.0290.1570.0000.1310.0470.4130.000合计6.8597.277表:解:原假设H0:d=0计算如下:34.314/549.0490.0549.0301.014131)(1141490.014859.61411412214122141tsddddsdddiiiidii由=0.01及df=14-1=13,查表得t0.01/2(13)=3.012,由于|t|3.012,p0.01,故在显著性水平=0.01下拒绝H0。即高压氧治疗前后冠状循环指数有显著性差异。(2)成组T检验有些试验不便作配对设计,而是把实验对象随机地分成两组(两组个数可以不相等),然后对两组作不同处理,观察某一指标的变化。这种的设计属于完全随机化的设计,得到的两组数据是相互独立。设x1,x2,...,xn1是来自正态总体N(x,x2),y1,y2,...,yn1是来自正态总体N(y,y2),且x=y。试问两个总体均数是否有显著性差异?原假设H0:x=y或x-y=0检验统计量:2)1()1()2(~11)()(2122221122121nnsnsnsnntnnsyxtwwyx其中注意:在原假设成立的条件下有x-y=0例甲乙两厂生产同一药物,现分别从其产品中抽取若干样品测定其含量,结果如表:甲厂0.510.490.520.550.480.47乙厂0.560.580.520.590.490.570.54若已知两厂产品的药物含量均服从正态分布,且方差相等。试问两厂生产的产品总体均数有显著性差异?分析:X~N(1,12),Y~N(2,22),且1=2=。原假设H0:x-y=0,检验统计量:)2(~11)()(2121nntnnsyxtwyx解:原假设H0:x-y=0已知:03249.00010849.02)1()1(0012667.0,55.0,700086667.0,503.0,6212222112222211wwsnnsnsnssynsxn故在H0成立的条件下检验统计量的样本值:5646.2716103249.055.0503.01121nnsyxtw给定=0.05,df=6+7-2=11,查表得t0.05/2=2.201。由|t|=2.5646t0.05/2=2.201,p0.05,故在显著性水平=0.05下拒绝原假设H0,即两厂生产的药物含量有显著性差异。设X1,X2,...,Xn是来自正态总体N(,2)的样本。原假设第四节正态总体方差的检验一、单个正态总体方差的2-检验02020:或H在原假设成立的条件下,检验统计量)1(~)1(22022nSn把样本观测值x1,x2,...,xn是代入检验统计量得2值。比较2值与临界值,作出结论。给定显著性水平,查表得:)1()1(22122nn和例:溶解速度是药物制剂的一个重要理化指标,今随机抽取某种药片7片,测定其溶解一半所需时间(min)分别是:5.36.65.23.74.94.55.8假定溶解时间服从正态分布,试问这种药片溶解一半所需时间的方差是否等于2?解:记药片溶解一半时间为T50,由假设T50~N(μ,2).原假设H0:2=2计算得样本均值和样本方差分别为:8562.09253.0,142.522sx代入检验统计量得给定=0.1,查表得临界值:5686.2)1(222sn635.1)6(,592.12)6(221.01221.0因为1.6352.568612.592,所以不能拒绝原假设(P0.1),即尚不能认为方差2与2有显著性差异。设X1,X2,...,Xn1是来自正态总体N(1,12)的样本。设y1,y2,...,yn1是来自正态总体N(2,22)的样本。原假设二、两个正态总体方差齐性的F-检验2122210:或H在原假设成立的条件下,检验统计量)1,1(~212221nnFSSF例甲乙两厂生产同一药物,现分别从其产品中抽取若干样品测定其含量,结果如表:甲厂0.510.490.520.550.480.47乙厂0.560.580.520.590.490.570.54若已知两厂产品的药物含量均服从正态分布,试问两厂生产的产品总体均数有显著性差异?分析:X~N(1,12),Y~N(2,22),且1=2=。原假设H0:1=2在原假设成立的条件下,检验统计