第九章假设检验假设检验的提出:在实际中存在着许多不同于参数估计的问题,请看下面的例子例1.某厂有一批产品,按国家规定标准,次品率不得超过4%才能出厂.现从中任取10件进行检验(每次取1件,取后放回),发现有4件次品,问该批产品能否出厂?一般的方法是:首先假设该批产品的次品率p4%,然后利用抽样的结果来判断这一假设是否成立。从频率的角度来看,这批产品不能出厂,但我们现在所关心的问题是如何根据抽样得到的次品率4/10来推断整批产品的次品率是否超过4%例2.某车间生产的一种铜丝,其折断力服从N(570,64)。现改变生产工艺,并从新产品中抽取10个样品进行测量,得=575.2(N),问折断力大小与原来是否相同?(假定方差不会改变)。若以X表示折断力,那么这个例子的问题就化为:如何根据抽样的结果来判断等式:“EX=570”是否成立。x更一般的问题是:如何根据抽样的结果来判断总体X的分布函数F(x)是否等于给定的函数F0(x)。上述例子所代表的问题是很广泛的,它们的共同特点是:先对总体的参数或总体的分布函数的形式作某种假设H0,然后由抽样结果对假设H0是否成立进行推断。为此需要建立检验假设的方法。在数理统计学中,称检验假设H0的方法为假设检验。第一节假设检验的概念1.定义先对总体X的分布函数或参数提出假设,然后通过抽样并根据样本提供的信息对假设的正确性进行推断,作出接受或拒绝假设的决策.这一过程称为假设检验.2.参数假设检验和非参数假设检验3.理论依据实际推断原理:小概率事件在一次试验中(几乎)是不可能发生的.第二节正态总体均值和方差的假设检验一.设X~N(,2),而2为已知.U检验(1)已知2.待检验的假设:H0:=0,检验水平:(给定的小量)双边检验第一步提出假设H0:=0(原假设);第二步构建检验统计量0~0,1/XUNnH1:0(备选假设).第三步确定拒绝域第四步由样本提供的信息计算出的值,0/xun若则拒绝原假设(H0伪)21||uz21||uz第五步给出结论假设检验统计量拒绝域推断结论再对H0的正确性进行推断.若则接受原假设(H0真)222111{||}(,)(,)PUzuzz例1根据大量调查得知,我国健康成年男子的脉搏平均为72次/分,标准差为6.4次/分,现从某体院男生中,随机抽出25人,测得平均脉搏为68.6次/分.根据经验脉搏X服从正态分布.如果标准差不变,试问该体院男生的脉搏与一般健康成年男子的脉搏有无差异?并求出体院男生脉搏的置信区间(=0.05).0~(0,1)/xUNn解:此例是在已知=6.4的情况下,第一步检验假设H0:0=72,第二步统计量第四步现在n=25,=68.6,656.2|54.6726.68|/00nxu对于=0.05,查标准正态分布表得96.1975.021zz因为|u0|=2.6561.96,故拒绝H0.x第三步确定拒绝域拒绝域:|u|1.96第五步结论该体院男生的脉搏与一般健康成年男子的脉搏存在差异。由于1.6696.1254.66.6821znx1.7196.1254.66.6821znx所以,该体院男生脉搏的95%的置信区间为[66.1,71.1]例1某糖厂有一台自动打包机打包,额定标准每包质量为100kg.设包质量服从正态分布,且根据以往经验,其方差2=(0.4)2.某天开工后,为检查打包机工作情况,随机地抽取9包,称得质量(单位:kg)如下:9998.5102.51019899102102.1100.5问这天打包机工作是否正常?(1=0.05,2=0.01)0~(0,1)/xUNn解:此例是在已知2=(0.4)2的情况下,第一步检验假设H0:0=100,第二步统计量第三步现在n=9,=100.29,00100.29100||2.1750.4/3xunx(1)对于=0.05,查标准正态分布表得96.1975.021zz第四步确定拒绝域拒绝域:|u|1.96(2)对于=0.01,查标准正态分布表得0.995122.58zz拒绝域:|u|2.58因为|u0|=2.1721.96,故拒绝H0.因为|u0|=2.1722.58,故接受H0.注:假设检验过程中的两类错误(判断失误)假设检验的依据是“小概率事件实际不可能发生”原理,但是小概率事件并非不可能事件,我们并不能完全排斥它发生的可能性,因而假设检验的结果就有可能出现错误。正确正确假设检验的两类错误犯第一类错误的概率为H0为真H0为假真实情况所作判断接受H0拒绝H0第一类错误(弃真)第二类错误(取伪)犯第二类错误的概率记为任何检验方法都不能完全排除犯错误的可能性.理想的检验方法应使犯两类错误的概率都很小,但在样本容量给定的情形下,不可能使两者都很小,降低一个,往往使另一个增大.假设检验的指导思想是控制犯第一类错误的概率不超过,然后,若有必要,通过增大样本容量的方法来减少.在实际问题中,如何给定检验水平,应根据具体情况而定.(1)当拒绝一个属真的假设其后果非常严重时,应将取得小一些,如=0.01,=0.005等,例如,在雷达预警系统中,漏报敌人飞行器入侵是十分严重的错误,这时就要选的小一些.(2)当拒绝一个属真的假设其后果不甚严重,而“取伪”会引起严重后果时,可将取得适当大一些,如=0.05,=0.10,等。例如:在判别药品合格与否时,取伪的危害性很大,这时便要选的大一些,虽然引起经济上的损失可能大一些,但危及生命的可能性便减小了。(2)(右边检验)H0:=0;H1:0,此时样本信息显示0H0原假设;H1备选假设第一步提出假设H0:=0(原假设);H1:0(备选假设).第二步构建检验统计量0~0,1/XUNnx第三步确定拒绝域11{}(,)PUzuz第四步由样本提供的信息计算出的值,并对H0的正确性进行推断.0/xun若则拒绝原假设(H0伪)1uz1uz第五步给出结论若则接受原假设(H0真)例2已知某零件的质量X~N(,2),由经验知=10g,2=0.05.技术改新后,抽取8个样品,测得质量(单位:g)为9.8,9.5,10.1,9.6,10.2,10.1,9.8,10.0,若方差不变,问平均质量是否比10为小?(取=0.05)解本例是一个左边检验问题,检验假设:01:10;:10HH选取统计量0/xUn在H0为真的条件下10~(0,1)/xUNn645.195.01zz由样本值计算出9.9x计算10/xUn的试验值并比较查标准正态分布表得01109.9101.261.645/0.0510xuzn故接受假设10:0H例3某厂生产的一种铜丝,它的主要质量指标是折断力大小.根据以往资料分析,可以认为折断力X服从正态分布,且数学期望EX==570(N),标准差是=8(N).今换了原材料新生产一批铜丝,并从中抽出10个样品,测得折断力(单位:N)为:578572568570572570570572596584从性能上看,估计折断力的方差不会发生变化,问这批铜丝的折断力是否比以往生产的铜丝的折断力较大?(取=0.05)解:(1)假设01:570:570HH(2)计算统计量570/xn先算出x=575.2570575.25702.055/8/10xn的值,(3)当=0.05时,查标准正态分布表得临界值10.951.645zz1z570/xn(4)比较与的值的大小。现在15702.0551.645/xzn(5)拒绝假设H0即接受H1.也就是说新生产的铜丝的折断力比以往生产的铜丝的折断力要大.以上三种检验法由于都是使用U的分布,故又名U检验法.假设检验与置信区间对照2211(,)xzxznn201xzn接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布00(2已知))1,0(~0NnXU(2已知))1,0(~NnXU原假设H0备择假设H1待估参数由于2未知,这时U已不是统计量,因此,我们很自然地用2的无偏估计量S2来代替2,选取检验函数nsxT/0为检验H0:=0的统计量。1~/ntnsxT由第七章定理四得二.2未知时,均值的假设检验1.未知方差2,检验假设H0:=0所以在H0为真时,1~/0ntnsxT类似于前面的讨论,采用双边检验,对于给定的检验水平,查t(n-1)表得121nt使得21)}1({21ntTP12{||(1)}1PTtn)}1(|{|21ntTP即得)}1(|{|210ntnsxP)}1(|{|210ntnsx是一个小概率事件0/xTsn)1(21nt)1(||21ntT)1(||21ntT由样本值算出,然后与相比较,做出判断:若,则接受假设H0.若,则拒绝假设H0;2.未知方差2,检验假设H0:=0;H1:00x(事先算出样本值,才提这样的检验假设)选取检验用的统计量1~/ntnsxT所以在H0为真时,1~/0ntnsxT类似于前面的讨论,采用单边检验,对于给定的检验水平,查t(n-1)表得11nt使得1)}1({1ntTP)}1({1ntTP即得01{(1)}/xPtnsn01{(1)}/xtnsn是一个小概率事件由样本值算出0/xTsn然后与)1(1nt相比较,做出判断:)1(1ntT10(1),()Ttnx则接受假设H0.若则拒绝假设H0,接受H1;若检验假设H0:=0;H1:00x(事先算出样本值,才提这样的检验假设)与2类似,略。3.未知方差2通常总体的方差2是未知的,所以用本法对均值进行检验及求均值的置信区间具有更大的使用价值.以上三种检验法均采用了t分布,故又名t检验法.例4在某砖厂生产的一批砖中,随机地抽取6块进行抗断强度试验,测得结果(单位:kg/cm2)如下:32.5629.6631.6430.0031.8731.03设砖的抗断强度服从正态分布,问这批砖的平均抗断强度是否为32.50(kg/cm2)?取=0.05.解:(1)假设H0:0=32.50(2)计算统计量T的值,31.13,1.13xs32.5031.1332.502.97/1.13/6xTsn(3)当=0.05时,查t分布表得0.97512(1)(5)2.57tnt(4)比较|T|与)1(21nt的大小。现在12(1)Ttn,故拒绝假设H0(5)结论:这批砖的平均抗断强度不是32.50(kg/cm2)接受域置信区间检验统计量及其在H0为真时的分布枢轴量及其分布原假设H0备择假设H1待估参数00(2未知))1(~0nTnSXT(2未知))1(~nTnSXT21)sxtn201xtsn21(,sxtn2检验法22111()ninisxx22Es已知条件,总体X~N(,2),x1,x2,,xn为来自于总体X的样本,三.(单个)正态总体方差的假设检验1.检验假设H0:202分析:s2比较集中地反映了2的信息,若则s2与应接近,因此不能太大或太小.如太大或太小,应拒绝H0.20220/s220/s由第七章定理三知1~1222