第8章假设检验假设检验与两类错误正态总体参数的假设检验非正态总体均值的假设检验非参数假设检验1•习题P157•8.1,8.4,8.5,8.6,•8.8,8.12,8.15§8.1假设检验与两类错误例:去市场买荔枝,小贩说他的荔枝是糯米糍。通常的做法是吃一个看看。若是真就买,不真就走开。这一做法就含有假设检验的思想。第1步:假设小贩所言为真(原假设)第2步:吃一个(抽取样本,做检验);第3步:走开或买(根据样本和统计理论作出判断)这里的第1步为假设,第2,3步为检验。8.1.1假设检验问题的提法21210101231010,,,,132010,12iikgxxxxxkgXN某地早稻收割前根据长势估计平均亩产量为,收割时,随机地抽取了块地,测得每块地的实际亩量为计算出,如果已知早稻产量服从正态分布,试问所估产量是否正确?例13解20012~,12:310,:31012~310,10310~0,112/103101.960.9512/103101.960.0512/10XNHuHXNXuNXPXP由于亩产量,两个假设:则显然由标准正态分布的性质知:4003103203102.641.9612/1012/10310XHHkg而小概率事件发生了,所以我们有理由不相信是真的,于是拒绝,即认为估产不正确。5000000011/12///XPknXPknXXkHnXXkHn在提出假设、选取统计量的基础上,选定一个小的正数<<,使此时显然有当样本观察值满足时,就拒绝;当满足时,就接受。步骤:6定义1由(1)式知,当k确定后,不等式。的拒绝域,记为式的区域称为ZH0)4(4,,00nknk。接受落入此区域内时就拒绝当)(10HH03/Xkn的一个区域确定了关于705/XknX不等式确定了关于的另一个区域6式称为区间形式的接受域。01XHH当落入此区域内时,就接受拒绝。(6)Z式的区域称为接受域,记为。5式称为临界值形式的接受域。6,00nknk8定义2称H0为原假设(或零假设),称H1为备择假设(或备选假设,对立假设)定义3称值α为显著性水平(或检验水平),它是用来衡量原假设与实际情况差异是否明显的标准。定义4称值k为临界值。小概率原理:小概率事件在一次试验中是几乎不发生的9人们自然会产生这样的问题:概率小到什么程度才当作“小概率事件”呢?这要据实际情况而定,例如即使下雨的概率为10%,仍有人会因为它太小而不带雨具。但某航空公司的事故率为1%,人们就会因为它太大而不敢乘坐该公司的飞机,通常把概率不超过0.05(或0.01)的事件当作“小概率事件”。为此在假设检验时,必须先确定小概率即显著性的值α(即不超过α的概率认为是小概率)。108.1.2假设检验的两类错误第一类错误:H0正确,但拒绝了它,这类错误也称为“拒真错误”。第二类错误:H0不正确,但接受了它,这类错误称为“受伪错误”00PHH拒绝真00PHH接受伪11首先,且可以证明,在样本容量一定时,同时缩小两类错误是不可能的。1-当样本容量一定时,犯第一类错误的概率越小,则犯第二类错误的概率越大。当现实中样本容量不可能无限制的大,从而同时控制两类错误就不可能。12实际中常用的是只控制第一类错误而不控制第二类错误的检验方法,即显著性检验。当想用显著性检验对某一猜测结论作强有力的支持时,应该将猜测结论的反面作为原假设例2220012n001101,,X,X,X:,:=()XNHuHu设总体已知。,为其样本,试求对假设检验问题:做检验其中,并解释该检验的第一类错误的概率与第二类错误的概率之间的关系。13解01200X/unH当时拒绝原假设。200XN,Xn由于,用的分布密度函数,将第一类错误与第二类错误标于下图。1415假设检验的基本步骤(1)提出假设。(2)找统计量。(3)求临界值。(求接受域)(4)算出观察值。(5)作出判断。16§8.2正态总体参数的假设检验1、已知方差σ2,假设检验H0:μ=μ00X~01/uNn,(1)提出假设。H0:μ=μ0.(2)找统计量。确定样本函数的统计量一、单个正态总体的假设检验17121212011uPuuPuu给定显著性水平,查正态分布表求出临界值,使即(3)求临界值1812u12u1910101-1-22uuHuuH若,则接受;若,则拒绝。(4)求观察值。(5)作出判断。。的观察值计量根据给定的样本求出统1uu这种检验方法称为u检验法。20001122001122,,,ZuunnZuunn拒绝域为+接受域为u检验法的2122例2某砖厂生产的砖其抗拉强度X服从正态分布N(μ,1.21),今从该厂产品中随机抽取6块,测得抗拉强度如下:32.56,29.66,31.64,30.00,31.87,31.03检验这批砖的平均抗拉强度为32.50是否成立,取显著性水平α=0.05。解:(1)提出假设.H0:μ=μ0=32.50.(2)找统计量0~0,1/XuNn231122030.050.051.96.4132.5631.0331.13631.1332.503.05/1.1/6Puuuxxun求临界值。对给定的,查正态分布表得的临界值求观察值24不能成立。抗拉强度为即认为这批产品的平均,所以拒绝因为作出判断。50.32,96.105.350Hu252220~1/uuSXttnSn因为未知,这时已不是统计量,所以不能用检验法,用来代替,找出统计量临界值,使分布表查得,由对给定的显著水平t101、提出假设2、构造统计量3、求临界值.:00H2、未知方差σ2,假设检验H0:μ=μ02610121012ttHttH若,则接受。若,则拒绝。4、求观察值5、作出判断。的观察值计量根据所给的样本算出统1tt这种检验方法称为t检验法。1-2Ptt2712t12t28例3用热敏电阻测温仪间接测量地热勘探井底温度,设测量值X~N(μ,σ2),今重复测量7次,测得温度(℃)如下:112.0,113.4,111.2,114.5,112.5,112.9,113.6而用某种精确方法测量温度的真值μ0=112.6,现问用热敏电阻测温仪间接测量温度有无系统偏差?设显著性水平α=0.05。29解(1)提出假设,H0:μ=μ0=112.6(2)找统计量。0~1/XttnSn0.9751230.0517162.447.nttt求临界值。对给定的,查自由度为的分布表得3072212220041112.0113.4113.6112.871711112.0112.8113.6112.861.136112.8112.60.4657/1.136/750.46572.447,iixSxxxtSntH求观察值。作出判断,因为,所以接受即用热敏电阻测温仪间接测量温度可以认为无系统偏差。31序号σ2已知σ2未知IIIIIIIVV0H000001H00000表8.1单个正态总体均值的假设检验的拒绝域(显著性水平为)012/xun01/xun0/xun0121/1nxtnsn011/1nxtnsn01/1nxtnsn32!2222101~niiXn确定样本函数的统计量=22003:H、已知期望,假设检验.:2020H2、构造统计量1、提出假设33222122222212201,122nnPnPn对给定的显著性水平<<,由分布表查得临界值与,使2221221Pnn即3、求临界值342222110122nnH若或<,则拒绝。。的观察值计量根据所给的样本算出统212检验法。这种检验方法称为24、求观察值5、作出判断22210122nnH若,则接受。3522n212n36例4某涤纶厂的生产的维尼纶的纤度(纤维的粗细程度)在正常生产的条件下,服从正态分布N(1.405,0.0482),某日随机地抽取5根纤维,测得纤度为1.32,1.55,1.36,1.40,1.44问一天涤纶纤度总体X的均方差是否正常(α=0.05)?37解22200222210(1):0.048.(2)1~niiHXn提出假设。找统计量。2220.97512220.0252(3)0.055512.83350.831nnn求临界值。对给定的,查自由度为的分布表得38222222220.975012(4)11.321.4051.551.4051.441.4050.04813.683(5)13.683512.833nH求观察值。作出判断。因为,所以拒绝,即这一天涤纶纤度的均方差可以认为不正常。392020:H22004:H、未知期望,假设检验2222101~1niiXXn1、提出假设2、构造统计量40,使和查得临界值1122122nn3、求临界值222122111Pnn即22221221,1122PnPn分布表,由对给定的显著水平21041。计量的观察值根据所给的样本算出统212220122222211012211,11nnHnnH若则接受。若或<,则拒绝。4、求观察值5、作出判断42例540.05X数据见例,假设期望未知,问总体均方差是否正常?解2200222210(1):.(2)1~1niiHXXn提出假设。找统计量。分布表得的,查自由度为对给定的求临界值。24105.03n43220.97512220.02521411.143140.484nn522222110222222(4)11.321.551.361.401.441.4145110.04811.321.4141.551.4141.361.4140.0481.401.441.441.41413.51niiiixxxxx求观察值442202(5)13.51111.143nHX作出判断因为,所以拒绝。即这一天生产的涤纶纤度均方差不正常。45序号已知未知IIIIIIIVV0H2201H222102222110211niiniixnxn或2202202