2我认为这种新药的疗效比原有的药物更有效!总体构造假设选择统计量并计算作出决策抽取随机样本均值x=20我认为人口的平均年龄是50岁提出假设拒绝假设别无选择!作出决策确定1.问题背景假设检验是统计推断的基本问题之一,主要是确定关于样本总体特征的判断是否合理.其基本思想是,按照一定的规则(即检验准则),根据样本信息对所做出的原假设H0判断是否成立,以决定是接受还是否定原假设H0.假设检验的判断和结论是根据样本做出的,故具有“概率性”,从而要犯判断上的错误——弃真错误和取伪错误.假设检验分为参数假设检验和总体分布假设检验两类.由样本数据来做出拒绝和接受原假设的判断,计算量是相当大的.下面我们用MATLAB软件来解决这一问题.2.实验目的与要求(1)掌握MATLAB工具箱中关于假设检验的有关操作命令;(2)熟练掌握对单个正态总体均值、方差的假设检验;(3)掌握对两个正态总体均值、方差有关的假设检验;(4)掌握两个未知总体分布类型对均值是否相等的假设检验;(5)掌握对单个总体是否服从正态分布的假设检验;(6)掌握对单个总体是否服从指定的理论分布的假设检验.求解参数假设检验问题的步骤:(1)根据问题提出合理的原假设H0和备择假设H1;(2)给定显著性水平α,一般取较小的正数,如0.05,0.01等;(3)选取合适的检验统计量及确定拒绝域的形式;(4)令P{当H0为真拒绝H0}=α,求拒绝域;(5)由样本观察值计算检验统计量的值,并做出决策:拒绝H0或接受H0.0~(0,1)xzNn已知:(1)设是来自正态总体X的一个简单随机样本,样本均值为,根据单个总体的抽样分布结论,选用统计量12,,,nxxx11niixxn未知:(2)选用统计量:0~(1)/xttnsn假设双侧检验单侧检验左侧检验右侧检验原假设H0:=0H0:0H0:0备择假设H1:≠0H1:0H1:00临界值临界值/2/2样本统计量拒绝H0拒绝H0抽样分布1-置信水平双侧检验0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量0临界值样本统计量拒绝H0抽样分布1-置信水平观察到的样本统计量假设双侧检验左侧检验右侧检验假设形式H0:=0H1:0H0:0H1:0H0:0H1:0统计量已知:未知:拒绝域P值决策拒绝H00xzn0xtsn1/2zz1tt1zzP1/2tt1zz1tt一、总体标准差已知时的单个正态总体均值的U检验调用格式:h=ztest(x,m,sigma)h=ztest(...,alpha)h=ztest(...,alpha,tail)h=ztest(...,alpha,tail,dim)[h,p]=ztest(...)[h,p,ci]=ztest(...)[h,p,ci,zval]=ztest(...)ztest函数20~(,)XN总体:12,,,nXXX样本:001000100010:,:.:,::,:HHHHHH假设:当H=0表示接受原假设;当H=1表示拒绝原假设。·h=ztest(x,m,sigma)·h=ztest(x,m,sigma,alpha)·[h,sig,ci]=ztest(x,m,sigma,alpha,tail)命令[h,sig,ci]=ztest(x,m,sigma,alpha,tail)表示通过tail指定值控制可选择假设的类型,以显著性水平为alpha检验,标准差为sigma的正态分布样本x的均值是否为m.返回值h=l表示在显著性水平为alpha时拒绝原假设;h=0表示在显著水平为alpha时不拒绝原假设.返回值sig为Z的样本数据在x的均值为m的原假设下较大或者在统计意义下较大的概率值.ci返回置信度为100(1-alpha)%的真实均值的置信区间.在Matlab中U检验法由函数ztest来实现。调用格式如下0[,,,](,,,,)HPCIzvalztestXTail当Tail=0时,备择假设为“”;当Tail=1时,备择假设为“”;当Tail=-1时,备择假设为“”;000·[h,sig]=ztest(x,m,sigma,alpha,tail)x=[9710210511299103102941009510598102100103];%调用ztest函数作总体均值的双侧检验,%返回变量h,检验的p值,均值的置信区间muci,检验统计量的观测值zval[h,p,muci,zval]=ztest(x,100,2,0.05)%调用ztest函数作总体均值的单侧检验[h,p,muci,zval]=ztest(x,100,2,0.05,'right')例1、某切割机正常工作时,切割的金属棒的长度服从正态分布(100,4)N.从该切割机切割的一批金属棒中随机抽取15根,测得它们的长度(单位:mm)如下:9710210511299103102941009510598102100103.假设总体方差不变,试检验该切割机工作是否正常,即总体均值是否等于100mm?取显著性水平0.05.例2某电子元器件生产厂对一批产品进行检测,使用寿命不低于2000小时为合格品。该电子元器件的使用寿命服从正态分别,标准差为100小时。从该批产品中随机抽取了120个产品进行检测,测得样本均值为1960小时,在的显著性水平下检验该批电子元器件的质量是否符合要求。0.01解:由题意总体服从正态分布,02000,100,样本均值,样本容量1960x120.n=-4.3821zz拒绝域=-2.33所以拒绝原假设,即电子元件的质量不符合标准。02000H:12000H:(1)0-19602000/100/120xZn(2)1z(3)1zz(4)算法1、定义参数,mean,mu,sigma,n,alpha,model分别代表样本均值,总体均值,标准差,样本容量,显著性水平,检验模式包括:左侧,双侧,右侧2、根据检验模式定义出拒绝域;3、根据上述参数计算4、判断sample是否在第2步定义的拒绝域,如果在就拒绝原假设返回值0,否则返回值1.5、根据第四步结果做出结论,0拒绝原假设,1接受原假设。()/meanmusamplesigman在Matlab中t检验法由函数ttest来实现。调用格式如下[,,](,,,)HPCIttestXMTail·[h,sig]=ttest(x,m,alpha,tail)·h=ttest(x,m)·h=ttest(x,m,alphal)·[h,sig,ci]=ttest(x,m,alpha,tail)命令[h,sig,ci]=ttest(x,m,alpha,tail)表示在给定显著水平为alpha的基础上进行t假设检验,检验正态分布样本x的均值是否为给出的m,m的缺省值是0.返回的h值等于1表示在显著水平为alpha时拒绝原假设;返回的h值等于0表示在显著水平为alpha时不拒绝原假设.返回的sig表示在x的均值等于m的原假设下较大或者统计意义下较大的概率值.ci返回一个置信度为100(1-alpha)%的均值的置信区间.二、总体标准差未知时的单个正态总体均值的t检验调用格式:h=ttest(x)h=ttest(x,m)h=ttest(x,y)h=ttest(...,alpha)h=ttest(...,alpha,tail)h=ttest(...,alpha,tail,dim)[h,p]=ttest(...)[h,p,ci]=ttest(...)[h,p,ci,stats]=ttest(...)ttest函数2~(,)XN总体:12,,,nXXX样本:001000100010:,:.:,::,:HHHHHH假设:%定义样本观测值向量x=[49.450.550.751.749.847.949.251.448.9];%调用ttest函数作总体均值的双侧检验,%返回变量h,检验的p值,均值的置信区间muci,结构体变量stats[h,p,muci,stats]=ttest(x,50,0.05)例3、化肥厂用自动包装机包装化肥,某日测得9包化肥的质量(单位:kg)如下:49.450.550.751.749.847.949.251.448.9设每包化肥的质量服从正态分布,是否可以认为每包化肥的平均质量为50kg?取显著性水平0.05.例4某电视机厂采用了新的生产技术生产显像管,质监部门随机抽取了20个样本,测得样本的平均寿命为31850小时,样本标准差1300小时。已知,在采用了新技术前生产的显像管的平均寿命为3万小时,显像管的寿命服从正态分布,问:在的显著性水平下,问:新技术采用前与采用后生产的显像管的平均寿命是否有显著差异。0.05解:未知,所以采用t检验1/2(1)tn(3)1/2tt拒绝域00:H10:H(1)03185030000/1300/20xtsn(2)(4)1/2tt=6.36=2.0930所以拒绝原假设,即平均寿命有显著差异。算法1、定义参数,mean,mu,n,alpha,model分别代表样本均值,总体均值,样本容量,显著性水平,检验模式包括:左侧,双侧,右侧2、根据检验模式定义出拒绝域;3、根据上述参数计算4、判断sample是否在第2步定义的拒绝域,如果在就拒绝原假设返回值0,否则返回值1.5、根据第四步结果做出结论,0拒绝原假设,1接受原假设。()/meanmusamplesn当两个正态总体均服从正态分布且方差未知但相等时,进行两个总体均值之差的检验采用统计量。2212,~(2)11wXYTtmnSmn选用统计量:调用格式:h=ttest2(x,y)h=ttest2(x,y,alpha)h=ttest2(x,y,alpha,tail)h=ttest2(x,y,alpha,tail,vartype)h=ttest2(x,y,alpha,tail,vartype,dim)[h,p]=ttest2(...)[h,p,ci]=ttest2(...)[h,p,ci,stats]=ttest2(...)ttest2函数211~(,)XN总体1:112,,,nXXX样本1:012112012112012112:,::,::,:HHHHHH假设:222~(,)YN总体2:212,,,nYYY样本2:·[h,sig,ci]=ttest2(x,y,alpha,tail)·[h,sig,ci]=ttest2(x,y,alpha)·[h,sig,ci]=ttest2(x,y)命令[h,sig,ci]=ttest2(x,y,alpha,tail)表示在tail指定可选择假设类型,显著水平为alpha的情况下,对两个正态分布样本x和y是否具有相同的均值进行t检验;返回值h=l表示在显著水平为alpha时拒绝原假设,返回值h=0表示在显著水平为alpha时不拒绝原假设;返回值ci表示置信度为100(1-alpha)%的均值真实差的置信区间;返回值sig为样本x的均值等于样本y的均值的原假设下较大或者统计意义下较大的概率值.在Matlab中由函数ttest2来实现。调用格式如下:[,,]2(,,,)HPCIttestXYTail当H=0表示接受原假设;当H=1表示拒绝原假设。当Tail=0时,备择假设为“”;当Tail=1时,备择假设为“”;当Tail=-1时,备择假设为“”;121212例5、甲、乙两台机床加工同一种产品,从这两台机床加工的产品中随机抽取若干件,测得