假设检验讲义

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第八章假设检验内容介绍本章主要介绍统计假设检验的基本思想和概念以及参数的假设检验,并简单介绍非参数的统计假设检验的一些方法.内容讲解§8.1假设检验的基本思想和概念1.引例例题1.P167例8-1味精厂用一台包装机包装味精,已知袋装味精的重量(单位:公斤)X~N(μ,0.0152),机器正常时,其均值μ=0.5公斤.某日开工后随机抽取9袋袋装味精,其净重分别为0.497,0.506,o.518,0.524,0.498,0.511,0.520,0.515,0.512,问这台包装机工作是否正常?【答疑编号12080101】分析:从上述数据可知,9袋味精没有一袋与包装上标明的0.5公斤相同,这是一种普遍现象.造成这种差异不外乎有两种原因:一是偶然因素造成的差异称为随机误差,属于正常误差;二是由于条件因素造成的误差,称为条件误差,属于不正常的误差。为了检验包装机是否正常,在数理统计中给出了假设检验的方法。解:已知袋装味精重X~N(μ,0.0152),假设现在包装机工作正常,提出如下假设:H0:μ=μ0=0.5,H1:μ≠μ0,这是两个对立的假设,让我们通过抽样进行检验,从中选取其一,作出决策.从总体中抽取容量为n的样本,其均值为是μ的一个无偏估计.易知,当很小时,认定H0为真,反之,很大时,我们有理由怀疑H0为真而拒绝H0,接受H1.如何求出大、小的临界值?下面讨论之.为了确定临界值,给定一个小数α(0α1).由于H0为真时,~,与区间估计类似,考虑,查表可得临界值.显然,事件是一个小概率事件,在一次试验中几乎不可能发生.我们只需计算的值,与临界值比较大小,若,说明上述小概率事件没有发生,我们接受H0,反之说明,小概率事件居然发生了,与“小概率事件在一次试验中几乎不可能发生”相矛盾,于是拒绝H0,接受H1,认为这台包装机工作不正常.2.统计假设检验中的一些基本概念(1)参数检验与非参数检验如果需要检验的量仅仅涉及总体分布的未知参数,则称之为参数检验.这是本章讲解的主要内容;如果涉及分布函数形式等时,则称之为非参数检验.(2)原假设与备择假设引例中的假设H0,即正常情况下放弃H0是小概率事件,则称H0为原假设或零假设;与之相对立的是假设H1,称之为备择假设.两个假设有且仅有一个为真.(3)检验统计量引例中的,称为检验统计量.对样本数据进行加工并用来判断是否接受原假设的统计量称为检验统计量.检验统计量应满足:①必须与统计假设有关;②当H0为真时,检验统计量的分布是已知的.(4)显著水平假设检验的基本理论根据是小概率原理,即小概率事件在一次试验中几乎不可能发生,根据这一原理,如果小概率事件不发生,则接受原假设,否则拒绝原假设。那么,确定多大范围算作小概率呢?选择一个小数α(0α1)作为标准,通常取0.05,0.01等,称之为显著水平,所以,假设检验问题要规定一个显著水平α.(5)接受域与拒绝域应用检验统计量及其分布和显著水平,可以求出小概率事件发生和不发生的临界值,即引例中的.此数值将统计量可能取值划分为两部分,一部分是原假设成立的取值范围,称为接受域;另一部分是使小概率事件发生的统计量取值范围,即拒绝原假设的范围,称为拒绝域,本书用W表示.3.假设检验中的两类错误(1)数理统计的任务本来是用样本来推断总体,即用局部来推断整体,当然有可能犯错误.假设检验是在一定的概率(显著水平)下确定拒绝域的,同样会犯错误.可能犯的错误可分为两类:第一类错误是:在H0为真的情况下,样本值落入拒绝域W,因而拒绝H0.这种错误也称为“拒真”错误,犯这类错误的概率是α.第二类错误是:在H0为不真的情况下,样本值落入接受域,因而接受H0.这种错误也称为“取伪”错误,犯这类错误的概率是β.(2)如何减小犯错误的可能?①犯两类错误的概率是相互关联的.当样本容量n固定时,犯一类错误的概率的减小将导致犯另一类错误的概率增加.②要同时降低犯两类错误的概率,只有增大样本容量n.在实际使用中,只能采取折中方案.一般地,先控制α值,再尽可能减少β值,并把这一检验方法称为显著性水平为α的显著性检验,简称水平为α的检验.4.假设检验的基本步骤(1)提出假设:根据实际问题提出原假设H0和备择假设H1,要求H0与H1有且仅有一个为真.(2)选统计量:选择适当的检验统计量,并在原假设H0成立的条件下确定该检验统计量的分布.(3)求拒绝域:根据给定的显著水平α,查检验统计量的分布表,求出对应于α的临界值,从而得到对原假设H0的拒绝域W.(4)作出决策:计算样本的统计量的值,若落入拒绝域W,则认为H0不真,拒绝H0,接受备择假设H1;否则,接受H0.§8.2总体均值的假设检验1.u检验(在其他书上也称Z检验)(1)单正态总体,方差已知,均值的检验设x1,x2,…,xn为正态总体N(μ,σ2)的一个样本,σ2已知,欲检验假设H0:μ=μ0,H1:μ≠μ0,其中,μ0为已知数.由引例,可选择统计量,并且,在H0成立的条件下,u~N(0,1).当给定的显著水平为α时,查标准正态分布表求得临界值,从而得到拒绝域.由样本观察值计算统计量u的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.(2)双正态总体,方差已知,均值差的检验设总体X~,Y~,其中,已知,又x1,x2,…,xm和y1,y2,…,yn分别为X和Y的样本,且相互独立.欲检验H0:μ1=μ2,H1:μ1≠μ2.检验H0:μ1=μ2等价于H0:μ1-μ2=0,而是μ1-μ2的无偏估计量,且当H0已知时,有~.当给定的显著水平为α时,查标准正态分布表求得临界值,从而得到拒绝域.由样本观察值计算统计量u的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.2.t检验(1)单正态总体,方差未知,均值的检验设x1,x2,…,xn为正态总体N(μ,σ2)的一个样本,σ2未知,欲检验假设H0:μ=μ0,H1:μ≠μ0.其中,μ0为已知数.由于σ2未知,不能应用u检验.但是,由点估计知,s2是σ2的无偏估计,考虑用s2代替σ2,构造新的检验统计量.由§6.3定理可知,当H0为真时,t~t(n-1).当给定的显著水平为α时,查t分布表求得临界值,从而得到拒绝域.由样本观察值计算统计量t的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.例题2.P172【例8-2】车辆厂生产的螺杆直径服从正态分布N(μ,σ2),现从抽取5枝,测得直径(单位:毫米)为:22.3,21.5,22.0,21.8,21.4.如果σ2未知,试问直径均值μ=21是否成立?(α=0.05)【答疑编号12080102】(2)双正态总体,方差未知,均值差的检验设总体X~,Y~,x1,x2,…,xm和y1,y1,…,yn分别为X和Y的样本,且相互独立.①方差未知,但.欲检验H0:μ1=μ2,H1:μ1≠μ2.由§6.3定理的讨论可知,当H0为真时,构造如下检验统计量~.当给定的显著水平为α时,查t分布表求得临界值,从而得到拒绝域.由样本观察值计算统计量t的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.例题3.P172【例8-3】在漂白工艺中考察温度对针织品断裂强度的影响,现在700C与800C下分别作8次和6次试验,测得各自的断裂强度X和Y的观测值。经计算得,,,。根据以往的经验,可认为X和Y均服从正态分布,且方差相等,在给定α=0.10时,问700C与800C对断断裂强度有无显著差异。【答疑编号12080103】解:由题设,可假定X~N(μ1,σ2),Y~N(μ2,σ2)。于是若作统计假设为两个温度下的断裂强度无显著性差异,即相当于作假设H0:μ1=μ2,H1:μ1≠μ2.取(8.2.5)式定义的检验统计量t,由α=0.10,查t分布临界值表得,取(8.2.5)式算出t的观测值t=2.0737。由于,(2)方差未知,,但m=n(配对问题).欲检验H0:μ1=μ2,H1:μ1≠μ2.令Zi=Xi-Yi,i=1,2,…,n,由正态分布的可加性,Zi也服从正态分布总体的样本,则有E(Zi)=E(Xi-Yi)=μ1-μ2=d,,上式中所设的d,σ2均未知,但所设的假设等价于下述假设:H0:d=0,H1:d≠0.可构造检验统计量,其中,.在H0为真时,t~t(n-1).当给定的显著水平为α时,查t分布表求得临界值,从而得到拒绝域.由样本观察值计算统计量t的观察值,若此数值落入拒绝域W内,则作出拒绝H0的决策,否则,接受H0.例题4.P173【例8-4】有两台仪器A,B,用来测量某矿石的含铁量,为鉴定它们的测量结果有无显著的差异,挑选了8件试块(它们的成分、含勿量、均匀性等均各不相同),现在分别用这两台仪器对每一试块测量一次,得到8对观测值如表8-2所示。【答疑编号12080104】表8-2A4952.25560.263.476.686.548.7B49.34951.45761.168.879.350.1问能否认为这两台仪器的测量结果有显著性差异(α=0.05,假定A,B两种仪器的测量结果X,Y分别服从同方差的正态分布)?解:由题意X~N(μ1,σ2),Y~N(μ2,σ2),要检验假设:H0:μ1=μ2,H1:μ1≠μ2.下面有两种解法:解法1:作配对情况处理结论。视两种测量结果之差为来自一个正态总体,记Z=X-Y,得8对数据之差如表8-3所示。表8-3Z-0.33.23.63.22.37.87.2-1.4原检验问题化为:H0:d=0,H1:d≠0。由表8-3可求得:,,。由于2.832.365,因而否定H0,即认为这两种仪器的测量结果有显著差异。解法2:作不配对处理结论。视表8-2的两行结果分别来自两个正态总体,类似例8-3的解法,算得,,,。这时,可算得检验统计量观测值t为由α=0.05,查表可得临界值。由于0.5162.145,因而不否定H0,即认为这两台仪器的测量结果差异不显著。两种解法结论各不相同,究竟哪一种正确?仔细分析不难发现,配对解法消除了试块不同对数据分析的干扰,因为一对数据与另一对之间的差异是各种因素,如材料成分、铁的含量、均匀性等因素引起的,而同一对中两个数据的差异则可看成是仅由这两台仪器性能差异所引起的。因而这也表明不能将仪器A对8个试块的测量结果(表8-2中第一行)看成一个样本,也不能将第二行看成另一个样本,即不配对解法是错误的。§8.3正态总体方差的假设检验1.检验单正态总体,均值未知,方差的检验设x1,x2,…,xn为正态总体N(μ,σ2)的一个样本,μ未知,欲检验假设HO:,H1:,其中,为已知数.由点估计知,s2是σ2的无偏估计,即当HO为真时,s2应该在σ2附近波动,则应该在1附近波动;如果的值与1相比过大或过小,都应否定HO,因此构造检验统计量.由§6.3定理可知,当HO为真时,~.当给定的显著水平为α时,查分布表求得临界值与,从而得拒绝域.由样本观察值计算统计量的观察值,若此数值落入拒绝域W内,则作出拒绝HO的决策,否则,接受HO.2.F检验双正态总体,均值未知,方差是否相等的检验设总体X~,Y~,x1,x2,…,xm和y,y2,…,yn分别为X和Y的样本,且相互独立.欲检验假设:,:.由于和分别为和的无偏估计,当HO为真时,由§6.3定理的推论6-4可得到检验统计量,当HO为真时.当给定的显著水平为α时,查F分布表求得临界值与,从而得拒绝域.由样本观察值计算统计量F的观察值,若此数值落入拒绝域W内,则作出拒绝HO的决策,否则,接受HO.【例8-7】设甲、乙两台机床加工同一种轴,从这两台机床加工的轴中分别的取若干根,测得数据如下m=8,,;n=7,,.假定各台机床加工轴的直径X,Y分别服从正态分布,试比较甲、乙两台机床加工轴的精度有无显著差异(取α=0.05)。【答疑编号12080201】解:按题意,本题是要检验两正态总体的方差,是否相等,即要检验统计假设H0:,H1:。对给定的α=0.05,查附表5可得,,于是,而因而,故认为两正态总体之方差无显著差异。

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功