数理统计的基本概念

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第八章假设检验关键词:假设检验正态总体参数的假设检验拟合优度检验28.1假设检验统计推断的另一类重要问题是假设检验问题。它包括(1)已知总体分布的形式,需对其中的未知参数给出假设检验.—参数检验(2)总体的分布形式完全未知的情况下,对总体的分布或数字特征进行假设检验.—非参数检验例1设某种清漆的9个样品,其干燥时间(以小时计)分别为:6.05.75.56.57.05.85.26.15.0根据以往经验,干燥时间的总体服从正态分布N(6.0,0.36),现根据样本检验均值是否与以往有显著差异?(一)问题的提出例2一种摄影药品被其制造商声称其贮藏寿命是均值180天、标准差不多于10天的正态分布。某位使用者担心标准差可能超过10天。他随机选取12个样品并测试,得到样本标准差为14天。根据样本有充分证据证明标准差大于10天吗?5例3孟德尔遗传理论断言,当两个品种的豆杂交时,圆的和黄的、起皱的和黄的、圆的和绿的、起皱的和绿的豆的频数将以比例9:3:3:1发生。在检验这个理论时,孟德尔分别得到频数315、101、108、32、这些数据提供充分证据拒绝该理论吗?假设:1(HH0原假设零假设),备择假设(对立假设)关于总体参数的假设:010(HH0::,左边检验)010HH0::,(右边检验)010HH0::,(双边检验)(二)检验统计量和拒绝域对例1的统计分析~(XXN22设清漆的干燥时间为,由已知,),其中=0.36,考虑有关参数的假设:16.06.0HH0:,:(双边检验)6.0|XXX因样本均值是的无偏估计,的取值大小反映了的取值大小,当原假设成立时,|取值应偏小。00|6.0|6.0|XCHXCH检验规则:当时,拒绝原假设;当|时,接受原假设,C其中是待定的常数.100(,.nTTXXHHWW如果统计量,,)的取值大小和原假设是否成立有密切联系,可将之称为对应假设问题的,对应于拒绝原假设时,样本值的范围称为,记为其补集检验统称为计量拒绝域接受域1(6.0),(,,):|6.0|nXXWXXXC上述例子中,可取检验统计量为或拒绝域为C如何确定临界值?(三)两类错误由于样本的随机性,任一检验规则在应用时,都有可能发生错误的判断。第I类错误:拒绝真实的原假设(弃真)第II类错误:接受错误的原假设(取伪)原假设为真原假设不真根据样本拒绝原假设第I类错误正确根据样本接受原假设正确第II类错误0000{{{}II}}HPHPHPH拒绝|是犯第类错误的概率第误=的拒绝错真类1000II{I}I{{}}HPHHPHP犯第类错误的概率接第类错误=受|是假的接受00I){}{|6.0|6.0}|6.0|{6.0}//CPHHPXCXCPnn例1中,犯第类错误的概率(拒绝|是真的||06.06.0~(0,1),/XHNn由于当成立时,即时,因此C)22/Cn(00II){}{|6.0|}CPHHPXC犯第类错误的概率(接受|是假的|6.0{6.06.06.0}6.06.0{6.0}///PCXCCXCPnnn||6.06.0,6.0//CCnnI)II)CCCC显然,犯第类错误的概率(关于是单调减函数,而犯第类错误的概率(关于是单调增函数.))nCCC在给定的样本量下,不可能找界值,使得(和(都尽能小.犯两类错误的概率相互制约!I0,1II首先控制犯第类错误的概率不超过某个常数(),再寻找检验,使得犯第Neyman-Pears类错误的概率尽可on原则:能小.,0,0其中的常数称为常取显著水=0.01.平.05.1等.1710.05在例中,若取显著水平,则有C)220.05/Cn(0.025/1.960.6/30.392Czn计算得II)N0.392CCeymanPearsonC由于犯第类错误的概率(关于单调增函数,根据原则,应取19(,,):|6.0|0.392WXXX因此拒绝域为196.4,6.00.40.392,xx根据实际样本资料,得有样本落入拒绝域.0,.H我们有95%的把握拒绝原假设即认为油漆干燥时间与以往有显著差异20I=根据上述检验规则,犯第类错误的概率(0.392)=0.05II6.00.3926.00.3920.6/90.6/9犯第类错误的概率(0.392)=6.3925.608,6.00.20.2=II例如,当=5.4时,犯第类错误的概率6.3925.45.6085.40.20.2=4.961.041.00-0.85=0.15=()()P(四)值与统计显著性P当原假设成立时,检验统计量取比观察到的结果更为极端的数值:值的概率.006.0|6.0|6.46.0||20.2HHPXPPXP例1中值的计算:===2-2(2)=0.046|6.0|0.4X是小概率事件.作出拒绝原假设的判断.P用值计算,不仅简单,而且能知道概率大小。|6.0|XC两种检验方式比较:根据拒绝域的形式:,I){|6.0|}0.050.396,|6.46.0|0.396CPXCC方式一:由犯第类错误的概率(|=6.0确定由样本值计算得,,落在拒绝域内,拒绝原假设。{|6.0||6.46.0|}(2)0.0460.05PPX方式二:计算:=|=6.0=2-2拒绝原假设。0.025z10.0250.0250.025z0.0230.023PP若,等价于样本落在拒绝域内,因此,拒绝原假设,此时称检验结果在水平值与显著水下是平的关系:统计显著的.P若,等价于样本不落在拒绝域内,因此,不拒绝(接受)原假设,此时称检验结果在水平下是统计不显著.处理假设检验问题的基本步骤(2)提出检验统计量和拒绝域的形式;(1)根据实际问题提出原假设和备择假设;Neyman-Pearson(3)在给定的显著水平下,根据原则求出拒绝域的临界值。(4)根据实际样本观测值作出判断。/3P()计算检验统计量的观测值与值;/(4)根据给定的显著水平,作出判断.8.2单个正态总体参数的假设检验2122,,,,,,nXXXNXS设样本来自正态总体和分别为样本均值和方差显著性水平为29一有关均值的检验21已知时---Z检验0100:,:HH0,其双边中是已假设问题知的常数0.XZn由前一节讨论知,可取检验统计量为30~0,1.HZN0在为真时,0/2Neyman-Pearson|||XWZzn根据原则,检验的拒绝域为|31P值的计算100,,,Znxxxzn对给定的样本观察值记检验统计量的取值为,则有00000||||2||2(1(||)).HHPPZzPZzzP当小于显著水平时,拒绝原假设,否则,接受原假设.320100:,:HH0,其左边中是已假设问题知的常数00..XZnXZCn检验统计量仍取为拒绝域形式为330Neyman-PearsonXWZzn根据原则,可得检验的拒绝域为000I{}{}XPHHPCn0事实上,犯第类错误的概率拒绝|是真的|0{}XPCnn0|0()CnCz34P值的计算000000supsup{}HXxPPZzPnn0|010,,,nxxxzn对给定的样本观察值.000sup{}xXPnnn0|0000{}HXxPPZznn00||0().z0100:,:HH0,其双边中是已假设问题知的常数0/2|||XWZzn检验的拒绝域为|0100:,:HH0,其左边中是已假设问题知的常数0XWZzn检验的拒绝域为思考题:比较与你能写出右边假设问题检验的拒绝域吗?360100:,:HH0,其右边中是已假设问题知的常数0.XZn检验统计量仍取为370Neyman-PearsonXWZzn根据原则,可得拒绝域为38P值的计算000000sup|1().HPPZzPZzz010,,,nxxxzn对给定的样本观察值.390010:,:HH双边假设问题22t未知时---检验20Xn由于未知,故不能用来确定拒绝域.0SXTSn用的估计量代替,采用作检验统计量。400~1XtnSn当原假设成立时,02Neyman-Pea(1)rsonXTtnSn根据原则,可得拒绝域为2(1)tn1222(1)tn0.SnXk即检验拒绝域的形式为41P值的计算100,,,nxxTxtsn对给定的样本观察值记检验统计量的取值为,则有000||||2(1)||.HPPTtPtntP当时,拒绝原假设,否则,接受原假设.420100:,:HH0,其左边中是已假设问题知的常数0(1)XWTtnSn拒绝域为P值为000sup(1).PTtPtnt430100:,:HH0,其右边中是已假设问题知的常数0(1)XWTtnSn拒绝域为P值为000sup(1).PTtPtnt44例某种元件的寿命X(以小时记)服从正态分布均未知。现测得16只元件的寿命如下:159280101212224379179264222362168250149260485170问是否有理由认为元件的平均寿命大于225(小时)?(取显著性水平为0.05)2(,),N2,01:225:225.HH0解:按题意需检验,0(1).XTtnSn拒绝域为:0.0516,(15)1.7531.241.5,98.7259ntxs000.050.66851.7531(15).xttsn计算得:没有落在拒绝域内,故不能拒绝原假设,认为元件的平均寿命不大于225小时。00(15)0.66850.2570.05HExcelPPPTtPt由可计算值为因此接受原假设,即认为元件的平均寿命不大于判断结果与225小时。前面一致!问:若将原假设和备择假设互换,即考虑左边检验检验结果怎么样?请给出合理的解释。01:225:225.HH0,一般地,在有关参数的假设检验中,备择假设是我们根据样本资料希望得到支持的假设。49例3要求某种元件的平均使用寿命不得低于1000小时,生产者从一批这种元件中随机抽取25件,测得其平均寿命为950小时,标准差为100小时。已知这批元件的寿命服从正态分布。试在显著性水平0.05下确定这批元件是否合格?5001:1000:1000.HH0解:按题意需检验,0(1).XttnSn拒绝域为:0.0525,(24)1.7109.950,100ntxs00.052.51.7109(24).XttSn计算

1 / 134
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功