六-假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章统计推断第一节参数估计第二节假设检验第三节假设检验中的两个问题本章小节主要内容第四章统计推断第一节参数估计•一、点估计•设总体的分布函数的形式已知,但它含有一个或多个未知参数,借助于总体的一个样本来估计总体未知参数的值的问题称为参数的点估计问题。•常用的构造估计量的方法:矩估计法和最大似然估计法。X第四章统计推断二、估计量的评选标准•(一)无偏性•设为参数的点估计量,若则称为参数的无偏估计量。ˆ)ˆ(Eˆ第四章统计推断(二)有效性•设和是的无偏估计量,若对于的变化范围内的任意一个值,都有且至少有一个使得不等号成立,则称较有效。1ˆ2ˆ)ˆ()ˆ(21DD1ˆ2ˆ第四章统计推断(三)相合性•无偏性与有效性都是基于样本容量n固定的前提下提出的,我们希望随着样本容量的增大,一个估计量的值趋向于待估参数的真值。•设为参数的一个估计量,若对于其变化范围内的任意一个,当时,依概率收敛于,则称为的相合估计量。ˆnˆˆ第四章统计推断三、区间估计定义设总体的分布函数中含有未知参数对于给定的,有两个样本统计量,使得则称随机区间是的置信度为的置信区间,分别称为置信度为的双侧置信区间的置信下限和置信上限。X),(xF,101}{P),(1,1第四章统计推断三、区间估计含义如下:若反复抽样多次(各次得到的样本容量相等,都是n)。由每个样本值确定一个区间),(,则每个这样的区间要么包含的真值,要么不包含的真值,如图所示。按贝努利大数定理,在这样多的区间中,包含真值的约占)%1(100,不包含真值的约占%100。例如,若01.0,反复抽样1000次,则得到的1000个区间中不包含真值的约为10个。第四章统计推断例题例4.1.9设总体),,(~2NX2为已知,为未知,设nXXX,,,21是来自X的样本,求的置信度为1的置信区间。解:因),(~2nNX,则)1,0(~/NnX即nX/所服从的分布)1,0(N不依赖于任何未知参数。由标准正态分布的上分位点的定义,有1/2<znXP第四章统计推断例题122znX<<znXP这样,我们就得到了的一个置信度为1的置信区间22,znXznX简写成2znX第四章统计推断确定未知参数置信区间的一般步骤(1)构造一个样本的函数W它包含待估未知参数,而不含其它未知参数,并且W的分布已知且不依赖于任何未知参数;(2)对于给定的置信度,定出两个常数a,b,使得(3)若能由上式得到等价的不等式,其中,都是统计量,那么就是的一个置信度为的置信区间11}{bWaP,),(1第四章统计推断正态总体参数的置信区间1.单个正态总体的情况•(1)的置信区间①已知时,②未知时,•(2)方差的置信区间(仅以未知为例)),(2N2),(2/2/znXznX2))1(),1((2/2/ntnSXntnSX2))1()1(,)1()1((22/1222/2nSnnSn第四章统计推断•例3现从某天生产的洗衣粉中随机地取16袋,称得重量(以克计)如下表所示。设洗衣粉的重量近似地服从正态分布,试求总体均值的置信度为0.95的置信区间。解这里,总体的方差未知,故总体均值的置信区间为:而,经过计算得,又查表得,故所求的置信区间为(500.4,507.1)。506508499503504510497512514505493496506502509496))1(),1((2/2/ntnSXntnSX,2022.6,75.503sx1315.215)(025.0t第四章统计推断2.两个正态总体的情况•实际中存在这样的问题:已知产品的某一指标服从正态分布,但由于原料、设备条件、操作人员不同,或工艺过程的改变等因素的影响,而引起总体均值、方差的改变。我们要考察这些变化的大小,这就涉及两个正态总体均值差或方差比的估计问题。•设有两个正态总体,样本均值和方差分别为),(),,(222211NN2221,,,SSYX第四章统计推断(1)两个总体均值差的置信区间•①均已知,的置信区间•未知但相等,的置信区间21,),(2221212/2221212/nnzYXnnzYX21,2121)11)2(,11)2((21212/21212/nnSnntYXnnSnntYXww第四章统计推断例4为提高某一化学生产过程的得率,拟采用一种新的催化剂。为此,先进行试验。设采用原来的催化剂进行了次试验,得到得率的平均值和样本方差分别为;又采用新的催化剂进行了次试验,得到得率的均值和样本方差分别为。假设两总体都服从正态分布,方差相等,两样本独立。试求两总体均值差的置信度为0.95的置信区间。解由题意,可得,则的置信度为0.95的置信区间为即(-4.15,0.11)81n82n89.373.9121,sx02.4,2275.93sy2196.3ws21))14(,)((8181818114025.0025.0wwstyxstyx第四章统计推断(2)两个总体方差比的置信区间•这里仅讨论未知的情形•对于给定的置信度,的置信区间为21,))1,1(1,)1,1(1(212/12221212/2221nnFSSnnFSS12221第四章统计推断四、大样本下总体均值、比率的区间估计•(一)总体均值的区间估计这里的大样本,是指样本的容量不小于30•1.总体方差已知时总体均值的置信区间•2.总体方差未知时总体均值的置信区间2),(2/2/nzXnzX),(2/2/nSzXnSzX2第四章统计推断•例5某保险公司有36个投保人的年龄资料如表表所示所示。•试求投保人平均年龄的置信度为95%的置信区间。233642343934354253284939394645393845274354363438363147444845443324405032第四章统计推断•解这里总体的方差未知,但为大样本情形。查标准正态分布表得,再由上表数据,得,由此,可以得到投保人平均年龄的置信度为95%的置信区间为,即(39.96,42.04)96.1025.0z77.75.39,sx),(2/2/nszxnszx第四章统计推断(二)总体比率的区间估计•由样本比率的抽样分布可以知,当样本容量足够大时(一般指不小于30,且都大于5),•样本比率的抽样分布近似正态分布。设总体比率为,则有•对于置信度,P的置信区间为n)1(,pnnppP))1(,(~nPPPNp近似1))1(,)1((2/2/nppzpnppzp第四章统计推断•例6某公司要估计某天生产的某型号的全部产品的合格率。为此随机抽取了100件产品,经检验其中有94件为合格品。对于置信度95%,试求该天此型号产品合格率的区间估计。解由题意,易得样本合格率,从而得全部产品合格率置信度为95%的置信区间为即(89.35%,98.65%)%94p))1(,)1((2/2/nppzpnppzp第四章统计推断(三)两个总体均值差的区间估计•对于给定的置信度,的置信区间•这里,为来自与两个总体的样本均值;•为样本的方差。121),(2221212/2221212/nSnSzYXnSnSzYXYX,2221,SS第四章统计推断•例7为了评估甲乙两种方法包装某产品所需要的时间,在不同的方法下独立地抽取两个随机样本,经整理计算得到下列资料。试在置信度95%下,给出这两种方法下包装某产品平均时间之差的置信区间。解由公式得到这两种方法下包装某产品平均时间之差的置信度为95%的置信区间为(3.86,10.14)甲方法乙方法1.6834111sxn3.7763211sxn),(2221212/2221212/nSnSzYXnSnSzYX第四章统计推断•例1现从某天生产的洗衣粉中随机地取16袋,称得重量(以克计)如下表所示。设洗衣粉的重量近似地服从正态分布,试求总体均值的置信度为0.95的置信区间。506508499503504510497512514505493496506502509496第四章统计推断•现从某天生产的洗衣粉中随机地取16袋,称得重量(以克计)如下表所示。设洗衣粉的重量近似地服从正态分布,试求总体均值的置信度为0.95的置信区间。解这里,总体的方差未知,故总体均值的置信区间为:而,经过计算得,又查表得,故所求的置信区间为(500.4,507.1)。506508499503504510497512514505493496506502509496))1(),1((2/2/ntnSXntnSX,2022.6,75.503sx1315.215)(025.0t第四章统计推断•例2某公司要估计某天生产的某型号的全部产品的合格率。为此随机抽取了100件产品,经检验其中有94件为合格品。对于置信度95%,试求该天此型号产品合格率的区间估计。第四章统计推断•例2某公司要估计某天生产的某型号的全部产品的合格率。为此随机抽取了100件产品,经检验其中有94件为合格品。对于置信度95%,试求该天此型号产品合格率的区间估计。解由题意,易得样本合格率,从而得全部产品合格率置信度为95%的置信区间为即(89.35%,98.65%)%94p))1(,)1((2/2/nppzpnppzp第四章统计推断统计推断•超越实际数据。•是一个过程,它能从样本数据得出与总体参数值有关的结论。•由两部分构成:估计和假设检验。•估计包括参数估计和非参数估计。第四章统计推断第二节假设检验•一、参数假设检验••在总体的分布函数已知,但参数未知时,如对总体分布中的未知参数提出假设,则如何利用样本提供的信息来检验这个假设,即接受此假设还是拒绝此假设。这类统计问题我们称之为参数的假设检验问题。参数估计和参数检验是利用样本对总体的统计特性提供的信息,建立样本的函数,即估计量或检验统计量,是从不同角度处理总体未知参数的两种统计方法。第四章统计推断第四章统计推断(一)假设检验的基本思想•设总体为,建立假设•这里表示原假设,表示备择假设。•假设检验问题,就是要建立一个合理的法则,根据这一法则,利用已知样本作出接受原假设(即拒绝备择假设),还是拒绝原假设(即接受备择假设)的决策。),(2N0100:;:HH0H1H第四章统计推断(二)判断“假设”的依据•实际推断原理:概率很小的事件在一次试验中几乎是不会发生的。•如果原假设为真,则由一次抽样计算而得的样本观测值,满足不等式此事件几乎是不会发生的。现在在一次观测中竟然出现了满足上述不等式的样本均值,则我们有理由怀疑原来的假设的正确性,因而拒绝原假设。若出现的观测值不满足上述不等式,此时没有足够的理由拒绝,因此只能接受原假设。2/0/znx第四章统计推断(三)两类错误•在使用任何一个检验法(相当于确定一个拒绝域)时,由于抽样的随机性,作出的判断总可能会犯两类错误:一是假设实际上为真时,我们却作出拒绝的错误决策,称这类“弃真”的错误为第一类错误;•二是当实际上不真时,我们却接受了,称这类“取伪”的错误为第二类错误。我们这里讨论的检验问题中的显著性水平控制了犯第一类错误的概率。这种只对犯第一类错误的概率加以控制,而不考虑犯第二类错误的检验问题,称为显著性检验问题。第四章统计推断参数假设检验问题的步骤:•第一步:根据实际问题的要求,提出原假设和备择假设;•第二步:给定显著性水平以及样本

1 / 49
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功