第5章假设检验(统计学-袁卫等)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

5-1统计学(第三版)第5章假设检验§5.1假设检验的基本原理§5.2一个总体参数的检验§5.3两个总体参数的检验参考:贾俊平《统计学》(第二版)“第8章假设检验”5-2统计学(第三版)学习目标1.了解假设检验的基本思想2.掌握假设检验的步骤3.一个总体参数的假设检验(部分)4.两个总体参数的假设检验(暂不要求)5.利用P-值进行假设检验5-3统计学(第三版)假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验5-4统计学(第三版)§5.1假设检验的基本原理一.什么是假设和假设检验?二.假设检验的步骤三.假设检验中的两类错误四.双侧检验和单侧检验五.假设检验中的P值5-5统计学(第三版)什么是假设?假设(hypothesis):是指对总体参数的数值(或总体的分布形式)所作的一种陈述。总体参数包括总体均值、比率、方差等我认为该地区新生婴儿的平均体重为3190克!5-6统计学(第三版)什么是假设检验?•假设检验(hypothesistesting):事先对总体参数(或分布形式)作出某种假设,然后利用样本信息来判断假设是否成立。有参数假设检验和非参数假设检验两种•假设检验采用逻辑上的反证法,依据统计上的“小概率事件原理”。也有人称之为“概率性质的反证法”。5-7统计学(第三版)小概率事件原理什么小概率?1.小概率:在一次试验中,几乎不可能发生的事件发生的概率。•小概率通常由研究者事先确定,如=0.01。2.小概率事件原理:在一次试验中,小概率事件几乎不可能发生。3.在一次试验中,小概率事件一旦发生,我们就认为出现了不合理的结果(因为违背了“小概率事件原理”)。5-8统计学(第三版)总体假设检验的过程抽取随机样本均值X=20我认为人口的平均年龄是50岁提出假设小概率事件发生,拒绝假设!作出决策5-9统计学(第三版)假设检验的步骤:1.提出假设(包括原假设和备择假设)2.确定适当的检验统计量3.规定显著性水平4.根据样本数据计算检验统计量的值5.作出检验结论5-10统计学(第三版)1.提出原假设和备择假设什么是原假设?(nullhypothesis)①原假设:是待检验的假设,又称“0假设”,通常是研究者想收集证据予以反对的假设。②在原假设中总是含有等号:,或③原假设表示为H0H0:某一数值0也可以是:H0:(或)某一数值0例如,H0:3190(克)5-11统计学(第三版)什么是备择假设?(alternativehypothesis)①备择假设:是与原假设对立的假设,也称“研究假设”,通常是研究者想收集证据予以支持的假设。②在备择假设中总是含有不等号:,或③备择假设表示为H1H1:某一数值0也可以是:H1:(或)某一数值0例如,H1:3910(克)1.提出原假设和备择假设5-12统计学(第三版)什么是检验统计量?(1)检验统计量:用于对原假设和备择假设作出决策的某个样本统计量。(2)检验统计量实际上是总体参数的点估计量,但点估计量并不能直接作为检验统计量。只有将其标准化之后,才能用于度量它与原假设的参数值之间的差异程度。2.确定适当的检验统计量点估计量假设值标准化的检验统计量点估计量的标准误差5-13统计学(第三版)(3)选择检验统计量时,还需考虑:总体方差已知,还是未知大样本,还是小样本(4)检验统计量的基本形式(总体均值检验):0()XZsn大样本2.确定适当的检验统计量nXZ00()Xtsn小样本5-14统计学(第三版)3.规定显著性水平什么显著性水平?(significantlevel)•显著性水平:是一个概率值,是原假设为真时,拒绝原假设的概率。•显著性水平通常表示为。常用的值有0.01,0.05,0.10•显著性水平由研究者事先确定。•那么,显著性水平在假设检验中有什么作用呢?5-15统计学(第三版)3.规定显著性水平•根据给定的显著性水平,结合检验统计量的抽样分布,可以查表得到相应的临界值z或z/2,t或t/2,并构造检验的拒绝域。拒绝域:在检验统计量的分布密度曲线下由临界值划定的尾部。检验统计量的值落入拒绝域的概率刚好是显著性水平,所以,拒绝域实际上界定了一个小概率事件。5-16统计学(第三版)4.作出检验结论①根据样本数据计算检验统计量的值②将检验统计量的值与临界值进行比较【检验统计量是否落入了拒绝域】③得出拒绝或不拒绝原假设的结论5-17统计学(第三版)假设检验中的两类错误•在进行假设检验时,可能犯两类错误:1.第一类错误(弃真错误)原假设为真时拒绝原假设发生第一类错误的概率为,也就是显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设发生第二类错误的概率为5-18统计学(第三版)a)双尾检验(=0.1)b)单尾检验(=0.05)图犯第一类错误的概率例如,在原假设H0:=150正确时犯第一类错误的概率:-1.64501.645-1.6450H0:=150H0:=150φ(z)φ(z)拒绝域拒绝域接受域接受域拒绝域0.050.050.05zz5-19统计学(第三版)在原假设H0:=150不正确,真实情况是=149.7时,犯第二类错误的概率(双尾检验,=0.1):-1.64501.645-3.4接受域φ(z)φ(z)7.149150z图犯第二类错误的概率5-20统计学(第三版)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H0正确决策(1–)第二类错误()拒绝H0第一类错误()正确决策(1-)假设检验就好像一场审判过程统计检验过程5-21统计学(第三版)和的大小关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小5-22统计学(第三版)βαβα接受域拒绝域拒绝域接受域φ(z)φ(z)H0H0H1H1zz图n固定时α和β的大小关系(以单尾检验为例)5-23统计学(第三版)双侧检验和单侧检验5-24统计学(第三版)双侧检验和单侧检验•双侧检验:是指把拒绝域放在检验统计量分布密度曲线的两个尾部的假设检验,也叫双尾检验。•单侧检验:是指把拒绝域放在检验统计量分布密度曲线的一个尾部的假设检验,也叫单尾检验。包括:左侧检验(左单尾检验)和右侧检验(右单尾检验)5-25统计学(第三版)双侧检验与单侧检验(对应的假设形式)假设研究的问题双侧检验左侧检验右侧检验H0=000H1≠000•可见,决定采用双侧检验还是单侧检验(以及左侧还是右侧),取决于备择假设的形式。5-26统计学(第三版)•备择假设的不同表述(从而,拒绝域的不同安排方法)的适用场合可归纳如下:(1)如果在θ=θ0之外,没有特别的理由作出到底是θθ0还是θθ0的判断,应采用双尾检验。如果事先已确知,在θ=θ0被拒绝后剩下的只有θθ0(或θθ0)一种可能性,应采用左单尾(或右单尾)检验。双侧检验与单侧检验(对应的假设形式)5-27统计学(第三版)(2)如果在θ=θ0被拒绝后,不论出现θθ0还是出现θθ0,我们都会采取相同的行动,应采用双尾检验。如果在θ=θ0被拒绝后,我们对θθ0和θθ0这两种情况会采取不同的行动,应采用单尾检验,其中,和θ=θ0采用同样行动的一种情况与θ=θ0一起设作原假设,对立的另一种情况作备择假设,以便把显著性检验的两种决策域同检验者的两种不同质的工作行为统一起来。双侧检验与单侧检验(对应的假设形式)5-28统计学(第三版)双侧检验(原假设与备择假设的确定)•例如,某种零件的尺寸,要求其平均长度为10cm,大于或小于10cm均属于不合格。我们想要证明(检验)大于或小于这两种可能性中的任何一种是否成立建立的原假设与备择假设应为H0:10H1:105-29统计学(第三版)双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域1-置信水平5-30统计学(第三版)H0值临界值临界值/2/2样本统计量拒绝域拒绝域抽样分布1-置信水平观察到的检验统计量双侧检验(显著性水平与拒绝域)5-31统计学(第三版)H0值临界值临界值/2/2样本统计量拒绝域拒绝域抽样分布1-置信水平观察到的检验统计量双侧检验(显著性水平与拒绝域)5-32统计学(第三版)H0值临界值临界值/2/2样本统计量拒绝域拒绝域抽样分布1-置信水平观察到的检验统计量双侧检验(显著性水平与拒绝域)5-33统计学(第三版)单侧检验(原假设与备择假设的确定)例如,一项研究表明,采用新技术生产后,将会使产品的使用寿命明显延长到1500小时以上。检验这一结论是否成立。研究者总是想证明自己的研究结论(寿命延长)是正确的备择假设的方向为“”(寿命延长)建立的原假设与备择假设应为H0:1500H1:15005-34统计学(第三版)单侧检验(原假设与备择假设的确定)又如,一项研究表明,改进生产工艺后,会使产品的废品率降低到2%以下。检验这一结论是否成立。研究者总是想证明自己的研究结论(废品率降低)是正确的备择假设的方向为“”(废品率降低)建立的原假设与备择假设应为H0:2%H1:2%5-35统计学(第三版)单侧检验(原假设与备择假设的确定)再如,某灯泡制造商声称,该企业所生产的灯泡的平均使用寿命在1000小时以上。如果你准备进一批货,怎样进行检验。检验权在销售商一方作为销售商,你总是想收集证据证明生产商的说法(寿命在1000小时以上)是不是正确的备择假设的方向为“”(寿命不足1000小时)建立的原假设与备择假设应为H0:1000H1:10005-36统计学(第三版)单侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平5-37统计学(第三版)左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平观察到的检验统计量5-38统计学(第三版)左侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平观察到的检验统计量5-39统计学(第三版)右侧检验(显著性水平与拒绝域)H0值临界值样本统计量拒绝域抽样分布1-置信水平观察到的检验统计量5-40统计学(第三版)右侧检验(显著性水平与拒绝域)H0值临界值样本统计量抽样分布1-置信水平拒绝域观察到的检验统计量5-41统计学(第三版)课堂练习•P179,第1题•P179,第2题•P180,第3题5-42统计学(第三版)假设检验中的P值5-43统计学(第三版)什么是P值?1.P-值(P-value):是当原假设为真时,抽样结果出现比检验统计量的值更极端的值(落入检验统计量的值所截取的尾部)的概率。左侧检验时,P-值为抽样分布密度曲线左尾部小于等于检验统计量的值的面积右侧检验时,P-值为抽样分布密度曲线右尾部大于等于检验统计量的值的面积2.由于P-值是当原假设为真时,实际犯第一类错误的概率,所以也被称为观察到的显著性水平。5-44统计学(第三版)双侧检验的P值/2/2Z拒绝拒绝H0值临界值计算出的检验统计量计算出的检验统计量临界值1/2P值1/2P值5-45统计学(第三版)左侧检验的P值H0值临界值样本统计量拒绝域抽样分布1-置信水平计算出的检验统计量P值5-46统计学(第三版)右侧检验的P值H0值临界值拒绝域抽样分布1-置信水平计算出的检验统计量P值5-47统计学(第三版)利用P值进行检验(决策准则)•通常,单侧检验时,P值位于抽样分布的一侧;而双侧检验时,P值位于抽样分布的两侧,每一侧的P值为1/2。•因此,不论是单侧检验还是双侧检验,用P值进行检验决策的准则都是:若p值,不拒绝H0若p值,拒绝H05-48统计学(第三版)§5.2一个总体参数的检验一

1 / 73
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功