第六章假设检验和方差分析(一).

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第六章假设检验和方差分析(一)假设检验第一节假设检验的一般问题第二节一个正态总体的参数检验第三节两个正态总体的参数检验第四节非参数检验假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验第一节假设检验的一般问题一、假设检验和抽样估计的不同点二、假设检验的概念与思想三、假设检验(一个实例)四、假设检验的步骤五、假设检验中的两类错误一、假设检验和抽样估计的不同点抽样估计:通过样本的观察结果来推断总体参数的取值范围以及得到此结论的可靠程度。假设检验:预先对总体参数的取值作出假定,然后用样本数据来验证,从而作出是接受还是拒绝该假设的结论。二、假设检验的概念与思想对总体参数的一种看法总体参数包括总体均值、比例、方差等,分析之前必需陈述我认为该企业生产的零件的平均长度为4厘米!什么是假设?什么是假设检验?事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立。包括参数假设检验和非参数假设检验假设检验的基本思想...因此我们拒绝假设=50...如果这是总体的真实均值样本均值=50抽样分布H0这个值不像我们应该得到的样本均值...20在一次试验中,一个几乎不可能发生的事件发生的概率称为小概率。在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设。小概率原理总体假设检验的过程(提出假设→抽取样本→作出决策)抽取随机样本均值X=20我认为人口的平均年龄是50岁提出假设拒绝假设!别无选择.作出决策三、假设检验(实例)某地区水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响,因此可推测该地区儿童的智力水平可能低于一般水平。心理学家使用某一标准化智力检验方法,对该地区随机选取36名儿童进行智力测验,得到智力分数的平均值是94分,已知总体标准差为15分,问该地区儿童的智力水平是否和一般水平(100分)有明显差异?为真0H不应太大0ux)10(0,服从分布(因Nnux0000HknuxHknuxk时,就接受假设当时,就拒绝假设当,使得选定正数几种可能结果为真即为真拒绝0000HknuxPHHP2Zk根据分位点定义,知拒绝假设接受假设100:100:0100uuHuuH原假设备择假设四、假设检验的步骤1、提出原假设和备择假设2、确定适当的检验统计量3、规定显著性水平,查出临界值,确定拒绝域和接受域4、计算检验统计量的值5、作出统计决策提出原假设和备择假设什么是原假设?(NullHypothesis)1、陈述待检验的假设,又称“0假设”2、开始时总假设原假设是正确的3、总是有等号,或4、表示为H0H0:某一数值例如,H0:3190(克)5、原假设可能会被否决什么是备择假设?(AlternativeHypothesis)1、与原假设相反的假设2、总是有不等号,或3、表示为H1H1:某一数值,或某一数值例如,H1:3910(克),或3910(克)4、备择假设不一定会被接受提出原假设和备择假设什么检验统计量?1、用于假设检验问题的统计量2、选择统计量的方法与参数估计相同,需考虑是大样本还是小样本总体方差已知还是未知3、检验统计量的基本形式为确定适当的检验统计量nxz0规定显著性水平什么显著性水平?1、是一个概率值2、原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3、表示为(alpha)常用的值有0.01,0.05,0.104、由研究者事先确定双侧检验(显著性水平与拒绝域)抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平双侧检验(显著性水平与拒绝域)H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域抽样分布1-置信水平作出统计决策1、计算检验的统计量2、根据给定的显著性水平,查表得出相应的临界值Z或Z/23、将检验统计量的值与水平的临界值进行比较4、得出接受或拒绝原假设的结论五、假设检验中的两类错误(决策风险)1.第一类错误(弃真错误)原假设为真时拒绝原假设第一类错误的概率为被称为显著性水平2.第二类错误(取伪错误)原假设为假时接受原假设第二类错误的概率为(Beta)H0:无罪假设检验中的两类错误(决策结果)陪审团审判裁决实际情况无罪有罪无罪正确错误有罪错误正确H0检验决策实际情况H0为真H0为假接受H01-第二类错误()取伪拒绝H0第一类错误()弃真(1-)假设检验就好像一场审判过程统计检验过程错误和错误的关系你不能同时减少两类错误!和的关系就像翘翘板,小就大,大就小参数检验和非参数检验对定量数据进行检验有参数检验和非参数检验两种。参数方法:在检验过程中比较的是总体参数(最常见的是总体均数),这种检验方法需要事先对数据的分布做出假定,如t检验要求数据服从正态分布、方差相同等。非参数方法:(1)不依赖于总体分布。参数假设检验除了大样本情况下进行的参数假设检验外,其余都是假定总体服从某一分布的检验。(2)非参数假设检验适用于比较低的计量水准,如等级的、顺序的计量,如中位数计量。第二节一个正态总体的参数检验一、总体方差已知时的均值检验二、总体方差未知时的均值检验三、总体比例的假设检验一个总体的检验Z检验(单尾和双尾)t检验(单尾和双尾)Z检验(单尾和双尾)2检验(单尾和双尾)均值一个总体比例方差假设检验的步骤1、提出原假设和备择假设2、确定适当的检验统计量3、规定显著性水平,查出临界值,确定拒绝域和接受域4、计算检验统计量的值5、作出统计决策一、总体方差已知时的均值检验(双尾Z检验)(2已知)1、假定条件总体服从正态分布若不服从正态分布,可用正态分布来近似(n30)2、原假设为:H0:=0;备择假设为:H1:03.使用z-统计量)1,0(~0Nnxz均值的双尾Z检验(实例)例:某机床厂加工一种零件,根据经验知道,该厂加工零件的椭圆度近似服从正态分布,其总体均值为0=0.081mm,总体标准差为=0.025。今换一种新机床进行加工,抽取n=200个零件进行检验,得到的椭圆度为0.076mm。试问新机床加工零件的椭圆度的均值与以前有无显著差异?(=0.05)均值的双尾Z检验(计算结果)H0:u=0.081H1:u0.081α=0.05n=200临界值(s):检验统计量:Z01.96-1.96.025拒绝H0拒绝H0.025决策:结论:拒绝H0有证据表明新机床加工的零件的椭圆度与以前有显著差异83.2200025.0081.0076.00nxz二、总体方差未知的均值检验(双尾t检验)(2未知)1、假定条件总体为正态分布如果不是正态分布,只有轻微偏斜和大样本(n30)条件下2、使用t统计量)1(~0ntnsxt均值的双尾t检验(实例)例:厂采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克。某日随机抽查9包,测得样本平均重量为986克,样本标准差为24克。试问在0.05的显著性水平上,能否认为这天自动包装机工作正常?均值的双尾t检验(计算结果)H0:=1000H1:1000=0.05df=9-1=8临界值(s):检验统计量:在=0.05的水平上接受H0有证据表明这天自动包装机工作正常决策:结论:75.192410009860nsxtt02.306-2.306.025拒绝H0拒绝H0.025三、总体比例的假设检验适用的数据类型离散数据连续数据数值型数据数据品质数据一个总体比例的Z检验1、假定条件有两类结果总体服从二项分布可用正态分布来近似2、比例检验的z统计量P0为假设的总体比例)1,0(~)1(ˆ000Nnppppz一个总体比例的Z检验(实例)例:某研究者估计本市居民家庭的电脑拥有率为30%。现随机抽查了200的家庭,其中68个家庭拥有电脑。试问研究者的估计是否可信?(=0.05)一个样本比例的Z检验(结果)H0:p=0.3H1:p0.3=0.05n=200临界值(s):检验统计量:在=0.05的水平上接受H0有证据表明研究者的估计可信决策:结论:234.12007.03.03.034.0)1(ˆ000nppppzZ01.96-1.96.025拒绝H0拒绝H0.025一、二个独立样本的均值检验(一)Z检验(12、22已知)(二)t检验(12、22未知,但相等)检验两个不相关的样本是否来自具有相同均值的总体:(1)购买某产品的顾客与不购买某产品的顾客平均收入是否相同?(2)男女在成就、智商和其他性格方面的均值差异;(3)检验两地的平均房价是否有差异?(4)检验两种品牌的灯泡的寿命均值是否有差异?二、二个相关(配对或匹配)样本的均值检验检验两个相关的样本是否来自具有相同均值的总体,如,测度员工在技术培训前后某项技能的成绩,要求比较培训前后成绩均值是否有显著差异?比较公司去年和今年的经营绩效是否有显著差异?第三节二个正态总体的参数检验一、两个独立样本均值之差的抽样分布11总体122总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X212抽样分布两个独立样本均值之差的检验(一)两个总体均值之差的Z检验(12、22已知)(二)两个总体均值之差的Z检验(12、22未知,大样本)(三)两个总体均值之差的t检验(12、22未知,小样本))1,0(~)()(2221212121Nnnxxz)1,0(~)()(2221212121NnSnSxxz21212111)()(nnsxxtp其中:2)1()1(212222112nnsnsnSp(一)两个总体均值之差的Z检验(12、22已知)1、假定条件两个样本是独立的随机样本两个总体都是正态分布若不是正态分布,可以用正态分布来近似(n130和n230)2、原假设:H0:12=0;备择假设:H1:1203.检验统计量为)1,0(~)()(2221212121Nnnxxz两个总体均值之差的Z检验(例子)例:有两种方法可用于制造某种以抗拉强度为重要特征的产品。根据以往的资料得知,第一种方法生产出的产品其抗拉强度的标准差为8公斤,第二种方法的标准差为10公斤。从两种方法生产的产品中各抽取一个随机样本,样本容量分别为n1=32,n2=40,测得x2=50公斤,x1=40公斤。问这两种方法生产的产品平均抗拉强度是否有显著差别?(=0.05)两个总体均值之差的Z检验(计算结果)H0:1-2=0H1:1-20=0.05n1=32,n2=40临界值(s):检验统计量:决策:结论:拒绝H0有证据表明两种方法生产的产品其抗拉强度有显著差异83.240100326404050)()(2221212121nnxxzZ01.96-1.96.025拒绝H0拒绝H0.025例:某大学欲比较大学毕业后留校工作与分配到其他岗位的人工资水平的差别,因为工资还与工龄等其他因素有关,因此抽选大学毕业后满10年在校工作的教师50人,另外抽选大学毕业后满10年在机关、企业工作的人员进行比较,取得的数据如下。试比较大学毕业后留校当教师与分配在机关企业等工作人员的工资水平是否有差异?(α=0.05)大学教师机关、企业工作人员243523700501

1 / 73
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功