第4章-假设检验---非参数假设检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

4.2参数假设检验假设检验一个正态总体均值的假设检验s未知1、s已知2、大样本3、小样本两个正态总体均值差的假设检验总体方差的假设检验__01、/2、/3、1/xZnXZsnxttnsns假设检验5、配对样本独立样本两个正态总体均值差的假设检验1、已知2、未知,大样本未知s,小样本3、4、、、__1212221212__1212221212__22121221122121222212__12121222222121212121()1()2()(1)(1)3211()4=、、、,、,自由度:ssppxxZnnxxZssnnxxnsnstsnnsnnssxxnntfssssnnnnn22_5/、ddndtsn假设检验的内容假设检验总体均值的假设检验总体方差的假设检验两个总体方差比单一总体两个总体均值差的假设检验2222122112、、snssFs4.3非参数假设检验*4.3.1符号检验法:通过两个相关样本的每对数据之差的符号进行检验,比较两个样本的显著性–配对资料的符号检验–样本中位数与总体中位数比较的符号检验*4.3.2秩和检验法:一种用样本秩来代替样本值的检验法,可用于检验两个总体的分布函数是否相等的问题–配对试验资料符号秩和检验–非配对试验资料符号秩和检验4.3.3非参数假设检验。–卡方检验–柯尔莫哥洛夫-斯米诺夫检验配对资料的符号检验•提出原假设与备择假设–H0:/•计算差值并赋予符号–d>0,记为“+”,“+”个数记为n+–d<0,记为“-”,“-”个数记为n-–d=0,记为“0”,“0”个数记为n0–统计量K=min{n+,n-}•统计推断–令n=n++n-–K>K0.05(n),P>0.05,不能否定H0,两个处理差异不显著–K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著–K≤K0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著•某数据分析公司研究加薪对数据分析员工作准确度的影响。结果如下表所示,问加薪对工作精确度有没有影响K0.05(15)=3,K0.05(10)=1?No123456789101112131415加薪前0.050.060.070.050.040.020.080.010.050.020.030.020.060.070.05加薪后0.040.060.060.050.030.020.070.010.040.030.020.020.050.080.06差值0.0100.0100.0100.0100.01-0.010.0100.01-0.01-0.01符号+0+0+0+0+-+0+--•提出原假设与备择假设–H0:样本所在的中位数=已知总体的中位数–H1:样本所在的中位数≠已知总体的中位数–进行单尾检验,把“≠”换成“<”或者“>”•计算差值,确定符号及其个数–样本各观测值中大于已知总体中位数的,记为“+”,“+”个数记为n+–样本各观测值中小于已知总体中位数的,记为“-”,“-”个数记为n-–样本各观测值中等于已知总体中位数的,记为“0”,“0”个数记为n0–统计量K=min{n+,n-}样本与总体中位数比较的符号检验•统计推断–令n=n++n-–K>K0.05(n),P>0.05,不能否定H0,样本中位数与已知总体中位数差异不显著–K0.01(n)<K≤K0.05(n),0.01<P≤0.05,否定H0,接受H1,样本中位数与已知总体中位数差异差异显著–K≤K0.01(n),P≤0.01,否定H0,接受H1,样本中位数与已知总体中位数差异差异极显著配对试验资料符号秩和检验•提出原假设与备择假设–H0:差值d总体中位数=0–H1:差值d总体中位数≠0–进行单尾检验,把“≠”换成“<”或者“>”•编秩次,定符号–求配对数据的差值d–按d的绝对值从小到大编秩次–根据原差值正负,在各秩次前标正负号–d=0,舍去不记–d的绝对值相等,取其平均秩次•确定统计量T–T为正秩次及负秩次和中绝对值较小者•统计推断–令正负差值的总个数为n–T>T0.05(n),P>0.05,不能否定H0,两个处理差异不显著–T0.01(n)<T≤T0.05(n),0.01<P≤0.05,否定H0,接受H1,两个处理差异显著–T≤T0.01(n),P≤0.01,否定H0,接受H1,两个处理差异极显著非配对试验资料符号秩和检验•提出原假设与备择假设–H0:甲样本所在的总体中位数=乙样本所在的总体中位数–H1:甲样本所在的总体中位数≠乙样本所在的总体中位数–进行单尾检验,把“≠”换成“<”或者“>”•求两个样本合并数据的秩次–两个样本的含量为n1和n2,合并后为n1+n2–合并后的数据按从小到大的顺序排列,序号即为数据的秩次–不同样本的观测值相同,取原秩次的平均秩次–同一样本的观测值相同,不必改动•确定统计量T–秩和较小的样本含量记为n1,秩和为T统计量•统计推断–T在T0.05(n1)-T0.05(n2–n1)之内,P>0.05,不能否定H0,两个处理差异不显著–T在T0.05(n1)-T0.05(n2–n1)之内外,在T0.01(n1)-T0.01(n2–n1)之内,0.01<P≤0.05,否定H0,接受H1,两个处理差异差异显著–T在T0.01(n1)-T0.01(n2–n1)之外,P≤0.01,否定H0,接受H1,两个处理差异差异极显著卡方分布拟合检验χ2检验的原理与方法χ2检验的基本原理χ2检验统计量的基本形式χ2检验的基本步骤χ2检验的注意事项χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时,χ2值就为0,表明理论值完全符合。性别观察值(O)理论值(E)O-E公母428448438438-10+10合计8768760876只羔羊性别调察要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度。判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。性别观察值(O)理论值(E)O-E公母428448438438-10+10合计876876羔羊性别观察值与理论值由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。0为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2的比重,最后将各组求和,这个总和就是χ2。羔羊性别观测值与理论值性别观测值(O)理论值(E)O-E(O-E)2/E公母428448438438-10+100.22830.2283合计87687600.4566χ2=∑(Oi-Ei)2Eiχ2值就等于各组观测值和理论值差的平方与理论值之比,再求其和。皮尔逊证明了这个样本统计量服从自由度为k-1的卡方分布。在用卡方时,若分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.(注意,估计了几个参数,就要在相应的卡方估计量的自由度上减去相应的个数)在使用卡方检验时要注意两点:n要足够大,以及npi不太小这两个条件.根据计算实践,要求n不小于50,以及npi都不小于5.否则应适当合并区间,使npi满足这个要求.例题1:自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次,统计如下:(X表示相继两次地震间隔天数,Y表示出现的频数)86681017263150403935343029252420191514109540YX试检验相继两次地震间隔天数X服从指数分布.0.05)(解所求问题为:在水平0.05下检验假设的概率密度:0XH.0,0,0,e1)(xxxfx.,0故先估计未具体给出中参数由于在H由最大似然估计法得,77.131622231ˆxX为连续型随机变量,.9,,2,1),,[9),[01iaakXii的子区间个互不重叠分为可能取值区间将(见下页表)𝑓𝑖−𝑛𝑝𝑖(𝑓𝑖−𝑛𝑝𝑖)2𝑛𝑝𝑖503126171086680.27880.21960.15270.10620.07390.05140.03580.02480.056845.165635.575224.737417.204411.97188.32685.79964.01769.20164.8344-4.57521.2626-0.2044-1.9718-0.32680.20041.9824-1.20160.5174607080.5884002070.0644432620.0024284110.3247627960.0128258440.0069246430.9781734770.156912125.40:1xA5.95.4:2xA5.145.9:3xA5.195.14:4xA5.245.19:5xA5.295.24:6xA5.345.29:7xA5.395.34:8xAxA5.39:9iAifipˆipnˆ拟合检验计算表2在H0为真的前提下,X的分布函数的估计为.0,00,1)(ˆ77.13xxexFx有估计概率)(iiAPp)(ˆˆiiAPp}{ˆ1iiaXaP),(ˆ)(ˆ1iiaFaF)(ˆˆ22APp如ˆ{4.59.5}PX)5.4(ˆ)5.9(ˆFF,2196.00.0522(1)(7)14.0672.6523,kr故在水平0.05下接受H0,认为样本服从指数分布.22.6523,9,1,kr例2:医学家研究心脏病人猝死人数与日期的关系时发现,一周之中星期一心脏病人猝死者较多,其他日子基本相同。每天的比例近似为2.8:1:1:1:1:1:1.现在收集到168个观察数据,其中星期一至星期日的死亡人数分别为:55,23,18,11,26,20,15。现在利用这批数据,推断心脏病人猝死人数与日期的关系是否成立?解:该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期分布相同,可以使用卡方检验进行处理,过程如下:(1)建立零假设和备择假设零假设:每天心脏病猝死人数分布同预期分布相同备择假设:每天心脏病猝死人数分布同预期分布不同(2)构造和计算统计量日期实际频数if期望频率inp差值if-inp(if-inp)2iiinpnpf2)(周一5553.51.52.250.04205607周二2319.13.915.210.79633508周三1819.1-1.11.210.06335079周四1119.1-8.165.613.43507853周五2619.16.947.612.49267016周六2019.10.90.810.04240838周日1519.1-4.116.810.88010471合计1681687.752inp怎么计算得到的呢?23.2卡方检验的例题(3)设定显著性水平和确定否定域给定显著性水平0.05,在原假设成立时,统计量2服从自由度为7-1=6的卡方分布,否定域为:59.12)6(295.0223.2卡方检验的例题(4)做出统计决策统计量=7.752,没有落在否定域259.12)6(205.022中,接受零假设零假设:每天心脏病猝死人数分布同预期分布相同因此,医学家的研究结论是正确的。K-S检验与KS统计量一、适用范围Kolmogorov-Smirnov检验常译为柯尔莫哥洛夫-斯米尔诺夫检验,简写为K-S检验,亦称D检验法,也是一种拟合优度检验法。主要用来检验一组样本

1 / 41
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功