第5讲t检验与u检验(2004)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1均数差异的假设检验假设检验的具体方法,通常是以选定的检验统计量来命名的,如t检验要用特定的公式计算检验统计量t值,u检验要用特定的公式计算检验统计量u值。应用时首先要了解各种检验方法的用途、应用条件和检验统计量的计算方法。一、单组完全随机化设计资料均数的t检验和u检验从一个总体中完全随机地抽取一部分个体进行研究,这样的设计称为单组完全随机化设计(completelyrandomizeddesignofsinglegroup)。例题1:根据大量调查,已知健康成年男子脉搏均数为72次/分,某医生在某一山区随机抽查了25名健康成年男子,求得其脉搏均数为74.2次/分,标准差为6.0次/分,能否据此认为该山区成年男子脉搏均数高于一般成年男子脉搏均数?这两个均数不等有两个可能:(1)由于抽样误差所致;(2)由于环境条件的影响。如何作出判断呢?在统计上是通过假设检验来回答这个问题。以下介绍建设检验(t检验)的思想方法与步骤。1、建立检验假设和确定检验水准H0:1=0(=72次/分):H1:10(=72次/分):=0.05本例分析目的是比较山区成年男子脉搏样本均数与一般成年男子脉搏总体均数有无差别?是未知的,可以假设等于某一定值0,与0的差等于零,这样的假设称为无差异假设或零假设(nullhypothesis)记为H0:1=0表示该山区的环境条件对脉搏数无影响,他们之间的差异是由于抽样误差所致。与零假设相对立的假设称为对立假设或备择假设(alternativehypothesis),符号为H1,它是在拒绝H0的情况下而接受的假设。假设检验所用的检验统计量一般都是建立在零假设的基础上,因为H0比较单纯明确,而H1却包含着各种情况。检验水准(sizeoftest)亦称显著性水准(significancelevel),符号为,在实际工作中常取0.05或0.01。2、选定检验方法和计算统计量本例:n=25,x=74.2次/分,S=6.0次/分。检验统计量公式为:21-n,0xsxt将以上数据代入公式,得:241-25,1.83325/0.60.722.74t要根据研究类型和统计推断目的选用不同检验方法,不同检验方法有相应的检验统计量,本例的检验统计量t服从=n-1的t分布。建设检验方法通常是以检验统计量来命名的,故,本例检验称为t检验。3、确定P值和作出推断结论查t界值表,得出结论为,按=0.05水准,拒绝H0,接受H1认为该山区的成年男子脉搏均数高于一般的成年男子脉搏均数。关于检验水准是取0.05、0.01或其他数值,要根据不同的实验而定。取值较小,有利于提高“阳性”统计检验结果的可靠性;取值较大,有利于发现研究总体可能存在的差异,但可靠性降低。较好的做法是精确地计算出P值,这会对人们认识你所作的实验有很大的参考价值。二、随机化配对设计资料均数的t检验配对设计资料分三种情况:(1)配成对子的同对受试对象分别给予两种不同的处理;(2)同一受试对象分别接受两种不同处理;(3)同一受试对象处理前后的比较。同对或同一受试对象分别接受两种不同处理结果的比较,其目的是推断两种处理的效果有无差别;自身处理前后结果的比较,其目的是推断某种处理有无作用。因此,应该首先计算出各对差值d的均数。当两种处理结果无差别或某种处理不起作用时,理论上差值d的总体均数d=0。故可将配对设计资料的假设检验视为样本均数与总体均数d=0的比较,配对设计资料以小样本居多,故常用t检验。其计算公式为:1-n,/ndddddtss例题2、将大白鼠配成8对,每对分别饲以正常饲料和缺乏维生素E饲料,测得两组大白鼠肝中维生素A的含量如下表,试比较两组大白鼠中维生素A的含量3有无差别。表不同饲料组大白鼠肝中维生素A的含量(U/g)大白鼠配对号正常饲料组维生素E缺乏组差数,dd213550245011001210000220002400-400160000330001800120014400004395032007505625005380032505503025006375027001050110250073450250095090250083050175013001690000合计----650073700001)H0:d=0,H1:d0,=0.052)计算统计量74.2070,193.12980-812.5/)/(1298.193)18(88/)6500(7370000)1(/)(dS(U/g)812.586500222dnSdtgUnnndnSnddddd3)确定P值下结论查t界值表(双側),tt0.01,7=3.499,P0.01结论:按=0.01水准,拒绝H0,接受H1。4)题目结论:可以认为两种饲料喂养的大白鼠肝中维生素A的含量有差别,正常饲料组比缺乏维生素E饲料组的含量要高。4例3:胃癌或巨型胃溃疡13人,在实行全胃切除术前后的体重(kg)如下:试比较手术前后体重有无变化?时间12345678910111213术前42.548.039.046.058.547.539.058.051.043.038.050.057.5术后52.051.545.052.549.055.052.052.050.550.041.051.572.2d9.503.506.006.50-9.507.5013.0–6.0-0.57.003.001.5014.701、H0:d=0,H1:d0,=0.052、计算统计量12,2.271.9044.323)(1.904S(kg)323.4132.56dtkgnSnddd3、确定P值下结论查t界值表(双側),tt0.05,12=2.179,P0.05结论:按=0.05水准,拒绝H0,接受H1。4、题目结论:可以认为术前后体重有显著性差别。三、两组完全随机化设计资料均数的t检验与u检验1、t检验将受试对象完全随机地分配到两组中,这两组分别接受不同的处理。这样的设计称为两组完全随机化设计(completelyrandomizeddesignoftwogroups)。有些研究设计既不能作自身对比,也不便于配对。如实验中只有把受试动物杀死后才能获得所需数据,则不可能对动物在处理前后各进行一次测定;再如比较两种治疗方法对同一疾病的疗效,每个患者一般只能接受一种方法的治疗,把受试患者配成若干对在实际工作中又非常困难,这时只能进行两组间均数的比较。在两组比较的资料中,每个观察对象都应按照随机的原则进行分组,两组样5本量可以相同,也可以不同,但只有在两组例数相同时检验效率才最高。统计量计算公式为:2121x212121SX)()(xxxXSXXt221nn2121222221212121112/)(/)()11(221nnnnnXxnxxnnSScxx)1()1()1()1(212222112nnSnSnSc例题某医院研究乳酸脱氢同工酶(LDH)测定对心肌梗死的诊断价值时,曾用随机抽样方法比较了10例心肌梗死患者与10例健康人LDH测定值的差别,结果如下,试问LDH测定值在两组间有无差别?患者(X1)23.245.045.040.035.044.142.052.550.058.0健康人(X2)20.031.030.523.124.238.035.537.839.0131.0(1)、H0:1=2H1:12=0.05本例:74.6S,01.31X,59.10025X,10.310X,1064.9S,48.43X,30.19742X,80.434X,10222222112111nn(2)、计算统计量:将上述数据代入公式,得:182-1010,3506.37217.301.3148.43(%)7217.3)101101(2101010/10.31059.1002510/8.434230.19742221tSxx6(3)、确定P界作出结论本例tt0.05,18=3.197,P0.05(4)、结论:按=0.05水准,拒绝H0,接受H1。可以认为乳酸脱氢同工酶测定值在心肌梗死与健康人之间有差别,心肌梗死患者的含量比健康人的要高。如果例3用随机样本设计的t检验计算得到如下结果:0875.7S8615.51X132585.7S5385.47X13222111、、、、nn242-1313,536.18145.2323.48145.2861.51538.47)(8145.2)131131(213130875.71-135857.21-132221tkgSxx)()(查t界值表(双側),tt0.05,24=2.064,P0.05结论:按=0.05水准,接受H0,可以认为术前后体重有显著性差别。2、U检验(两大样本均数的假设检验)以两个正态或非正态总体独立地抽取含量分别为n1和n2的样本,当n1和n2均较大时,比如均大于100时,那么样本均数的和与差的分布也服从正态分布,即:)n(),(~)(2221212121nNXX故当两样本均数较多时,即使总体分布呈偏离正态,其样本均数的分布仍近似正态分布,且这时用S估计的误差较小,故可用u检验,即用正态分布的原理作两个均数间的假设检验。7关于非正态分布资料均数差别的检验医学上有许多资料是服从正态分布的,但有不少资料不是正态分布,例如血清抗体滴度、传染病潜伏期、动物对毒物的耐受量等。由于t分布以原始资料呈正态分部为依据,因此非正态分布资料用t检验是有些问题的。但当资料的分布与正态分布略有偏倚时对结果的影响不会影响太大,所以在略有偏倚时t检验仍是可以使用的。当资料与正态分布偏倚较大时,可有以下两种处理方法。1)当n较大时,由于样本均数在n较大时仍可近似正态分布,)n(),(~)(2221212121nNXX且这时用S估计的误差较小。一般当每组例数大于100时仍可用下式作统计检验:222121XXSSXXU因U近似正态分布,判断的标准是:U1.96,P0.05,差别无统计意义;U1.96,P0.05,差别有统计意义;U2.58,P0.01,差别有高度统计意义。2)当n较小时,可将数据进行转换使其近似正态后再作检验。例如传染并的潜伏期,血清抗体滴度等资料经对数转换后近似正态分布,然后在对数条件下计算均数、标准差、标准误(不求反对数),并作t检验。例题某医院在心肾内科普查工作中,测得40~50岁年龄组男性193人的脂值蛋白平均数为397.5(mg%),标准差为104.30(mg%);女性128人的脂蛋白平均数为357.89(mg%),标准差为89.67(mg%);问男性与女性脂蛋白平均数有无差别?(1)H0:1=2H1:12=0.05(2)检验统计量公式为:8222121212221212121)()()(nSnSXXnnXXu将上述数据代入公式得:636.312867.8919330.104)89.35759.397(22u(3)96.105.0uuP0.05结论:按=0.05水准,拒绝H0,接受H1。认为男性与女性脂蛋白平均数有差别,男性高于女性。

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功