1王可流行病与卫生统计学教研室2第一节单个样本t检验第二节配对样本t检验第三节两独立样本t检验第四节方差不齐时两样本均数的t’检验第五节u检验第六节t检验中的注意事项第七节假设检验中的两类错误本章节主要内容:3第一节单样本t检验1.单样本t检验(onesamplettest)适用于样本均数与已知总体均数的比较。2.目的是检验样本均数所代表的总体均数是否与已知总体均数有差别,也即是手头的样本所来自的总体是否与已有的总体的一致。这里的总体均数一般指已知的理论值、标准值或大量观察得到的稳定值,认为这是一个确定的总体。XX004例7.1以往通过大规模调查已知某地新生儿出生体重为3.30kg,从该地难产儿中随机抽取35名新生儿作为研究样本,平均出生体重为3.42kg,标准差为0.42kg,问该地难产儿出生体重是否与一般新生儿体重不同?503.33.420.4XS0,1/XtnSn随机抽样95%1n61.建立假设检验,确定检验水准H0:μ=μ0,该地难产儿与一般新生儿平均出生体重相同;H1:μ≠μ0,该地难产儿与一般新生儿平均出生体重不同;α=0.05。72.计算检验统计量77.135/40.030.342.3/00nSXSXtX83.确定P值,做出推断结论本例ν=35-1=34,查附表2,得t0.05/2,34=2.032。因为tt0.05/2,34,故P0.05,表明差异无统计学意义,按α=0.05水准不拒绝H0,根据现有样本信息,尚不能认为该地难产儿与一般新生儿平均出生体重不同。应用条件:此单样本服从正态分布或近似正态分布91.配对t检验(pairedttest)适用于配对设计计量资料均数的比较2.目的检验两相关样本均数所代表的未知总体均数是否有差别。第二节配对样本t检验10何谓配对?配对(match)设计是将受试对象按照某种特征或条件(混杂因素)配成对子,目的在于使得组间均衡。然后随机的将两个受试对象分配到不同的组中。对非混杂因素配对可能导致过度匹配(over-match)。配对设计的意义控制了非处理因素对研究结果的影响,使得组间均衡性增大,可比性增强,提高了检验效能。113.配对设计主要有三种情况(1)两种同质受试对象分别接受两种处理。如把同窝、同性别和体重相近似的动物配成一对或把同性别和年龄相近的相同病情病人配成一对(2)同一受试对象或同一样本的两个部分,分别接受两种不同处理。(3)自身对比。即将同一受试对象处理前后的结果进行比较。122.实例分析例7-2某项研究评估咖啡因对运动者的心肌血流量的影响,先后测定了12名男性志愿者饮用咖啡前后运动状态下的心肌血流量(ml/min/g),数据如表7-1所示,问饮用咖啡前后运动者的心肌血流量有无差异。Pairedttest13Pairedttest143.检验步骤(1)建立检验假设,确定检验水准H0:d=0,饮用咖啡前后运动者的平均心肌血流量差异为零;H1:d0,饮用咖啡前后运动者的平均心肌血流量差异不为零;0.05(2)计算检验统计量本例:9.6d213.72dPairedttest15计算差值均数:计算差值标准差:计算差值的标准误:计算t值得:/9.6/120.8ddn2229.613.72120.7411121dddnSn0.7410.21412ddSSn0.83.7380.214ddtSPairedttest16(3)根据P值,作出推断结论查附表2,t0.05/2,11=2.201,tt0.05,11,P0.05,差别有统计学意义,拒绝H0,接受H1,可以认为饮用咖啡前后运动者的心肌血流量存在差异。Pairedttest应用条件:差值服从正态分布17第三节两独立样本t检验18将同质受试对象完全随机分入两组,接受两种不同的处理:治疗组与对照组新药组与传统药组对两个组的均数差值进行检验:如果来源同一总体,则均数的差值主要由抽样误差所致。191.两样本t检验适用于完全随机设计的两样本均数的比较2.目的检验两样本所来自总体的均数是否相等。3.使用条件两独立样本t检验要求两样本所代表的总体服从正态分布且两总体方差齐。若两总体方差不齐,可采用t’检验,或进行变量变换及用秩和检验方法处理。204.公式(方差齐)(1)何谓方差齐?(2)怎么判断?方差齐性检验2221212??21221nn1221211()CXXSSnn方差齐时的公式22为合并方差(pooledvariance),当两组样本标准差S1和S2已知时,:2CS232.实例分析例7-3某项研究评估低氧环境(模拟高原环境)对运动者的心肌血流量的影响,将17名男性志愿者随机分成两组,分别在正常含氧环境(正常组)和低氧环境(低氧组)中测定运动后的心肌血流量(ml/min/g),数据如表7-2所示,问两种环境中运动者的心肌血流量有无差异。Twosamplet-test24Twosamplet-test253.检验步骤建立检验假设,确定检验水准H0:1=2,两种环境中运动者的心肌血流量的总体均数相同;H1:12,两种环境中运动者的心肌血流量的总体均数不同;0.05。计算检验统计量Twosamplet-test26由原始数据得:代入公式得:得出统计量t值:22223.941.265.27217.26980.459982CS12110.4590.32998XXS|2.6565.150|7.5810.329tTwosamplet-test27查t界值表,t0.05/2,15=2.131,tt0.05/2,(15),P0.05,按0.05的水准拒绝H0,接受H1,差异具有统计学意义。故可认为该地两种疗法治疗糖尿病患者二个月后测得的空腹血糖值的均数不同。几何均数资料t检验,服从对数正态分布,先作对数变换,再作t检验。Twosamplet-test284.t检验应用条件样本对总体有较好代表性,对比组间有较好组间均衡性——随机抽样和随机分组。样本来自正态分布总体,配对t检验要求差值服从正态分布,实际应用时单峰对称分布也可以。两独立样本均数t检验要求方差齐性——两组总体方差相等。大样本时,用z检验不要求正态和方差齐性。Twosamplet-test29第二节方差不齐时两样本均数检验一、两样本方差齐性检验•在正态分布情况下,检验统计量F值按下列公式计算•为较大的样本方差,为较小的样本方差;若样本方差的不同仅为抽样误差的影响,F值一般不会偏离1太远。查附表3(方差齐性检验用的F界值表)可得P值。ν1=n1-1,ν2=n2-12122()()SFS较大较小21S22S30例7-4两组小白鼠分别饲以高蛋白和低蛋白饲料,4周后记录小白鼠体重增加量(g)如表7-3所示,问两组动物体重增加量的均数是否相等?31H0:12=22,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差相同;H1:12≠22,即高蛋白与低蛋白饲料喂养后小白鼠体重增加量的总体方差不同;=0.05。计算检验统计量,对表的数据计算可得:32按公式计算确定P值,作出统计推论。查附表3的F界值表,F0.05(11,12)=3.34,FF0.05(11,12),P0.05,认为两组体重增加量的总体方差不等。402.5269.3659.172221==SSF33二、检验当两总体方差不等(方差不齐)时,两独立样本均数的比较,可采用检验,主要有Satterthwaite法近似t检验、Welch法近似t检验和Cochran&Cox法近似t检验。其中Cochran&Cox法是对临界值校正;而Satterthwaite法和Welch法是对自由度进行校正。tt34检验的统计量的计算公式为Cochran&Cox法校正临界值的公式为式中,12221212'XXtSSnn12121222/2,/2,/222'XXXXStSttSS111n22=1ntt’-test35Satterthwaite法是统计软件中普遍使用的方法,其自由度校正公式为根据自由度查t界值表,作出推断结论。22211222222112212(//)(/)(/)11SnSnSnSnnnt’-test36对例7-4资料进行检验H0:12,即两种饲料小白鼠增重总体均数相同;H1:12,即两种饲料小白鼠增重总体均数不相同;0.05两总体方差不同,应选用t’检验103.313269.312659.17538.3675.4522212121=+-=+nSnSXXtt’-test37确定P值,作出推断结论按Satterthwaite法计算校正自由度,得查t界值表得t0.05,12=2.179,tt0.05,12,P0.05,差异有统计学意义,可认为两种饲料饲养后小白鼠增重的均数不同。222222112222222222112212(//)(17.659/123.269/13)11.69612(/)(/)(17.659/12)(3.269/13)12113111SnSnSnSnnnt’-test38按Cochran&Cox法计算校正界值,先查t界值表得t0.05,11=2.201,t0.05,12=2.179,再按公式计算,P0.05,结论同前。12121222/2()/2()0.05/2221.4722.2010.2512.1792.1981.4720.251XXXXStSttSS++===++0052./ttt’-test39第六节t检验中的注意事项1.假设检验结论正确的前提作假设检验用的样本资料,必须能代表相应的总体,同时各对比组具有良好的组间均衡性,才能得出有意义的统计结论和有价值的专业结论。2.检验方法的选用及其适用条件应根据分析目的、研究设计、资料类型、样本量大小等选用适当的检验方法。403、单侧检验和双侧检验需根据研究目的和专业知识来选择。/2,t/2,ttP1414、检验结论不能绝对化假设检验统计结论的正确性是以概率作保证的,作统计结论时不能绝对化。P≤,差异有统计学意义,这种差异不太可能是偶然的。statisticallysignificant;Ifthedataarenotconsistentwiththenullhypothesis,thedifferenceissaidtobestatisticallysignificant.P,差异无统计学意义,这种差异不排除偶然性。Nostatisticalsignificance.统计的立场是中性的425、正确理解P值的统计意义P值是指在H0成立的前提下,重复抽样,所观察到的等于或大于现有统计量值的概率。P值的含义:拒绝H0接受H1时所冒的风险;如果P值越小,则表明拒绝拒绝H0所冒的风险越小,那么研究者就越愿意做这样的结论。P值越小,并不是说明两个总体间的差别越大。只是表明越有理由拒绝H0接受H1,而不是表明差别越大;P值在0.05附近时要慎下结论;436、假设检验和可信区间的关系假设检验:样本是否来自于同一总体?可信区间:总体参数在哪里?在相同的α之下,若假设检验拒绝H0(p=α),那么可信度为(1-α)的可信区间必然不包括总体参数;反之成立。可信区间和假设检验是对同一问题所作的不同结论,效果等价。44第七节假设检验中的两类错误假设检验的核心是推断H0:当H0是真实的,拒绝H0就是错误的;当H0是不真实的,不拒绝H0则是错误的。45(1)H0成立,但由于样本的随机性,拒绝了原本正确的H0所犯的错误称第一类错误或Ⅰ型错误或拒真错误。犯第一类错误的概率记作α(0.05)(漏诊)(2)H0不成立,但由于样本的随机性,不拒绝原本错误的H0所犯的