第五章两均数差别的统计意义检验testofstatisticalsignificance又称testofhypothesis第一节假设检验的基本步骤基本步骤:41、建立无效假设nullhypothesis和确定检验水准–如μ=μ0,又称检验假设hypothesisundertest,零假设、原假设,用H0表示–μμ0:称备择假设或对立假设alternativehypothesis.用H1或HA表示–一般取α=0.05和0.012、选定检验方法,计算检验统计量3、确定统计意义的水平和检验用临界值–levelofsignificance:指无效假设是对的而被拒绝的可能性,即第I类错误,用α表示,常取值0.05、0.01:significantatthe5%level–查表获得界值4、统计判断:nostatisticalsignificance(NS),statisticalsignificance,highlysignificant(P0.05,P≤0.05,P≤0.01)–Pα,结论为按α检验水准,不拒绝H0,无统计学意义(统计结论),还不能认为……不同或不等(专业结论)。不拒绝H0不等于接受H0。此时尚没有足够的证据认为H0成立。从决策的观点:可认为暂时接受它,或阴性待观察。–下结论时,对只能说拒绝H0或不拒绝H0;而对H1只能说,接受H1,除此之外其他说法均不妥当假设检验种类非等效性检验nonequivalence优效性检验superiority等效性检验equivalence非劣效性检验noninferiority第二节样本均数和总体均数差别的统计意义检验inferencesfrommeans(onesample/groupu,t-test)样本均数代表的未知总体均数μ和已知总体均数μ0(一般为理论值、标准值或经过大量观察所得的稳定值)若已知总体标准差,可用统计量u,如果总体标准差σ未知,只有从样本中获得的标准差s,那么应该用t检验P41例5-1:建立检验假设;选定和计算统计量;查得临界值;确定P值,判断结果。第三节配对t检验pairedt-testfordependentsamples医学科研中配对设计有:–同一批对象身体两个部位的数据–同一批对象实验(或处理)前后的配对数据–同一批样品用两种方法(两种仪器、两名化验员、两种条件)检验的结果–配对试验的结果(两个同质受试对象分别接受两种不同的处理)一、同体比较(自身对照比较)的t检验:见P43例5-2,计算差值d,并假设差值的总体均数为0二、配对实验的t检验:见P44例5-3三、同一批对象两次检验结果差值的t检验第四节两样本均数差别的统计意义检验一、两样本均数差别的t检验two-sample/groupt-testforindependentsamples又称成组t检验comparisonfortwomeans适用于:完全随机设计两样本均数的比较完全随机设计:指分别从两研究总体中随机抽取样本,然后比较两组的平均效应t值计算公式为:equalvariance:thetwo-samplettest例题:P46例5-5(合并方差combined/pooledv))1()1()1()1(S2])([])([2)()(2)(21222211222121222221212121222211212211221212)()(212121nnSnSnSSSnnnxxnxxnnxxxxnnllSnnnnSSSxxtccccxxxx,则可用下式计算和如先算出了方联合估计的标准差的平差数的标准误二、关于非正态分布资料均数差别的检验当资料的分布与正态分布略有偏倚时,对结果影响不会太大,仍可用t检验当资料与正态分布偏倚较大时处理方法:1、n较大时,样本均数仍可近似正态,且S估计σ的误差较小(每组例数均大于100),用u检验222121xxSSxxu2、当n较小时,进行数据较换,近拟正态后再作检验。是否符合正态分布应作正态性检验3、用非参数统计方法第五节方差不齐时两样本均数差别的t’检验总体方差不等时unequalvariancesituation正态分布由位置参数μ和变异度参数σ两者所决定,t检验需方差齐性。可用F检验来判断P48例5-6求得F值后查附表6-1P5501,1)()(22112221nnSSF较小较大1、近似t检验separatevarianceestimationt-test:t’-test(原版教材称统计量d)。有三种方法,前两种常用①Cochran&Cox法(1950)教科书中介绍的方法:对临界值进行校正22,2,2'22212122)(2211)(21212211212121..'1,1''xxxxxxxxxxSStStStnSnSSSSnnSxxt注意:当n1=n2=n时,ν1=ν2=ν,t’=ttα’=tαν;t和t’值也用双尾概率时的tα/2和t’α/2②Satterthwaite法:对自由度进行校正③Welch法:也是对自由度进行校正重点介绍第一种方法,见书P48例5-6第六节两种检验与两类错误一、单侧检验与双侧检验1、若检验目的在于检验两总体均数是否相等,两者谁大谁小都有可能,只要t的绝对值大于0.05界值即认为均数差别有统计学意义,称双侧检验(two-tailedtest)或双尾检验2、若已知一个均数不可能低于另一个均数,检验时只需考虑一侧的临界值,称单侧(one-tailedtest)或单尾检验单、双侧检验时界值间的关系见面积示意图,图5-1、图5-2(p49-50)二、第一类错误与第二类错误I型错误typeIerror:拒绝了实际上成立的H0,这类“弃真”的错误称I型错误,其概率大小用α表示,α可取单尾亦可取双尾。取0.05时,表示当无效假设正确时,在100次抽样中可以有5次推断是错误的。falsepositiveerrorII型错误:“接受”〔不拒绝〕了实际不成立的H0,这类“取伪”的错误,称typeIIerror。其概率大小用β表示,β只取单尾,其值的大小在进行检验时一般并不知道。falsenegativeerrorTypeIerrorTypeIIerrorμ0μ0μ1两类错误示意图见P51图5-31-β称为检验效能powerofatest,过去曾称为把握度。它的意义是当两总体确有差异,按规定检验水准α所能发现该差异的能力。只取单尾,1-β=0.90,意味着两总体确有差别,理论上在100次检验中,平均有90次能够得出有统计学意义的结论。α愈小,β愈大,反之亦然。若要同时减小I和II型错误,只有增加样本含量n。注:拒绝H0只能犯I型错误,不可能犯II型错误;“接受”〔不拒绝〕H0,只可能犯II型错误。三、假设检验应注意的问题1、要有严密的研究设计2、不同变量或资料应选用不同的检验方法3、正确理解“显著性”一词的含义:差别有统计学意义,亦称差别有“显著性”,不能理解为差异大。假设检验的结果并不指差异的大小,只能反映两者是否相同,差异的大小只能根据专业知识予以确定。4、作结论不能绝对化:因统计结论具有概率性质,不宜用“肯定”、“一定”、“必定‘”等词。报告中最好列出统计量的值和P值确切范围。以便读者与同类研究进行比较5、P值的正确理解:P或=0.05时,作出差别有统计意义的结论。理解:若无效假设正确,从该总体抽样所得的样本,它们能计算得这样的或比它更大的|t|值的可能性小于或等于0.05。决不能把P或=0.05理解为两总体均数相同的可能性小于或等于0.05。6、统计“显著性”与医学/临床/生物学“显著性”:统计“显著性”对应于统计结论;医学/临床/生物学“显著性”对应于专业结论。统计结论与专业结论有机结合,才能得出恰如其分、符合实际的最终结论。如体重、血压值的差异检验四、可信区间与假设检验的区别和联系可信区间用于说明量的大小即推断总体均数的范围,而假设检验用于推断质的不同即判断两总体均数是否不同。1、可信区间亦可回答假设检验的问题:算得的可信区若包含了H0,则按α水准不拒绝H0;若不包含H0,则按α水准,拒绝H0接受H1。2、可信区间比假设检验可提供更多的信息:CI不但能回答差别有无统计学意义,还能提示差别有无实际专业意义。但并不意味着CI可完全替代假设检验,因CI在预先确定概率情况下计算的,而假设检验可获得精确的概率值,两者结合才是完整的分析。有实际意义的值H0有统计学意义无统计学意义有实际意义可能有实际意义无实际意义样本过小可接受零假设(1)(2)(3)(4)(5)第七节正态性检验一、正态概率纸法:适用于小样本、大样本或分组资料,粗略检验.亦可用Proportion-proportionplotorquartile-quartileplot(PPorQQplot)将观察值从小到大排序,计算累计百分数,转换成概率单位probabilityunit:probit〔查附表5-1〕,以概率单位为纵坐标,以观察值单位为横坐标,作点图,若点子基本在一直线上,即近似正态分布。为标准差为均数,:值累积百分数时对应横轴等于:正态曲线下左侧面积m5xmxprobit二、偏度与峰度检验(methodofmoment)正态分布有一定的峰度kurtosis,用g2表示,且左右对称,即偏度skewness,用g1表示,不应太大按P54~56计算峰度系数和偏度系数,再作u检验正态时两者都为0,g1为正时表示多数频数集中在左边,少数较大数据向右延伸,曲线向右偏(正偏,医学常见),为负时向左偏(负偏,医学少见);g2为负时曲线较平坦(平阔峰),为正时曲线峰度超出正态分布(尖峭峰),即靠中心处数据过多。三、W检验(用于3≤n≤50时,且不需知道偏离正态的类型),W越大(附表5-3),P越大。四、D检验:用于不需知道偏离正态分布类型,且样本含量50≤n≤1000时计算统计量y,y值不在y0.025~y0.975之间为有统计意义(附表5-4),拒绝原假设,认为不符合正态分布