第六章两样本定量资料的比较第一节配对设计定量资料的比较第二节两组独立样本的比较第三节两组二项分布资料的比较第四节两组Possion分布资料的比较青岛大学医学院流行病与卫生统计教研室吴义丽讲师第六章两样本定量资料的比较第一节配对设计定量资料的比较第二节两组独立样本的比较第三节两组二项分布资料的比较第四节两组Possion分布资料的比较一、配对资料的t检验配对设计是研究者为了控制可能存在的主要非处理因素而采用的一种试验设计方法。形式:1、将受试对象配成特征相近的对子,同对的两个受试对象随机分别接受不同处理;2、同一样品分成两份,随机分别接受不同处理(或测量);3、同一受试对象处理前后,数据作对比。基本思想:理论上,若两种处理无差别时,差值d的总体均数μd应为0。适用条件:差值服从正态分布)00(0:010ddddHH或单侧:1,~0ntnSdtd例6-1某儿科采用静脉注射人血丙种球蛋白治疗小儿急性毛细支气管炎。用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量如表所示。试问用药前后IgG有无变化?序号用药前用药后差值d11206.441678.44472.002921.691293.36371.6731294.081711.66417.584945.361416.70471.345721.361204.55483.196692.321147.30454.977980.011379.59399.588691.011091.46400.459910.391360.34449.9510568.561091.83523.27111105.521728.03622.5112757.431398.86641.44表6-1用药前后患儿血清中免疫球蛋白IgG(mg/dl)含量2、计算统计量:根据资料类型和检验方法选择1、建立检验假设,确立检验水准05.00:010ddHH:11112),/(552.1912/2747.84066.4752747.841121295.5707166.2793182,166.279318266.47512/95.5707,95.5707,1222dlmgtSdndddnd3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。查t临界值表:t0.05/2,11=2.201,tt0.05/2,11,得P0.05,按α=0.05水准拒绝H0,接受H1。认为用药后小儿IgG增高。二、配对资料的符号秩和检验基本思想:假定两种处理效应相同,则差值的总体分布是对称的,总体中位数为0。对于样本的正秩和与负秩和之间的差异是一些随机因素造成的抽样误差,这些差异一般不会太大。如果差别太大,超出了规定的范围,就拒绝H0,接受H1,认为差值的总体中位数不等于0。适用条件:差值不服从正态分布或分布型未知。例6-2某研究欲研究保健食品对小鼠抗疲劳作用,将同种属的小鼠按性别和年龄相同、体重相近配成对子,共10对,并将每对中的两只小鼠随机分到保健食品两个不同的剂量组,过一定时期将小鼠杀死,测得其肝中糖原含量(mg/100g),结果见表10-1,问不同剂量组的小鼠肝糖原含量有无差别?表6-2不同剂量组的小鼠肝糖原含量(mg/100g)小鼠号中剂量组高剂量组差值d差值为正差值为负(1)(2)(3)(4)秩次(5)秩次(6)1620.16958.47338.31102866.50838.42-28.08-53641.22788.90147.6884812.91815.202.291.55738.96783.1744.2166899.38910.9211.543.57760.78758.49-2.29-1.58694.95870.80175.8599749.92862.26112.34710793.94805.4811.543.5检验步骤:1建立假设H0:差值总体中位数Md=0H1:Md≠0α=0.052根据差值编秩:按差值的绝对值由小到大编秩,并按差值的正负给秩次加上正负号。编秩时,若差值为0,舍去不计;若差值的绝对值相等时取平均秩次。3求秩和并确定检验统计量:分别求出正、负差值秩次之和,以T+和T-表示,单侧检验时任取其一为统计量T;双侧检验时,以绝对值较小者为统计量T。本题取T=min(T+,T-)=6.54确定P值作结论:5≤n≤25→查表法n25→正态近似法/校正4824)12)(1(5.04/)1(3jjttnnnnnTZ24/)12)(1(5.04/)1(nnnnnTZ若n25超过附表C8的范围,可用Z检验。若多次出现相持现象,用下式计算:式中tj:第j个相同差值的个数,假定差值中有2个4,5个6,3个7则t1=2,t2=5,t3=3,1503355223333jjjtt第六章两样本定量资料的比较第一节配对设计定量资料的比较第二节两组独立样本的比较第三节两组二项分布资料的比较第四节两组Possion分布资料的比较一、两组独立样本资料的t检验条件:两小样本均来自正态总体且方差齐正态性检验方差齐性检验)(:2121211210或单侧:HH2)11(212121nnnnSXXtc,2)1()1(212222112nnSnSnsc例6-3为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗,另一组用常规药物治疗,测得的血红蛋白增加量(g/L)见表6-3。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?治疗药物血红蛋白增加量/g•L-1新药组30.521.425.034.533.032.529.525.524.423.6常规药组19.519.013.024.721.522.019.015.524.523.4表6-3两种药物治疗贫血患者结果05.0(:,211210双侧):HH2、计算统计量:根据资料类型和检验方法选择1、建立检验假设,确立检验水准818.3,560.4,210.20,990.272121ssXX685.1721010818.3)110(560.4)110(2)1()1(22212222112nnSnSnsc18210102137.4)101101(685.17210.20990.27)11(21221221nnnnSXXtc3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。001.0,,922.3)10(01.0)18(001.0Pttt得查t值表:按α=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同,根据样本均数的信息,认为μ1μ2,即服用新药后血红蛋白含量平均增加量高于常规药。正态性检验图示法:P-P图W检验:3≤n≤50D检验:50≤n≤1000矩法检验K-S检验所观察数据的实际累计概率假设数据服从正态分布时累计概率的期望值直线上则正态分布直线上方则负偏态直线下方则正偏态10.010布:该数据不服从正态分:该数据服从正态分布HH2、计算统计量:1、建立检验假设,确立检验水准3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。按α=0.10水准,不拒绝H0,可以认为该数据服从正态分布。211210::HH方差齐性检验两组正态分布随机样本判断其总体方差是否齐同:1,1,~(2211212221nnFSSF,(较小)较大)当H0成立时,检验统计量1.0(:,2221122210双侧):HH2、计算统计量:1、建立检验假设,确立检验水准426.1818.3560.4(222221(较小)较大)SSF3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。10.0,18.3)9,9(,10.0PF得查F值表:按α=0.1水准,不拒绝H0,可以认为两总体方差相等,符合两小样本t检验的方差齐性要求。方差齐性检验的另一个方面是比较两组观测数据的测量精度。(两个总体的变异程度是否相同)例6-4将同一瓶液样分成20份。将此20份样品随机分成两组,每组10份。用不同的方法分别检测液样中某物质的含量(mmol/L)。结果两种方法测得样本均数相同,样本标准差分别为1.02与0.56。试问两法检测精度是否相同?9110,9110,3176.356.002.105.0,::212222212221122210SSFHH查F临界值表3.2:F0.05,(9,9)=4.03,FF0.05,(9,9),得P0.05按α=0.05水准不拒绝H0,故还不能认为两法检测结果精度不同。二、两组独立样本资料的t’检验近似t检验-----t’检验样本来自正态总体,方差不齐时,两小样本均数的比较,可选择以下方法:1)采用适当的变量变换,使达到方差齐的要求。2)采用秩和检验。3)采用近似法检验(包括对临界值和自由度校正两种)。当所两小样本均数的比较时,其总体分布不呈正态分布时,可选择的方法有两种即变量变换和秩和检验。)(:2121211210或单侧:HH1nS1nSSS,nSnSXXt24X14X22X2X222121212121当H0成立时,检验统计量(Satterthwaite近似法)例6-5为探讨硫酸氧钒对糖尿病性白内障的防治作用,研究人员将已诱导糖尿病模型的20只大鼠随机分为两组。一组用硫酸氧钒治疗(DV组),另一组作对照观察(D组),12周后测大鼠血糖含量(mmol/L)。结果为DV组12只,样本均数为6.5mmol/L,标准差为1.34mmol/L;D组8只,样本均数为13.7mmol/L,标准差为4.21mmol/L。试问两组动物血糖含量的总体均数是否相同?1.0(:,2221122210双侧):HH2、计算统计量:1、建立检验假设,确立检验水准1111271887.935.120.4(21222221(较小)较大)SSF3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。查F临界值表3.2:F0.05,(7,11)=3.76,FF0.05,(7,11),得P0.05按α=0.05水准拒绝H0,接受H1,故可认为两个总体方差不相等。05.0:211210HH:1、建立检验假设,确立检验水准89542.71121234.118821.41234.1821.46817.41234.1821.45.67.1322222222222212121nSnSXXt2、计算统计量:查t临界值表:t0.05/2,8=2.306,t’t0.05/2,8,得P0.05按α=0.05水准拒绝H0,接受H1,故可认为经硫酸氧钒治疗的大鼠与未治疗大鼠的血糖含量不同。3、确定P值,做出统计推断P值的意义:如果总体状况和H0一致,统计量获得现有数值以及更不利于H0的数值的可能性(概率)有多大。22212121nSnSXXz三、两组独立样本资料的z检验z检验的应用条件样本例数n较大,或n虽小但总体标准差σ已知例6-6某地对241例正常成年男性面部上颌间隙进行了测定,得其结果如下表,问不同身高正常成年男子其上颌间隙是否不同?表6-4某地241名正