医学统计学定性资料的统计分析statisticalanalysisforqualitativedata主要内容二项分布简介总体率的可信区间估计Poisson分布简介总体事件数的可信区间估计样本率与总体率的比较两样本率比较的u检验四格表资料的2检验行列表资料的2检验确切概率法两事件数的比较卡方检验应用的注意事项第七节四格表资料的2检验2检验(chi-squaretest)是英国统计学家Pearson于1900年提出的一种应用范围很广的统计方法。常用来推断两个及两个以上总体率或构成比是否有差异。根据设计类型的不同,四格表资料的2检验可分为:完全随机设计的两样本率比较的2检验配对设计的2检验。一、2检验的基本思想u检验与t检验的思路相同,是用标准误作为尺度,去衡量统计量与总体参数差别的大小。2检验(chi-squaretest)的思路则与u检验、t检验不同,却有着异曲同工之妙。例、某医院肿瘤科3年来共治疗乳腺癌患者n=131例,每例观察5年,其中单纯手术治疗组观察n1=84例,存活x1=57例,联合治疗组观察n2=47例,存活x2=39例。将资料整理成以下形式的分类频数表。组别存活数死亡数合计阳性率(%)联合治疗39(a)8(b)47(a+b)83.0单纯手术57(c)27(d)84(c+d)67.9合计96(a+c)35(b+d)131(n)73.31、四格表的概念a、b、c、d这四个格子的频数是整个表的基本数据,其余数据都是从这四个基本数据推算出来的,通常将这种资料称为四格表资料(2×2表资料)。四格表资料多用来比较两种处理的不同效果,而每种处理只产生两种相互对立的结果。如生存与死亡、有效与无效、患病与未患病、阳性与阴性、检出与未检出等。2、建立检验假设当两个样本率不等时,可能有两种原因:差别仅由抽样误差所致;两种处理的效果确有不同,而导致了样本率的不同。为区别这两种情况,分别建立检验假设:H0:两总体存活率相等,即1=2;H1:两总体存活率不等,即12。=0.05。3、H0条件下的理论频数H0假设认为,两个样本来自同一总体,即“单纯组”与“联合组”的存活率相同,差别仅由抽样误差所致,则可用合计存活率73.3%(即96/131)作为总体率的点估计。H0条件下,单纯组理论存活数应为47×(96/131)=34.44例,联合组理论存活数应为84×(96/131)=61.56例;同理,两组理论死亡数为12.56例和22.44例。这四个根据H0假设求得的数据称为理论频数T。理论频数T可用公式计算:式中TRC表示第R行、第C列的理论频数,nR为相应行的合计,nC为相应列的合计,n为总例数。nnnTCRRC处理存活数死亡数合计H0假设的5年存活率(%)联合治疗34.4412.564773.3单纯治疗61.5622.448473.3合计963513173.34、2检验的思路如果H0假设成立,则实际频数A与理论频数T应该比较接近。如果实际频数与理论频数相差较大,超出了抽样误差所能解释的范围,则可以认为H0假设不成立,即两样本对应的总体率不等。实际频数Ai与理论频数Ti之间的抽样误差,可以用2统计量表示:2统计量服从2分布,反映了实际频数A与理论频数T吻合的程度。A与T相差越大,则2值就会越大。22()iiiATT如果H0假设成立,则实际频数与理论频数之差异纯系抽样误差所致,故2值不会很大。即在H0假设的前提下,一次随机试验中,出现较大2值的概率P是很小的。如果手头样本求得很小的P,且P≤,根据小概率原理,就有理由怀疑H0的真实性,故拒绝之;若P>,则没有理由拒绝H0。2值与P值的对应关系可查附表3的2界值表。根据计算公式,2值的大小除了和实际频数与理论频数的差值|A-T|有关还与格子数有关,严格的讲是和自由度有关。行×列表的自由度,是指在表中周边合计数不变的前提下,基本数据可以自由变动的格子数。四格表中有四个基本数据,其中任何一个数据发生变化,其余三个数据由于受周边合计数的限制,只能随之相应变动,故其自由度为1。=(行数-1)(列数-1)二、完全随机设计的两样本率的比较完全随机设计的两个样本率比较的目的是推断两个样本率各自所代表的总体率是否相等。检验方法可用u检验或2检验。例1、某医院肿瘤科3年来治疗乳腺癌患者n=131例,其中单纯手术组观察n1=84例,存活x1=57例,联合治疗组观察n2=47例,存活x2=39例,问两组存活率有无差别?处理存活数死亡数合计治疗数联合治疗39(34.44)(a)8(12.56)(b)47(a+b)单纯治疗57(61.56)(c)27(22.44)(d)84(c+d)合计96(a+c)35(b+d)131(n=a+b+c+d)首先将资料整理成四格表形式:①建立检验假设:H0:两总体存活率相等,即1=2;H1:两总体存活率不等,即12。②确立检验水准:=0.05。③计算检验统计量2值:222222()(3934.44)(812.56)34.4412.56(5761.56)(2722.44)3.5261.5622.44iiiATT④确定P值:v=1,查附表3的2界值表,20.05,1=3.843.52,所以P0.05。⑤结论:按=0.05水准,不能拒绝H0,差别无统计学意义。故尚不能认为单纯手术疗法与联合疗法对乳腺癌患者治疗效果有差别。结论与u检验一致。例2、在某项治疗牙科术后疼痛控制的双盲临床研究中,将178例患者随机分成两组,A药组90人,有效人数为68人。B药组88人,有效人数为58人。处理有效无效合计有效率/%A药68(63.71)(a)22(26.29)(b)90(a+b)75.56B药58(62.29)(c)30(25.71)(d)88(c+d)65.91合计126(a+c)52(b+d)178(n=a+b+c+d)70.79①建立检验假设:H0:两种药的有效率相等,即1=2;H1:两种药的有效率不等,即12。②确立检验水准:=0.05。③计算检验统计量2值:222222()(6863.71)(2226.29)63.7126.29(5862.29)(3025.71)2.0062.2925.71iiiATT④确定P值:v=1,查附表3的2界值表,20.05,1=3.842.00,所以P0.05。⑤结论:按=0.05水准,不能拒绝H0,差别无统计学意义。故尚不能认为两药对控制牙科术后疼痛的疗效不同。三、四格表资料专用公式理论频数由四格表中实际频数计算得来。对于四格表资料,可直接用专用公式计算2值,以简化计算过程。式中a、b、c、d分别为四格表的四个实际频数即四格表的基本数据,总例数n=a+b+c+d。))()()(()(22dbcadcbanbcad分别将前面的两个例子中的基本数据代入公式可以得到相同的2值。39857276822583052.335968447131)5782739(2222(68302258)1782.00908812652四、四格表2统计量的连续性校正2分布是一种连续性分布,附表3中2界值是根据此连续性分布的理论公式计算得到。而两个或多个率比较的原始数据却属离散型分布资料,是不连续的。因此,2检验公式是一个近似计算公式。英国统计学家YatesF认为,应将实际频数与理论频数之差的绝对值减去0.5作连续性校正。实际上,2值公式在四格表的基础数据均不太小时,近似程度相当高。但是,只要四格表中的有一个基础数据出现较小值,此时求得的2值往往偏大,相应的P值偏小,从而扩大了I型误差。为校正这种偏差,可采用校正2,用C2表示。其计算公式为:TTAC22)5.0(对四格表专用公式的校正为:两者是等价的,这种校正称为连续性校正,即Yate’s校正。))()()(()2/(22dbcadcbanncbdaC分析四格表资料时,不同公式的选择条件在分析四格表资料时,需根据具体情况作出不同处理,一般认为:1、当n≥40,且T≥5时,用基本公式计算2值;2、当n≥40,且1≤T<5时,则用2检验的连续性校正公式;3、当n<40,或有T<1时,不能用2检验,应当用四格表的确切概率法。4、当2检验所得P值接近检验水准时,最好使用四格表确切概率法。例1、下表资料是单用甘磷酰芥(单纯化疗组)与复合使用争光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者总体的完全缓解率有无差别?治疗组缓解未缓解合计缓解率(%)单纯化疗2(4.68)101216.67复合化疗14152948.28合计16254139.02①建立检验假设:H0:两种方法治疗后患者的完全缓解率相等,即1=2;H1:两种方法治疗后患者的完全缓解率不等,即12。②确立检验水准:=0.05。③计算检验统计量2值:由于a格的理论频数最小,T11=1216/41=4.685且n40,故考虑用校正公式计算2值。222(215101441/2)41(/2)2.36()()()()12291625Cadbcnnabcdacbd④确定P值:v=1,查附表3的2界值表,20.05,1=3.842.36,所以P0.05。⑤结论:按=0.05水准,不能拒绝H0,差别无统计学意义。故根据本资料尚不能认为两种疗法的总体缓解率有差别。例2、为观察甲、乙两药对治疗胃溃疡的疗效,将70名患者随机分成两组,一组30人服用甲药,另一组40人服用乙药。结果见下表。问两种药物的胃溃疡治愈率有无差别?药物治愈未愈合计治愈率(%)甲228(4.71)3073.33乙3734092.50合计59117085.71①建立检验假设:H0:两种药物的胃溃疡治愈率相等,即1=2;H1:两种药物的胃溃疡治愈率不等,即12。②确立检验水准:=0.05。③计算检验统计量2值:由于b格的理论频数最小,T12=3011/70=4.715且n40,故考虑用校正公式计算2值。222(22383770/2)70(/2)3.42()()()()30405911Cadbcnnabcdacbd④确定P值:v=1,查附表3的2界值表,20.05,1=3.843.42,所以P0.05。⑤结论:按=0.05水准,不能拒绝H0,差别无统计学意义。故根据本资料尚不能认为两种药物的胃溃疡治愈率不等。五、u检验与2检验的关系事实上,对两样本率的比较的双侧检验,u检验和2检验是等价的。即自由度为1的2=u2。因此,两样本率的比较,可以用u检验,也可以用2检验。两者的应用条件是一样的。但若需进行单侧检验,则应选用u检验,因为2检验理论上本身就是双侧检验。六、配对设计四格表的卡方检验配对设计是医学研究中常用的设计方法之一,二分类结果资料的配对研究常用于比较两种检验方法、两种培养方法、两种提取方法之间的差别。配对四格表设计的特点是对同一样本的每一份检品分别用甲、乙两种方法处理,观察其阳性与阴性例数。以推断两种处理的结果有无差别。配对四格表资料结果的四种情况两法均为阳性(a)、两法均为阴性(d)、甲为阳性乙为阴性(b)、甲为阴性乙为阳性(c)。a、d为两法结果相同部分;b、c为结果不同部分。乙法甲法+合计+aba+bcdc+d合计a+cb+da+b+c+d=n这样的资料称为配对四格表,其形式与普通四格表类似,但内容及检验方法却不一样。配对设计的两个率的比较——配对2检验。两种方法若没有差别,则总体B=C。样本常表现为bc,是由于抽样误差的存在,还是两种方法确有差别,