一.概述分析策略分类数据分析策略可以分成假设检验和建立模型。1.假设检验法是建立一个关于联系(association)的假设。通常研究用随机化的方法进行。例如:把病人随机分成两组,检验组别与疗效之间(列联表的行与列之间)是否有关。这种联系的无效假设为变量间没有联系,而备择假设一般有3种情况:①有一般联系(generalassociation)。②平行均分有差别(rowmeanscoresdiffer)。③非零相关(nonzerocorrelation)。在以后讨论中我们将对各种不同的联系进行说明。2.建立模型的方法可求得各参数值,说明各因素的作用。通常用最大似然估计或加权最小二乘法估计。二.2×2表临床试验实例例2.1在研究老年慢性支气管炎的中草药疗效时,将病人随机分配到江剪刀草组和胆麻片组。结果疗效如下表所示:表2-1两组有效率的比较这是2.1中提到的第一种情况。根据无效假设,数据为超几何分布。2.2.1Mantel-Haenszel卡方——Q如果用以下符号表示表2-1中的数据表2-2两组有效率的比较则每一格出现数据为的概率为:如上例江剪刀草组无效(263例)的期望值为:方差:本例:样本足够大时近似正太分布,由此得:结论为两组疗效不同。2.2.2Pearson卡方——QpPearson卡方即一般常用的。这一公式即一般习惯用的:计算Pearson卡方先要计算出4个期望值,一个已算出为239.87。其他则可由合计值减出。Mantel-Haenszel与Pearson的关系如下:=本例:=2.2.3SAS程序[程序2-1]databronchit;inputtreat$outcome$count;cards;jiangy70jiangn263dany102dann180;procfreqorder=data;weightcount;tablestreat*outcome/chisq;run;检验结果:STATISTICSFORTABLEOFTREATBYOUTCOME表中各列依次为统计量、自由度(DF)、卡方值及P值。2.7配对资料四格表2.7.1例2.3205份标本分别接种于甲、乙两种培养基,共有4种结果,即甲、乙都生长;甲生长乙不生长,乙生长甲不生长及甲、乙都不生长。试比较两种培养基的效果,结果如表2-5:表2-5两种培养基的结果2.7.2计算方法2.7.3程序在SAS第6.10版以后,在procfreq中tables语句中加入了agree选项作McNemar检验。本例程序如下:[程序2-2]dataculture;inputa$b$count;cards;yy36yn34ny0nn135;procfreqorder=data;weightcount;tablesa*b/agree;run;2.7.4输出除频数部分外,输出的结果如下:STATISTICSFORTABLEOFABYBMcNemar’sTest其中,Kappa系数是反映一致性的指标。三.多层2×2表3.1概述在医学研究中经常遇到分层研究,如果每个层都有一个2×2表,则有多个2×2表(setsof2×2table)。例如在多中心临床试验中,每个医院随机地把病人分为试验组和对照组,疗效为有效和无效,则每个医院的数据形成了一个2×2表数据。3.2Mantel-Haenszel检验3.2.1实例3.1在三所医院中考察某感冒药A(江剪刀草组)对治疗流鼻涕的效果,与对照药B(胆麻片组)对比记录其疗效如表3-1:表3-1某感冒药A与对照药B治疗流鼻涕的效果3.2.2符号对于多层四格表,除四格表中数字以代表外,以h表示层次,则第h层的四格表可用以下符号表示(表3-2):表3-2多层四格表的符号表示3.2.3QMH统计量在无效假设为两组疗效相同时,第h层的期望值及方差的计算公式为:=(3.1)=(3.2)校正中心因素的两组之间疗效的差异可用Mantel-Haenszel1959年提出的统计量表示。=式中q为层数,本例q=3。当q层的i行合计数的合计数大于30时近似服从自由度等于1的卡方分布。Mantel-Haenszel方法,消除了层次因素的干扰而提高了检出关联的把握度。当各层次的阳性率的方向一致时,如每层的治愈率都是试验组高于对照组,则QMH检验效果很好。如果各层的方向不一致则可能检验不出其关联。3.2.4程序[程序3-1]datapark2;inputcentertreat$response$count@@;cards;1testy121testn181placeboy151placebon152testy312testn93placeboy342placebon63testy163testn143placeboy153placebon15;procfreqorder=data;weightcount;tablescenter*treat*response/chisqCMH;run;tables语句中要把需要校正的因素,即center放在最前面,CMH选项可输出Mantel-Haenszel统计量。3.2.5输出输出内容除包括各层的四格表频数、百分数、X2检验、Fisher精确检验结果及相关等内容外,还输出了小结统计量(summarystatistics)、OR及RR。这里没有列出四格表,但由结果可见,中心1江剪刀草组与胆麻片组疗效比为40.00%:50.00%,以胆麻片组疗效较好(表3-3);中心2为77.50%:85.00%,也是以胆麻片组疗效较差。就是各组疗效比的方向在各中心间并不一致,这样的资料QMH检验效果较差。表3-3各中心疗效方向比较CMH选项输出了下列结果:SUMMARYSTATISTICSFORTREATBYRESPONSECONTROLLINGFORCENTER首先输出Cochran-Mantel-Haenszel统计量,其中检验了非零相关,行平均得分差及一般关联三个备选假设。这三者在四格表资料中结果是相同的,因而不必考虑应当选择哪一个结果。这里是检验治疗方法与疗效的关系,但校正了中心的作用。有表中数据可见,QMH=0.586,P=0.44,不能得出两种疗法疗效有所不同的结论。输出的总的OR及RR的可信区间都包括了1在内,因而并无统计意义,结论与上述相同。输出的Breslow-Day检验是检验治疗组与疗效的关联在各中心是否一致。本例QMH=0.821,DF=2,P=0.663,即虽然我们看到中心1,中心2与中心3治疗组与疗效的关系有所不同,但还不足以说明其各中心的OR不同。如果Breslow-DayQMH有统计意义则不能用总的OR表示总的疗效比较。四.2×r表和多层2×r表4.12×r表2行多列的列联表为2×r表;多行2列的表为s×2表。如为分层分析,则可有多层2×r表或s×2表。4.1.1例4.1在一种感冒药片的研究中对咳嗽的疗效如表4-1所示:表4-1两组病人咳嗽疗效的比较4.1.2行平均得分这种资料用一般的卡方检验只能得出两组构成是否相同的结论,并不能得出哪组疗效较好的结论。例如,当试验组无效和痊愈较多,对照组则好转和显效者较多,这时X2则会较大,P则较大,说明其构成不同,但不能说明何者疗效好。一种办法是人为地给各疗效一个分数,如无效为1、好转为2、显效为3、痊愈为4,则可计算其均数,称为行平均得分(rowmeanscores)。公式为:(4.1)式中为各疗效的得分,为第一行的各疗效频数,为第一行合计。由此求得第一行的平均得分。本例试验组行平均得分为:当然也可求出第二行平均得分,但这里作检验时只需第一行平均得分。4.1.3行平均得分差检验--以第一行平均得分与期望得分之差的平方除以方差,可得检验统计量:=(4.2)式中为平均期望得分,为方差,可由列合计得出即:(4.3)(4.4)本例在以上计算中略去了小数点后的一些数字。如果计算更精确,计算结果应为:近似服从自由度为1的卡方分布。4.1.4SAS程序上例可编程如下:程序中在tables语句后增加了MCH选项,即求Cochran-Mantel-Haenszel统计量。4.1.5输出以上程序输出了列联表中频数及各百分比,与前相同,这里从略。以下输出为及相关系数。这里的Mantel-Haensel卡方即值。,与前面精确计算结果相同4.2结果尺度为次数的数据当2×r表中列数据为次数时由于没有理由认为次数是正太分布和方差齐性,因而不能用方差分析,而需用CMH分析。这是一个反应变量为另一种数据类型的例子。4.2.1例4.2调查小学生一学期中感冒情况,得病学生感冒次数如表4-2所示,试研究性别间感冒次数有无不同。表4-2学生一学期中感冒次数4.2.2程序[程序4-2]datacold;inputsexcoldcount@@;cards;male045male164male271female084female1124female282;procfreqorder=data;weightcount;tablessex*cold/all;run;程序中all选项包括了chisq及CMH项。4.2.3输出输出格式与上例相同。结果Mantel-Haenszel卡方及rowmeanscoresdiffer卡方都是4.249,DF=1,P=0.039。性别之间感冒次数差别由统计意义。4.3多层2×r表在分层分析时,每个层有一个2×r表则形成多层2×r表。4.3.1例4.3在以上研究感冒咳嗽的疗效这中,实际是一个多中心研究。每个医院(中心层)有一个2×r表.结果如表4-3:表4-3三中心感冒咳嗽疗效4.3.2符号以h代表层的符号,共有g层,则每层2×r表的符号为(表4-1):表4-42×r表的符号表示4.3.3扩展的Mantel-Haenszel平均得分统计量——各层第一行总得分的合计由下式求出:(4.7)第h层第一行平均得分为:(4.8)在(两组行平均得分相等)成立的前提下的期望值为:(4.9)式中为各层第一行得分期望值(4.10)h层第一行平均得分的方差为:(4.11)总方差:(4.12)如果各层各行的合计数足够大,则近似正态分布,统计量为:(4.13)服从自由度为1的卡方分布。4.3.4程序本例可编程序如下:[程序4-3]datacough2r;inputcenter$treat$response$count@@;cards;onetestnone7onetestimprove11onetestnotable8onetestcure4onecontrolnone2onecontrolimprove13onecontrolnotable13onecontrolcure2twotestnone2twotestimprove7twotestnotable22twotestcure9twocontrolnone0twocontrolimprove6twocontrolnotable20twocontrolcure14threetestnone5threetestimprove9threetestnotable13threecure3threecontrolnone6threecontrolimprove9threecontrolnotable15threecontrolcure0;procefreqorder=data;weightcount;tablescenter*treat*response/cmh;run;程序中输入中心,治疗方法、结果及计算,用order=data保证输出时与输入顺序相同,计数用weightcount;语句。Tables语句中有三个变量其中第一个center为分层变量,treat*response为各层2×r表。分析用CMH。4.3.5输出各中心皆输出一个2×r列联表的频数及百分比(略)。然后输出CMH,统计量如下:值即表中的RowMeanScoresDiffer。本例,。在校正中心效应后两组的平均得分差没有统计学意义。输出的CMH统计量后面的注明为以表中得分为基础。也即是