1秩和检验(ranksumtest)四川大学华西临床医学院循证医学与临床流行病学教研室刘关键一.秩和检验的概述在实践中我们常常遇到以下一些资料,如,需比较患者和正常人的血血铅值、铁蛋白、不同药物的溶解时间、实验鼠发癌后的生存日数、护理效果评分等。这类资料有如下特点:(1)资料分布类型已知,但不服从正态分布的资料,如偏态分布的计量资料;(2)资料的总体分布未知,如两端无界的计量资料;(3)等级资料。如果是上述类型的计量资料,目前最使用的统计方法是非参数统计方法。t检验、方差分析、均数的可信区间等统计推断方法,通常都要求样本来自正态总体(即分布型是已知的),在这种基础上,对总体参数(如总体均数)进行估计或检验。这类建立在已知总体的指标(参数)基础上的统计分析方法,称之为参数统计(parametricstatistics)。参数统计方法非参数统计(nonparametricstatistics)方法并不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知,由于这种假设检验方法,并非是参数间的比较,而是用于分布之间的比较,故此称为非参数检验。如果不知道所研究样本来自总体的分布形式或已经知道总体分布与检验所要求的假定不符,此时可用非参数统计方法。非参数统计方法2参数法与非参数法的结论需要指出,若总体分布未知或是偏态分布的资料,盲目使用参数检验,由于总体分布的基本假定得不到满足,那么根据这些假定所进行的推断亦难达到准确,所用参数法确定的P值也就不能用于结论。此时,若用非参数检验,由于不受总体分布的影响,假设检验的P值和结论则是正确的。非参数检验主要特点不受总体分布的限定、适用范围广。对数据的要求不像参数法那样严格,不论研究的是何种类型的变量,包括那些难以准确测量、只能以严重程度、优劣等级、次序先后等表示的资料;或有的数据一端或两端是不确定数值。非参数检验主要缺点符合参数法(如t检验)的资料,如果使用非参数法,因没有充分利用资料提供的信息,检验效率低于参数法,非参数法犯第二类错误(β)的概率比参数法大。若要使两法的β相同,非参数法比参数法需要更大的样本含量。故适合参数检验条件的资料,应首选参数检验。非参数法的种类非参数检验方法很多,如秩和检验、符号检验、趋势检验、游程检验、Ridit分析等。此处仅介绍非参数法中检验效率较高又比较系统和完整的秩和检验(ranksumtest)。其中秩即按数据大小排定的顺序号。顺序之和称为秩和,秩和检验就是用秩次(顺序)之和作为统计量进行假设检验的方法。二.不同设计的秩和检验1.配对秩和检验(signedranktest)2.两组比较的秩和检验(Wilcoxon法)3.多组比较的秩和检验(Kruskal-Wallis法)4.随机区组设计的秩和检验(Friedman法)秩和检验的主要种类3(一)配对秩和检验(Wilcoxonsigned-ranktest)基本思想对配对比较的资料可采用符号秩和检验(Wilcoxonsigned-ranktest)。该检验的基本思想是:若无效假设成立,则差值秩次的总体分布应是对称的,即正负秩和相差不应悬殊太大,否则拒绝无效假设,接受备择假设。实例分析12份血清两法测定结果的比较编号原法新法差值正秩负秩160802082142152105319524348114808221.55242240-21.56220220071902051578253813692122433191038446411236200-3610129510053T+=54.5T-=11.5建立假设检验假设如下:H0:两法测定结果差值的总体中位数为零,即M0=0;H1:两法测定结果差值的总体中位数不为零,即M0≠0;检验水准α=0.05。计算统计量①计算各对子的差值;②按差值的绝对值大小,由小到大编秩;③若差值的绝对值等于0,则舍去;若差值的绝对值相等时,取平均秩次;④对各秩次分别冠以原差值的正负号;⑤分别计算正、负秩次之和,即T+和T-,较小者为统计量T;实例分析的结论本例,T=11.5,查表得双侧T0.05,11=10−56,P0.05,按双侧α=0.05水准,不拒绝H0,故尚不能认为两法测定结果有差别。4-3.0-2.0-1.00.01.02.03.0uφ(u)95.0%99.0%5404410.01P0.050.01P0.05P0.01P0.01P0.05(二)两组比较的秩和检验(Wilcoxon法)基本思想两样本成组资料的比较可采用Wilcoxon秩和检验。该检验的基本思想是:若无效假设成立(两组的总体分布相同),则两组的秩次之和不应相差太大;否则拒绝无效假设,接受备择假设。实例分析肺癌病人与矽肺0期工人的RD值的比较肺癌病人矽肺0期工人RD值秩次RD值秩次2.7813.232.53.232.53.5044.2074.0454.87144.1565.12174.2886.21184.3497.18194.47108.05204.64118.56214.75129.60224.82134.95155.1016N1=10T1=141.5N2=12T2=111.5建立假设秩和检验的假设如下:H0:肺癌病人与矽肺0期工人的RD值的总体分布位置相同;H1:肺癌病人的RD值高于矽肺0期工人的RD值(单侧);检验水准α=0.05。计算统计量①两组不分组别混合编秩;②若遇数值相等时,取平均秩次;③分别求两组的秩次之和;④若n1≠n2时,用例数较小组的秩和做为统计量T;若n1=n2时,任取一组的秩和为统计量T;5实例分析的结论本例n1<n2,取T=141.5,查附表,T0.05,2,10=89−141,T0.025,2,10=84−146,得0.025P0.05,按单侧α=0.05水准,拒绝H0,接受H1,故可认为肺癌病人与矽肺0期工人的RD值不相同,肺癌病人的RD值高于矽肺0期工人的RD值。矽肺0期工人的RD值的平均秩次为111.5/12=9.29,肺癌病人的RD值平均秩次为141.5/10=14.15。-3.0-2.0-1.00.01.02.03.0uφ(u)95.0%99.0%84146154760.01P0.050.01P0.05P0.01P0.01P0.05(三)两组频数表资料(等级资料)比较的秩和检验(Wilcoxon法)实例分析结果正常人病人合计-11516+101828++31619+++055合计244468秩和的计算方法合计秩次范围平均秩次正常人秩和病人秩和161-168.593.542.52817-4430.5305.0549.01945-6354.0162.0864.0564-6866.00.0330.068560.51785.5计算统计量①两组不分组别混合编秩;②若遇数值相等时,取平均秩次;③分别求两组的秩次之和;④若n1≠n2时,用例数最小组的秩和做为统计量T;若n1=n2时,任取一组的秩和为统计量T;实例分析的结论本例n1<n2,取T=560.5,查附表,得P0.01,按双侧α=0.05水准,拒绝H0,接受H1,故可认为两组测定结果不相同,正常人平均秩次为23.35,患者组平均秩次为40.58,可认为正常人的测定结果小于对照组。6等级资料错判为计数资料一痊愈有效进步无效χ2P甲药251150208.5260.036乙药15174034WilcoxonW=10497.0P=0.061组别轻中重合计χ2P第1组181230607.9000.019第2组15261960合计333849120WilcoxonW=3444.0P=0.298(四)多组比较的秩和检验(Kruskal-Wallis法)简述多个成组资料的比较不能使用两组比较的方法进行检验。秩和检验也是如此。多组资料比较的秩和检验可使用Kruskal-Wallis法。该法又简称K-W检验或H检验。实例分析不同时间空气中的CO2含量课前课中课后含量秩和含量秩和含量秩和0.4814.4512.52.9570.5324.73143.0780.5534.77153.1890.5544.82163.20100.5854.89173.30110.6265.00184.4512.5Ri2192.557.5n666平均秩次3.515.429.58建立假设不同时间点空气中的CO2含量比较的秩和检验假设如下:H0:不同时间空气中的CO2含量的总体分布相同;H1:不同时间空气中的CO2含量的总体分布不同或不全相同;检验水准α=0.05。计算统计量(一)①多组不分组别,混合编秩;②若遇数值相等时,取平均秩次;③计算各组秩次之和Ri;④利用Ri计算出检验统计量H;7计算统计量(二)H=12N(N+1)∑Ri2ni-3(N+1)若相同秩次较多时(如超过25%),需进行校正,校正公式如下:HC=HC式中C=1-∑(tj3-tj)(N3-N)实例计算本例:H=1218(18+1)×(2126+92.526+57.526)-3(18+1)=14.95H=12N(N+1)∑Ri2ni-3(N+1)K-W法检验的概率查H界值表或查χ2值表,确定概率(P)大小,并做出统计结论。若组数k=3,每组例数≤5,可查H界值表得出P值。若组数k≥3,或每组例数>5,H近似于服从ν=k-1=的χ2分布,故可查χ2界值表。实例分析结论本例,H=14.95,查ν=2的χ2界值表得P0.005。按α=0.05水准,拒绝H0,接受拒绝H1,故可认为3个不同时间空气中的CO2含量不等或不全相等。K-W法秩和检验两两比较方法与方差分析相似,多个样本组比较的秩和检验,如拒绝H0,只说明比较各组的总体分布位置不同或不全相同,若要对每两组间进行比较可使用两两比较。秩和检验的两两比较,最常使用Nemenyi法。(五)多组频数表资料(等级资料)比较的秩和检验(Kruskal-Wallis法)8实例分析三种病人肺切除术的针麻效果比较针麻效果肺癌肺化脓肺结核合计Ⅰ10244882Ⅱ174165123Ⅲ19333688Ⅳ47819合计50105157312秩次平均各组秩次范围秩次肺癌肺化脓肺结核1-8241.5415996199283-205144.0244859049360206-293249.54740.58233.58982294-312303.01212212124248815.517254.522758计算统计量①多组不分组别,混合编秩;②若遇数值相等时,取平均秩次;③计算各组秩次之和Ri;④利用Ri计算出检验统计量H;即与K-W法相同。需注意的是由于样本含量较多,相同秩次也较多,应用校正H值。多个频数表比较秩和检验的两两比较方法与方差分析相似,多个样本组比较的秩和检验,如拒绝H0,只说明比较各组的总体分布位置不同或不全相同,若要对每两组间进行比较可使用两两比较。秩和检验的两两比较,最常使用Nemenyi法。等级资料错判为计数资料二组别无效好转显效小计甲组217432乙组1310629丙组15131341小计493023102卡方检验:χ2=7.19P=0.1285秩和检验:KW=6.638P=0.0353(六)随机区组设计的秩和检验(Friedman法)简述随机区组设计的秩和检验是由Friedman提出来的,故常称Friedman检验,又称M检验。9实例分析用药后不同剂量血清中指标DT值编号剂量0剂量1剂量2剂量3163(2)190(4)138(3)54(1)279(1)238(4)220(3)144(2)345(1)300(4)93(3)92(2)445(1)140(3)213(4)100(2)551(2)175(4)150(3)36(1)672(1)300(4)163(3)90(2)764(1)207(4)185(3)87(2)Ri9272212平均1.293.863.141.71建立假设