1第八章等级资料的分析AnalysisofRankedData2医学研究中的等级资料疗效:痊愈、显效、有效、无效、恶化化验结果:-、、++、+++体格发育:下等、中下、中等、中上、上等心功能分级:I、II、III…文化程度:小学、中学、大学、研究生营养水平:差、一般、好3等级资料的特点既非呈连续分布的定量资料,也非仅按性质归属于独立的若干类的定性资料;比“定量”粗,而比一般的“定性”细;等级间既非等距,亦不能度量。4内容秩次与秩和两样本比较的秩和检验多组比较的秩和检验配对符号秩和检验配伍设计的秩和检验多重比较秩和检验的正确应用58.1秩次与秩和秩次(rank),秩统计量是指全部观察值按某种顺序排列的位序秩和(ranksum)同组秩次之和。6例8.1编秩A组:-、、+、+、+、++B组:+、++、++、++、+++、+++A组:-±+++++B组:+++++++++++++123457689101112124.54.54.58.54.58.58.58.511.511.57秩和A组:-、、+、+、+、++秩和:124.54.54.58.5TA=25B组:+、++、++、++、+++、+++秩和:4.58.58.58.511.511.5TB=53TA+TB=N(N+1)/2=788秩次:在一定程度上反映了等级的高低秩和:在一定程度上反映了等级的分布位置对等级的分析,转化为对秩次的分析。秩和检验就是通过秩次的排列求出秩和,进行假设检验秩变换:将等级变成秩次的方法ranktransformation98.2两样本比较的秩和检验检验假设H0:A、B两组等级分布相同;H1:A、B两组等级分布不同(相互偏离)。=0.05。10基本思想如果H0成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2;(B组的实际秩和应接近理论秩和n2(N+1)/2)。或相差不大。如果相差较大,超出了预定的界值,则可认为H0不成立。A组B组和实际秩和255378理论秩和n1(N+1)/2n2(N+1)/2N(N+1)/2393978差值-14140抽样误差?如果H0成立,则理论秩和与实际秩和之差纯粹由抽样误差造成。12检验结果如果H0成立,则按0.05水准,A组秩和之界值为26~52。现A组的实际秩和为25,在界值之外,故拒绝H0,接受H1,认为两组的分布位置不同。13秩和检验的结论判断A组的实际秩在界值之外,则拒绝H0,接受H1。(小于或等于下界,大于或等于上界)A组的实际秩在界值之内,则不拒绝H0。(大于下界且小于上界)14某药对两种病情的慢性支气管炎病人的疗效比较人数秩和疗效喘息型单纯型合计秩次范围平均秩次喘息型单纯型(1)(2)(3)(4)(5)(6)(7)=(2)(6)(8)=(3)(6)治愈2360831~83429662520显效839818184~2641741444217052好转6551116265~380322.520962.516447.5无效111223381~40339243124704合计n1=182n2=221403T1=40682.5T2=40723.515检验步骤(一)H0:两型老慢支疗效分布相同;H1:两型老慢支疗效分布不同。=0.05。编秩16求秩和T1、T2确定检验统计量Tn1n2:规定n1组的秩和为T;n1=n2:则任取一组的秩和为T本例n1=182,n2=221,则检验统计量T=T1=40682.5。检验步骤(二)17确定P值,作出推断结论若n110,且n2-n110:查表法当n110或n2-n110时,正态近似法检验步骤(三)18正态近似法12/)1(5.02/)1(211NnnNnTuCuuc)/()(133NNttCjj3669.312/)1403)(221)(182(5.02/)1403(1825.40682u8766.06545042480741881)()(133NNttCjj01.05961.38766.0/3669.3uCuucP0.01,按=0.05水准,拒绝H0,接受H1,差异有统计学意义。可认为复方猪胆胶囊治疗老年性慢性支气管炎喘息型与单纯型的疗效有差别。208.3多组比较的秩和检验Kruskal-Wallis法先对所有数据编秩;求秩和T计算H统计量;查H界值表,或2界值表,界定P值;作出结论。21多组等级比较的检验假设H0:各组总体的等级分布相同;H1:各组总体的等级分布不同或不全相同。=0.05。)1(3)1(122NnRNNHii22H的校正与2近似当有相同秩次时,H需校正:当n较大时,H近似服从=k–1的2分布。故可按2分布获得概率P,作出统计推断。)]/[)(1/33NNttCCHHjjC23三种方剂的疗效比较表8.2三种复方小叶枇杷治疗老年性慢性支气管炎疗效比较疗效例数平均秩和等级老复方复方I复方II合计秩次范围秩次老复方复方I复方II(1)(2)(3)(4)(5)(6)(7)(8)=(2)(7)(9)=(3)(7)(10)=(4)(7)控制3641411~4121.0756.08421显效11518914242~183112.512937.520251012.5好转1844425253184~436310.057040.0136407750无效4735486437~522479.522536.516782.51918合计3821013952293270.032531.510701.524三种方剂的疗效比较H0:三药疗效总体分布相同H1:三药疗效总体分布不同或不全相同=0.05。256325.21)1522(3)395.107011015.3253138293270()1522(52212222H=(41341)+(1423142)+(2533253)+(86386)=19762020)(3jjttC=119762020/(5223522)=0.86113120.238611.0/6325.21/CHHc=k1=31=220.005,2=10.60,Hc20.005,2,P0.005按=0.05水准拒绝H0,接受H1,认为三药疗效有差别。268.4配对符号秩和检验Wilcoxon符号秩和检验计算等级之差值,对差值绝对值进行编秩,并冠以差值的符号。查T界值表,或用近似u检验,计算P值;界定P值,作出结论。27符号秩和检验的假设H0:差值的总体中位数为0;H1:差值的总体中位数不为0。=0.05。当n≤50时,查界值表(附表10)当n>50时,用u近似24/)12)(1(5.04/)1(nnnnnTu28扁平足疗效例用配对设计观察两种方法治疗扁平足效果记录如下,问那种方法好。病例号12345678910111213141516A法好好好好差中好好中差好差好中好中B法差好差中中差中差中差好差中差中差两种方法治疗扁平足效果观察原始记录量化值病例号A法B法A法B法差值秩次1好差312102好好330—3好差312104好中3214.55差中12-1-4.56中差2114.57好中3214.58好差312109中中220—10差差110—11好好330—12差差110—13好中3214.514中差2114.515好中3214.516中差2114.530检验步骤(一)建立假设H0:两法疗效差值的总体中位数为0;H1:差值的总体中位数不为0。建立检验水准=0.0531计算检验统计量编秩:求秩和:T+=61.5,T-=4.5确定检验统计量T:T+或T-作为统计量T检验步骤(二)32界定P值本例T+=61.5,T-=4.5,已超出附表10中双侧P0.01相对应的界值5~61,故得P0.01。结论按=0.05水准拒绝H0,接受H1,认为两种方法疗效的总体分布不同。结合资料可认为A法优于B法。检验步骤(三)33符号秩和检验的基本思想总秩和为T=N(N+1)/2如H0成立,则正负各半,T+与T-均接近N(N+1)/4。如果相差太大,超出了事先规定的界值,则H0不成立。34符号秩和检验T界值表N=11双侧单侧13~530.100.0510~560.050.0257~590.020.015~610.010.005间距4046525611(11+1)/4=33(理论值)35u的校正当重复的秩次较多时,u需要校正:48)(24)12)(1(5.04/)1(3jjttnnnnnTu36配伍设计的秩和检验配伍设计使用范围37评委白兰地W白兰地X白兰地Y白兰地ZA四(4)二(2)一(1)三(3)B四(4)一(1)二(2)三(3)C三(3)一(1)二(2)四(4)D四(4)二(2)三(3)一(1)E三(3)一(1)二(2)四(4)Ri1871015五位评委对4种葡萄酒作等级评定(一至四级)38将每一配伍组的数据由小到大编秩,相同值取平均;分别求出各处理组的秩和;将有关数据带入公式。131122kbRkbkMi76.8145315107181445122222确定P值(p.347)b=5,k=4,查表13,当b或k超出表的范围,M近似服从分布的21k05.001.0p39当有相同秩次,且M按近似分布进行推断时需校正:2CMMckkbttCijij33/140两两比较(q检验)1、建立检验假设H0:对任两种葡萄酒评判结果的总体分布相同H1:对任两种葡萄酒评判结果的总体分布不同或不全同2、计算统计量将各处理组的秩和从大到小排列:1815107组次1234原组WZYX41对四种酒评价结果的两两比较对比组组数两秩和之差PA与Ba1与4418-73.8105P0.051与3318-102.7713P0.051与2218-151.0392P0.052与4315-72.7713P0.052与3215-101.7321P0.053与4210-71.0392P0.058868.2BARRqBARR8868.2121445121BABABARRRRRRBAskbkssRRq423、确定P值以查q值表(P.342)4、统计推断按水准,……,a05.0438.6秩和检验的正确应用主要对等级资料进行分析;秩和检验可用于任意分布(distributionfree)的资料;T检验与H检验的关系H检验T检验n=2F检验t检验44秩和检验用于定量资料计量资料中:极度偏态资料,或个别数值偏离过大各组离散度相差悬殊资料中含有不确定值大于5年0.0011:1024以上兼有等级和定量性质的资料45参数检验与非参数检验在总体的分布类型已知的条件下,对总体的参数进行检验,称为参数检验。在总体的分布类型未知或者不考虑总体的分布的条件下,对总体的分布进行检验,称为非参数检验。适用于任意分布类型的资料,不受总体分布的制约。46成组设计两样本比较如资料满足t检验的条件,应该用t检验进行分析。此时,如果对这类资料用Wilcoxon秩和检验,实际上是将观察单位的具体数值舍弃不用,只保留了秩次的信息,使检验功效降低;尤其样本含量较小时,降低更加明显。如资料不满足t检验的条件,而用了t检验,同样降低了检验效能。