第十二章秩和检验温州医科大学环境与公共卫生学院黄陈平参数检验(parametrictest)依赖于总体分布形式,总体分布是已知,而且有规律可循,是总体参数间的比较。非参数检验(nonparametrictest)不依赖于总体分布形式,应用时可以不考虑被研究对象为何种分布及分布是否已知,不是是参数间的比较,而是检验总体分布位置是否相同。参数检验与非参数检验概念两类统计方法的优缺点:参数统计:检验效率较高,但使用条件较严格;非参数统计:由于对资料无特殊要求,因此适用范围广,但统计效率较低。选择:首先考虑参数检验,当条件不符,才选择非参数统计方法。非参数统计适用情况(1)偏态分布资料;(2)总体分布不明资料;(3)数据一端或两端有未确定值;(4)有序分类变量资料(等级资料);(5)方差不齐资料。秩和检验(ranksumtest)是非参数检验中效率较高,而且比较系统完整的一类。第一节配对资料的符号秩和检验(Wilcoxon配对法)第二节两样本比较的秩和检验(Wilcoxon两样本比较法)第三节完全随机设计多个样本比较的秩和检验(Kruskal-Wallis法,即H检验)第四节多个样本间两两比较的秩和检验课堂讨论配对资料的符号秩和检验例12-1某医院组织病人对护理质量作评价,同时对护士进行再培训,问培训前后的评分结果是否有显著性差异?护士编号⑴培训前评分⑵培训后评分⑶171027937746757106767898269981069114612661367合计——1.建立假设检验,确定检验水准2.计算检验统计量T值(1)求差值(2)编秩:依差值的绝对值从小到大编秩,再根据差值的正、负给秩次冠以正负号。若遇有几个差值的绝对值相等则取其平均秩次。差值为0时,弃去不计,并相应减少对子数n。(3)分别求正、负秩次之和检验步骤:H0:两总体分布相同H1:两总体分布不同=0.05例12-1某医院组织病人对护理质量作评价,同时对护士进行再培训,问培训前后的评分结果是否有显著性差异?护士编号⑴培训前评分⑵培训后评分⑶171027937746757106767898269981069114612661367合计——差值⑷=⑶–⑵32013-114-13201—正秩⑸负秩⑹96.5393311396.53606本例n=11,T+=60,T-=6分析基本思想:如果两个总体分布的位置相同,这些配对数值的差值应服从于以0为中心的对称分布。也即这些差值按其绝对值大小编秩并给秩次标上原来差值的符号,正秩和与负秩和在理论上应是一致的。配对资料的符号秩和检验秩和分布的特点N=3时两样本配对比较对子号A样本B样本d秩(+)1A1B1d12A2B2d23A3B3d3N=3时秩和(T+)分布T+秩和组成频数f概率P0010.1251110.1252210.12531+2,320.25041+310.12552+310.12561+2+310.125合计——81.000秩和分布的特点(1)离散型的对称分布;(2)N一定时,秩和分布也一定;(3)靠近中央的频数较多;(4)当N足够大时,秩和分布逼近正态分布。配对资料的秩和均数:T+与T-是以T为中心的两个对称点上例资料:T=11(11+1)/4=33T+=60,T-=6,差值均为27。•配对资料秩和标准误:结果判断:(1)查表法:当n25时查表12-2,P.327得:T0.05,11=10~56,(T0.01,11=5~61)若T+或T-:落在范围内,则P0.05;落在范围外,则P0.05;等于界值,则P=0.05。现T=6或60,故0.01P0.053.确定P值和判断结果(2)正态近似法:当n>25,可认为此时秩和分布逼近正态分布,按式(12-1)计算检验统计量Z值以进行检验。检验步骤:24/)12)(1(5.04/)1(nnnnnTZ分析基本思想:假定含量分别为n1和n2的两个样本来自同一分布的总体,则样本含量为n1(或n2)的统计量T与其相应平均秩和一般应相差不大(仅随机误差所致),若相差悬殊,有理由拒绝检验假设H0。两样本比较的秩和检验12/)1(5.02/)1(211NnnNnTZ1.建立假设检验,确定检验水准2.计算检验统计量T值(1)编秩:将两样本观察值从小到大统一编秩,遇相同观察值,取平均秩次。(2)求含量较小样本的秩和,作为检验统计量T3.确定P值和判断结果(1)查表法:n1≤10,且n2-n1≤10(2)正态近似法:超出查表范围时,可认为秩和分布已逼近正态分布。检验步骤:H0:两总体分布相同H1:两总体分布不同=0.05表12-3铅作业工人与非铅作业工人血铅测定值(μmol/L)比较铅作业组⑴秩次⑵非铅作业组⑶秩次⑷0.859.50.2610.89110.2920.93120.3231.26140.3341.84150.4752.18160.5962.33170.6470.7280.859.51.0113n1=7T1=94.5n2=10T2=58.5T=94.5,查表12-4得:P<0.01表12-5某药对两种病情的老年慢性支气管炎患者的疗效秩和单纯性单纯性合并肺气肿合计秩次范围平均秩次单纯性合并肺气肿疗效⑴⑵⑶=⑴+⑵⑷⑸⑹=⑴•⑸⑺=⑵•⑸控制65421071~1075435102268显效18624108~131119.52151717有效302353132~18415847403634无效131124185~208196.52554.52161.5合计12682208——12955.58780.5如果样本含量较大,超出查表范围时,可用正态近似法作检验:12/)1(5.02/)1(211NnnNnTZCuZCNNttCjj331本例Zc=0.543<Z0.05=1.96,故P>0.05本法利用多个样本的秩和来推断各样本分别代表的总体的位置有无差别。它相当于完全随机设计资料方差分析的非参数方法,此法适用于有序分类变量资料及不宜用参数检验(F检验)的数值变量资料,亦称H检验.完全随机设计多个样本比较的秩和检验1.建立假设检验,确定检验水准2.计算检验统计量T值(1)编秩:同两样本比较秩和检验。(2)计算检验统计量H值检验步骤:)(131122NnR)N(NHii相同秩次较多时,H值需校正:CHHCH0:多个总体分布相同H1:多个总体分布不同或不全相同=0.053.确定P值和判断结果求得H值后,查表12-7三样本比较秩和检验H界值表,当样本数或ni超出上表范围时,H分布近似于自由度为样本数减1的x2分布,可查x2界值表,得P值,按所取检验水准作出推断结论。检验步骤:表12-6三种手术方法治疗肝癌患者的术后生存月数甲法术后生存月数⑴秩次⑵乙法术后生存月数⑶秩次⑷丙法术后生存月数⑸秩次⑹3491311710121522.5710111467.567.58124522.571056Ri346422ni555H0:三个总体的分布位置相同H1:三个总体的分布位置不同或不全相同α=0.0536.9)115(3522564534)115(1512222H查表H界值表,P<0.01表12-8不同孕周产妇的乳量比较秩和乳量早产足月产过期产合计秩次范围平均秩次早产足月产过期产⑴⑵⑶⑷⑸⑹⑺⑻⑼⑽无30132101721~17286.5259511418865少3629214342173~514343.5123661003024809多3141434479515~9937542337431215625636合计9783858993——3833542387631310计算得:Hc=17.0查x2界值表,P<0.005,按α=0.05水准,拒绝H0,接受H1,可认为不同孕周产妇的乳量不同或不全相同。当多个样本比较的秩和检验拒绝无效假设,其结论只是认为各总体的分布位置不同或不全相同,若要推断哪些总体间分布位置不同,需进一步作两两比较。当各样本例数较大时,可选用Nemenyi法进行多重比较。多个样本间两两比较的秩和检验例12-6上例12-4某医院外科用三种手术方法治疗肝癌患者15例,每组5例,每例术后生存月数见表12-6。经多个样本比较的秩和检验,得到各组间术后生存时间总的来讲有差别的结论,试再进一步作两两比较。表12-9表12-6三组样本秩和的两两比较样本含量对比组i与j⑴ni⑵nj⑶两平均秩次之差jiRR⑷2,ji⑸P⑹甲与乙556.04.55>0.05甲与丙552.40.73>0.05乙与丙558.48.92<0.054.2配对比较两种方法治疗扁平足效果记录如下,问那种方法好?病例号12345678910111213141516甲法好好好好差中好好中差好差好中好中乙法差好差中中差中差中差好差中差中差差值2021-111200001111秩次10104.5-4.54.54.5104.54.54.54.5T+=61.5,T-=4.5查表得:T0.05,11=10~56,T0.01,11=5~61P0.01三、课堂讨论某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作观察指标,结果如下.问两组生存日数有无差别?两组小鼠发癌后生存日数━━━━━━━━━━━━━━━━━实验组对照组━━━━━━━━━━━━━━━━━102123154155166177188209231090111213──────────────────用二乙胺化学法与气相色谱法测定车间空气中CS2的含量,结果如下,问两法所得结果有无差别(提示:资料不呈正态分布)?两种方法测定车间空气中CS2含量(mg/M3)━━━━━━━━━━━━━━━━━样本号化学法色谱法━━━━━━━━━━━━━━━━━150.760.023.33.3328.830.0446.243.251.22.2625.527.572.94.985.45.093.83.2101.04.0━━━━━━━━━━━━━━━━用某药治疗胃癌,对溃疡型与梗阻型胃癌的治疗结果如下,问对两型胃癌的治疗效果有无差异?某药对胃癌治疗的结果━━━━━━━━━━━━━━━━━━━━━结果溃疡型梗阻型━━━━━━━━━━━━━━━━━━━━━治愈51显效84好转107无效26━━━━━━━━━━━━━━━━━━━━━合计2518━━━━━━━━━━━━━━━━━━━━━某实验室观察局部温热治疗小鼠移植性肿瘤的疗效,以生存日数作观察指标,结果如下.问两组生存日数有无差别?两组小鼠发癌后生存日数━━━━━━━━━━━━━━━━━实验组对照组━━━━━━━━━━━━━━━━━102123154155166177188209231090111213──────────────────何为秩和?把多个变量值按从小到大排列,其排列的位次称为“秩次”,把一组变量值的秩次相加则为“秩和”。