秩和检验主讲教师朱彩蓉某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,实验结果见表1,试检验两组小鼠生存日数有无差别?表1两组小鼠发癌后生存日数实验组生存日数对照组生存日数102123154155166177188209231090以上111213秩和检验非参数统计(Nonparametricstatistics)–不依赖于总体分布类型,也不对总体参数进行统计推断的统计方法。参数统计(Parametricstatistics)–要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验。秩、秩和秩♀♂♀♀♀♂♂♀♀♂♂♂123456789101112秩和♀=1+3+4+5+8+9=30♂=2+6+7+10+11+12=48例12.3某地职业病防治欲比较使用二巯基丙磺酸钠与二巯基丁二酸钠的驱汞效果。将22例汞中毒患者随机分配到两组,分别测定并计算出两组驱汞的排汞比值,并将结果列于表12.3。试问两药驱汞效果有无差别?表12.3两种驱汞药物排汞效果比较丁二酸钠丙磺酸钠排汞比值秩次排汞比值秩次0.931.50.931.51.1933.3482.4644.82122.6055.22132.6266.11142.7576.13153.5096.34163.83106.80173.83117.28188.50198.542012.592114.9222110n175.5T212n2177.5T1.建立检验假设,确定检验水准0H:两种药物排汞比值的总体分布位置相同1H:两种药物排汞比值的总体分布位置不同0.052.计算检验统计量T值(1)编秩将两组数据由小到大统一编秩。编秩时,遇相同数值在同一组内,可顺次编秩;当相同数值出现在不同组时,则必须求平均秩次。(2)求各组秩和以样本例数较小者为1n,其秩和为1T。(3)确定检验统计量T值若12nn,则1TT;若12nn,则1TT或2TT。本例,21nn,故175.5TT。确定P值以n1及n2-n1查秩和检验临界值表(附表11)。101n212nn7984891411461510.100.050.02761540.013.确定P值,作出统计推断本例,由110n,21nn=2,75.5T,查附表11,得双侧0.01P。按照0.05水准,拒绝0H,接受1H,差异有统计学意义,可认为两种驱汞药物的排汞效果有差别。丁二酸纳组平均秩次为75.5/10=7.55,丙磺酸钠组平均秩次为177.5/12=14.79,可认为丙磺酸钠驱汞效果好于丁二酸钠。正态近似法如果n1>10或n2-n1>10超出附表11的范围,可按式(12.3)计算Z值:相同秩次较多(如超过25%)时,按式(12.4)进行校正12/)1(5.02/)1(211NnnNnTZ(12.3))()(133NNttCCZZjjc(12.4)常用两组比较的秩和检验检验分布的集中趋势是否相同–Mann-WhitneyUtest–Wilcoxontest–当其中一组样本含量大于10时,以上两个统计量的分布均近似服从Z分布,用正态近似Z检验同时检验分布形状及其集中趋势–thetwo-sampleKolmogorov-SmirnovWilcoxon符号秩和检验例7.1某市环保局对每一测定点用甲、乙两种方法测定大气中SO2日平均浓度(μg/m3),测定值如表7.1。两种方法的测定结果有无差别?对象号甲法乙法差值d秩*1210225-15-6.524045-5-2.53320335-15-6.543037-7-45232250-18-86353052.573534118300327-27-994553-8-5T+=3.5T-=41.5表7.19个测定点用甲、乙两种方法的测定结果(μg/m3)假设0:0dMH差值总体中位数0:1dMH05.0计算检验统计量求差值。见表7.1第(4)栏。编秩。–依差值的绝对值从小到大编秩。–编秩时遇差数等于零,舍去不计,同时样本例数减1。–遇绝对值相等差数,取平均秩次。–秩次冠以原差值的正负号。分别计算正、负差值的秩和,任取其一为检验统计量。确定P值和作出推断结论当n50时,查附表10,T界值表。本例n=9,T=3.5,0.05P0.02,=0.05水准拒绝H0,差别有统计学意义。可以认为甲、乙两种方法测定大气中SO2日平均浓度测定结果不同,乙法较高。正态近似法若n50超出附表10的范围,可用Z检验,按(12.1)计算Z值,0.5为连续性校正数。24/)12)(1(5.04/)1(nnnnnTZ相同“差值”(计绝对值)数多时(不包括差值为0值),改用(12.2)校正式。48)(24)12)(1(5.04/)1(3jjttnnnnnTZ例12.1某研究用甲、乙两种方法对某地方性砷中毒地区水源中砷含量(mg/L)进行测定,检测10处,测量值如表12.1的(2)、(3)栏。问两种方法的测定结果有无差别?表12.1甲、乙两种方法测定某地区10处水源中砷含量的结果(mg/L)测定点序号水中砷含量差值id正差值秩次负差值秩次(1)甲法(2)乙法(3)(4)=(2)-(3)(5)(6)10.0100.015-0.005-220.0600.070-0.010-330.3200.3000.0205.5-40.1500.170-0.020-5.550.0050.0050.000--60.7000.6000.1008-70.0110.0100.0011-80.2400.255-0.015-491.0101.245-0.235-9100.3300.3050.0257-合计---21.5(T)23.5(T-)1.建立检验假设,确定检验水准0H:两种方法测定结果差值的总体中位数等于01H:两种方法测量结果差值的总体中位数不等于00.052.计算检验统计量T值(1)求差值id,见表12.1第(4)栏。(2)编秩依差值的绝对值由小到大编秩。(3)分别求正、负秩和计算正差值的秩和T和负差值的秩和T-。(4)确定检验统计量T任取T或T-作为检验统计量T。本例取21.5T或23.5T。3.确定P值,作出统计推断本例,由10n,21.5T或23.5T查附表10,得0.10P。按照0.05水准不拒绝0H,差异无统计学意义,尚不能认为甲、乙两种方法测定水源中砷含量有差别。注意当n50时,根据和查附表10,T界值表(配对比较的符号秩和检验用)。由附表10可知,当n5时,配对符号秩和检验不能得出双侧有统计学意义的概率,故样本含量必须大于5。单一样本与总体中位数比较例7.2已知某地正常人尿氟含量的中位数为2.15mmol/L。今在该地某厂随机抽取12名工人,测得尿氟含量(mmol/L)如表7.2。问该厂工人的尿氟含量是否高于当地正常人?表7.212名工人尿氟含量测定结果尿氟含量(mmol/L)(1)差值(2)=(1)-2.15秩次(3)2.150.00-2.10-0.05-2.52.200.052.52.12-0.03-1.02.420.274.02.520.375.02.620.476.02.720.577.03.000.858.03.181.039.03.871.7210.05.673.5211.0T+=62.5T-=3.5H0:该厂工人尿氟含量总体中位数等于2.15mmol/LH1:该厂工人尿氟含量总体中位数大于2.15mmol/L单侧=0.05(1)求差值:(2)编秩:方法同例7.1。(3)求秩和:T+=62.5,T-=3.5,取T=3.5。查附表100.0513-530.02510-560.017-590.0055-61T=3.5101n212nn710135356590.050.0250.015610.0053.确定P值,做出推断结论查附表10T界值表(配对比较的符号秩和检验用),得单侧P0.005,按α=0.05水准拒绝H0,接受H1,差别有统计学意义,故可以认为该厂工人尿氟含量高于当地正常人。多个样本比较Kruskal-Wallistest多个样本比较Kruskal-Wallistest例用15只小白鼠,随机分为3组,比较小白鼠接种三种不同菌型伤寒杆菌9D、11C、DSC1后存活日数,实验数据见下表第(1)、(3)、(5)栏,问接种不同菌型伤寒杆菌的小白鼠存活日数间有无差别?表小白鼠接种三种不同菌型伤寒杆菌后存活日数9D11CDSC1存活日数秩次存活日数秩次存活日数秩次(1)(2)(3)(4)(5)(6)2143.579325691143.5681012.5568101114561012.51315Ri18.5-40-61.5H0:3个总体的分布位置相同H1:3个总体的分布位置不全相同α=0.05计算统计量H:混合编秩,相同数值,取平均秩,算得各组的秩和Ri,)1(3)1(122NnRNNHii245.9)115(3)55.6154055.18()115(1512222H3.确定P值,做出推断结论以N=15,n1=n2=n3=5查附表12,H界值表,得P0.01,按=0.05水准拒绝H0,接受H1,差别有统计学意义,故可认为接种3种不同菌型伤寒杆菌的小白鼠存活日数不全相同。例12.5某医师检测3种卵巢功能异常患者血清中促黄体素的含量(U/L)资料见表12.5第(1)、(3)、(5)栏。问3种患者血清中促黄体素的含量(U/L)是否有差别?表12.5三种卵巢功能异常患者血清中促黄体素的含量(U/L)卵巢发育不良丘脑性闭经垂体性闭经促黄体素含量(1)秩次(2)促黄体素含量(3)秩次(4)促黄体素含量(5)秩次(6)31.38171.6711.90333.60181.7422.10435.12193.3262.75535.76204.597.54.597.538.31216.71105.98940.50229.4511.59.4511.542.502310.211310.8615502410.511411.1416iR1646571in888iR20.5008.1258.875H0:3个总体的分布位置相同H1:3个总体的分布位置不全相同α=0.05计算统计量H:混合编秩,相同数值,取平均秩,算得各组的秩和Ri,)1(3)1(122NnRNNHii222121646571()3(241)15.4124(241)888H当组数k=3,每组例数ni5;或者k≥3,或者ni5时,H分布近似服从于=k–1的2分布,可查2界值表得到P值。本例,以2,215.41H,查2界值表,得0.005P。按照0.05水准,拒绝0H,接受1H,差异有统计学意义,可认为3种卵巢功能异常患者血清中促黄体素的含量总体分布位置不全相同等级资料的秩和检验相同秩较多,算得的H值偏小,还需计算校正的统计量HCNNttHHiic33/1例12.6某医院用三种复方小叶枇杷治疗老年慢性支气管炎,数据见表12.6第(1)、(4)栏,试比较三种方剂的疗效有无差异。表12.6三种复方小叶枇杷治疗老年慢性支气管炎疗效的比较例数疗效等级老复方复方I复方II合计秩次范围平均秩次(1)(2)(3)(4)(5)(6)(7)无效47354861~8643.5好转184442525387~339213显效115189142340~481410.5控制364141482~522502合计38210139522--1.建立检验假设,确定检验水准0H:3种方剂疗效的总体分布位置相同1H:3种方剂疗效的总体分布位置不全相同0.052.计算检验统计量H值(1)编秩编秩方法同两组等级资料例12.4。各等级合计、秩次范围、平均秩次的计算结果,见表12.6第(5)