山西医科大学卫生统计教研室第十二章基于秩转换的非参数检验山西医科大学卫生统计教研室刘桂芬liugf66@yahoo.com.cn山西医科大学卫生统计教研室参数检验的特点条件不满足时——采用非参数统计的方法。分析目的:对总体参数(μπ)进行估计或检验。分布:要求总体分布已知,如:•连续性资料——正态分布•计数资料——二项分布、POISSON分布等统计量:有明确的理论依据(t分布、u分布)有严格的适用条件,如:•正态分布Normal•总体方差齐EqualVariance•数据间相互独立Independent山西医科大学卫生统计教研室非参数检验又称为任意(不拘)分布检验(distribution-freetest),这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的是分布之间而不是参数之间的检验,故又称非参数检验(nonparametrictest),简称非参检验。非参数检验方法很多,本章主要介绍基于秩转换的非参数检验。非参数检验的概念山西医科大学卫生统计教研室非参数检验的优点:①适用范围广②受限条件少。参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况。③具有稳健性。参数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好。山西医科大学卫生统计教研室①对符合用参数检验的资料,如用非参数检验,会丢失部分信息。②虽然非参数检验计算简便,但有些问题的计算仍显繁冗。非参数检验的缺点:山西医科大学卫生统计教研室内容提要:配对设计差值比较的符号秩检验(Wilcoxon配对法)完全随机设计两样本比较的Mann-WhiterU检验完全随机设计多个样本比较的秩和检验(Kruskal—Wallis法)随机区组设计资料比较的秩和检验Ridit分析山西医科大学卫生统计教研室第一节配对设计差值比较的符号秩检验配对设计差值比较的符号秩检验由Wilcoxon1945年提出,又称Wilcoxon符号秩检验(Wilcoxonsigned-ranktest),常用于检验差值的总体中位数是否等于零。山西医科大学卫生统计教研室(1)建立检验假设,确定检验水准Ho:差值总体中位数Md=0H1:差值总体中位数Md≠0α=0.05分析步骤:(2)编秩:•求差值•编秩方法:依差值的绝对值从小到大编秩。•编秩时注意两点:遇差值为0者,舍去不计,n相应减少•差值的绝对值相等,符号不同者应取平均秩次•编秩后,按差值的正负给秩次冠上符号。山西医科大学卫生统计教研室(3)求差值为正或负的秩和差值为正的秩和以T+表示差值为负的秩和以T-表示。T++T-=n(n+1)/2(4)确定P值和作出推断结论:当n≤50时,查T界值表T在界值范围内PαT在界值范围外Pα分析步骤:山西医科大学卫生统计教研室T界值表的构造原理假定一组配对数据n=4,则:秩次有:1,2,3,4。差值为正的秩次与差值为负的秩次共有24=16种组合。即,每种组合出现的概率为:1/16=0.0625。16种组合如下表:=》山西医科大学卫生统计教研室T界值表的构造原理差值为正的秩次差值为负的秩次T+T-T概率1,2,3,4—10000.06252,3,419110.06251,3,428220.06251,2,43733}0.1253,41,27331,2,34644}0.1252,41,36441,42,3555}0.1252,31,45551,32,4464}0.12541,2,34641,23,4373}0.12531,2,437321,3,42820.062512,3,41910.0625—1,2,3,401000.0625《=返回山西医科大学卫生统计教研室•无论n有多大,都可以按上述方式计算得到检验统计量T的概率分布。•n=4时的任一种组合的概率都0.05,所以在T界值表中没有n=4的界值。•最少也应在6对数据以上.T界值表的构造原理山西医科大学卫生统计教研室当n50,可采用正态近似法,计算u值。Z或24/)1n2)(1n(n5.04/)1n(nTu正态近似法山西医科大学卫生统计教研室若相同秩次较多,应作校正计算。Z或式中,tj为第j(j=1,2,…)个相同差值的个数。48)(24)12)(1(5.04/)1(3jjttnnnnnTu正态近似法山西医科大学卫生统计教研室第二节完全随机设计两样本比较的Mann-Whiter(U检验)某医师测得两组28名妇女大腿内侧皮下脂肪厚度,试进行Mann-WhiterU检验.甲组1.82.22.52.83.23.63.84.04.24.44.85.66.06.26.67.010.0乙组1.82.02.02.03.03.84.25.47.6山西医科大学卫生统计教研室1.建立检验假设,确定检验水准(α)H0:两总体分布位置相同,总体中位数M1=M2H1:两总体分布位置不同,总体中位数M1≠M2α=0.05。2.选择B组,清点每组数据B前A组数据的个数.按数值由小到大排列,若有相同数据,取平均秩。分析步骤:山西医科大学卫生统计教研室3.计算U值,并确定检验统计量求出两组的秩统计量UA、UB。4.确定P值和作出推断结论分析步骤:山西医科大学卫生统计教研室当n120或(n2-n1)10时,附表6中查不到P值,则可采用正态近似法求u值来确定P值,其公式如下:Z或12)1(5.02/212121nnnnnnUu正态近似法山西医科大学卫生统计教研室第三节完全随机设计多样本比较的秩和检验一、原始数据的K—W检验(Kruskal—Wallis法)分析步骤:1.建立检验假设,确定检验水准2.混合编秩3.求秩和并计算检验统计量H4.确定P值和作出推断结论山西医科大学卫生统计教研室1.建立检验假设,确定检验水准(α)H0:k个总体分布位置相同;H1:k个总体分布位置不同或不全相同;α=0.05。2.混合编秩将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。分析步骤:山西医科大学卫生统计教研室3.求秩和并计算检验统计量H将各组秩次分别相加,求出各组的秩和Ri。i为组序。检验统计量值H可按下式计算:式中,Ri为各组的秩和,ni为各组样本含量,N为总样本含量。)1N(3nR)1N(N12Hi2i分析步骤:山西医科大学卫生统计教研室当各组相同秩次较多时,可对H值进行校正,按下式求值。)NN()tt(1CcHH3j3jc分析步骤:山西医科大学卫生统计教研室4.确定P值和作出推断结论当组数K=3,每组样本含量ni≤5时,可查附表(H界值表)得到P值。若k3或ni5时,H值的分布近似于自由度为k-1的χ2分布,此时可查附表4χ2界值表得到P值。最后按P值作出推断结论。分析步骤:山西医科大学卫生统计教研室二、频数表资料的K—W检验分析步骤:1.建立检验假设,确定检验水准2.编秩3.求秩和并计算检验统计量H4.确定P值和作出推断结论)1N(3nR)1N(N12Hi2i山西医科大学卫生统计教研室白细胞(1)支气管扩张(2)肺水肿(3)肺癌(4)病毒性呼吸道感染(5)合计(6)秩次范围(7)平均秩次(8)-++++++0296355257323530111920101—1112—3031—5051—6062140.555.5RiNi739.517.043.50436.51529.10409.51724.09244.51122.23—60———————四种疾病患者痰液内嗜酸性粒细胞比较山西医科大学卫生统计教研室第四节随机区组设计资料比较的秩和检验随机区组设计资料比较,如果观察结果不满足方差分析条件,可用FriedmanM检验(Friedman’sMtest)。分析步骤1.建立检验假设和确定检验水准2.编秩:•先在每一配伍组内将数据从小到大编秩,如有相同数据,取平均秩次;•再求各处理组秩和Ri,i=1,2,...,k。山西医科大学卫生统计教研室3.计算检验统计量M值(1)查表法(b≤15,k≤15):M=Σ(Rj-R)2==》M界值表基于χ2分布近似法得到χ2值查有关的M界值表(2)χ2分布近似法分析步骤4.确定P值和作出推断结论返回主题山西医科大学卫生统计教研室第五节多个样本资料的两两比较如同方差分析一样,当多个样本比较的秩和检验,拒绝H0,认为多组处理效应不同或不全相同时,常需进一步作两两比较的秩和检验,以推断哪些组之间不同,或哪些组之间相同。山西医科大学卫生统计教研室一、成组设计资料的两两比较成组设计多组定量资料或等级资料比较,经Kruskal-Wallis检验,拒绝H0后,需进一步作两两比较。分析步骤:1.建立检验假设和确定检验水准2.计算检验统计量3.确定P值并作出推断结论山西医科大学卫生统计教研室分析方法之一:——精确法:样本含量较小时,采用两样本秩和检验。之二:——正态近似法——Z或u检验法之三:——(扩展的)t检验法山西医科大学卫生统计教研室RA、RB:任两个对比组A及B的秩和,分母:-的标准误其中、nA、nB分别为A、B两组相应的样本例数平均秩次:=RA/nA及=RB/nB,k:处理组数,n:各处理组的总例数。方法之二:正态近似法BABAnnnnRRuz1112)1(或公式:山西医科大学卫生统计教研室方法之二:正态近似法•如何确定P值?——u界值表•检验水准α=0.05?由于K个样本两两比较增大了第一类错误,为保证α=0.05,需要对检验水准进行调整,即:α‘=α/比较的次数•多组间两两比较:α’=α/[k(k-1)/2]•多个实验组与对照组比较α‘=α/(k-1)山西医科大学卫生统计教研室RA、RB:任两个对比组A及B的秩和,分母:A-B的标准误其中、nA、nB分别为A、B两组相应的样本例数平均秩和A=RA/nA及B=RB/nB,k:处理组数,n:各处理组的总例数。H:H检验统计量。方法之三:t检验法BABAnnknHnnnRRt11)(12)1)(1(公式:v=n-k山西医科大学卫生统计教研室二、随机区组设计资料的两两比较随机区组设计资料经Friedman检验拒绝H0,可进一步作两两组间比较方法步骤(同前)分析方法:之一:精确法之二:正态近似法——Z或u检验法之三:q检验法山西医科大学卫生统计教研室方法之二:正态近似法Z或u检验法方法同完全随机设计注意检验水准的调整bkkRRuzBA6)1(或山西医科大学卫生统计教研室方法之三:q检验法1.建立检验假设和确定检验水准先将各组的秩和由小到大排位次,并注明原组别及秩和。位次号123组别ABC秩和---计算检验统计量。q界值表——P值。12)1(kbkRRqBA山西医科大学卫生统计教研室小结非参数检验的研究,近年发展迅速,理论逐步趋于完善。它与参数检验不同,并不涉及样本取自何种特定分布的总体,因而应用甚广。秩和检验不仅可用于等级资料的比较与分析,且可用于极度偏态、小样本总体方差不齐,总体分布型未知的探索性研究,以及无确切值表述的超限值资料分析等。但若资料适用参数检验时,采用非参数检验分析,常会损失部分信息。秩和检验常用于推论两个及两个以上总体分布位置(中位数)是否相同。据设计类型不同,有配对设计差值比较的符号秩检验,成组设计两样本与多样本比较的秩和检验,随机区组设计资料比较的秩和检验等。他们编秩求和略有不同,检验统计量各异。对多个样本资料比较,得到差别有统计学意义结论时,尚应进行两两比较。山西医科大学卫生统计教研室谢谢!