第十一章非参数检验假设检验的方法有两种:参数检验(parametrictest)和非参数检验(non–parametrictest)。各种参数检验的共同特点:是对总体参数的推论,要求样本所属的总体呈正态分布、总体方差齐性等等。参数检验主要适用于等距变量和比率变量的资料。非参数检验不要求样本所属的总体呈正态分布,一般也不是对总体参数进行检验。非参数检验不仅适用于非正态总体名义变量和次序变量的资料,而且也适用于正态总体等距变量和比率变量的资料。一、两独立样本的检验1.秩和检验⑴.小样本情况n1和n2都小于10,且n1≤n2时,将两个样本的数据合在一起编秩次(从小到大赋予等级),计算容量小的样本的秩次和T(等级和)。检验步骤①提出假设②编秩次(将两样本数据混合在一起)③求秩和(求容量较小的样本的秩次和,并表示为T)④查秩和检验表,做出统计决断表17-9秩和检验统计决断规则T与两侧临界值比较显著性T1<T<T2不显著T≤T1或T≥T2显著例5:从某班随机抽取5名走读生和6名住校生,测得英语口语成绩见表17-10。问走读生与住校生英语口语成绩是否有显著差异?表17-10走读生与住校生英语口语测验成绩走读生4238354132住校生561960433855表17-11学生英语口语测验成绩秩和检验计算表原始分数走读生4238354132住校生561960433855等级分数走读生63.5251住校生1081173.59T=17.5根据n1=5,n2=6查表当显著性水平为0.05时,T1=19,T2=41差异显著。(双侧概率,单侧为0.025)⑵.大样本情况当n1和n2都大于10,二项分布接近于正态分布,其平均数和标准差分别为:21211nnnT1212121nnnnT检验统计量计算为:TTTZ1212/12121211nnnnnnnT(17.4)2.中位数检验顺序变量的数据常以中位数作为集中量。对两个或几个独立样本的比较,可以采用非参数检验法中的中位数检验法(mediantest)。中位数的检验方法是将各组样本数据合在一起找出共同的中位数,然后分别计算每个样本在共同中位数上、下的频数(恰好等于中位数的不计),再进行R×C表的χ2检验。检验步骤①提出假设(H0:两独立样本中高于中位数和低于中位数的数据个数相同)②将两样本数据混合,并找出共同的中位数。③分别统计两样本中大于中位数的数据个数和小于中位数的数据个数。④用独立样本四格表的χ2检验方法进行检验。秩和检验法和中位数检验法,针对的是两独立样本。如果样本的数据不能满足参数检验中独立样本t检验的要求,可以用这两种方法进行差异检验,但检验精度比参数检验要差。二、两相关样本的检验两相关样本的数据是一一对应的成对数据,因此相关样本又称为配对样本。对两相关样本的数据进行非参数检验的方法主要有符号检验法和符号等级检验法。1、符号检验法符号检验法(signtest)以每一对数据之差的正负符号的数目进行检验。检验思想是:如果两样本没有显著性差异,则两样本中每一对数据之差所得的正号与负号的数目应大致相当。实际应用中,遇到无法用数字描述的问题,符号检验法是一种简单而有效的检验方法。⑴.小样本情况(n≤25)检验步骤①.提出假设:H0:P(X1>X2)=P(X1<X2)H1:P(X1>X2)≠P(X1<X2)②.观察每一对数据的差数并记符号③.分别将正号和负号的个数记为n+和n-,0不计。④.将n+和n-较小的一个记为r,并计算N=n++n-⑤.确定检验形式,查表并做出统计决断符号检验表中是单侧检验表,进行双侧检验时,其显著性水平应乘以2。符号检验是以二项分布为基础的。符号检验表也是以二项分布为基础编制的。表17-1单侧符号检验统计决断规则r与临界值比较P值显著性检验结果r>r0.05P>0.05不显著在0.05显著性水平保留H0,拒绝H1r0.01<r≤r0.050.05≥P>0.01显著*在0.05显著性水平拒绝H0,接受H1r≤r0.01P≤0.01极其显著**在0.01显著性水平拒绝H0,接受H1例1:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见表11-2。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异?表11-2关于五种颜色命名得分的测验结果序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622表11-3关于五种颜色命名得分的符号检验计算表序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622差数符号+0++-+0+-++-计算:n+=7,n-=3,因此n=n++n-=10,r=3查表:n=10时,r0.05=1,本题r=3,差异不显著问题:本例题是双侧检验,若单侧检验呢?⑵、大样本情况(n>25)大样本时,由于二项分布接近于正态分布,可用Z作为检验统计量,采用正态近似法。(附表中的数据虽然可满足n从1到90的情况,但在实际应用中,当n>25时常常使用正态近似法)。在零假设条件下,二项分布的平均数和标准差分别为:2nnp21:p假设22121nnnpq为了使计算结果更接近正态分布,可用校正公式计算:nnrnpqnprrZ212nnrZ2125.0(17.1)(17.2)统计量的计算公式为:例2:32人的射击小组经过三天集中训练,训练后与训练前测验成绩见表17-4。问三天的集中训练有无显著效果?表11-4集训前后成绩序号前测后测序号前测后测序号前测后测序号前测后测142409606417504425203623835104739182526266042353561112151963592751444494112323020453728282352421136561213932293430654601448582248533062687433415545223665631606085140166258245754324945计算n+=22,n-=9,n=n++n-=31,r=9338.231212319212nnrrZ16.231212315.092125.0nnrZ2.符号等级检验(符号秩和检验)又称为WilcoxonSigned–Ranktest,也简称为Wilcoxontest,是比符号检验法精确度高一些的另一种非参数检验方法⑴.小样本情况(n≤25)当样本容量n≤25时,用查表法进行符号等级检验:①.提出假设:H0:P(X1>X2)=P(X1<X2)②.求差数的绝对值③.编秩次(赋予每一对数据差数的绝对值等级数)④.添符号(给每一对数据差数的等级分数添符号)⑤.求等级和(分正、负求等级和,将小的记为T)⑥.查符号等级检验表,做出统计决断。表11-5符号等级检验统计决断规则T与临界值比较P值显著性检验结果T>T0.05P>0.05不显著在0.05显著性水平保留H0,拒绝H1T0.01<T≤T0.050.05≥P>0.01显著*在0.05显著性水平拒绝H0,接受H1T≤T0.01P≤0.01极其显著**在0.01显著性水平拒绝H0,接受H1例3:将三岁幼儿经过配对而成的实验组施以五种颜色命名的教学,而对照组不施以教学,后期测验得分见表17-6。问进行教学与不进行教学,幼儿对颜色命名的成绩是否有显著差异?表17-6关于五种颜色命名得分的测验结果序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622表17-7关于五种颜色命名得分的符号检验计算表序号123456789101112实验组X1182026142525211214172019对照组X21320241027172181511622计算:T+=47.5,T-=7.5,因此T=7.5查表:n=10时(差数为0不计),T0.05=8,差异显著差数5024280416143等级72.55.52.595.518104添符号+++–++–++–⑵.大样本情况(n>25)当样本容量n25时,二项分布接近于正态分布,因此有:41nnT24121nnnT检验统计量可计算为:TTTZ241214/1nnnnnT(17.3)例4:32人的射击小组经过三天集中训练,训练后与训练前测验成绩见表17-8。问三天的集中训练有无显著效果?表17-8集训前后成绩计算表序号前测后测序号前测后测序号前测后测序号前测后测142409606417504425203623835104739182526266042353561112151963592751444494112323020453728282352421136561213932293430654601448582248533062687433415545223665631606085140166258245754324945计算T+=356.5T-=139.5因此,T=139.5,n=31241214/1nnnnnTZ13.2241312131314/131315.139符号检验法和符号等级检验法,针对的是相关样本。如果样本的数据不能满足参数检验中相关样本t检验的要求,可以用这两种方法进行差异检验,但检验精度比参数检验要差。三、等级方差分析方差分析要求满足“总体正态”、“方差齐性”等条件,而且只能针对连续型测量数据。当这些条件不能满足时,就需要采用非参数检验的方法。等级方差分析就是方差分析的非参数检验方法。1、克-瓦氏单向等级方差分析克-瓦氏单向等级方差分析是一种非参数方差分析方法,又称为克-瓦氏H检验法(Kruskal–WallisH)。用于对多组独立样本进行分析,对应于参数检验法中的完全随机设计方差分析。基本分析过程:将多组样本数据合在一起编秩次(从小到大赋予等级)计算各样本的等级和R代入统计量公式计算H查统计表做出统计结论统计量计算公式公式中,N为各组频数总和,n为各样本容量,R为各组数据秩次和。(17.5)131122NnRNNH统计决断方法1、样本容量较小或组数较少情况当各组的容量n≤5,或者样本组数k≤3,可查H检验表,根据相应的样本容量找出概率值。(P≤0.05时差异显著)2、样本容量较大或组数较多情况当各组容量n>5,或者样本组数k>3时,由(17.5)式计算的H值,其抽样分布接近于自由度df=k-1的χ2分布,因此可查χ2值表进行统计决断。例6:三个小组图画成绩见表17-12,问三组成绩是否有显著差异?表17-12三个小组图画成绩计算表等级分数甲乙丙5.5114104127111323985.5序号原始分数甲乙丙162458527760793687882454567657062合计N=5+5+4=14R1=32.5R2=24.5R3=48计算根据k=3,n1=5,n2=5,n3=4查表判断131122NnRNNH114344855.2455.321141412222846.62、弗里德曼双向等级方差分析弗里德曼双向等级方差分析(Friedmantest)用于多组相关样本,是随机区组设计的非参数检验。双向等级方差分析是对同一个对象(或匹配的对象)接受k次实验处理所获得的原始数据之间编秩次(即赋予等级),然后以这些等级数为基础,计算值作为检验统计量。2r统计量计算公式为:1311222knRknkr(17.6)统计决断方法1.样本容量较小或组数较少情况当样本容量n≤9,k=3;或者n≤4,k=4时,可查