第一节非参数检验的基本概念及特点一、非参数检验(一)什么是“非参数”非参数模型:缺乏总体分布模式的信息。(二)非参数检验的定义非参数检验:不需要假设总体是否为正态分布或方差是否为齐性的假设检验称非参数检验。(三)非参数检验的优点和缺点:1、优点:一般不涉及总体参数,其假设前提也比参数假设检验少得多,适用面较广。计算简便。2、缺点:统计效能远不如参数检验方法。由于当数据满足假设条件时,参数统计检验方法能够从其中广泛地充分地提取有关信息。非参数统计检验方法对数据的限制较为宽松,只能从中提取一般的信息,相对参数统计检验方法会浪费一些信息。(四)非参数检验的特点:1、它不需要严格的前提假设;2、特别适用于顺序数据;3、适用于小样本,且方法简单;4、最大的不足是不能充分利用资料的全部信息;5、不能处理“交互作用”,即多因素情况。第二节两个独立样本的非参数检验方法一、秩和检验法秩和即秩次的和或等级之和。秩和检验法也叫Mann-Whitney-Wilcoxon检验,它常被译为曼-惠特尼-维尔克松检验,简称M-W-W检验,也称Mann-WhitneyU检验。秩和检验法与参数检验法中独立样本的t检验法相对应。当“总体正态”这一前提不成立时,不能用t检验,可以用秩和检验法。(一)秩统计量秩统计量指样本数据的排序等级。假设从总体中反复抽取样本,就能得到一个对应于样本容量1n和2n的秩和U的分布。这是一个间断而对称的分布,当1n和2n都大于10时,秩和T的分布近期近似正态分布,其平均数和标准差分别为21211nnnT1212121nnnnT其检验值为TTTZ(二)计算过程1、小样本:两个样本容量均小于10(n110,n210)例11-1:在一项关于模拟训练的实验中,以技工学校的学生为对象,对5名学生用针对某一工种的模拟器进行训练,内外让6名学生下车间直接在实习中训练,经过同样的时间后对两组人进行该工种的技术操作考核,结果如下:模拟器组:56,62,42,72,76实习组:68,50,84,78,46,92假设两组学生初始水平相同,则两种训练方式有无显著差异?表11-1两种训练方式的成绩考核成绩成绩排列等级等级和模拟器组(5人)56421251T62564426257272776768实习组68462412T(6人)505038468678789468410929211检验过程:1.建立假设0H:21RR,即两样本无显著差异aH:21RR,即两样本有显著差异2.计算统计量1)将数据从小到大排列,见上表。2)混合排列等级,即将两组数据视为一组进行等级排列,见上表。3)计算各组的秩和,并确定T值,即T=min(T1,T2)min(25,41)=253.比较与决策若T1<T<T2,则接受虚无假设,拒绝研究假设。若T≤T1,或T≥T2,拒绝虚无假设,接受研究假设。查秩和检验表,当n1=5,n2=6,T1=19,T2=41,因为192541,即T1TT2,所以接受虚无假设,拒绝研究假设,差异不显著。说明两种训练的成绩无显著差异。2、大样本:两个样本容量均大于10(n110,n210)例11-2:对某班学生进行注意稳定性实验男生与女生的实验结果如下,试检验男女生之间注意稳定性有否显著差异?男生:(n1=14)19,32,21,34,19,25,25,31,31,27,22,26,26,29女生:(n2=17)25,30,28,34,23,25,27,35,30,29,29,33,35,37,24,34,32检验过程:1.建立假设0H:21RRaH:21RR2.计算统计量1)求秩和T。先混合排列等级,再计算1T和2T,最后确定T。排序如下:男生:,,,,,,,,,,,,,,175.115.1145.135.215.215.85.85.12735.235.1女生5.23276315.292517175.195.295.135.8527155.195.8,,,,,,,,,,,,,,,,175.115.1145.135.215.215.85.85.12735.235.1T=174=2)求Z值98.12.25224174-TZTT3.比较与决策2/05.098.1ZZ,05.0p,拒绝虚无假设,差异达到显著性水平。说明男女在注意稳定性上有显著差异。二、中数检验法(一)适用条件中数检验法对应着参数检验中两独立样本平均数之差的t检验。中数检验法的基本思想是将中数作为集中趋势的量度,检验不同的样本是否来自中位数相同的总体。因而其虚无假设(H0)为:两个独立样本是从具有相同中数的总体中抽取的,它也可以是双侧检验或单侧检验。双侧检验结果若有统计学意义,意味着两个总体中数有差异(并,2242)11714(1421nnn211T=2.2512)11714(1714211nnnn2121T没有方向);单侧检验结果若有统计学意义,则表明对立假设“一个总体中数大于另一个总体中数”成立。(二)计算过程例题13-8:为了研究核糖核酸是否可以作为记忆的促进剂,研究者以老鼠为对象分成实验组与控制组。实验组注射RNA,控制组注射生理盐水,然后在同样的条件下学习走迷津,如果如下(单位:时间)。试问两组的学习成绩有无显著差异?实验组:16.7,16.8,17.0,17.2,17.4,16.8,17.1,17.0,17.2,17.1,17.2,17.5,17.2,16.8,16.3,16.9控制组:76.6,17.2,16.0,16.2,16.8,17.1,17.0,16.0,16.2,16.5,17.1,16.2,17.1,16.8,16.51.提出假设0H:mdnmdnBA,即两组中位数相等,或两组成绩无显著差异aH:mdnmdnBA,即两组中位数不等,或两组成绩有显著差异2.计算统计量1)求混合中数。将数据按大小排列,确定中数。表13-11中数计算表1616.216.316.516.616.716.816.91717.117.217.417.5f2312115144511F2568910151620242930319.1616213121XXXMdnN2)统计多个样本在中数上下的次数,列出列联表。表13-12计数表实验组控制组>Mdn的次数10515<Mdn的次数510151515303)求2值33.31515151555101030223.比较与决策33.32<84.3205.01,p>0.05,差异不显著,接受虚无假设,拒绝研究假设。说明实验组与控制组在迷津学习中差异不显著,即RNA对记忆无明显的促进作用。第三节配对样本的非参数检验方法一、符号检验法(一)、适用条件符号检验是以正负符号作为资料的一种非参数检验程序。它是一种简单的非参数检验方法,适用于检验两个配对样本分布的差异,与参数检验中配对样本差异显著性t检验相对应。符号检验也是将中数作为集中趋势的量度,虚无假设是配对资料差值来自中位数为零的总体。它是将两样本每对数据之差(Xi—Yi)用正负号表示,若两样本没有显著性差异,理论上正负号应各占一半或不相上下。相反,若正负个数相关较大,则可能存在差异,由此表明两个样本不是来自同一总体,并可推论两样本的总体存在差异。(二)、计算过程1、小样本符号检验法N≤25例11-4:用配对设计方法对9名运动员不同方法训练,每一个对子中的一名运动员按传统方法训练,另一名运动员接受新方法训练。课程进行一段时间后对所有运动员进行同一考核,结果如下。能否认为新训练方法显著优于传统方法配对123456789传统(X)858887868282707280新法(Y)908487859094858892符号(X-Y)-+0+-----1)建立假设单侧检验0H:P<PaH:P>P2)标记配对数据之差的符号。见上表。3)统计符号总数N。符号总数中不包含0,只包括正号和负号个数和,即nnN=2+6=84)将n,n中的较小者记为r,即nnr,min5)比较与决策根据符号总和N及显著水平值查符号检验临界值表,见附表15。表中列出了符号总和与显著性水平所对应的临界值r,其判断规则如下表。表11-2单侧符号检验法的方法的统计判断规则表r与临界值(CR)比较P值差异显著性r>r0.05P>0.05不显著2nr0.01<r≤r0.05r≤r0.010.01<P≤0.05P≤0.01显著极显著查附表15,N=8时,临界值为0(0.05水平),而实得r=n+=2r0.05。所以差异不显著,接受虚无假设,不能认为新法显著优于传统方法。2、样本容量N25时在附表15中,虽然N是从1到90,就是说N在这个范围内时都可以用查附表15的方法,但是在世纪中当N25时常常使用正态近似法。将N分为n+和n-两部分,为二项分布,根据二项分布的原理,有21qp,NNp21,22121NNNpqrZ22NNr为了更接近正态分布,采用较正公式,即2205.0NNrZ例11-5:在教学评价活动中,要求学生对教师的教学进行7点评价(即1-7分),下表是某班学生对一位教师期中与期末的两次评价结果,试问两次结果差异是否显著?学生期中(X)期末(Y)Xi—Yi136-227-354+415-532+623-713-837-932+1013-113301212-1354+1426-1536-1614-1753+1812-1946-2032+2137-2212-2313-2446-2535-2653+2743+2856-①建立假设0H:PPaH:P≠P②确定正、负号数目,正负号总数N的r值8n,19n,27nnN,8)19,8min(r③计算统计量92.12/272/27)5.08(Z④比较与决策2/05.092.1ZZp>0.05,接受虚无假设,差异不显著。不能认为期中、期末两次评价结果有显著差异。二、符号等级检验法(一)适用条件维尔克松符号等级检验法(WilcoxonSigned-Ranktest)是由维尔克松提出的,又称符号秩和检验,有时也简称为维尔克松检验法。其使用条件与符号检验法相同,也适合于配对比较,但它的精度比符号检验法高,因为它不仅仅考虑差值的符号还同时考虑差值大小。目的是推断配对样本差值的总体中位数是否和0有差别,即推断配对的两个相关样本所来自的两个总体中位数是否有差别。(二)计算步骤1、小样本(N≤25)检验(1)把相关样本对应数据之差值按绝对值从小到大作等级排列(注意差值为零时,零不参加等级排列);(2)在各等级前面添上原来的正负号;(3)分别求出带正号的等级和(T+)与带负号的等级和(T-),取两者之中较小的记作T;(4)根据N,T查符号等级检验表,当T大于表中临界值时表明差异不显著;小于临界值时说明差异显著。例11-6:某幼儿园对10名儿童在刚入园时和入园一年后均进行了血色素检查,结果如下,试问两次检查有否明显变化?儿童ABCDEFGHIJ刚入园12.311.313.015.012.015.013.512.810.011.0一年后12.014.013.813.811.414.013.513.512.014.7差值-0.32.70.8-1.2-0.6-1.000.72.03.7差值绝对值排等级184625379添符号-184-6-2-53791)建立假设0H:正负号等级和无显著差异。即入园时和入园一年没有显著差异,TT。aH:正负号等级和有显著关系。即入园时和入园一年有显著差异,TT2)求成对数据的差数D值,见上表。3)按D排列顺序(不包括0)并添加符号。并将原来差值的正负号添加在等级前。4)计算正号等级和(T)与负号等级和(T),并取较小者为T值,即T-=1+6+2+5