Wilcoxon符号秩检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

§2.2Wilcoxon符号秩检验Wilcoxon符号秩检验(Wilcoxonsigned-ranktest)是非参数统计中符号检验法的改进,它不仅利用了观察值和原假设中心位置的差的正负,还利用了差的值的大小的信息。虽然是简单的非参数方法,但却体现了秩的基本思想。例2.4下面是10个欧洲城镇每人每年平均消费的酒量(相当于纯酒精数)(单位:升)。数据已经按升幂排列。4.125.187.639.7410.3911.9212.3212.8913.5414.45人们普遍认为欧洲各国人均年消费酒量的中位数相当于纯酒精8升,也就是me0=8。由数据算得的中位数为11.16。因此,我们的检验设为:H0:me=8,H1:me8先计算每个样本值和原假设中me0的值之差,即Xi-8。考虑这些差的绝对值并将绝对值从小到大排序,从而求出这些绝对值的秩。再计算比8大的样本对应的绝对值的秩之和,如果这个和比较大,我们就拒绝原假设,接受备择假设。问题一般提法:假定样本X1,…,Xn来自分布连续对称的总体X,在此假定下总体X的中位数等于均值。问题主要是检验中位数,即原检验为H0:me=me0,相对于各种单双边的备择假设。注:(1)与符号检验不同:Wilcoxon符号秩检验假设总体分布是对称的。(2)在总体分布对称的假设下,即设总体X的分布关于点θ对称,则X的均值和中位数相同,且均为θ。所以检验总体中位数可等价于检验总体对称中心。即检验的原假设H0:M=M0等价于H0:θ=θ0(相对于各种单双边的备择假设)。检验步骤:H0:θ=θ0(对应于各单双边备择假设)Step1.计算i=1,2,…,n。记差为zi.Step2.将差zi.的绝对值,即…,按从小到大的顺序排列。由于总体服从连续型分布,不妨假定样本互不相等,都不等于0,且样本差的绝对值也互不相等。所以可得到样本zi.的绝对值的秩,不妨记的秩为Ri。,1znziz,0ixStep3.符号秩和检验统计量为其中或者取检验统计量为其中主要取W+为检验统计量。,1niiiRuW否则。;,00,1viiz,v1iniiRW-否则。,00,1iizuStep4设w+表示由样本算出的W+的值。(1)H0:θ=θ0,H1:θθ0p值=P(W+≥w+);(2)H0:θ=θ0,H1:θθ0p值=P(W+≤w+);(3)H0:θ=θ0,H1:θ≠θ0p值=2min{P(W+≥w+),P(W+≤w+)}对Step4的注解:对于对称中心不为0的总体分布,可以转化为中心为0的情况进行检验!现不妨假设θ0=0,则原假设变为H0:θ=0对于这种检验,通过严格的证明来说明p值的选取。(1)H0:θ=0,H1:θ0。若H1成立,则总体X的分布关于点θ对称。从而有,P(X0)P(X0),且对任意正数a,P(Xa)P(X-a)。所以当H1成立,不仅观察到的取正值的样本数据的个数比较多,且取正值的样本数据的拒绝值也比较大。由此,H1成立时,W+的值较大。所以p值=P(W+≥w+)。例2.2中我们的检验设为:H0:M=8,H1:M8下面来用Wilcoxon符号秩检验,等价于检验H0:θ=8,H1:θ8检验步骤Step1.对于i=1,2,…,n,计算得到新的样本zi和它们对应的秩如下:样本xi4.125.187.639.7410.3911.9212.3212.913.5414.45zi的符号---+++++++zi的绝对值3.882.190.371.742.393.924.324.895.546.45秩53124678910Step2.计算W+。W+=2+4+6+7+8+9+10=46利用W+的分布,辅以统计软件,可计算出p值=0.032。Step3.所以给定α=0.05时,此时可拒绝原假设,认为欧洲人均酒精年消费多于8升。W+的分布性质设独立同分布样本x1,…,xn来自连续对称总体X,X分布的对称中心为θ。为方便讨论,不妨设原假设为H0:θ=0,即总体分布关于原点0对称的条件下,讨论W+的性质。注:W+与W-有下列关系:W++W-=n(n+1)/2(关键)性质2.1令则在总体的分布关于原点0对称时,W+与S同分布。注:S是W+当Ri=i时的特殊情况。研究W+的分布可转为研究S的分布。,1niiiuS概率分布性质2.2在总体的分布关于原点0对称时,W+的概率分布为P(W+=d)=P(S=d)=tn(d)/2n,其中,d=0,1,2,…,n(n+1)/2,tn(d)表示从1,2,…,n这n个数中任取若干个数(包括一个都不取),其和恰为d,共有多少种取法。对称性性质2.3在总体的分布关于原点0对称时,W+服从对称分布,对称中心为n(n+1)/4,即:对所有的d=0,1,2,…,n(n+1)/4,有P(W+=n(n+1)/4-d)=P(W+=n(n+1)/4+d),P(W+≤n(n+1)/4-d)=P(W+≥n(n+1)/4+d)。期望方差及渐近正态性性质2.4在总体分布关于原点0对称时,E(W+)=n(n+1)/4,D(W+)=n(n+1)(2n+1)/24。性质2.5若总体分布关于原点0对称,则在样本容量n趋于无穷大时,W+有渐近正态性:W+N(n(n+1)/4,n(n+1)(2n+1)/24)L有结的情况下,用平均秩法。性质2.6在总体的分布关于原点0对称,有结秩取平均时,E(W+)=n(n+1)/4,D(W+)=n(n+1)(2n+1)/24-其中g表示结的个数,表示第i个结的长度。有结时,W+的期望和方差实际上是条件期望和方差,它们是在样本数据中给定有g个结,且结的长度分别给定为时的条件期望和条件方差。48/)(13igiiig,,,21与符号检验的比较。续例2.2两个不同方向的假设检验。考虑下面的假设检验:H0:M=12.5,H1:M12.5(H2)比较它与前一个假设检验:H0:M=8,H1:M8(H1)对这两个问题分别用Wilcoxon符号秩检验和符号检验方法。符号检验结果对于检验(H1):S-=3,S+=7,检验统计量K=S+=3,p值=0.171875,对α=0.05,不能拒绝H0。对于检验(H2):S-=7,S+=3,检验统计量K=S+=3,p值=0.171875,对α=0.05,不能拒绝H0。结果完全对称!说明符号检验只与符号有关!Wilcoxon符号秩检验结果对于检验(H1):检验统计量W+=46,p值=0.03223,对α=0.05,拒绝H0。对于检验(H2):检验统计量W+=11,p值=0.05273,对α=0.05,不能拒绝H0。结果不对称!说明Wilcoxon符号秩检验不仅与符号有关,还和数值大小有关!Wilcoxon符号秩检验置信区间Walsh平均为利用更多的信息,可求每两个数的平均(Xi+Xj)/2,i≤j,(一共有n(n+1)/2个)来扩大样本数目。这样的平均称为Walsh平均。Walsh平均和W+的关系。在原假设成立的条件下,即H0:θ=θ0成立,有特别当原假设为H0:θ=0成立,有}.,2{#)(00jiXXWji}.,02{#jiXXWjiHodge-Lehmann估计量利用Walsh平均可以得到对称中心θ的点估计,即可由Walsh平均的中位数来估计对称中心,称之为Hodge-Lehmann估计量。}.,2{ˆjiXXmedianjiθ0的置信区间。可利用Walsh平均得到θ0的100(1-α)%置信区间。具体步骤:(1)先求出满足下面两式的整数k,即k使得P(W+≤k)≤α/2,P(W+≥n-k)≤α/2,(2)将求出的Walsh平均数,按升幂排列,记为W(1),…,W(N),N=n(n+1)/2,则θ0的100(1-α)%置信区间为[W(k+1),W(N-k)]。再看看例2.2的置信区间。求出其Walsh平均,共55个值。取α=0.05,则求得k=9时,有P(W+≤9)≤0.025,P(W+≥55-9)≤0.025,所以θ的95%的置信区间为[W(10),W(46)]=[8.02,12.73]。两配对数据比较问题两成对数据的比较问题可以转化成单样本问题,用符号检验或Wilcoxon符号秩检验做统计分析。方法是将两成对样本作差,观察它们的差值,将其视为新的样本,所以两配对样本实际上就是单一样本。例2.3给12组双胞胎做心理检验,以测量每个人的进取心。我们感兴趣的是对双胞胎进行比较,看第一个出生的是否倾向于比另外一个更有进取心。结果如下,高分显示更多的进取心。表中,Xi表示第一个出生的得分,Yi表示第二个出生的得分。Di表示两者差,即Di=Yi-Xi,i=1,2,…,12。Ri表示Di绝对值的秩。则D1,…,D12是独立同分布的,且设总体为D。问题是求D的中位数MD的95%置信区间。双胞胎组123456789101112Xi867177689172779170718887Yi887776649662658862808172Di符号++--+----+--|Di|261451012389715Ri261451011389712Di的12个值按顺序排列为:-15,-12,-10,-8,-7,-4,-3,-1,2,5,6,9间为[W(15),W(64)]。这15个最小的平均,由(-15-15)/2开始,是-15,-13.5,-12.5,-12,-11.5,-11,-11,-10,-10,-9.5,-9.5,-9,-9,-8.5,-8所以,W(15)=-8,即置信区间下界是-8。15个最大的平均,从(9+9)/2开始,是9,7.5,7,6,5.5,5.5,5,4,4,3.5,2.5,2,2,1.5,1所以,W(64)=1,置信区间的上界是1。所以中位数95%的置信区间是[-8,1]。

1 / 33
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功