spss秩和检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

研究生SPSS统计——秩和检验第1页/共17页秩和检验前面介绍的均数的区间估计及假设检验,都是要求个体变量值服从正态分布,或根据中心极限定理,当样本较大时,样本均数服从正态分布。这种要求样本来自总体分布型是已知的,在此基础上对总体参数进行估计或检验,称为参数统计(parametricstatistics)。但在医学研究中,许多数据不符合参数统计的要求,这时有两种处理的方法。一是,进行数据转换,使其符合参数统计方法的要求。二是,选择非参数检验方法,非参数检验(non-parametrictest)方法是对样本来自的总体分布不作要求(如不要求样本来自正态分布)的一类假设检验方法。非参数检验的主要优点是对样本的总体分布不作要求,适用的范围广,尤其是当变量中有不确定数值时,如0.5mg,可用非参数检验。同时,非参数检验方法存在其致命的缺点,其检验功效低于相应的参数统计方法。因此,如果数据符合参数统计的要求首选参数统计方法;如果数据不符合参数统计的要求有两个选择,一是选择非参数检验方法。下面介绍了属于非参检验的两种秩和检验(ranksumtest)方法。二是,将数据经过变换使其符合参数统计方法,再选择参数统计方法,本节介绍了几种数据变换方法。应用条件①总体分布形式未知或分布类型不明;②偏态分布的资料:③等级资料:不能精确测定,只能以严重程度、优劣等级、次序先后等表示;④不满足参数检验条件的资料:各组方差明显不齐。⑤数据的一端或两端是不确定数值,如“50mg”等。一、配对资料的Wilcoxon符号秩和检验(Wilcoxonsigned-ranktest)例1对10名健康人分别用离子交换法与蒸馏法,测得尿汞值,如表9.1的第(2)、(3)栏,问两种方法的结果有无差别?表110名健康人用离子交换法与蒸馏法测定尿汞值(μg/l)样品号(1)离子交换法(2)蒸馏法(3)差值(4)=(2)(3)秩次(5)10.50.00.5222.21.11.1730.00.00.0—42.31.31.0656.23.42.88研究生SPSS统计——秩和检验第2页/共17页61.04.6-3.6-971.81.10.73.584.44.6-0.2-192.73.4-0.7-3.5101.32.1-0.8-5T+=+26.5T-=-18.5差值先进行正态性及方差齐性检验,看是否可以做参数检验,其检验效能高于非参数检验。(下同)H0:Md(差值的总体中位数)=0H1:Md≠0α=0.05T++T-=1+2+3+…n=n(n+1)/2①小样本(n≤50)--查T界值表基本思想:如果无效假设H0成立,则正负秩和的绝对值从理论上说应相等,都等于n(n+1)/4,既使有抽样误差的影响正负T值的绝对值相差也不应过大。反过来说,如果实际计算出的正负T值绝对值相差很大,我们只能认为H0成立的可能性很小。界值的判断标准若下限T上限,P值表中概率值若T≤下限或T≥上限,则P值≤表中概率值②大样本时(n50),正态近似法(Z检验)基本思想:假定无效假设H0成立,则正负秩和的绝对值应相等,随着n增大T逐渐趋近于均数等于n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布。所以可用近似正态法计算Z值。即:24)12)(1(5.0|4/)1(|nnnnnTZ*校正公式:当相同秩次个数较多时48)(24)12)(1(5.0|4/)1(|3jjttnnnnnTZtj:第j个相同秩次的个数SPSS:建立变量名:研究生SPSS统计——秩和检验第3页/共17页录入数值:统计分析:研究生SPSS统计——秩和检验第4页/共17页分析——非参数检验——两相关样本(配对样本)结果分析:研究生SPSS统计——秩和检验第5页/共17页表一:第一行:b-a的负秩(NegativeRanks)有5个(右上角的a在表下方有注释),平均秩次为5.3,负秩和为26.5。第二行:正秩,正秩的个数,平均秩次,正秩和。表二:可用正秩和18.5或负秩和26.5计算,习惯上用较小的秩和计算Z值。p=0.635大于0.05,不拒绝H0,还不能认为两种方法有差别。二、两个独立样本比较的Wilcoxon秩和检验(Wilcoxonranksumtest)1.原始数据的两样本比较例2某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以生存日数作为观察指标,试检验两组小鼠生存日数有无差别?实验组对照组生存日数秩次生存日数秩次109.5211212.5321515431516541617651718761819872020982321109.590以上221111研究生SPSS统计——秩和检验第6页/共17页1212.51314n1=10T1=170n2=12T2=83时间资料不服从正态分布H0:两总体分布位置相同H1:两总体分布位置不同a=0.05记n较小组秩和为T,样本量n1。如果n1=n2,可取任秩和①查表法:查T界值表:n1≤10,n2n1≤10界值的判断标准:若下限T上限,P值表中概率值若T≤下限或T≥上限,则P值≤表中概率值②正态近似法当n1或n2-n1超出T界值表的范围时,随n增大,T的分布逐渐逼近均数为n(n+1)/4、方差为n(n+1)(2n+1)/24的正态分布,所以可用近似正态法计算Z值。即:12/)1(5.0|2/)1(|2111NnnNnTZ*校正公式(当相同秩次较多时)cZZC/)-/()-(-133NNttCjjSPSS建立变量名:录入数值:研究生SPSS统计——秩和检验第7页/共17页统计分析:研究生SPSS统计——秩和检验第8页/共17页结果分析:Z值为-3.630,p<0.001,拒绝H02.频数表资料(或等级资料)的两样本比较例320名正常人和32名铅作业工人尿棕色素定性检查结果见下表。问铅作业工人尿棕色素是否高于正常人?结果(1)人数秩次范围(5)平均秩次(6)秩和正常人(2)铅作业工人(3)合计(4)正常人(7)=(2)(6)铅作业工人(8)=(3)(6)研究生SPSS统计——秩和检验第9页/共17页-188261-2613.52431082101227-3832.565325++07739-4542.00294+++03346-4847.00141++++04449-5250.50202合计n1=20n2=3252--T1=308T2=1070取n较小组的秩和为T值,用校正公式计算。即:12/)1(5.0|2/)1(|2111NnnNnTZcZZC/)-/()-(-133NNttCjjSPSS:建立变量名:录入数值:统计分析:研究生SPSS统计——秩和检验第10页/共17页研究生SPSS统计——秩和检验第11页/共17页结果分析:同两个独立样本比较的Wilcoxon秩和检验Mann-WhitneyTestRanks2015.40308.003233.441070.0052VAR000011.002.00TotalVAR00002NMeanRankSumofRanksTestStatisticsa98.000308.000-4.503.000Mann-WhitneyUWilcoxonWZAsymp.Sig.(2-tailed)VAR00002GroupingVariable:VAR00001a.P<0.001,拒绝H0三、多个样本比较的秩和检验(Kruskal-WallisHtest)1.原始数据法例4某研究者测定正常人、单纯性肥胖、皮质醇增多症者各10人的血浆总皮质醇含量见下表,问这三组人的血浆总皮质醇含量有无差别?研究生SPSS统计——秩和检验第12页/共17页三组人的血浆总皮质醇含量测定值(μg/L)正常人单纯性肥胖皮质醇增多症测定值秩次测定值秩次测定值秩次0.410.629.8201.941.2310.2212.262.0510.6222.582.4713.0232.893.110.514.0253.110.54.11414.8263.7125.01615.6273.9135.91715.6284.6157.41921.6296.01813.62424.030Rini96.510117.51025110H0::三组人的血浆总皮质醇含量总体分布位置相同H1:三组人的血浆总皮质醇含量总体分布位置不全相同a=0.05)1(3)1(122NnRNNHii1kSPSS建立变量名录入数值:研究生SPSS统计——秩和检验第13页/共17页统计分析:研究生SPSS统计——秩和检验第14页/共17页结果分析:研究生SPSS统计——秩和检验第15页/共17页若g(组数)=3且最小样本例数大于5或g3时,H或HC近似服从自由度为g-1的卡方分布。H=18.130,自由度=2,P<0.001,拒绝H0,三组总体分布位置不全相同,需做两两比较。2.频数表法:例5(单向有序分类变量的多个样本比较)用A、B、C三种药物治疗单纯性慢性支气管炎,结果见表第(1)~(5)栏,问三种药物的总体疗效是否不同。表三种药物疗效比较的秩和检验计算过程疗效(1)药物合计(5)秩次范围(6)平均秩次(7)秩和R1(8)=(2)(7)秩和R2(9)=(3)(7)秩和R3(10)=(4)(7)A(2)B(3)C(4)治愈1753251~2513.0221.065.039.0显效5111177926~10465.03315.0715.01105.0好转335247132105~236170.55626.58866.08013.5无效7242657237~293265.01855.06360.06890.0合计1089293293——11017.516006.016047.5检验步骤如下:研究生SPSS统计——秩和检验第16页/共17页(1)建立检验假设H0:三种药物疗效的总体分布相同H1:三种药物疗效的总体分布不同或不全相同=0.05(2)编秩用各疗效等级的合计值排序确定秩次范围,如表第(6)栏所示,A、B、C三种药物总的治愈人数是25,他们的秩次范围是1~25。同理疗效为“显效”组的秩次范围是26~104,以此类推。再对第(6)栏秩次范围的上下限求和取平均值得各等级的平均秩次,如第(7)栏所示,疗效为“治愈”组的平均秩次为1+252=13。(3)求秩和分别用第(2)~(4)栏各等级的频数与(7)栏平均秩次相乘再求和,如第(8)~(10)栏所示。(4)计算统计量H值将第(8)~(10)栏的总秩和ΣT1、ΣT2、ΣT3代入公式(11.15)计算H值。若各样本相同秩次较多时(如超过25%),由公式(11.15)计算所得H值偏小,应按公式(11.16)和公式(11.17)对H值作校正计算HcH=12N(N+1)(∑Ri2ni)-3(N+1)H=12293(293+1)((11017.5)2108+(16006.0)292+(16047.5)293)-3(293+1)=48.23C=1-(tj3-tj)/(N3-N)C=1-(253-25)(793-79)(1323-132)(573-57)/(2933-293)=0.9086Hc=H/CHc=48.23/0.9086=53.08(5)确定P值和作出统计结论研究生SPSS统计——秩和检验第17页/共17页若组数k=3,每组例数均小于或等于5,可查附表H界值表,得出P值。本例各组例数均大于5,已超出附表的范围,则H值近似服从ν=k-1的χ2分布,可查附表的χ2界值表。故按ν=3-1=2,查χ2界值表得χ20。05(2)=5.99,因为53.085.99,故P0.05。按α=0.05水平拒绝H0,接受H1认为三种药物的疗效不同或不全相同。用SPSS统计软件中的nonparametrictests—KIndependentSamples—Kruskal-WallisH程序做秩和检验得到Hc统计量。)1(3)1(122NnRNNHiicHHc)()(133N

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功