非参数统计分析方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医疗等本科生《医学统计学》第六章非参数统计分析方法2019年12月15日已知总体分布类型,对未知参数(μ、π)进行统计推断依赖于特定分布类型,比较的是参数参数统计(parametricstatistics)非参数统计(nonparametricstatistics)对总体的分布类型不作任何要求不受总体参数的影响,比较分布或分布位置适用范围广;可用于任何类型资料(等级资料,或“50mg”)对于符合参数统计分析条件者,采用非参数统计分析,其检验效能较低2019年12月15日秩和检验第一节两独立样本差别的秩和检验第二节配对设计资料的秩检验第三节完全随机设计多组差别的秩和检验第四节随机单位组设计的秩和检验秩和检验(ranksumtest):一类常用的非参数统计分析方法;基于数据的秩次与秩次之和2019年12月15日第一节两独立样本差别的秩和检验Wilcoxonranksumtest对于计量数据,如果资料方差相等,且服从正态分布,就可以用t检验比较两样本均数。如果此假定不成立或不能确定是否成立,就应采用秩和检验来分析两样本是否来自同一总体。表6-1两独立样本秩和检验计算表A样本B样本观察值秩号观察值秩号743114652221063361110540131774814188631520998163912n1=8秩和R1=89n2=8秩和R2=47基本思想两样本来自同一总体任一组秩和不应太大或太小如果两总体分布相同假定:两组样本的总体分布形状相同T与平均秩和应相差不大2/)1(0Nn212121),,min(,nnRRnnT较小例数组的秩和),min(21021nnnnnN2019年12月15日⑴H0:两样本来自相同总体;H1:两样本来自不同总体(双侧)=0.05或H1:样本A高于样本B(单侧)⑵编秩:两样本混合编秩次,求得R1、R2、T。相同观察值(即相同秩,ties),不同组------平均秩次。⑶确定P值作结论:①查表法(n0≤10,n2n1≤10)查附表9如果T位于检验界值区间内,,不拒绝H0;否则,,拒绝H0本例T=47,取α=0.05,查附表9得双侧检验界值区间(49,87),T位于区间外,P0.05,因此在α=0.05的水平上,拒绝H0,接受H1。②正态近似法:12/)1(|2/)1(|210NnnNnTu*校正公式(当相同秩次较多时)个相同秩号的数据个数为第itttNNNNccuuiiiic;)(;333PP96.1205.22/05.0u本例2019年12月15日表6-2某药对两种不同病情的支气管炎疗效的秩和检验疗效单纯型(1)单纯型合并肺气肿(2)合计(ti)(3)=(1)+(2)秩号范围(4)平均秩次(5)秩和单纯型(6)=(1)(5)合并肺气肿(7)=(2)(5)控制65421071-1075435102268显效18624108-131119.52151717有效302353132-18415847403634近控131124185-208196.52554.52161.51268212955.58780.5编号病情疗效1单纯型控制2单纯型合并肺气肿显效3单纯型合并肺气肿有效4单纯型控制………206单纯型显效207单纯型合并肺气肿有效208单纯型近控1.H0:两组疗效相同;H1:两组疗效不同,取α=0.052.编秩,求各组秩和T;本例T=8780.54986.012/)1208(82126|2/)1208(825.8780|u0883.1))2424()5353()2424()107107((208208208208333333c5426.0cuuc2019年12月15日附表9的来历?设第一组“×”,n1=3;第二组“∆”,n2=3若T≤6,P=0.05(单侧)若T≤7,P=0.05+0.05=0.10(单侧)2036秩次秩和概率P123456T界值×××6×××70.05×××80.05×2=0.10××××××90.05×3=0.15××××××05.02012019年12月15日附表9的来历?设第一组“×”,n1=3;第二组“∆”,n2=3若T≥15,P=0.05(单侧)T≥14,P=0.05+0.05=0.10(单侧)对应于单侧0.05或双侧0.10,临界值为6和152036秩次秩和概率P123456T界值×××120.05×3=0.15×××××××××130.05×2=0.10××××××140.05×××1505.02012019年12月15日Wilcoxon-Mann-WhitneyU检验一般文献上使用的方法:Wilcoxon_Mann_WhitneyU检验两种方法是独立提出的,检验结果完全等价的;前者用T统计量计算u统计量,而后者直接计算u值,即:)2)1(,2)1(min(2222111121RnnnnRnnnnu上例中:4986.05.4954)5.87802838282126,5.12955212712682126min(u2019年12月15日第二节配对设计资料的秩检验(Wilcoxonsignedranktest)家兔号A照射B照射A-B秩次(1)(2)(3)(4)(5)139551610242541293515543443474355553-2-164563181172252301284844-4-39404886104555108114032-8-612495786合计R=10(68)表6-3家兔皮肤损伤程度(评分)1.H0:差值的总体中位数=0,H1:差值的总体中位数0;=0.052.求差值;依其绝对值从小到大编秩次(i)绝对值相等者(tie)取平均秩次;(ii)将差值的正负标在秩次之前;(iii)零差值时秩次正负各半(或不参与编秩)3.分别求正负秩次之和,以绝对值较小者为R值4.根据统计量R确定对应的P值(i)小样本时,查表(附表10)(ii)大样本时,正态近似2019年12月15日(i)小样本(n≤25)时,查附表10界值的判断标准:RR0.05时,P0.05,R≤R0.05时,P≤0.05本例:R=10R0.05=14,n=12,P0.05,拒绝H0,故认为A,B两种照射方式造成的急性皮肤损伤程度不同,B照射的损伤程度比A照射严重。2019年12月15日(ii)大样本(n10)时,可采用正态近似275.224/)1122)(112(124/)112(121024/)12)(1(|4/)1(|nnnnnRu查标准正态分布表,得P值校正公式:(当相同秩次个数较多时)333|(1)/4|(1)(21)/24()/481012(121)/42.28212(121)(2121)/24[(33)(33)]/48iiRnnunnntt2019年12月15日第三节完全随机设计多组差别的秩和检验(Kruskal-Wallis法)对于完全随机设计多组资料比较,如果不满足方差分析的条件,可采用Kruskal-Wallis秩和检验。此法的基本思想与Wilcoxon-Mann-Whitney法相近:如果各组处理效应相同,混合编秩号后,各组的秩和应近似相等。2019年12月15日表6-4脾淋巴细胞对HPA刺激的增值反应(测量指标3H吸收量cpm)A组(对照)B组(截肢)C组(截肢治疗)3H吸收量秩号3H吸收量秩号3H吸收量秩号3012112532881381594581846821220736841916202551867495801922687885213590212775964901312787202884109003176600141717301秩和Ri1195458例数ni777平均秩和iR17.0007.7148.8262019年12月15日1.H0三组处理效应相同;H1三组处理效应不全相同。α=0.052.混合编秩号,分组求秩和R1,R2,R3,…,相同秩次取平均秩次。3.计算检验统计量H)1(3)1(122NnRNNHii=848.9223)7587547119(222112222H的校正,cHHc,)(333iittNNNNcti是相同秩次个数。本例数据不存在同秩,不用校正2019年12月15日4.求P值,下结论(i)查表:k≦3,各组例数ni≦5,根据H值查附表11(ii)如超出附表范围,在ni不太小时,理论上H近似于自由度为(k-1)的分布,故可查卡方界值表(附表8)。本例:α=0.05,自由度为2的卡方界值为5.99计算所得卡方值=0.05。在0.05检验水平拒绝H0,接受H1,认为三组脾淋巴细胞对HPA刺激的增值反应不全相同。2019年12月15日表分娩时孕周与乳量的关系频数表法:属于同一组段的观察值,一律取平均秩次(组中值),再以该组段频数加权,计算Hc值。秩和乳量早产足月产过期产合计秩次范围平均秩次早产足月产过期产(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)无30132101721~17286.5259511418865少3629214342173~514343.5123661003024809多3141434479515~9937542337431215625636合计978385899338335423876313101.H0:三个总体分布相同,H1:三个总体分布不全相同α=0.052.编秩:计算各等级合计,确定秩次范围3.求秩和:各组频数与该组平均秩次乘积求和2019年12月15日4.计算统计量5.确定P值作结论:查2界值表,得P0.05,可认为分娩时孕周对乳量是有影响的。3.14)1993(358313108384238769738335)1993(99312222H=(1723172)+(3423342)+(4793479)=154991382)(3iitt9893.16188061.13.141881.115499138299399399399333cHHcc2019年12月15日二、多组处理效应间的两两比较经Kruskal-Wallis秩和检验得多组处理效应间存在差别时,需进一步判断哪些组之间的差别有显著性,这个问题的解决方法与方差分析中的多个均数间的两两比较很相似.例6-2的结论认为ABC三组有差异,用Nemenyi法作各组间两两间比较,步骤如下:1.计算各组平均秩和2.按下式计算第i组与第j组间的2值2019年12月15日)11(12)1()(22jijinnNNcRR,c为按公式(6-8)计算的校正系数当例数较大时,2近似服从df=(组数-1)的2分布,例中c=1,N=21,99.5)2(205.0,2PA组与B组比较7.830.05A组与C组比较6.070.05B组与C组比较0.110.053.求P值,下结论2019年12月15日第四节随机单位组设计的秩和检验Friedmanranksumtest例6-4表6-5比较穿四种防护服时的脉搏数(次/分)防护服A防护服B防护服C防护服D编号脉搏秩号脉搏秩号脉搏秩号脉搏秩号1144.44143.03133.41142.822116.22119.24118.03110.813105.81114.83113.22115.84498.01120.03104.02132.845103.82110.64109.83100.61秩和Ri101711122019年12月15日1。H0穿四种防护服的脉搏次数分布相同;H1穿四种防护服的脉搏次数分布不全相同。α=0.052.按区组(受试者)编秩号,按处理(防护服分

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功