秩和检验【统计学】

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

9非参数统计分析方法non-parametricstatistics余小金东南大学公共卫生学院流行病学与卫生统计学系1主要内容Outline9.0Introductiontononparametrictest9.1Wilcoxonsignedranktest(paireddesign)9.2Wilcoxonranksumtest(completelyrandomizeddesign,2groups)9.3Wilcoxonranksumtest(completelyrandomizeddesign,morethan2groups)9.4multiplecomparison29.0非参数检验简介9.1配对设计秩和检验9.2完全随机设计秩和检验9.3多组比较秩和检验9.4两两比较两类统计方法参数统计方法总体均数的可信区间估计均数比较的t检验或z检验均数比较的方差分析率比较的u检验非参数统计方法卡方检验秩和检验3t检验等的条件正态性方差齐性非参数统计(nonparametricstatistics)概念不以一定的抽样分布为基础;不通过统计量来估计参数或对参数进行推断。常用的有符号检验,秩和检验,卡方检验,游程检验等优缺点计算简单;不需严格的正态性假设,因而适用范围广;;对异常数据不敏感;单调转换下的不变性;检验效能低;4非参数统计方法的适用范围1.分布类型不明或偏态分布2.等级资料3.方差明显不齐,无法变换4.个别数据偏离,或开口资料5.正态分布资料5统计学家们Wilcoxon-Mann-Whitney20世纪40年代,美国氰胺公司化学家Frankwilcoxon实验中由于仪器的预热过程,数据变异较大,导致t检验方法似乎有误。基于组合与排列的方法。Wilcoxon,F.(1945)IndividualComparisonsbyRankingMethods.BiometricsBulletin1:80–83.经济学家HenryB.Mann和OhioStateUniversity统计学研究生D.RansomWhitney20世纪30年代,苏联数学家安德烈柯尔莫哥洛夫和N.V.Smirnov发展了无需使用参数的分布比较方法6Frankwilcoxon(1892-1965)位次(rank)的概念中位数(median)复习概念数值的具体大小与相对大小(exactmagnitudeandrelativemagnitude)不考虑数值的具体大小,只考虑其相对大小,用对代表秩次的连续整数的统计来代替对具体数值计算统计指标。所以,秩和检验不是针对总体的数值分布,而是总体的位置排列。Observation3.15.56.010.211.9rank123457一个小问题比较男生与女生的平均身高(不许用任何测量工具)89.2两样本比较的秩和检验Wilcoxonrank-sumtest表9.2两种方法治疗胆道梗阻患者测得血清总胆红素下降量9对照组(1)秩次(2)试验组(3)秩次(4)140.21148.65268.516246.515-28.23415.721-94.42378.220328.419133.810118.99308.41885.97308.11746.64487.32272.16113.38-209.61155.613228.514144.012n1=10T1=78n2=12T2=175检验假设H0:…………….的分布位置相同。H1:…………………..的分布位置不同。α=0.051011求检验统计量T值统一排序,并给予秩次(为什么?)。遇相同数据时,怎么办?分别求两组秩和,以样本含量较小者为n1,其秩和为统计量T。若n1=n2,可取任一组的秩和为T。本例T1=78(n1=10),T2=175(n2=12),T=78。12确定P值和作出推断结论由n1,n2-n1查附表18,若T值在界值Tα范围内,则Pα;若T值在界值Tα外,或恰好等于下界值(或上界值),则P≤α。本例n1=10,n2-n1=23,T=78,查附表12得双侧P0.05,按α=0.05水准,拒绝H0,接受H1,故认为可以认为两组患者血清总胆红素下降量是不相同的。13基本思想N=n1+n2秩次应从1到N,总秩和是一定的,即从1到N的连续整数的求和。如果两样本来自一个总体,样本例数相等时,应平分总秩和;样本例数不等时则按比例分总秩和。14正态近似与校正数如果n1或n2-n1超出附表的范围,可用正态近似法即u检验计算u值.相同秩次较多时要作校正。12/)1(5.02/)1(211NnnNnTu15uc=cuucNNttcjj33/表9.3两种疗法对急性脑梗死Ⅱ期的疗效比较疗效(1)试验组(2)对照组(3)合计(4)秩次范围(5)平均秩次(6)秩和试验组(7)=(2)×(6)对照组(8)=(3)×(6)基本痊愈398471~4724936192显著进步43489148~1389339994464进步213253139~19116534655280无效51621192~21220210103232合计108104212--941013168169.1配对符号检验Wilcoxonsigned-ranktest表9.1治疗前后测得患者血清总胆红素样品编号(1)术前(2)术后(3)差值d(4)=(2)-(3)秩次(5)1395.5255.3140.272299.230.7268.593577.5605.7-28.2-14158.4252.8-94.4-55428.099.6328.4106123.54.6118.96795.910.085.948218.6172.046.629394.1322.072.1317检验假设H0:所测前后值的总体分布位置相同,差值的总体中位数Md=0);H1:所测前后值的总体分布位置不同(Md≠0);α=0.0518求检验统计量T值编秩依差值的绝对值从小到大编秩,再根据差值的正、负给秩次冠以正负号;编秩时如遇差值等于0,舍去不计,有效对子数n相应减少,本例有效对子数n=8;遇有差值的绝对值相等,符号不同,则取其平均秩次。如表10.6第(4)栏中差值绝对值等于0.02的有4个,它们位次是4、5、6、7,其平均秩次为(4+5+6+7)/4=5.5。分别求出正、负秩次之和T+和T-(二者之和等于n(n+1)/2。可用于验算计算是否正确)。本例T+=41,T-=14(和为55),任取T+(或T-)作检验统计量T.本例取T=1419确定P值和作出推断结论当n25时,查附表11T界值表。查表时,若T在Tα上、下界值范围外或等于界值时,则Pα;若T在Tα上、下界值范围内,则Pα。本例n=10,T=14;查附表,得T在双侧界值范围内,P0.05。按双侧α=0.05水准,不拒绝H0,故尚不能认为术前和术后患者血清总胆红素检测结果有差别。20正态近似法当n25,超出附表17的范围,可用正态近似法即u检验,按式(10.6)计算u值:48/24/1215.04/13jjttnnnnnTu219.3多个样本比较的秩和检验Kruskal-WallisHtest22肝癌(1)秩次(2)肝炎(3)秩次(4)肝硬化(5)秩次(6)健康组(7)秩次(8)4.716.52.141.511.725.8182.352.032.4613.3214.716.52.892.67.522.9237.8194.5152.67.5205.92550.6249.0202.910274.026452.32721.1223.31171348.8283.6122134.8293.9139402.0304.414159261.031Ri247.595.57083ni10669表9.44组人群AFP检测结果假设检验步骤23H0:四组人群AFP检测结果总体分布相同;H1:四组人群AFP检测结果总体分布不同或不完全相同(1)编秩;(2)求秩和(3)计算统计量H确定P值和作出推断结论若组数k=3,每组例数ni≤5,可查附表19,H界值表得出P值;若k3最小样本例数不小于5,则H近似服从ν=k-1的χ2分布。本例k=4,每组例数ni5,查附表10界值表,=3,得P0.05(P=0.001),按的检验水准,拒绝H0,接受H1,可以认为四组人群AFP检测结果总体分布不同或不完全相同。131122NnRNNHii多个样本两两比较的秩和检验24BABAnnNNRR1112121kk作业选择题P123第11,12题25谢谢您的认真听讲!26

1 / 26
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功