医学统计学-非参数检验秩和检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医学统计学(7)•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验诊断试验ROC曲线分析基于秩次的非参数检验•非参数检验又称为任意分布检验,这类方法并不依赖总体分布的具体形式,应用时可以不考虑研究变量为何种分布以及分布是否已知,进行的不是参数之间的检验,故称非参数检验。•基本特点:与分布无关•基本方法:χ2检验基于秩(等级,rank)的方法基于特定参照点(如中位数)的方法……非参数检验的优点:①适用范围广②受限条件少。参数检验对总体分布等有特别限定,而非参数检验的假定条件少,也不受总体分布的限制,更适合一般的情况。③具有稳健性。参数检验是建立在严格的假设条件基础之上的,一旦不符合假设条件,其推断的正确性将受到怀疑;而非参数检验都是带有最弱的假定,所受的限制很少,稳健性好。①对符合用参数检验的资料,如用非参数检验,会丢失部分信息。②虽然非参数检验计算简便,但有些问题的计算仍显繁冗。非参数检验的缺点:已知总体分布类型,对未知参数进行统计推断依赖于特定分布类型,比较的是参数参数检验(parametrictest)非参数检验(nonparametrictest)对总体的分布类型不作严格要求不受分布类型的影响,比较的是总体分布位置优点:方法简便、易学易用,易于推广使用、应用范围广;可用于参数检验难以处理的资料(如等级资料,或含数值“50mg”等)缺点:方法比较粗糙,对于符合参数检验条件者,采用非参数检验会损失部分信息,其检验效能较低;样本含量较大时,两者结论常相同应用非参数检验的情况1.不满足正态和方差齐性条件的小样本资料;2.总体分布类型不明的小样本资料;3.一端或两端是不确定数值(如<0.002、>65等)的资料(必选);4.单向(双向)有序列联表资料;5.各种资料的初步分析。方法的起点--排队与秩次•统计描述中排秩思想的成功应用百分位数、中位数•排队的优点广泛适用于多种分布•排队的结果将原始数据的比较转化为秩次的比较秩次(rank)——将数值变量值从小到大,或等级变量值从弱到强所排列的序号。例111只大鼠存活天数:存活天数4,10,7,50,3,15,2,9,13,60,60例29名肺炎病人的治疗结果:疗效治愈治愈死亡无效治愈有效治愈有效无效秩次364928157101110.510.5平均秩次2.52.597.52.55.52.55.57.5秩次129735468SPSS中的菜单位置•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验诊断试验ROC曲线分析基于秩次的非参数检验1.建立检验假设,确定检验水准(α)H0:两总体分布相同H1:两总体分布不同α=0.05。2.编秩按数值由小到大排列,若有相同数据,取平均秩。分析步骤:基本思想两样本来自同一总体任一组秩和不应太大或太小假定:两组样本的总体分布形状相同T与平均秩和应相差不大=),,min(≠,=212121nnRRnnT较小例数组的秩和3.计算秩和,确定检验统计量秩和T值当n110或(n2-n1)10时,则可采用正态近似法求u(Z)值来确定P值,其公式如下:12/)1+(×5.0-)1+(21-=211nnnnnTu4.确定P值和作出推断结论当n1=10或(n2-n1)=10时,查表P值若相同秩次较多,应作校正计算个相同秩号的数据个数为第其中itNNttciiii);-/()-(-1=c/Z=Z33c∑【例1】某实验室观察缺氧条件下大鼠与小鼠的生存,以生存日数作为观察指标。试检验两组生存日数有无差别?序号123456789101112大鼠10121515161718202390以上小鼠2345678910111213T=170146,P0.05•T在界值范围内PαT在界值范围外PαT与界值相等P=αSPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大•第四步:结果解读(2)结果解读:Z=3.630,P=0.000【例2】20名正常人和32名铅作业工人尿铅定性检查结果如表。问铅作业工人尿铅是否高于正常人?结果-++++++++++正常人182000铅作业工人810734U检验:Zc=U,与1.96,2.58比较SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:加权个案•第四步:非参数检验•第五步:结果解读结果解读:Z=4.503,P=0.000•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验诊断试验ROC曲线分析基于秩次的非参数检验完全随机设计多个样本比较的秩和检验由Kraskal和Wallis在Wilcoxon秩和检验基础上扩展而来,又称K-W检验或H检验。1.建立检验假设,确定检验水准(α)H0:k个总体分布相同;H1:k个总体分布不同或不全相同;α=0.05。2.混合编秩将各组数据混合,由小到大编秩。遇有原始数据相同时,若相同数据在同一组内,则仍按顺序编秩;若相同数据在不同组,则取它们的平均秩次。分析步骤:3.求秩和并计算检验统计量H将各组秩次分别相加,求出各组的秩和Ri。检验统计量值H可按下式计算:式中,Ri为各组的秩和,ni为各组样本含量,N为总样本含量。)1+(3-)1+(12=2NnRNNHii∑分析步骤:当各组相同秩次较多时,可对H值进行校正,按下式求值。∑)-()-(-1==33NNttCcHHjjc分析步骤:•tj相同秩次的数量4.确定P值和作出推断结论当组数K=3,每组样本含量ni≤5时,可查附表(H界值表)得到P值。若k3或ni5时,H值的分布近似于自由度为k-1的χ2分布,此时可查χ2界值表得到P值。最后按P值作出推断结论。分析步骤:【例3】比较小白鼠接种三种不同菌型伤寒杆菌9D、11C和DSC1后存活日数,结果见表。问小白鼠接种三种不同菌型伤寒杆菌的存活日数有无差别?序号12345678910119D222344457711C55666781012DSC135666779101111)1+(3-)1+(12=2NnRNNHii∑∑)-()-(-1==33NNttCcHHjjcP=1-CDF.CHISQ(9.97,2)SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验•第四步:结果解读结果解读:x2=9.940,P=0.007【例4】四种疾病患者痰液内嗜酸性白细胞的检查结果见表。问四种疾病患者痰液内的嗜酸性白细胞有无差别?白细胞-++++++支气扩张0296肺水肿3552肺癌5732病毒性呼吸道感染3530)1+(3-)1+(12=2NnRNNHii∑∑)-()-(-1==33NNttCcHHjjcP=1-CDF.CHISQ(15.52,3)SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:加权个案•第四步:非参数检验•第五步:结果解读结果解读:x2=15.506,P=0.001【例5】某临床药理基地观察5组接受不同治疗的妇科病人,结果见表。问5组疗效有无差别?疗效对照组中药A组中药B组中药C组西药组合计I211900040II44413052III006113148IV023154262V000217798)1+(3-)1+(12=2NnRNNHii∑∑)-()-(-1==33NNttCcHHjjcP=1-CDF.CHISQ(195.50,4)SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:加权个案•第四步:非参数检验•第五步:结果解读结果解读:x2=195.504,P=0.000•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验诊断试验ROC曲线分析基于秩次的非参数检验配对设计差值比较的符号秩和检验由Wilcoxon1945年提出,又称Wilcoxon符号秩和检验,常用于检验差值的总体中位数是否等于零。(1)建立检验假设,确定检验水准Ho:差值总体中位数Md=0H1:差值总体中位数Md≠0α=0.05分析步骤:(2)编秩:•求差值•编秩方法:依差值的绝对值从小到大编秩。•编秩时注意两点:遇差值为0者,舍去不计,n相应减少差值的绝对值相等,符号不同者应取平均秩次•编秩后,按差值的正负给秩次冠上符号。(3)求差值为正或负的秩和差值为正的秩和以T+表示差值为负的秩和以T-表示。T++T-=n(n+1)/2T=min(T+,T-)(4)确定P值和作出推断结论:当n≤50时,查T界值表T在界值范围内PαT在界值范围外PαT与界值相等P=α分析步骤:当n50,可采用正态近似法,计算u值。24/)1+2)(1+(5.0-4/)1+(-=nnnnnTu正态近似法若相同秩次较多,应作校正计算。Z或式中,tj为第j(j=1,2,…)个相同差值的个数。48)-(24)1+2)(1+(5.0-4/)1+(-=3∑jjttnnnnnTu正态近似法【例6】对10名患者分别用甲法与乙法,测得血汞值。问两种方法的结果有无差别?n=10-1=9•T=min(26.5,18.5)=18.5•n=9•p0.05SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大•第四步:结果解读(2)结果解读:Z=0.474,P=0.635【例7】对12份血清分别用原方法(检测时间20分钟)和新方法(检测时间10分钟)测谷-丙转氨酶,结果见表。问两法所得结果有无差别?序号123456789101112原法6014219580242220190251983823695新法76152243822402202053824344190100•T=MIN(54.5,11.5)=11.5•n=11•P0.05SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。标准差较大•第四步:结果解读(2)结果解读:Z=1.913,P=0.056•两个独立样本比较的非参数检验•多个独立样本比较的非参数检验•配对样本比较的非参数检验•随机区组设计多个样本比较的非参数检验诊断试验ROC曲线分析基于秩次的非参数检验随机区组设计资料比较,如果观察结果不满足方差分析条件,可用Friedman检验(Friedmantest)。1.建立检验假设和确定检验水准2.编秩:•先在每一配伍组内将数据从小到大编秩,如有相同数据,取平均秩次;•再求各处理组秩和Ri,i=1,2,...,g。分析步骤3.计算检验统计量M值(1)查表法(n≤15,g≤15):M=Σ(Rj-R)2(R=ΣRj/g)==》M界值表基于χ2分布近似法得到χ2值查有关的χ2界值表(2)χ2分布近似法分析步骤:)1+(3-)1+(12=∑1=22gnRgngχgjjr)1+(12=2gngMχr自由度为(g-1)当各区组间出现相同秩次时,需进行校正校正公式为cχχc22=)1-()-(-1=23∑gngttcjjb为区组个数,k为处理组个数4.确定P值和作出推断结论【例8】8名受试对象在相同实验条件下分别接受4种不同频率声音的刺激,他们的反应率(%)资料见表。问4种频率声音刺激的反应率是否有差别?SPSS软件操作•第一步:建立变量。•第二步:输入原始数据•第三步:非参数检验(1)•第三步:非参数检验(2)•第四步:结果解读(1)结果解读:例数、均数、标准差、中位数、四分位间距等。•第四步:结果解读(2)结果解读:x2=1

1 / 155
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功