医学统计学常用非参数统计方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十章常用非参数统计方法白志茂zhimaobai@163.com10.1非参数统计的概念和应用范围回顾:t检验的应用条件小样本,样本取自正态总体,总体方差未知参数统计与参数检验样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知参数进行估计或检验。这类方法称为参数统计,所用的检验称为参数检验非参数统计与非参数检验在许多实际问题中总体分布的函数形式往往不知道,或者知道得很少。这时参数统计方法就不大适用了不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法,称为非参数统计,其检验方法就是非参数检验非参数统计的主要优点是:1.适用范围广非参数统计方法不受总体分布的限制,即使分布是未知时也能适用2.搜集资料方便非参数统计在搜集资料时可用“等级”或“符号”来评定观察结果,因而搜集资料十分方便非参数统计的缺点:对适宜用参数方法的资料,若用非参数法处理,因没有充分利用资料提供的信息,而效率降低;犯第二类错误的概率比参数检验大10.2两样本比较秩和检验【例】两个篮球队各5名队员,在没有测量工具的时如何比较那个队的身高高?•适用于两组数值变量资料或两组有序分类变量资料的比较。•秩是指秩次,又称等级,实际上就是按数值大小所作1,2,3,4…等的一种编码。而秩和就是按一定的要求,所求的秩次之和例10.1测得铅作业与非铅作业工人的血铅值(μmol/L),见表10.1,问两组工人的血铅值有无差别?表10.1两组工人的血铅值(μmol/L)铅作业组(1)秩次(2)非铅作业组(3)秩次(4)0.8290.2410.8710.50.2420.97120.2931.21140.3341.64150.4452.08160.5862.13170.6370.7280.8710.51.0113n1=7T1=93.5n2=10T2=59.5思考:为什么不能用参数检验?10.2.1方法步骤(1)假设HO:铅作业工人和非铅作业工人血铅值分布的位置相同。H1:铅作业工人和非铅作业工人血铅值分布的位置不同。α=0.05(2)求检验统计量T值将两组数据分别由小到大排队,然后统一编秩;编秩时如遇有原始数据相同时,均取平均秩次;取样本容量较小者为n1,其秩次为统计量T(3)确定P值和作出推断结论查附表12(P200)确定P值和作出推断结论•由n1,n2-n1查附表12,若T值在界值Tα范围内,则Pα;若T值在界值Tα外,或恰好等于下界值(或上界值),则P≤α。•本例n1=7,n2-n1=3,T=93.5,查附表12得双侧P0.05,按α=0.05水准,拒绝H0,接受H1,故认为铅作业工人比非铅作业工人的血铅值高。04284153•如果n1或n2-n1超出附表12的范围,可用正态近似法即u检验•当相同秩次较多时,尤其在有序分类资料中,常采用频数表作秩和检验,以各组段的平均秩次代表该组段的所有观察值。故按(10.1)式计算的u偏小,须按(10.2)式校正。12/)1(5.02/)1(211NnnNnTucuuc例10.2用某药治疗不同病情的老年慢性支气管炎病人,疗效见表10.2第(1)、(2)两栏,问该药对两种病情的老年慢性支气管炎病人的疗效是否相同?表10.2某药对两种病情的老年慢性支气管炎病人的疗效比较秩和疗效单纯性(1)单纯性合并肺气肿(2)合计(3)=(1)+(2)秩次范围(4)平均秩次(5)单纯性(6)=(1)(5)合并肺气肿(7)=(2)(5)控制65421071~1075435102268显效18624108~131119.52151717有效302353132~18415847403634无效131124185~208196.52554.52161.5合计12682208――12955.58780.5(1)建立假设H0:两种病情病人的疗效分布相同。H1:两种病情病人的疗效分布不同。α=0.05(2)计算检验统计量u值(3)确定P值和作出结论推断10.3多个样本比较的秩和检验•适用于:有序分类资料和不宜用方差分析的数值资料【例10.4】在研究白血病时,测得鼠脾的DNA含量如表10.4第(1)、(3)、(5)、(7)栏。问不同病情的鼠脾DNA含量有无差别?表10.4不同病情的鼠脾DNA含量(mg)正常脾(1)秩次(2)患自发性白血病时的脾(3)秩次(4)患移植性白血病时的脾(甲组)(5)秩次(6)患移植性白血病时的脾(乙组)(7)秩次(8)12.31810.889.319.5213.22211.61310.33.510.33.513.72612.31811.11110.5515.22812.72111.71410.5615.42913.52311.71510.5715.83013.52412.01610.9916.93114.82712.31811.01017.33212.42011.51213.625Rini21681347123.5954.58(1)建立假设H0:四种鼠脾DNA含量的总体分布位置相同。H1:四种鼠脾DNA含量总体分布位置不同或不全同。α=0.05(2)计算检验统计量H值(3)确定P值和作出推断结论131122NnRNNHii(3)确定P值和作出推断结论若组数k=3,每组例数ni≤5,可查附表19,H界值表得出P值。若k3,最小样本例数不小于5,则H近似服从ν=k-1的χ2分布。本例k=4,ni5,ν=k-1=4-1=3,查附表10,χ2界值表,得P0.005。按α=0.05水准拒绝H0,接受H1,认为不同病情的鼠脾DNA含量有差别。•当各样本相同秩次较多时,由式(10.3)计算所得的H值偏小,此时应按式(10.4)作H值的校正。CHHcNNttCjj331例10.4某医生用三种方剂治疗某妇科病,疗效如表10.4,问三种方剂的疗效有无差别?表10.4三种方剂的疗效比较疗效(1)糖衣片(2)黄酮片(3)复方组(4)合计(5)秩次范围(6)平均秩次(7)无效48513661~6633.5好转184163623667~302184.5显效771811106303~408355.5控制52191788409~496452.5Rini86459.5361181165818680.577(1)假设H0:三种方剂疗效分级的总体分布相同。H1:三种方剂疗效分级的总体分布不同或不全同。α=0.05(2)求检验统计量•为了对三组有分类资料进行统一编秩,需计算各等级的合计数,见表10.4(5)栏,再决定各等级的合计例数在所有数值中所处的秩次范围如(6)栏所示。由于同一等级的数据为相同的数值,故应计算平均秩次如(7)栏。再求秩和Ri。如(2)栏R1是用(2)栏各等级的频数与(7)栏平均秩次相乘再求和,即,仿此得表10.4下部Ri行。按(10.3)式计算H值。按式(10.4)计算Hc值(3)确定P值和作出推断结论本例处理组数k=3,ni均大于5,已超出附表19的范围,故按ν=k-1=3-1=2,查附表4,χ2界值表,得P0.005。按α=0.05水准绝H0,接受H1,故可认为三种方剂的疗效有差别。红蓝两个篮球队,哪个队平均身高高?•12345678910

1 / 24
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功