第九章分类变量的检验目录第一节检验的基本思想第二节率的比较第三节独立性检验第四节拟合优度检验第五节确切概率法01020304052重点难点※独立样本列联表资料的检验※配对设计资料的检验※四格表的Fisher确切概率法22第一节检验的基本思想21.检验的基本思想(一)统计量第一节检验的基本思想222例1为比较不同大骨节病区的大骨节病检出情况,分别随机抽取河水饮用区377人,泉水饮用区301人,采用X光拍片进行大骨节病诊断。结果见表9-1。现检验两个病区的大骨节病检出率是否不同?不同病区的大骨节病检出情况地区检出未检出合计检出率(%)河水饮用区7530237719.89泉水饮用区9920230132.89合计17450467825.66其中,Aij(i,j=1,2)为实际频数,Tij(i,j=1,2)为理论频数第一节检验的基本思想2独立样本数据2×2交叉表组别属性合计属性1属性2甲A11(T11)A12(T12)nR1乙A21(T21)A22(T22)nR1合计nC1nC1n第一节检验的基本思想22.理论频数111111377174()=96.75678RCRCnnnTnnn121122377504()=280.25678RCRCnnnTnnn212211301174()=77.25678RCRCnnnTnnn222222301504()=223.75678RCRCnnnTnnn四格表中所有格子Aij的Tij和之间的差异,可用式(9-1)计算的统计量来衡量:可以证明,成立时,统计量服从自由度为的分布。自由度的计算公式为:。上面公式可简化为:222211()(1,2;1,2)ijijijijATijTATT2220H1(1)()行数-列数-11.分布分布是一种连续型随机变量的概率分布,自由度是其唯一参数,记为。4种自由度分布的概率密度曲线(二)分布的性质第一节检验的基本思想22222()22.分布的性质(1)分布也可看作一种特殊的抽样分布。(2)分布是一簇连续光滑曲线,不同自由度的曲线形状各有不同。各种自由度取值下分布右侧尾部面积(概率)为α时的临界值记为,列于界值表。当=1时,。第一节检验的基本思想22222.20.05,1=3.84222(3)分布的期望值(均值)为自由度,方差为。随着自由度的增大,分布将随均值的增大向数轴右侧延伸,而分布曲线也将随方差的增大越趋低阔。(4)检验的基本思想实质是将对两个或多个总体率(构成比)的比较转化为实际频数与理论频数吻合程度的比较。第一节检验的基本思想222222第二节率的比较结合例1,四格表检验基本步骤为:(1)建立检验假设,确定检验水准,即河水饮用区和泉水饮用区大骨节病的总体检出率相同,即河水饮用区和泉水饮用区大骨节病的总体检出率不同α=0.05(一)2×2交叉表数据的检验第二节率的比较22012:H112:H(2)检验统计量的选择与计算(3)确定P值,作出统计推断=3.84。本例=14.823.84,即P0.05。在α=0.05水平上拒绝,接受。可以认为两个病区大骨节病的检出率之间差别具有统计学意义,且泉水饮用区的检出率较高。第二节率的比较222222(7596.75)(302280.25)(9977.25)(202223.75)14.8296.75280.2577.25223.75ATT20.05,120H1H第二节率的比较检验适用条件:(1)若n≥40,且任意一个格子的理论频数Tij≥5,可直接使用检验公式。(2)若n≥40,但出现1个格子的理论频数1≤Tij5时,则需对值按以下公式进行连续性校正。(3)若n40或者任意一个格子的理论频数Tij1时,则检验不再适用,宜采用Fisher确切概率法进行处理。22TTA225.0)(1.用于推断3个以上的总体率(或构成比)之间的差异2.与2×2交叉表检验比较不同之处:(1)理论频数Tij的公式可泛化为:(2)可直接使用下面公式计算统计量:(二)R×C交叉表数据的检验第二节率的比较21,2,,;1,2,,RCijijnnTiRjCn()2211()RCijijijijATT21.多个构成比的比较例2比较大骨节病区男、女性的膳食结构是否存在差异,研究组对病区555名男性,819名女性大骨节病患者的膳食结构进行调查。数据整理如下。大骨节病区男性和女性主食情况比较第二节率的比较性别大米糌粑外地面合计男157212186555女216348255819合计3735604411374对上述2×3列联表,作检验:第二节率的比较(1)建立检验假设,确定检验水准大骨节病区男、女性的膳食结构相同大骨节病区男、女性的膳食结构不全相同α=0.052(2)检验统计量的选择与计算(3)确定P值,作出统计推断自由度=(2-1)×(3-1)=2,=5.99,则P0.05,在α=0.05水平上不拒绝,尚不能认为大骨节病区男女膳食结构不同。2211()=2.53RCijijijijATT20.05,20:H1:H0H2.多个率的比较例3为研究NOC(N-亚硝基化合物)和DON(脱氧雪腐镰刀菌烯醇)对小鼠肝脏的致病作用,将94只小鼠随机分配到NOC组、DON组和(NOC+DON)组,染毒剂量分别为:NOC:0.25mg/kg;DON:0.5mg/kg;NOC:0.25mg/kg+DON:0.5mg/kg,60天后观察小鼠肝脏出现大片脂肪变性的数量,整理结果如表所示。现比较3种处理对小鼠肝脏的影响。第二节率的比较组别病变非病变合计病变率(%)DON组7243122.58NOC组9223129.03(NOC+DON)组21113265.63合计37579439.363种处理致小鼠肝脏组织大片脂肪变性的比较第二节率的比较(1)建立检验假设,确定检验水准三组脂肪变性的总体发生率相同三组脂肪变性的总体发生率不全相同α=0.05(2)检验统计量的选择与计算(3)确定P值,作出统计推断自由度=(3-1)×(2-1)=2,=5.99,=14.29,则P0.05,在α=0.05水平上拒绝,接受,可以认为三组脂肪变性的发生率不全相同。2211()=2.53RCijijijijATT20.05,2220.05,20:H1H1:H0H第二节率的比较3.分割多个率或多个频率分布比较的检验,当结论为拒绝时,仅表示多组之间是有差别的。若需明确究竟是哪两组之间存在差别,可做率的多重比较,将R×C表分割为若干个小的四格表进行检验。但在具体分割过程中,需根据比较的次数合理地修正检验水准α,否则将人为地增大犯第Ⅰ类错误的概率。如:原有检验水准α=0.05,若进行组数k为3的两两比较,需比较=3次,故调整后的水准α'=0.05/3=0.0167;若设置一个共用对照进行3组比较,则只需(k-1)=2次,调整后的水准α'=0.05/2=0.025。223C20H第二节率的比较现将例3中的DON组设置为共用对照,以下表为例介绍分割的过程。结果如下:1.NOC组和DON组比较2DON组和NOC组致小鼠肝脏组织组织大片脂肪变性比较第二节率的比较(1)建立检验假设,确定检验水准,即DON组和NOC组肝脏脂肪变性发生率相同,即DON组和NOC组肝脏脂肪变性发生率不同α=0.025(2)检验统计量的选择与计算(3)确定P值,作出统计推断自由度=(2-1)×(2-1)=1,=5.02,可知=0.345.02,则P0.025,在α=0.025水平上不拒绝,尚不能认为DON组和NOC组脂肪变性的检出率不同。2112222222(78.00)(98.00)(2423.00)(2223.00)+0.348.008.0023.0023.00ATT20.025,120:H1:H0H第二节率的比较2.(NOC+DON)组与DON组进行比较DON组和(NOC+DON)组致小鼠肝脏组织组织大片脂肪变性比较第二节率的比较(1)建立检验假设,确定检验水准,即DON组和(NOC+DON)组肝脏脂肪变性发生率相同,即DON组和(NOC+DON)组肝脏脂肪变性发生率不同α=0.025(2)检验统计量的选择与计算(3)确定P值,作出统计推断自由度=(2-1)×(2-1)=1,=5.02,可知=11.825.02,则P0.025,在α=0.025水平上拒绝,接受,即可认为DON组和(NOC+DON)组脂肪变性的检出率不同。2112222222(713.78)(2417.22)(2114.22)(1117.78)+11.8213.7817.2214.2217.78ATT20.025,121:H0H1H0:H第二节率的比较(三)配对设计数据的检验1.配对四格表检验例4为比较间接酶联免疫法和双抗原夹心酶联免疫法对丙肝病毒(HCV)抗原的诊断性能,某检验室将135名血清样本一分为二,分别进行两种试剂盒检测,结果见下表。现比较两种检测方法的结果是否不同?间接法和夹心法检测结果22第二节率的比较配对四格表的通用表格如表所示配对四格表的一般格式表中的实际频数分别为:a=80为两种检测方法均阳性的对子数,d=10为两种检测方法均阴性的对子数,很显然,a与d都不能反映两种检验方法的差别。而b=15和c=30则是两种检测方法检验结果不一致的对子数,故两种方法的检测结果有无差别就体现在b和c这两个对子数。第二节率的比较变量1的阳性率==;变量2的阳性率==。变量1的阳性率-变量2的阳性率=,同样提示两个变量阳性率的比较只和b、c有关,而与a、d无关。在原假设成立的条件下,b与c两个格子理论频数都应该为(b+c)/2。当时,可进行简单推导:类似地,若,则需对式(9-6)进行连续性校正。校正公式为nn1nbanm1ncanba40cb22222()()()()2222bcbcbcATbcbcbcTbc40bccbcb22)1|(|0H第二节率的比较结合例4,简述配对四格表检验的过程:(1)建立检验假设,确定检验水准,即两种检验方法的阳性率相同,即两种检验方法的阳性率不同α=0.0521120:H1:H(2)检验统计量的选择与计算由于b+c=15+30=4540,按式(9-6)求出(3)确定P值,作出统计推断自由度=1,查界值表,=3.84,=53.84,则P0.05。在α=0.05水平上,拒绝,接受,认为两种检测方法的阳性率有差别,且间接法阳性率高于夹心法阳性率。222()(15-30)515+30bcbc20.05,1220H1H第二节率的比较2.配对R×R交叉表数据的检验实际工作中,不少分类变量都具有R(R≥2)个可能的“取值”,则构成更泛化的配对R×R交叉表。这类研究通常需解决的问题为,两个样本分布所对应的总体概率分布是否相同,即类似于配对四格表检验的基本原理,对配对设计下两总体分布进行推断,应采用的检验统计量为:成立时上式中的统计量T服从自由度为k-1的分布221()12kiiiiiiinmkTknmA20H第三节独立性检验例5为分析肥胖与糖尿病是否有关,随机调查某社区678名居民,询问其病史,并对其进行体检,收集糖尿病及肥胖情况,结果整理如下表。现分析肥胖与患糖尿病之间是否存在关联性。(一)2×2交叉表的独立性检验第三节独立性检验肥胖与糖尿病检出情况的分布(1)建立检验假设,确定检验水准患糖尿病与是否肥胖之间互相独立患糖尿病与是否肥胖之间存在关联α=0.05(2)检验统计量的选择与计算,(3)确定P值,作出统计推断,P0.05,拒绝,接受,认为肥胖与糖尿