YangZhao,DepartmentofEpidemiology&Biostatistics,SchoolofPublicHealth,NanjingMedicalUniversity《医学统计学》(七年制用)分类资料的假设检验HypothesisTestsonCategoricalData主要内容•两样本率的比较•卡方检验•校正的卡方检验•四格表的确切概率检验•u检验•多个率的比较•构成比的比较•配对设计两样本率的比较•正确应用两样本率比较的卡方检验•卡方检验的原理•一种对理论频数和实际频数吻合程度的考察。•Ainvestigationofthedegreeofagreementoftheoreticalfrequencyandactualfrequency.•一个正常的骰子,抛出后得到六个面的概率均为1/6。因此,要判定一个骰子是否合格,可以通过抛骰子的方法来进行;χ2检验的原理理论101010101010实际121365159差值-2-345-51χ2检验的原理•衡量理论数与实际数的差别iiiTTA22)(KarlPearson1857~1936•英国统计学家•1901年10月与Weldon、Galton一起创办Biometrika22222221210131061010101051015109108.00101010理论101010101010实际121365159差值-2-345-512分布0.00.10.20.30.40.5RejectionArea四格表(fourfoldtable)例6.5109例患者治疗后有效率比较组别有效无效合计有效率(%)试验组43105381.13对照组40165671.43合计832610976.15理论数的计算•如果两组率相等,则理论上有效率为76.15%。•理论与实际相吻合!•则观察53人,有53×0.7615=40.36人有效,53-40.36=12.64人无效。•观察56人,有56×0.7615=42.64人有效,56-42.64=13.36人无效。理论频数的计算RCRCnnTN43104016实际数理论数40.3612.6442.6413.36衡量理论数与实际数的差别iiiTTA22)(22222(4340.36)(1012.64)(4042.64)(1613.36)40.3612.6442.6413.361.41自由度为1的2分布0.00.10.20.30.40.5自由度为2的2分布0.00.10.20.30.40.5自由度为1的2分布界值0.00.10.20.30.40.53.840.052检验的步骤(1)H0:1=2;H1:1≠2,=0.05(2)2=1.41(3)P0.05(4)按0.05水准,不拒绝H0,尚不能认为两种方法的治疗效果不同。四格表2检验的专用公式abcd))()()(()(22dbcadcbanbcad43104016四格表2检验的专用公式41.126835653)10401643(10922四格表2的检验的应用条件:•N40,T5,用2;•N40,但1T≤5,用校正2。•n≤40,或T≤1,用确切概率。•当P值接近检验水准时,推荐使用确切概率法。iiiCTTA22)5.0|(|))()()(()2/|(|22dbcadcbannbcadC四格表的校正卡方检验例6.6穿新旧两种防护服工人的皮肤炎患病率比较组别阳性阴性合计患病率(%)新114156.7旧10182835.7合计11324325.6H0:两组工人的皮肤炎患病率无差别,即π1=π2;H1:两组工人的皮肤炎患病率有差别,即π1≠π2;检验水准=0.05。求得最小的理论频数T11=15×11/43=3.84,1T115且n=4340,所以宜用χ2检验的校正公式查附表8的χ2界值表得0.05P0.10,按=0.05水准,不拒绝H0,差别无统计学意义,尚不能认为穿不同防护服的皮肤炎患病率有差别。94.2321128152/4310141814322四格表的确切概率Fisher’sexactprobability两种方法治疗黑色素瘤疗效比较方法缓解未缓解合计缓解率(%)A1311492.9B731070.0合计2042483.3确切概率的基本思想•基本思想:•周边合计应当是不变的•在假定H0成立时,四格表频数的各种组合都有可能得到,但得到的概率大小不同;•假定零假设成立,计算此时出现现有样本及更极端样本的概率。•所谓极端,这里指不同组合下两样本率差别更大的情形;•若零假设成立,此概率应当不会太小!四格表周边合计不变xa+b-xa+ba+c-xd-a+xc+da+cb+dnx=0,1,…,min(a+c,a+d)在周边合计一定时,某个格子数字确定后所有格子中都会被确定。四格表(周边合计不变时)所有可能的排列(1)(2)(3)(4)(5)14013112211310464738291100每一种组合的概率aba+bcdc+da+cb+dn()!()!()!()!!!!!!iabcdacbdPabcdn超几何分布(hypergeometricdistribution)四格表所有可能排列的概率(1)(2)(3)(4)(5)14013112211310464738291100Pi0.01980.15810.38540.34260.0942四格表(周边合计不变时)所有可能的排列(1)(2)(3)(4)(5)14013112211310464738291104|p1-p2|:0.4000.2290.0570.1140.286P值的计算(1)(2)(3)(4)(5)14013112211310464738291104|p1-p2|:0.4000.2290.0570.1140.286Pi0.01980.15810.0942P=0.0198+0.1581+0.0942=0.2721•H0:两种方法缓解率相等;•H1:两种方法缓解率不等。•=0.05。•P=Pi=0.2721•按=0.05水准,不拒绝H0,差异无统计学意义。故尚不能认为两种方法治疗黑色素瘤缓解率有差别。两个率比较的u检验•当n较大时,二项分布近似正态分布。因此两样本率比较的u检验,当n1p1、n2p2、n1(1p1)、n2(1-p2)均大于5才适用,2121111nnppppucc•某医师在用蛙王露口服液治疗贫血的临床试验中,将109名受试者随机分为两组,一组为试验组,接受蛙王露口服液的治疗,结果为有效43人,无效10人;另一组为对照组,接受复方阿胶浆的治疗,结果为有效40人,无效16人,问两组有效率有无差别?H0:两组有效率无差别,即π1=π2;H1:两组有效率有差别,即π1≠π2;=0.05。p1=43/53=0.8113,p2=40/56=0.7143,pc=(43+40)/(53+56)=0.7615查附表1得P=0.234,按=0.05的水准,不拒绝H0,差别无统计学意义,故尚不能认为两组的有效率有差别。188.15615317615.017615.07143.08113.0u与正态分布的关系3.840.050.0250.0251.96-1.96多个率比较的2检验虫卵阴转率的比较药物阴转例数未阴转例数合计阴转率(%)复方敌百虫片2893775.7纯敌百虫片18203847.4灭虫灵10243429.4合计565310951.4•如果各方法阴转率相等(H0成立),那么阴转率应当均为51.40%。由此可以计算出每格的理论频数。根据实际频数与理论频数之差所得出的卡方值越大,说明假设的总体中得到现有偏差及更偏差的样本的概率越小!•P≤α,拒绝H0。理论数的计算19.0217.9819.5318.4717.4816.52实际数A理论数T2893718203810243456(51.40%)53(48.60%)109NnnNnnTCRCR2值的计算19.0217.9819.5318.4717.4816.52实际数A理论数T28918201024iiiTTA22)(2222222(2819.02)(917.98)(1819.53)(2018.47)(1017.48)(2416.52)19.0217.9819.5318.4717.4816.5215.5562值的计算iiiTTA22)(289371820381024345653109222222228918201024109137563753385638533456345315.556122CRnnAn22iiiATT221RCAnnn11RC多个率比较的2检验的过程•H0:π1=π2=π3•H1:三种方法阴转率不等或者不全相等α=0.05ν=2×1=2P0.05;按照0.05的检验水准拒绝H0,接受H1,差别有统计学意义,可认为三种方法阴转率不同或不全相等。222282410913756345315.556自由度为2的2分布界值0.00.10.20.30.40.55.99=0.05构成比的比较鼻咽癌患者与眼科病人血型构成比较组别ABOAB合计鼻咽癌336565100眼科病人5414525125合计8720108102252值的计算iiiTTA22)(122CRnnAnRCRCnnTN2值的计算222222222336565225(10087100201001081001054145251)1258712520125108125105.710-3365651005414525125872010810225构成比比较的2检验步骤H0:两组血型构成比相同;H1:两组血型构成比不同。=0.05。计算统计量:2=5.710,v=3。P0.05按=0.05水准,不拒绝H0。尚不能认为两组血型构成比不同。R×C表的分析方法选择条件•条件:•理论数不能小于1;•理论数大于1小于5的格子数不超过总格子数的1/5。•否则用确切概率。•解决•增加样本含量•删除•合并•Fisher确切概率计算法配对四格表资料的2检验两种检验结果比较可能的结果甲法乙法频数1++a2+-b3-+c4--d配对四格表资料的2检验两种检验结果比较乙甲合计+-+36(a)24(b)60-10(c)135(d)145合计46159205配对四格表资料的实际数与理论数24(b)10(c)171722()()bcbc22(1)()Cbcbcb+c40且20时:配对四格表资料的2检验步骤一.H0:两法检出阳性率相同,总体B=C;H1:两法检出阳性率不同,总体B≠C。=0.05。二.计算统计量:2=4.971。三.P0.05四.按=0.05水准,不拒绝H0。认为两种方法的阳性率不同。•阳性率相同,而非检验结果完全一致!+-+206050%-602050%50%50%定性资料假设检验的正确应用•四格表的卡方检验•n40,T5,用2;•n40,但1T≤5,用校正2。•n≤40,或T≤1,用确切概率。•R×C表的卡方检验•理论数不能小于1;•理论数大于1小于5的格子数不超过总格子数的1/5。•增加样本含量;Fisher确切概率法;删去;合并定性资料假设检验的正确应用•多个率或构成比的比较拒绝H0的含义;•等级资料(有序分类资料)的比较应该考虑使用秩和检验Contact:zhaoyang@njmu.edu.cn