第9章方差分析陈卫中讲师卫生统计学教研室2020年1月18日引例抽样研究护理专业、临床专业、药学专业三个专业成绩是否有差别。为调查某高血压药的疗效,以北京降压0号为对照,分别在4个不同地区医院纳入200例病例,以血压降低值为观察指标。为研究中西药物结合的药物疗效,分别设置4组,西药组,中药组,中+西组,空白组。为调查某高血压药的疗效,以北京降压0号为对照,分别在4个不同地区医院纳入200例病例,共观察4周,每周记录血压降低值。方差分析(AnalysisofVariance,ANOVA)多总体均数比较多重t检验:在检验过程中增大了I型错误的概率多因素设计的均数比较交互效应的分析重复测量的均数比较例9.1为研究大豆对缺铁性贫血的恢复作用,选取已做成贫血模型的大鼠36只,随机等分为3组,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料,喂养一周后,测定大鼠红细胞数(1012/L)。试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同。表9.1喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.03引例分析分析目的:喂养三种不同饲料大鼠贫血恢复情况不同,即1、2、3不同或不全相同设计类型:完全随机设计变量类型:定量变量已知条件:设大鼠红细胞数服从正态分布及3组样本数据表9.1喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.03变异的分解总变异(totalvariation):36个受试对象的观测值各不相等2()1TijTijSSXXnTTTSSMS表9.1喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.031x1x1x1x1x1x1x1x1x1x1x1x2x2x2x2x2x2x2x2x2x2x2x2x3x3x3x2x3x3x3x3x3x3x3x3x变异的分解组间变异(betweengroupsvariation):每组各样本均数也不等2()1BiiBiSSnXXk=BBBSSMS表9.1喂养三种不同饲料的大鼠红细胞数(×1012/L)普通饲料10%大豆饲料15%大豆饲料4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.031x2x3x变异的分解组内变异(Withingroupvariation):表示每个组内各观测值不等,也称为误差2j()WijiWiSSXXnk=变异的分解三种变异的关系:线性可加性(SS可相加)TBWTBWSSSSSSvvv变异解释总变异组间变异组内变异处理效应误差变异的比较构造F统计量若处理效应无意义,处理效应=0,即各样本均数来自同一总体,则组间变异与组内变异均只反映随机误差理论上:F=1抽样误差的影响:F1若处理效应0,则MS组间MS组内,F112~(,)BWMSFFMS变异的比较F1的原因处理作用无意义,抽样误差造成处理作用有意义,MS组间MS组内检验方法:F分布的基础上,小概率反证法F分布22f(F)F/2,,(1,2)(双)F0123450.00.20.40.60.81.01=10,2=10F/2,(1,2)(双)F,(1,2)(单)基本思想分解:根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和及自由度分解为两个或多个部分解释:除随机误差外,其余每个部分的变异可由某个因素的作用相联系。比较:通过不同变异来源的均方与随机误差均方的比较,借助F分布作出统计推断,从而了解该因素对观测指标有无影响。完整步骤1.建立检验假设,确定检验水准H0:1=2=3H1:1、2、3不全相等=0.052.计算检验统计量表9.3例9.1资料的方差分析表变异来源SSMSFP组间变异52.1258226.062942.92310.01组内变异20.0381330.6072总变异72.1639353.确定值,作出统计推断根据分子自由度1=2,分母自2=33,查F界值表,得P0.01,按=0.05水准,拒绝H0,接受H1,差别有统计学意义,可以认为喂三种不同饲料的大鼠红细胞数的总体均数不同。多个样本均数的两两比较当总的方差分析结果P时,说明多个总体均数不全等基础上的进一步分析在于明确到底哪两个总体均数不等或全不等SNK检验:又称q检验,两两比较Dunnet-t检验:某一对或某几对在专业上有特殊意义的均数间的比较t检验、q检验、Dunnet-t检验的比较121212122211221212,2(1)(1)11()2XXXXXXtnnSsnsnnnnnee,=11()2ABABABXXABXXXXqSMSnnee,=11()TCTCTCDXXTCXXXXtSMSnn应用条件正态独立方差齐方差分析的基本思想分解:根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和及自由度分解为两个或多个部分解释:除随机误差外,其余每个部分的变异可由某个因素的作用相联系比较:通过不同变异来源的均方与随机误差均方的比较,借助F分布作出统计推断,从而了解该因素对观测指标有无影响例9.5某医师研究A、B两种药物对失眠患者改善睡眠的效果,将12名患者按交叉设计方案随机分为两组,观察两种药物、两个阶段睡眠时间增加量(小时),每个阶段治疗两周,间隔两周。第一组患者为A→B顺序,即第一阶段服用A药,第二阶段服用B药;第二组为B→A顺序,即第一阶段服用B药,第二阶段服用A药。结果见表9.11。表9.11失眠患者睡眠时间增加量(小时)用药顺序患者编号第一阶段第二阶段12.71.623.12.132.91.642.22.352.62.361.63.1合计15.113.072.72.781.91.791.82.6101.42.3112.52.9122.42.0合计12.714.2ABBAn个体X个体X个体设计思想可比性是比较的基础:观察期间各种非实验因素的影响在组间均衡不随时间变化的因素/特征自身配对:每个对象都实施了两种处理随时间变化的因素/特征平行外对照:时间因素前阶段对后阶段的残留效应?交叉试验(cross-overtrial)是指按事先设计好的试验次序,在各个时期对研究对象逐一实施各种处理,以比较各处理组间的差异,是将自身比较和组间比较设计思路综合应用的一种设计方法特殊的自身配对设计二阶段(2×2)交叉设计模式受试对象阶段I清洗期阶段II1准备阶段→处理A→清除阶段→处理B2(runin)┆(washout)┆┆┆┆┆┆n1┆┆┆┆1准备阶段→处理B→清除阶段→处理A2(runin)┆(washout)┆┆┆┆┆┆n2┆┆┆┆交叉设计的特点优点:可比性强:优于一般的自身对照,控制了时间因素的影响节约样本照顾了医德缺点:分阶段实施不同的处理,比较效应的差别不适用于可以在短时间内痊愈或根治的疾病适用范围来源较困难、个体差异较大的动物(如牛、猴等)临床上多用于评价可缓解症状但无根治作用药物的疗效,如止痛、镇静、抗风湿、降血压、抗失眠药物等的疗效比较表9.11失眠患者睡眠时间增加量(小时)用药顺序患者编号第一阶段第二阶段12.71.623.12.132.91.642.22.352.62.361.63.1合计15.113.072.72.781.91.791.82.6101.42.3112.52.9122.42.0合计12.714.2ABBAn个体X个体X个体变异的分解总变异处理因素误差个体因素阶段因素变异分解的统计表达SSSSSSSSSS处理总阶段个体误差处理总阶段个体误差处理H0:A、B两种药物对失眠患者改善睡眠的效果相同H1:A、B两种药物对失眠患者改善睡眠的效果不同阶段H0:两阶段药物对失眠患者改善睡眠的效果相同H1:两阶段药物对失眠患者改善睡眠的效果不同个体H0:患者个体间药物改善睡眠的效果相同H1:患者个体间药物改善睡眠的效果不同变异来源SSMSFP总变异5.898323药物0.5410.541.5540.05阶段0.01510.0150.04320.05个体1.8683110.16980.48860.05误差3.475100.3475表9.13资料的方差分析表例9.6为研究某降血糖药物对糖尿病及正常大鼠心肌磺脲类药物受体SUR1的mRNA的影响,某研究者进行了如下实验:将24只大鼠随机等分成4组:两组正常大鼠,另两组制成糖尿病模型,糖尿病模型的两组分别进行给药物和不给药物处理,剩余两组正常大鼠也分别进行给药物和不给药物处理,测得各组mRNA吸光度的值(%)结果见表9.14。4种不同处理情况下吸光度的值(%)大鼠(a)药物(b)吸光度(X)302834374033513438292429313842202933524546405060正常大鼠(a1)使用(b1)糖尿病大鼠(a2)不使用(b2)使用(b1)不使用(b2)使用药物(b1)不使用药物(b2)使用药物(b1)不使用药物(b2)305131522834384534384246372920404024295033293360X正常大鼠(a1)糖尿病大鼠(a2)表9.144种不同处理情况下吸光度的值(%)22析因设计模式处理因素a处理因素bb1b2a1n1n2a2n3n4析因设计(factorialdesign)是将两个或多个实验因素的各水平进行排列组合、交叉分组,每组含若干个观察对象进行实验也叫两因素(或多因素)有重复设计析因设计(factorialdesign)是将两个或多个实验因素的各水平进行排列组合、交叉分组,每组含若干个观察对象进行实验也叫两因素(或多因素)有重复设计析因设计(factorialdesign)分析目的糖尿病与正常大鼠mRNA吸光度的均数有无差别使用降糖药物与不使用降血糖药物大鼠mRNA吸光度的均数有无差别使用不同药物对正常和糖尿病大鼠mRNA吸光度的均数有无影响若有影响,使用药物(或不使用)时,正常和糖尿病大鼠mRNA吸光度的均数有无差别正常大鼠(或糖尿病大鼠)使用降糖药物与不使用降血糖药物大鼠mRNA吸光度的均数有无差别4种不同处理情况下吸光度的值(%)大鼠(a)药物(b)吸光度(X)302834374033513438292429313842202933524546405060正常大鼠(a1)使用(b1)糖尿病大鼠(a2)不使用(b2)使用(b1)不使用(b2)33.9240.504种不同处理情况下吸光度的值(%)大鼠(a)药物(b)吸光度(X)3028343740335134382924