方差分析朱彩蓉某医师用A、B两种方案治疗婴儿贫血患者,A方案为每公斤体重每天口服2.5%的硫酸亚铁1ml,B方案为口服2.5%的硫酸亚铁0.5ml。治疗一个月后,记录血红蛋白的增加克数(g/L),资料下表。例1两种方案治疗后血红蛋白增加量(g/L)方案XA24362514263423B201817101924某医师用A、B和C三种方案治疗婴儿贫血患者,A方案为每公斤体重每天口服2.5%的硫酸亚铁1ml,B方案为口服2.5%的硫酸亚铁0.5ml,C方案为口服鸡肝粉1g。治疗一个月后,记录血红蛋白的增加克数(g/L),资料下表。例2三种方案治疗后血红蛋白增加量(g/L)方案XA24362514263423B201817101924C2011630-1459.1方差分析(ANOVA)(analysisofvariance)•用途:•比较k个总体均数间差别有无统计学意义•基本思想:•将总变异按设计和需要分解成两个或多个部分例9.1为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:–选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。喂养一周后,测定大鼠红细胞数(×1012/L),见表9.1。试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?表9.1喂养三种不同饲料的大鼠红细胞数(1012/L)普通饲料10%大豆饲料15%大豆饲料4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.0336只大鼠的红细胞数(1012/L)4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.03表9.1喂养三种不同饲料的大鼠红细胞数(1012/L)普通饲料10%大豆饲料15%大豆饲料4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.03SS总MS组间SS误差SS组间MS误差误差组间MSMSF组内组间MSMSF处理效应和随机误差效应随机误差检验统计量F的确定如果各样本均数来自同一总体,即各组之间无差别,则组间变异与组内变异均只反映随机误差,这时若计算组间均方与组内均方的比值F值应接近于1。组内组间MSMSF确定P值下结论在正态总体方差齐的假定之下,当H0成立时,检验统计量F服从自由度=k-1,=N-k的F分布,可根据附表4,F界值表确定P值。组间组内组内组间MSMSF服从自由度为(组间,组内)的F分布。若则,不拒绝H0,尚不能认为各组总体均数的差别有统计学意义。若则,拒绝H0,可以认为总体均数间有差别。,),(组内组间FFP,),(组内组间FFP变异的分解组内组间总ssssss组内组间总总变异全部试验数据大小不等,这种变异称为总变异,其大小可用观察值与总均数的离均差平方和表示,记为SS总nXXXXSSijijijijijij/222总1-n总总变异:36只贫血大鼠贫血恢复情况不同,这种变异称为总变异。nXXnXXXXSSijijijijijij//22222总1n总组间变异各处理组的样本均数也大小不等,这种变异称为组间变异,其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。iiijijiijjiinXnXXXnSS/222组间1-k组间组间变异:三种喂养方式的样本均数也大小不等,这种变异称为组间变异。它含有处理效应和随机误差效应两部分内容。CBAXXX,,iiijijiijjiinXnXXXnSS/222组间1-k组间组内变异各处理组内部观察值也大小不等,这种变异称为组内变异,可用各处理组内部每个观察值与组均数的离均差平方和表示,记为SS组内。ijijiijijiijnXXXXSS222组内kn组内组内变异:各处理组内部的观察值也大小不等,这种变异称为组内变异。它包含随机误差(个体差异,测量误差等)。ijijiijijiijnXXXXSS222组内kn组内方差分析思路H0:321SS总SS组间SS误差MS误差MS组间F=MS组间/MS误差1FF较大P较小拒绝不拒绝H09.2完全随机设计方差分析(completelyrandomizeddesign)单因素方差分析(one-wayANOVA)例9.1为研究大豆对缺铁性贫血的恢复作用,某研究者进行了如下实验:选取已做成贫血模型的大鼠36只,随机等分为3组,每组12只,分别用三种不同的饲料喂养:不含大豆的普通饲料、含10%大豆饲料和含15%大豆饲料。喂养一周后,测定大鼠红细胞数(×1012/L),见表9.1.试分析喂养三种不同饲料的大鼠贫血恢复情况是否不同?表9.2喂养三种不同饲料的大鼠红细胞数(1012/L)普通饲料10%大豆饲料15%大豆饲料合计4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.74X3.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.031212123652.5366.2387.62206.38234.2783373.2851647.73121255.294一、建立假设检验,确定检验水准H0:,即喂养三种不同饲料的大鼠红细胞数相同H1:不等或不全相等,即喂养三种不同饲料的大鼠红细胞数不全相同05.0二、计算统计量F值nXCijij/2=(206.38)2/36=1183.1307SS总=ΣX2-C=1255.2946–1183.1307=72.1639SS组间==52.1258SS组内=SS总-SS组间=72.1639–52.1258=20.0381CnXiijji/222252.5366.2387.62()1183.1307121212ν总=n-1=36-1=35ν组间=k-1=3-1=2ν组内=n-k=36-3=33MS组间=SS组间/ν组间=52.1258/2=26.0629MS组内=SS组内/ν组内=20.0381/33=0.6072F=MS组间/MS组内=26.0629/0.6072=42.9231表9.3例9.1资料方差分析表变异来源SSMSFP总变异72.163935组间变异52.1258226.062942.92310.01组内变异20.0381330.6072三、确定P值,作出统计推断因F界值表(附表4)中无33,在保守原则下取不大于33且与与其最近接者=32,按=2,=32,查表得:,P0.01,按水准,拒绝H0,接受H1,差异有统计学意义,可以认为喂养三种不同饲料的大鼠红细胞数的总体均数不全相同。0.05(2,32)3.30F0.01(2,32)5.34F05.09.3随机区组设计方差分析(randomizedblockdesign)随机区组设计的优点是每个区组内的k个实验单位有较好的均衡性,比完全随机设计更容易觉察到处理间的差别。例9.2利用随机区组设计研究不同温度对家兔血糖浓度的影响,某研究者进行了如下实验:将24只家兔按窝别配成6个区组,每组4只,分别随机分配到温度15℃、20℃、25℃、30℃的4个处理组中,测量家兔的血糖浓度值(mmol/L),结果如下表9.4所示,分析4种温度下测量家兔的血糖浓度值是否不同?表9.4四种温度下测量家兔的血糖浓度值(mmol/L)窝别温度15202530182.2282.3090.14112.762110.1083.17100.78140.623100.15110.30120.55120.49474.2082.43100.66110.31580.5797.90115.76103.566102.7781.2090.30138.54不同窝别家兔的血糖浓度值(mmol/L)182.2282.3090.14112.762110.1083.17100.78140.623100.15110.30120.55120.49474.2082.43100.66110.31580.5797.90115.76103.566102.7781.2090.30138.54四种温度下测量家兔的血糖浓度值(mmol/L)温度1520253082.2282.3090.14112.76110.1083.17100.78140.62100.15110.30120.55120.4974.2082.43100.66110.3180.5797.90115.76103.56102.7781.2090.30138.54组内组间总ssssssSS区组区组变异SS误差测量误差等变异的分解SS总=SS处理+SS区组+SS误差误差区组处理总)1)(1()1()1()1(bkbkN配伍组设计方差分析具体步骤表9.4四种温度下测量家兔的血糖浓度值(mmol/L)jnjXiniXiX2iX窝别温度(℃)15202530182.2282.3090.14112.764367.422110.1083.17100.78140.624434.673100.15110.30120.55120.494451.49474.2082.43100.66110.314367.60580.5797.90115.76103.564397.796102.7781.2090.30138.544412.81666624550.01537.30618.19726.282431.7891.6789.55103.03121.05101.3251470.998748829.183864501.033789092.9434253894.1596一、建立假设检验,确定检验水准H0:4个总体均数全相等,即4种温度下家兔血糖浓度值相同H1:4个总体均数不全相等,即4种温度下家兔血糖浓度值不全相同=0.05一、建立假设检验,确定检验水准H0:6个总体均数全相等,即不同窝别家兔血糖浓度相同H1:6个总体均数不全相等,即不同窝别家兔血糖浓度不全相同=0.05二、计算检验统计量F值变异的分解处理间的变异区组间的变异随机误差的变异SS总=SS误差+SS处理+SS区组本例中,处理个数为k=4区组个数为b=6先计算各列及,再计算各行,总ΣX及总,最后计算校正数C、SS和ν。jijXXijj2iijX2X222253894.15962431.78/(2431.78)/24246398.0820XXCXNSS总=X2–C=253894.1596–246398.0820=7496.0776=CrXSSjiji2)(处理2222550.01537.30618.19726.28()246398.082066663742.5