多个样本均数比较的方差分析第一节方差分析的基本思想及其应用条件目的:推断多个总体均数是否有差别。也可用于两个方法:方差分析,即多个样本均数比较的F检验。基本思想:根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。应用条件:总体——正态且方差相等设计类型:完全随机设计资料的方差分析随机区组设计资料的方差分析2221122(,),(,),,(,)ggNNN表1g个处理组的试验结果处理分组测量值统计量1水平X11X12…X1j…1nX1n11XS12水平X21X22…X2j…2nX2n22XS2…………………………g水平Xg1Xg2…Xgj…ggnXnggXSg完全随机设计资料的方差分析的基本思想合计NS:第i个处理组第j个观察结果XijXijX记总均数为,各处理组均数为,总例数为N=nl+n2+…+ng,g为处理组数。11/ingijijXXN1/iniijijXXn1.总变异:全部测量值大小不同,这种变异称为总变异。总变异的大小可以用离均差平方和(sumofsquaresofdeviationsfrommean,SS)表示,即各测量值Xij与总均数差值的平方和,记为SS总。总变异SS总反映了所有测量值之间总的变异程度。计算公式为2212111,,iinnggijijijNijijijXCSSXXXC总2211,()()ingNijijijijXXCNN其中:1N总2.组间变异:各处理组由于接受处理的水平不同,各组的样本均数(i=1,2,…,g)也大小不等,这种变异称为组间变异。其大小可用各组均数与总均数的离均差平方和表示,记为SS组间。21211()()inijjggiiiiiXSSnXXCn组间1g组间计算公式为3.组内变异:在同一处理组中,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异(误差)。组内变异可用组内各测量值Xij与其所在组的均数的差值的平方和表示,记为SS组内,表示随机误差的影响。Ng组内211()ingijiijSSXX组内SSSSSS总组间组内总组间组内三种变异的关系:SSMSSSMS组间组间组间组内组内组内均方差,均方(meansquare,MS)。检验统计量:如果,则应十分接近,两者有差别的原因可解释为随机误差,F值应接近于1。如果不全相等,(MS组间除随机误差外,又增加了干预因素作用)F值将明显大于1。用F界值确定P值。12,,MSFMS组间组间组内组内12g,MSMS组间组内12,,,gMSMS组间组内将明显大于第二节完全随机设计资料的方差分析(completelyrandomdesign)是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。一、完全随机设计例1某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名患者,采用完全随机设计方法将患者等分为4组进行双盲试验。问如何进行分组?(1)完全随机分组方法:1.编号:120名高血脂患者从1开始到120;2.取随机数字:从附表1中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,见表4-2第2行;表2完全随机设计分组结果编号12345678910…119120随机数260873373204056930160905886958…220634序号241063915311413109108117…1675分组结果甲丁乙甲甲丁甲丁丁丁…甲丙3.编序号:将全部随机数字从小到大(附表1中的任一行任一列开始,如第5行第7列开始,依次读取三位数作为一个随机数录于编号下,)编序号(数据相同则按先后顺序),见表2第3行。4.事先规定:序号1-30为甲组,序号31-60为乙组,序号61-90为丙组,序号91-120为丁组,见表4-2第四行。(2)统计分析方法选择:1.对于正态分布且方差齐同的资料,常采用完全随机设计的单因素方差分析(one-wayANOVA)或成组资料的t检验(g=2);2.对于非正态分布或方差不齐的资料,可进行数据变换或采用Wilcoxon秩和检验。二、变异分解表4完全随机设计资料的方差分析表变异来源自由度SSMSF总变异N-1211ingijijXC组间g-1211()inijgjiiXCnSS组间组间MSMS组间组内组内N-gSSSS总组间SS组内组内例2某医生为了研究一种降血脂新药的临床疗效,按统一纳入标准选择120名高血脂患者,采用完全随机设计方法将患者等分为4组(具体分组方法见例1),进行双盲试验。6周后测得低密度脂蛋白作为试验结果,见表3。问4个处理组患者的低密度脂蛋白含量总体均数有无差别?统计量分组测量值niXX2X3.534.594.342.663.593.132.642.563.503.253.304.043.533.563.854.073.523.934.192.96安慰剂组1.373.932.332.984.003.552.964.34.162.59303.43102.91367.85降血脂新药2.423.364.322.342.682.951.563.111.811.771.982.632.862.932.172.722.652.222.902.972.4g组2.362.562.522.272.983.722.803.574.022.31302.7281.46233.002.862.282.392.282.482.283.212.232.322.682.662.322.613.642.583.652.663.682.653.024.8g组3.482.422.412.663.292.703.042.811.971.68302.7080.94225.540.891.061.081.271.631.891.192.172.281.721.981.742.163.372.971.690.942.112.812.527.2g组1.312.511.881.413.191.922.471.022.103.71301.9758.99132.13表34个处理组低密度脂蛋白测量值(mmol/L)三、分析步骤H0:1234,即4个试验组的总体均数相等H1:4个试验组的总体均数不全相等0.05按表4-4中的公式计算各离均差平方和SS、自由度、均方MS和F值。H0:即4个试验组总体均数相等H1:4个试验组总体均数不全相等12340.052.计算检验统计量:1.建立检验假设,确定检验水准:102.9181.4680.9458.99324.30ijX2367.85233.00225.54132.13958.52ijX2(324.30)/120876.42C958.52876.42=82.10SS总,总=120-1=1192222(102.91)(81.46)(80.94)(58.99)876.4232.1630303030SS组间413组间82.1032.1649.94SS组内,1204116组内32.1610.723MS组间,49.940.43116MS组内,10.7224.930.43F变异来源自由度SSMSFP总变异11982.10组间332.1610.7224.930.01组内11649.940.43表4完全随机设计方差分析表列方差分析表0.053.确定P值,作出推断结论:按水准,拒绝H0,接受H1,认为4个试验组ldl-c总体均数不相等,即不同剂量药物对血脂中ldl-c降低影响有差别。注意:方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较。当g=2时,完全随机设计方差分析与成组设计资料的t检验等价,有。tF三、随机区组设计——配伍组设计(randomizedblockdesign)随机区组设计(randomizedblockdesign)又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体重、年龄、职业、病情、病程等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组。(1)随机分组方法:(2)随机区组设计的特点随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同。区组内均衡。在进行统计分析时,将区组变异离均差平方和从完全随机设计的组内离均差平和中分离出来,从而减小组内离均差平方和(误差平方和),提高了统计检验效率。预选对象受试对象按配伍条件区组14个水平区组2随机分组随机分组4个水平区组2随机分组4个水平。。。。区组n随机分组4个水平例4如何按随机区组设计,分配5个区组的15只小白鼠接受甲、乙、丙三种抗癌药物?分组方法:先将小白鼠按体重编号,体重相近的3只小白鼠配成一个区组,见下表。在随机数字表中任选一行一列开始的2位数作为1个随机数,如从第8行第3列开始纪录;在每个区组内将随机数按大小排序;各区组中内序号为1的接受甲药、序号为2的接受乙药、序号为3的接受丙药,分配结果见下表。表45个区组小白鼠按随机区组设计分配结果区组号12345小白鼠123456789101112131415随机数683526009953936128527005483456序号321132321231213分配结果丙乙甲甲丙乙丙乙甲乙丙甲乙甲丙(3)统计方法选择:1.正态分布且方差齐同的资料,应采用两因素(处理、配伍)方差分析(two-wayANOVA)或配对t检验(g=2);2.当不满足方差分析和t检验条件时,可对数据进行变换或采用随机区组设计资料的FriedmanM检验。处理因素(g个水平)区组编号123…g1X11X21X31…Xg12X12X22X32…Xg2………………jX1jX2jX3j…Xgj………………n1nX2nX3nX…gnX表5随机区组设计的试验结果二、变异分解(1)总变异:反映所有观察值之间的变异,记为SS总。(2)处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理。(3)区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组.(4)误差变异:完全由随机误差产生的变异,记为SS误差。对总离均差平方和及其自由度的分解,有:SSSSSSSS处理区组总误差处理区组总误差变异来源自由度SSMSF总变异N-1211gnijijXC处理间g-12111()gnijijnXCSS处理处理MSMS处理误差区组间n-12111()gnijjigXCSS区组区组MSMS区组误差误差(n-1)(g-1)SS总-SS处理--SS区组SS误差误差表6随机区组设计资料的方差分析表三、分析步骤例5某研究者采用随机区组设计进行实验,比较三种抗癌药物对小白鼠肉瘤抑瘤效果,先将15只染有肉瘤小白鼠按体重大小配成5个区组,每个区组内3只小白鼠随机接受三种抗癌药物(具体分配方法见例4),以肉瘤的重量为指标,试验结果见表4。问三种不同的药物的抑瘤效果有无差别?区组A药B药C药1gijiX10.820.650.511.9820.730.540.231.5030.430.340.281.0540.410.210.310.9350.680.430.241.351nijjX3.072.171.576.81()ijXiX0.6140.4340.3140.45