第八章方差分析方差分析方差分析(AnalysisofVariance,ANOVA)1928年由英国统计学家R.A.Fisher首先提出,为纪念Fisher,以F命名,故方差分析又称为F检验。方差分析的优点不受比较组数的限制,可比较多组均数可同时分析多个因素的作用可分析因素间的交互作用方差分析的应用条件独立性:各样本是相互独立随机的样本正态性:各样本都来自正态总体方差齐性:各样本的总体方差相等看一个实例例8-1研究郁金对低张性缺氧小鼠存活时间的影响,将36只小鼠随机分为A、B、C3组,每组12只,雌雄各半,分别以10g/kg、20g/kg、40g/kg三种不同剂量的郁金灌胃,各组小鼠均同时置于放有钠石灰的250ml密闭广口瓶中,观察并记录小鼠存活时间。数据如表8-3所示,问不同剂量的郁金下小鼠的存活时间是否不同。2SA组B组C组合计47.749.784.434.557.270.141.648.36834.159.173.736.347.775.5Xij………41.551.869.632.256.972.4ni12121236(N)40.0852.9674.1955.74()33.56225.08641.195234.808()234.808(iX2SX2iS总变异——SS总(离均差平方和)2ijSSXX总总=N-1组间变异——SS组间2iiSSnXX组间组间=k-1MS组间=SS组间/(k-1)组间均方(meansquare)它反映的是处理因素的作用,同时也包括了随机误差。组内变异——SS组内22(1)iijiiSSXXnS组内组内=N-kMS组内=SS组内/(N-k)组内均方它反映了观察值的随机误差,包括个体差异和测量误差等。变异分解组间变异总变异组内变异SS总=SS组间+SS组内总=组间+组内方差分析的基本思想抽样误差本质上的差别+抽样误差(组间差异)(组内差异)如果三种剂量效果相同,也即三组样本均数来自同一总体(H0:1=2=3),那么从理论上说组间变异应该等于组内变异,因为两者均只反映随机误差(包括个体差异),这时若计算组间均方与组内均方的比值:F=MS组间/MS组内则F值在理论上应等于1,但由于抽样误差的影响,F通常接近1,而并不正好等于1。相反,若三种疗法效果不同,则组间变异就会增大,F值则明显大于1,要大到什么程度才有统计学意义呢?可通过查方差分析用F界值表得到P值,将其与事先规定的值比较后作出判断。完全随机设计资料的方差分析(analysisofonewayvariance)ANOVA处理因素只有一个属于完全随机设计:随机抽样随机分组随机试验2CXN2SSXC总2iiSSnXX组间22(1)iijiiSSXXnS组内基本步骤建立检验假设计算检验统计量确定P值结论列方差分析表建立假设H0:A=B=C,三个总体均数全相等H1:三个总体均数不全相同=0.05计算基本数据甲乙丙合计40.0852.9674.1955.7433.56225.08641.195234.808XiS计算SS总、SS组间、和SS组内变异来源离均差平方和SS自由度df离均差平方均方MSFP组间组内SS组间SS组内K-1N-K-1SS组间/(K-1)SS组内/(N-K-1)MS组间/MS组内总SS总N-1表8-4例8-1的方差分析表变异来源SSdfMSFP组间7119.99423559.997106.9680.01组内1098.2753333.281总8218.26935确定P值,得出结论查方差分析表得F0.05(2,33)=3.29,F0.01(2,33)=5.34,则P<0.05。故按=0.05的水准,拒绝H0,接受H1,故可认为三个总体均数不全相同。随机区组设计资料的方差分析配伍因素和处理因素属于随机区组设计(blockdesign)又称“配伍设计”配伍的概念•随机区组设计(配伍设计)是配对设计的扩大,将全部受试对象按某种或某些特征划分成若干个区组,使每个区组内研究对象的特征尽可能相近。再使每一区组的各受试对象随机地接受不同水平的处理。配伍设计的目的对研究因素以外的已知的干扰因素加以控制,从而将研究因素的作用与干扰因素的作用区分开,以提高检验的功效。例9-2•为研究克拉霉素的抑菌效果,对28个短小芽孢杆菌平板依据菌株的来源不同分成了7个区组,每组4个平板用随机的方式分配给标准药物高剂量组(SH)、标准药物低剂量组(SL),以及克拉霉素高剂量组(TH)、克拉霉素低剂量组(TL)。给予不同的处理后,观察抑菌圈的直径,结果见表8-7,问(1)4种处理效果是否不同?(2)不同菌源之间抑菌圈的直径大小是否不同?28个平板给予不同处理后的抑菌圈直径区组SLSHTLTH118.0219.4118.0019.4618.72218.1220.2018.9120.3819.40318.0919.5618.2119.6418.88418.3019.4118.2419.5018.86518.2619.5918.1119.5618.88618.0220.1218.1319.6018.97718.2319.9418.0619.5418.94ni777728(N)18.1519.7518.2419.6718.95()0.0130.1110.0950.1020.668()XjXiX2iS2S两因素方差分析的原理类似于单因素方差分析,前者仅在后者的基础上,从误差中再分离出配伍组效应,使误差减少,达到提高检验功效之目的SS总=SS处理+SS区组+SS误差总变异——SS总(离均差平方和)2ijSSXX总总=N-1处理组变异——SS处理2iiSSnXX处理处理=k-1MS处理=SS处理/(k-1)处理均方(meansquare)它反映的是处理因素的作用,同时也包括了随机误差。区组变异——SS区组2()jjSSnXX区组区组=b-1MS区组=SS区组/(b-1)区组均方它反映了区组因素的作用,同时也包括了随机误差。误差变异——SS误差SSSSSSSS处理总误差区组处理总误差区组SSMS误差误差误差对于处理组H0:四个总体均数全相等,即4种处理的直径相同H1:四个总体均数不全相等,即4种处理的直径不全相同=0.05对于区组H0:7个总体均数全相等H1:7个总体均数不全相等=0.05建立检验假设计算SS总、SS处理、SS区组和SS误差随机区组设计方差分析的计算公式变异来源SSdfMSF处理组处理=k-1MS处理=SS处理/(k-1)MS处理/MS误差区组区组=b-1MS区组=SS区组/(b-1)MS区组/MS误差误差总N-12iiSSnXX处理2()jjSSnXX区组SSSSSSSS处理总误差区组处理总误差区组SSMS误差误差误差22()XSSXN总确定P值,作结论F0.05,(3,18)=3.16F0.05,(6,18)=2.66F0.01,(3,18)=5.09F0.01,(6,18)=4.01列方差分析表表8-8例8-2实验结果的方差分析表变异来源SSdfMSFP处理16.117535.3725116.8950.01区组1.095260.18253.970.05误差0.8273180.04596总18.0427•显然处理组间均数的检验结果是F>F0.01,P<0.01,拒绝H0,接受H1,差别有统计学意义,可认为4种处理的直径不全相同。•对区组:F>F0.05,P<0.05,拒绝H0,接受H1,差别有统计学意义,可认为各区组直径不全相同。多个样本均数的两两比较在方差分析认为多组均数间差异有统计学意义的基础上,若需了解究竟哪些组均数之间有差别,还是各组间均有差别,可用多个样本均数的两两比较(又称多重比较multiplecomparison)。多个样本均数的两两比较不宜用t检验如用t检验,则第一类错误率将增大,此时易将无差别的两均数错判为有差别'=1-(1-)m(m=Ck2=k(k-1)/2)如:三个组的比较1-(1-0.05)3=0.14,比0.05大多了。多个样本均数间的两两比较•用q检验(又称Student-Newman-Keuls法,即SNK法),统计量为q:112ABABMSqXXnn误差误差H0:A=B,每次对比时两个总体均数相等;H1:A≠B,每次对比时两个总体均数不等。=0.05。将三个样本均数按从小到大顺序排列并编上组次:组次123均数40.083352.958374.1917组别低剂量组中剂量组高剂量组XXAB1.6654ABXX表8-133个样本均数两两比较的q检验对比组两均数之差q值组数q检验界值P值RA与RBaP=0.05P=0.011与334.108420.48133.494.450.011与212.87507.73122.893.890.012与321.233412.75022.893.890.01结论由表8-13得低剂量组、中剂量组与高剂量组(“1与3、1与2及2与3”)间分别比较,P0.01,按=0.01水准均拒绝H0,接受H1,差异有统计学意义,可认为不同剂量的郁金下小鼠的存活时间各不相同。多个实验组与一个对照组均数间的两两比较•常用q´检验,又称Dunnettt检验,其计算公式为:•公式与q检验公式类似,但需查Dunnettt界值表。11TCDTCXXtMSnn误差误差TCXX0.1146TCXX表8-143个处理组与对照组均数比较的q’检验对比组两均数之差t值组数检验界值(误差=18)P值RT与RCTP=0.05P=0.01SH与SL1.598613.9532.563.330.01TL与SL0.08860.7732.563.330.05TH与SL1.520013.2632.563.330.01LSD-t法11ABABtXXMSnn误差误差ABXX0.1146ABXX表8-15两均数比较的LSD-t检验对比组两均数之差LSD-t值t检验界值(误差=18)P值RA与RBP=0.05P=0.01SL与SH1.598613.952.1012.8780.01TL与TH1.431412.492.1012.8780.01方差齐性检验•两个方差的齐性检验F检验•多个方差的齐性检验Bartlettχ2检验Levene检验22SFS大小Bartlettχ2检验•检验统计量222221111ln1ln1ln1gggCiiCiiiiiiSnnSnSSVg221111giiiCgiinSSnLevene检验•检验统计量212111igiiingijiijNgnZZWgZZ12gNnnn重复测量的方差分析•重复测量设计在医学、生物学研究中较为常见,它是指在给予一种或多种处理后,在多个时间点上从同一个受试对象重复获得指标的观察值,其目的是探讨同一研究对象在不同时间点上某指标的变化情况。数据的基本形式:对象编号时间1时间2…时间g实验1x111x112…x11g……………n1x1n11x1n12…x1n1g对照1x211x212…x21g……………n2x2n21x2n22…x2n2g重复测量设计与随机区组设计的区别•1.重复测量设计中“处理”不是在区组(受试者)间随机分配,区组内的各时间点是固定的,不要随机分配。随机区组设计要求处理在区组内随机分配,每个实验单位接受的处理各不相同。•2.重复测量设计区组内实验单位彼此不独立。•3.重复测量设计统计分析方法:一是多元方差分析,二是重复测量数据的方差分析。