卫生统计学流行病与卫生统计学系邹延峰zzyfl@163.com方差分析讲授内容方差分析的基本思想及应用条件完全随机设计资料的方差分析随机区组设计资料的方差分析多个样本均数间的多重比较研究因素为k个:当k=2时,两组总体均数比较是否相等可采用前面介绍的t检验(当然也可采用今天所介绍的方差分析)当k2时,即检验两组以上的总体均数是否相等时,t检验已不能满足要求,需采用方差分析(analysisofvariance,ANOVA)例9-1某医生为研究一种四类降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人,低剂量组19人,对照20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表9-1所示。问治疗4周后,餐后2小时血糖下降值的总体平均水平是否不同?表9-12型糖尿病患者治疗4周后餐后2小时血糖下降值(mmol/L)高剂量组(i=1)低剂量组(i=2)对照组(i=3)合计5.616.3-0.62.012.42.79.511.85.75.60.97.86.014.612.87.07.06.98.74.94.17.93.91.59.28.1-1.84.31.69.45.03.8-0.16.46.43.83.56.16.37.03.07.55.813.212.75.43.98.48.016.59.83.12.212.215.59.212.66.06.011.8211920609.19525.80005.43006.865017.360518.186712.384318.4176ijX2iiisXn2SXN上述资料如采用前面所学两样本t检验进行两两比较,而得出结论,会使犯第一类错误的概率增大。基本思想及应用条件总变异处理+随机误差随机误差18.417612.384318.186717.36056.86505.43005.80009.19526020192111.86.06.012.69.215.512.22.23.19.816.58.08.43.95.412.713.25.87.53.07.06.36.13.53.86.46.4-0.13.85.09.41.64.3-1.88.19.21.53.97.94.14.98.76.97.07.012.814.66.07.80.95.65.711.89.52.712.42.0-0.616.35.6合计对照组(i=3)低剂量组(i=2)高剂量组(i=1)18.417612.384318.186717.36056.86505.43005.80009.19526020192111.86.06.012.69.215.512.22.23.19.816.58.08.43.95.412.713.25.87.53.07.06.36.13.53.86.46.4-0.13.85.09.41.64.3-1.88.19.21.53.97.94.14.98.76.97.07.012.814.66.07.80.95.65.711.89.52.712.42.0-0.616.35.6合计对照组(i=3)低剂量组(i=2)高剂量组(i=1)基本思想及应用条件•基本思想:根据资料设计的类型及研究目的,将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释。通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响。•应用条件:1)各样本是相互独立的随机样本2)各样本来自正态总体3)各处理组总体方差相等,即方差齐基本思想及应用条件第一节完全随机设计资料的方差分析一、方差分析的基本思想用Xij表示第i个处理组的第j个观察值,或简记为X,总例数N=∑ni。第i个处理组的均数用表示,全部实验结果的总均数用表示。方差分析的目的就是通过分析各个处理组均数之间的差别,推断它所代表的k个总体均数间是否存在差别,或k个处理组间均数的差别是否具有统计学意义。表9-4方差分析试验数据示意图方差分析的基本概念•什么是方差?•离均差•离均差平方和SS•方差(2S2)均方(MS)•标准差:S•自由度:•关系:MS=SS/方差分析的几个名词变异的分解:1.总变异:全部实验数据大小不等ν总=N-12.组间变异:各处理组的样本均数也大小不等ν组间=k-1MS组间=SS组间/ν组间(反映了处理因素的作用,同时也包括了随机误差)3.组内变异各处理组内部的观察值也大小不等。它反映了观察值的随机误差(包括个体差异以及测定误差)MS组内=SS组内/ν组内ν组内=N-kSS总=SS组内+SS组间,且ν总=ν组间+ν组内。F=MS组间/MS组内P,组内组间,FFP,组内组间,FFF=MS组间/MS组内公式是在H0成立的条件下进行的,即MS组间与MS组内差别应该很小,F值应该接近于1。那么要接近到什么程度呢?(Fisher计算出了F的分布规律,即标准的F値)通过这个公式计算出统计量F,查表求出对应的P值,与进行比较,以确定是否为小概率事件。统计量FR.A.Fisher各种变异的表示方法•SS总•总•MS总SS组内组内MS组内SS组间组间MS组间三者之间的关系:SS总=SS组内+SS组间总=组内+组间二、完全随机设计资料方差分析的基本步骤•用于完全随机设计的多个样本均数的比较可用单因素方差分析。该分析中仅涉及一个研究因素,此因素有K(K≥2)个水平或状态。1.成组设计方差分析中变异的分解总变异组内变异:个体差异及血糖的随机测量误差。组间变异:不同用药的影响及随机测量误差。表9-5成组设计方差分析的计算公式变异来源SSνMSF总组间组内N-1K-1N-KSS组间/组间SS组内/组内MS组间/MS组内SS总-SS组间2.分析计算步骤(1)建立假设并确定检验水准H0:三个总体均数相等即μ1=μ2=μ3H1:三个总体均数不等或不全相等α=0.05(2)计算检验统计量F值 === === =-==-=-=====-= =-+-+-==-=组内组间组内组内组内组内组间总组内组间组间组间组间组间总总537.59627.153806.88MSMSF9627.15578723.909SSMS572598723.9097621.1766384.1086SSSSSS3806.8827621.176SSMS2137621.1768650.64300.5208650.68000.5198650.61952.921SS6384.10861604176.181NSSS22222xxniii3)确定P值并作出推断结论以分子的自由度ν组间=2为ν1,分母的自由度ν组内=57为ν2,查附表3.1,方差分析用F界值表,F0.05(2,60)=3.15F0.01(2,60)=4.98,F=5.537>F0.01(2,60)=4.98,P<0.01。在α=0.05水准上拒绝H0,接受H1可以认为三种人的血糖下降水平不同。表9-6例9-1的方差分析表变异来源SSdfMSFP组间(处理组间)176.7612288.38065.5370.01组内(误差)909.87235715.9627总1086.633559注意:以上结论表明,总的说三种人的血糖水平有差别,但并不能说明任何两种人的血糖值均有差别。只能说可能至少有两组人的血糖值有差别,可能有的组间没有差别。要了解那些组均数间有差别,那些组均数间没有差别,需要进一步做两两比较。当k=2时,对同一资料,单因素方差分析等价于完全随机设计的t检验,且F=t2。第二节随机区组设计资料的方差分析随机区组设计的多个样本均数的比较可用多个样本均数比较的两因素方差分析。两因素是指主要的研究因素和配伍(区组)因素,研究因素有k个水平,共有n个区组。•例9.2为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同、体重相近划分为10个区组。每个区组间3只大白兔随机采用A、B、C三种处理方案即在松止血带前分别给予丹参2ml/kg、1ml/kg、生理盐水2ml/kg在松止血带前及松后1小时分别测定血中白蛋白含量(g/L),算出白蛋白减少量如下表9-7,问A、B两方案分别与C方案的处理效果是否不同?区组内同质、随机ABCD表9-7A.B.C三种方案处理后大白兔血中白蛋白减少量(g/L))区组号A方案B方案C方案123456789102.212.323.151.862.561.982.372.883.053.422.912.643.673.292.452.743.153.442.612.864.254.564.333.893.784.624.713.563.774.233.12333.17333.71673.01332.93003.11333.41003.29333.14333.5033102.58000.2743102.97600.1581104.17000.160530(N)3.24200.6565(S2)jXiniS一、离均差平方和与自由度的分解从表9-7中可以看出,测定结果的变异除了总变异、不同处理方案(处理组)的变异和随机误差变异外,还存在区组间变异,这是由于大白兔遗传特征所致。其大小可用各区组的均数的离均差平方和表示,即:X与总均数jX1733.095577.15577.12420.35033.33...........2420.31733.332420.31233.3312222== = =区组区组间区组间区组间MSSSbXXnSSjjj总变异和处理组变异的计算同于完全随机设计资料的方差分析。即:进一步计算出处理和区组的F值。8509.627018.137018.132420.31700.4102420.39760.2102420.35800.210100385.191306565.01NS22222== = ==-=-=处理组处理组间处理间处理组间总总MSSSkXXnSSSSiii111NbkSSSSSSSSSSSSSSSS---=--= --= =区组间处理组间总误差区组间处理组间总误差误差区组间处理组间总总变异误差变异:个体差异及血白蛋白的随机测量误差。处理组间变异:A、B、C不同方案的影响及随机误差。区组间变异:既反映了十个区组不同的影响同时又包括了随机误差。•SS总•总SS误差误差MS误差SS处理处理MS处理变异之间的关系:•SS总=SS处理+SS区组+SS误差总=处理+区组+误差变异间的关系SS区组区组MS区组二.分析计算步骤(1)建立假设并建立检验水准对于处理组:H0:三个总体均数全相等,即μ1=μ2=μ3H1:三个总体均数不等或不全相等对于区组:H0:十个总体均数全相等H1:十个总体均数不等或不全相等α=0.05(2)计算检验统计量F值表9-10随机区组设计方差分析的计算公式变异来源SSvMSF处理间区组间k-1b-1V总-v处理-v配伍SS处理/v处理SS区组/v区组SS误差/v误差MS处理/MS误差MS区组/MS误差总N-1SS总-SS处理-SS配伍误差2xxniii2xxnjjjNXX221N-总SS表9-9例9-2的方差分析表变异来源SSdfMSFP组间(处理组间)13.708026.850932.6390.01区组间1.557790.17310.8250.05误差3.7790180.2099总19.0385293)确定P值并作出推断结论以分子的自由度ν处理=2为ν1,分母的自由度ν误差=18为ν2,查附表3.1,方差分析用F界值表,F0.05(2,18)=2.62,F处理=32.639F0.05(2,18)=2.62,P0.05。在α=0