第五章方差分析第2页§1单因子方差分析§1.1问题的提出实际工作中我们经常碰到多个正态总体均值的比较问题,处理这类问题通常采用所谓的方差分析方法。第五章方差分析第3页引例:在饲料养鸡增肥的研究中,某研究所提出三种饲料配方:A1是以鱼粉为主的饲料,A2是以槐树粉为主的饲料,A3是以苜蓿粉为主的饲料。为比较三种饲料的效果,特选24只相似的雏鸡随机均分为三组,每组各喂一种饲料,60天后观察它们的重量。试验结果如下表所示:第五章方差分析第4页表鸡饲料试验数据饲料A鸡重(克)A110731009106010011002101210091028A21107109299011091090107411221001A310931029108010211022103210291048第五章方差分析第5页本例中,我们要比较的是三种饲料对鸡的增肥作用是否相同。为此,把饲料称为因子,记为A,三种不同的配方称为因子A的三个水平,记为A1,A2,A3,使用配方Ai下第j只鸡60天后的重量用yij表示,i=1,2,3,j=1,2,,10。我们的目的是比较三种饲料配方下鸡的平均重量是否相等,为此,需要做一些基本假定,把所研究的问题归结为一个统计问题,然后用方差分析的方法进行解决。第五章方差分析第6页§1.2单因子方差分析的统计模型在例中我们只考察了一个因子,称其为单因子试验。通常,在单因子试验中,记因子为A,设其有r个水平,记为A1,A2,…,Ar,在每一水平下考察的指标可以看成一个总体,现有r个水平,故有r个总体.第五章方差分析第7页从每一水平下的总体抽取样本:设从第i个水平下的总体获得m个试验结果,记xij表示第i个总体的第j次重复试验结果。共得如下n=rm个试验结果:xij,i=1,2,…,r,j=1,2,…,m,其中r为水平数,m为重复数,i为水平编号,j为重复编号。第五章方差分析第8页水平观测值A1x11x12...x1mA2x21x22…x2m……………Arxr1xr2…xrm第五章方差分析第9页1)每一总体均为正态总体,记为N(i,i2),i=1,2,…,r;2)各总体的方差相同:12=22=…=r2=2;3)从每一总体中抽取的样本是相互独立的,即所有的试验结果xij都相互独立。假定:第五章方差分析第10页我们要比较各水平下的均值是否相同,即要对如下的一个假设进行检验:H0:1=2=…=r备择假设为H1:1,2,…,r不全相等在不会引起误解的情况下,H1通常可省略不写。如果H0成立,因子A的r个水平均值相同,称因子A的r个水平间没有显著差异,简称因子A不显著;当H0不成立时,因子A的r个水平均值不全相同,这时称因子A的不同水平间有显著差异,简称因子A显著。第五章方差分析第11页•由于Xij~N(μi,σ2),故Xij与μi的差可以看成一个随机误差εij~N(0,σ2).这样一来,可以假定Xij具有下述数据结构式:Xij=μi+εij,(i=1,2,...,r;j=1,2,...,m)其中诸εij~N(0,σ2),且相互独立.单因子方差分析的统计模型:2,1,2,...,,1,2,...,(0,)ijiijijXirjmN且相互独立第五章方差分析第12页总均值与效应:1111(...)rriirr第i水平下的均值i与总均值的差称为Ai效应:诸i的平均值称为总均值:αi=i-第五章方差分析第13页模型可以改写为12,1,2,...,,1,2,...,0N(0,)riiiijjjiiirjmX且相互独立假设可改写为H0:α1=α2=…=αr=0第五章方差分析第14页§1.3平方和分解§1.3.1试验数据下表中的最后二列的和与平均的含义如下:.111,2,,miiijijriiTTXXirmTTTTXrmnnrm总试验次数通常在单因子方差分析中可将试验数据列成如下页表格形式。第五章方差分析第15页表单因子方差分析试验数据因子水平试验数据和平均A1X11X12…X1mT1A2X21X22…X2mT2┆┆┆┆ArXr1Xr2…XrmTrT1.X2.XX.rX第五章方差分析第16页数据间是有差异的。单个数据Xij与总平均值间的可分解为二个偏差之和§1.3.2组内偏差与组间偏差..())(iiijijXXXXXX..1111111,mrrmiijiijjiijmrn记第五章方差分析第17页仅反映组内数据与组内平均的随机误差..()()iijijiijiiiXX...()()iiiiiXX除了反映随机误差外,还反映了第i个水平的效应.组内偏差:组间偏差:第五章方差分析第18页在统计学中,把k个数据y1,y2,…,yk分别对其均值=(y1+…+yk)/k的偏差平方和§1.3.3偏差平方和及其自由度y22211()()()kkiiQyyyyyy称为k个数据的偏差平方和,它常用来度量若干个数据分散的程度。第五章方差分析第19页在构成偏差平方和Q的k个偏差y1,…,yk间有一个恒等式,这说明在Q中独立的偏差只有k1个。yy1()0kiiyy在统计学中把平方和中独立偏差个数称为该平方和的自由度,常记为f,如Q的自由度为fQ=k1。自由度是偏差平方和的一个重要参数。第五章方差分析第20页总偏差平方和:§1.3.4总平方和分解公式组内偏差平方和(误差偏差平方和):211()rmTijijSXX2.11()rmEijiijSXX表示各Xij间总的差异大小,其自由度为fT=n1;表示仅由随机误差引起的数据间的差异,其自由度为fe=nr;.ijiijiXX第五章方差分析第21页组间偏差平方和(因子A的偏差平方和):2.1()rAiiSmXX反映了随机误差及效应间的差异,故反映了由效应不同引起的数据差异,其自由度为fA=r1;..iiiXX第五章方差分析第22页:EASST在单因子方差分析模型中,平方和有如下恒等式:S定理(平方和分解定理)证明221111()(..)rmrmTijijiiijijSXXXXXX22111(.)(.)rmrijiiijiXXmXX22111111(.)(.)2(.)(.)inrrmrmijiiijiiijijijXXXXXXXX第五章方差分析第23页其中交叉乘积项11112(.)(.)2(.)(.)rmrmijiiiijiijijXXXXXXXX12(.)(..)0riiiiXXXmX22111(.)(.).rmrEijiAiijiTEASXXSmXXSSS记则为一个平方和分解式第五章方差分析第24页111,.rmijijXXn是所有数据的平均值称为总平均值11.,.miijjiXXin是从第个总体中抽得的样本平均值称为组平均值211(),,().rmTijijSXX表示所有数据与总平均值的离差平方和是描述全部数据离散程度的一个指标称为总偏差平方和总离差平方和§1.4检验方法第五章方差分析第25页211(.),,().rmEijiijSXX表示每个数据与其组平均值的离差平方和反映了试验中的随机误差称为误差偏差平方和组内离差平方和21(.),(),().rAiiSmXXA表示组平均值与总平均值的离差平方和反映了各总体因子的不同水平均值之间的差异程度称为因子偏差平方和组间离差平方和第五章方差分析第26页.,.,,),1(,,001下无显著差异间在显著性水平认为因子各水平否则接受下有显著差异著性水平认为因子各水平间在显拒绝假设时当对给定的显著性水平按照显著性检验程序HHrnrFF.,,)/()1/(,,0...:,0210不真可以认为假设值过大时当也不应太大从而的值不应太大为真时故当假设异程度均值之间的差反映的是因子不同水平由于HFrnSrSFSHSEAArA第五章方差分析第27页当FF0.99时,称因子的影响高度显著,记为“**”;当F0.99F≥F0.95时,称因子的影响显著,记为“*”;当F<F0.95时,称因子无显著影响,即认为因子各水平间无差异.方差分析表方差来源平方和自由度均方和F值显著性因子影响SAr-1SA/(r-1)随机误差SEn-rSE/(n-r)总和STn-1F第五章方差分析第28页对给定的,可作如下判断:若FF1(fA,fe),则说明因子A不显著。如果FF1(fA,fe),则认为因子A显著;第五章方差分析第29页221122.1122.1212,,,1111/(1)/()iiinnrrTijrijijrriAAiiiETAEiAiiEjinSXnXfnnXSnXfrnnSSSfnrSrTTXnrXFSn若因子的每一水平所进行的试验次数不等设在第个水平下试验了次则在具体计算时可用下式第五章方差分析第30页等重复试验计算表各水平的试验号水平12…t和xi.和平方x2i.1x11x12…x1m2x21x22…x2m……………rxr1xr2…xrm第五章方差分析第31页不等重复试验计算表各水平的试验号水平12…ti和xi.和平方x2i.1x11x12…x1ni2x21x22…x2ni……………rxr1xr2…xrni第五章方差分析第32页例:采用引例的数据,将原始数据减去1000,列表给出计算过程:引例的计算表水平数据(原始数据-1000)TiTi2A17396012129281943763610024A210792-101099074122158534222560355A393298021223229483541253162098411335051779136321mijjy第五章方差分析第33页可算得各偏差平方和为:2211339136337876.0417,241232450517711339660.0833,31282437876.04179660.083328215.9584,3(81)21TTAAeTAeSfSfSSSf把上述诸平方和及其自由度填入方差分析表第五章方差分析第34页表引例的方差分析表来源平方和自由度均方和F比因子9660.083324830.04173.5948误差28215.9584211343.6171总和37876.041723若取=0.05,则F0.95(2,21)=3.47,由于F=3.59483.47,故认为因子A(饲料)是显著的,即不同种类饲料对鸡的增肥作用有明显的差别。第五章方差分析第35页•例:为寻求适应本地区的高产油菜品种,今选了五种不同品种进行试验,每一品种在四块试验田上得到在每一块田上的亩产量如下:品种田块A1A2A3A4A51256244250288206222230027728021232802902303152204298275322259212•我们要研究的问题是诸不同品种的平均亩产量是否有显著差异.第五章方差分析第36页计算表各水平的田块品种1234和和平方A125622228029810561115136A224430029027511091229881A325027723032210791164241A428828031525911421304164A5206212220212850722500•解:先列表计算第五章方差分析第37页412.2514155359228.1370784)(201iiijij