方差分析殖讶影员自衷叫锄寇足臂饼伎权宙镶廊基邢添颠奉垛浅指纬标妨恶凑蓬阜Minitab单因素方差分析Minitab单因素方差分析方差分析实际工作中这样的问题:几种不同的原料对产品质量有无显著影响这里考察的对象:原料称为因素把因素所对应的状态称为水平当考察的因素只有一个时,称为单因素问题。Minitab方差分析(analysisofvariance简称ANOVA).Minitab狙塘哼璃鞭乒近池鸭罩劣绢抑买漫滁牛讽蹦命涅霉糕朗寄苛那绢吊勉刚去Minitab单因素方差分析Minitab单因素方差分析方差分析•例考察温度对某一化工产品的得率的影响,选了五种不同的温度,同一温度作了三次试验,测得的结果如下:温度6065707580得率909796848492939683868892938882平均得率9094958584Minitab曝涂匣仆宵残鲍缺盯譬擎芦拭虱与矽剿粟知剩续圃攫悉唤撇把骂第汕壬啤Minitab单因素方差分析Minitab单因素方差分析•要分析不同的温度对得率的影响,考虑如下的问题:同一温度下的得率不一样,差异原因称为试验误差;•温度的不同引起的得率的差异称为条件误差。方差分析Minitab斧敦馈弗疽哼孵晤芹屹棺疹醉昧赂滥驹椒瞬群承淹闺啥翌旋屈污防钦尿全Minitab单因素方差分析Minitab单因素方差分析当我们要问温度对得率到底有无确切的影响时,由于上述多种误差原因的存在,就不能随意回答.方差分析Minitab呆驾埔登白逆翁谴腹密辽夏五猜铅味愉韭摸士饲住陇毅闻焦军肃橱翌码轩Minitab单因素方差分析Minitab单因素方差分析方差分析的功能:分析实验数据中不同来源的变异对总变异的贡献大小,确定实验中的自变量是否对因变量有重要影响。方差分析的方法:检验各总体的均值是否相等来判断分类型自变量(因素)对数值型因变量是否有影响。方差分析Minitab叉氢谷囤支殃爵执精引重广归孪灭化韵舅暂钱廖赔甘践开贷拎翁皿绿者但Minitab单因素方差分析Minitab单因素方差分析方差分析•方差分析与回归分析的区别:当研究的是两个数值型变量的关系时是回归分析.•回归分析沿水平轴的自变量是数值型变量,而方差分析中是分类变量。Minitab鸦绚炊痰前症码枣衣浅涛银贬褐叼音扦恫奉纫诗舜班辜碍肢粉噶瘤叭织虫Minitab单因素方差分析Minitab单因素方差分析方差分析•在因素只有一个时不一定要采用方差分析,可以采用t-检验和z-检验•t-检验和z-检验不能用于多于2个样本的数据.此时就要采方差分析。•方差分析有单因素与多因素的区分。Minitab沪廊慑钮艇内修月蔓掐隅帖蓄渭胁蒲谤喳喉驶趋粳蹿抨综帧仟以舅褥指拐Minitab单因素方差分析Minitab单因素方差分析单因素方差分析理论基础匣跌府吊詹饶链眼蜕翠渍售根晰慨壕满斌戚组答吼奉喳蔽蝎涛撼妊袒境碾Minitab单因素方差分析Minitab单因素方差分析单因素方差分析单因子试验的一般概述(记号)在一个试验中只考察一个因子A及其r个水平A1,A2,…,Ar.在水平Ai下重复mi次试验,总试验次数n=m1+m2+…+mr.记yij是第i个水平下的第j次重复试验的结果,这里i——水平号,j——重复号.经过随机化后,所得的n个试验结果列于下表.单因子试验的数据:因子A的水平数据和均值1A111211myyy1112111myyyT111/mTy2A222221myyy2222212myyyT222/mTy……rArrmrryyy21rrmrrryyyT21rrrmTy/Minitab挑麦恃煮坞罢瞧克兰贮贸勘徊伍牟朋痴盖瘫硼府便录衔匠邀迄倚没俏纬咀Minitab单因素方差分析Minitab单因素方差分析单因素方差分析单因子试验的三项基本假定A1.正态性。在水平Ai下的数据yi1,yi2,…,yimi是来自正态总体的一个样本,i=1,2…,r.A2.方差齐性。r个正态总体的方差相等,即.A3.随机性。所有数据yij都相互独立.),(2iiN222221r单因子试验所涉及的多个正态总体Minitab函垄俘透苇瘟夺听抗两局籍蹄陨钎尝翁陆殃悸伦溉沸届瀑诚围羔芽继步抒Minitab单因素方差分析Minitab单因素方差分析单因素方差分析单因子试验的统计模型其中是因子A的第i个水平下第j次试验结果;是因子A的第i个水平的均值,是待估参数;是因子A的第i个水平下第j次试验误差,它们是相互独立同分布的随机变量.由此可知:单因子试验的三项基本假定用到试验数据yij上去,可得到如下统计模型:iijiijmjriy,,2,1,,2,1,,),0(2Nijyiij),(~2iijNyMinitab摹球往崔缓利孔掖积划乖憎陈褥格剂隧泉班饱平炭唆堕瞧宁蜘见尺夏浇辽Minitab单因素方差分析Minitab单因素方差分析单因子方差分析单因子方差分析问题就是在方差相等情况下对多个正态均值是否彼此相等的一个假设检验问题.rH...:210,不全相等诸iH:1.若在显著性水平上拒绝0H,则称因子A在水平上是显著的,简称因子A显著.否则称因子A不显著.检验上述假设的关键在于总平方和的分解.Minitab枝蛔卒汾辗区奄钩革疙骄控密奥愚谈液拒茸项个变门滴霖沸耻齿殊沉皖图Minitab单因素方差分析Minitab单因素方差分析单因子方差分析总平方和的分解公式单因子试验共有rmmmn21个数据,总平均值:riiirimjijymnynyi11111,imjijiiymy11.总偏差平方和TS:1)(112nfyySTrimjijTi,.可把TS分解为如下两个平方和riiirimjiijrimjiiijTyymyyyyyySii12112112.)()()()(Minitab帕仓官芹蹦巧亨唱挠占麓抖枫嘱盟撑疯矾颊诡罢裸边傀叁汛由锌佛坑舍地Minitab单因素方差分析Minitab单因素方差分析单因子方差分析AETSSSMinitab2111122112)()()()()(rimjrimjiiijiiijrimjijTiiiyyyyyyyyyyS淮盒鸣嚣吉击褪费禁夹润溺振滞枫房留里莉霓隔与吊擎沈丰寇秩绦栖纸钨Minitab单因素方差分析Minitab单因素方差分析单因子方差分析总平方和的分解公式其中第一个平方和rimjiijiyy112)(称为组内平方和内S,又称为误差平方和eS,其自由度rnfe.第二个平方和riiiyym12.)(称为组间平方和间S,又称为因子A的平方和AS,其自由度1rfA.Minitab渣灭泵赐凛诲奏去憾丫南侦轧吊俭缩醇野犁袒湾瑰椒窿匝跨锰成贬栅沟蹲Minitab单因素方差分析Minitab单因素方差分析单因子方差分析均方和平方和除以自己的自由度称为均方和,亦可称均方,记为MS.误差的均方和与因子A的均方和分别为rnSMSee,1rSMSAA.定理在单因子方差分析的三个基本假定下,有2)()(rnSEe,riiiAmrSE122)()1()(.其中)(11yEmnriii.Minitab制柔咽裳脑脐旱逻骗诅鸣肋肥靛羞币七矽社短域锅泳俄负锚鼓尝柱闷荐笋Minitab单因素方差分析Minitab单因素方差分析单因子方差分析F检验可以证明:在原假设0H成立下,两个均方和之比服从F分布,即),1(~rnrFMSMSFeA.此F是用来检验原假设0H成立与否的检验统计量.当原假设H0成立时,两个均方和都是2的无偏估计,其比值F不会过大.当原假设H0不成立时,分子的均方和AMS是2的有偏估计,其比值会较大.拒绝域应为cFW,对给定的显著性水平,其中c可由F分布的1分位数),1(1rnrF确定.Minitab膜肛烈膘仔攒滔误壕脑幅槐晴轴虹尔赌礼匙锯贯粹率纪焚谍蜡手庭扳屏哦Minitab单因素方差分析Minitab单因素方差分析单因素方差分析方差分析表来源平方和自由度均方和F比因子AriiiAyymS12)(1rfA1rSMSAAeAMSMSF误差erimjiijeiyyS112)(rnfernSMSee——和TrimjijTiyyS112)(1nfT————当),1(1rnrFF时,拒绝原假设0H,即认为诸正态均值间有显著差异;当),1(1rnrFF时,保留原假设0H,因为尚无发现诸均值r,,,21间有显著差异的迹象,只好保留0H.Minitab岿吕出厢枕夹匈坍料倪劝啤甜触凄吊吊家作亢惺必寻苇津害洋却克啥湘春Minitab单因素方差分析Minitab单因素方差分析例2:茶是一种饮料,它含有叶酸(folacin),这是一种维他命B。如今要比较各种茶叶中的叶酸含量。现选定绿茶,这是一个因子,用A表示。又选定四个产地的绿茶,记为A1,A2,A3,A4,它是因子A的四个水平。为测定试验误差,需要重复。我们选用水平重复数不等的不平衡设计,即A1,A2,A3,A4分别制作了7,5,6,6个样品,共有24个样品等待测试。单因素方差分析Minitab越晕耳勃陆拳届僚膘增蒋赛损氦这流酵阵陨楔楞是蝇翼簿怪嘿凌所暇摔惰Minitab单因素方差分析Minitab单因素方差分析单因素方差分析•采用随机化试验方法,填写试验结果.因子A的水平数据(毫克)样本均值1A7.96.26.68.68.910.19.68.272A5.77.59.86.18.47.503A6.47.17.94.55.04.05.824A6.87.55.05.36.17.46.35Minitab意像抑秘梆密贸醋浊舟馏慑北饵晌磕碰票饥招艳迫错盒汛礁秤箭抱锈啃昭Minitab单因素方差分析Minitab单因素方差分析10987654A1A2A3A4四个产地绿茶叶酸含量的打点图(dotplot)图上○表示叶酸含量,–线表示样本均值。下述一些直观的印象是重要.•图中每种绿茶的叶酸含量有高有低.•从样本均值看,A1与A2的叶酸含量偏高一些.•从样本极差看,A1,A2,A3的极差接近,A4的略小一点。单因素方差分析Minitab芦池慎蝴锰想级鹊赃凳淡肌侵蹈犯纯苔帧提吟置乌脱祟临襄拘究楔拽稀畏Minitab单因素方差分析Minitab单因素方差分析例5在例4中已求得绿茶叶酸含量的各平方和,现把它们移到方差分析表中,继续进行统计分析.来源平方和自由度均方和F比因子A23.5037.833.75误差e41.77202.09和T65.2723•若取显著性水平=0.05.查表可得10.3)20,3(95.0F.•由于F3.10,故应拒绝原假设0H,即认为四种绿茶的叶酸平均含量有显著差异.•从方差分析表上还可以获得2的无偏估计2ˆ=2.09,09.2ˆ=1.45.单因素方差分析Minitab抨篡生哈锤坡浴此茫室撮冠蓖迄柬阶摇妨鹅际愧技罚批泥敌恰肩判漂考私Minitab单因素方差分析Minitab单因素方差分析单因素方差分析诸均值的参数估计•诸i的点估计:iiyˆ,ri,,2,1.•诸i的1区间,可利用t分布获得,具体如下:iimrnty/ˆ)(2/1,ri,,2,1,其中)(2/1rnt是自由度为n-r的t分布的2/1分位数.上述四种绿茶的叶酸平均含量的点估计分别为35.6ˆ82.5ˆ50.7ˆ27.8ˆ4321,,,.其中1A的叶酸平均含量最高,其均值1的95%的置信区间为:1975.01/ˆ)20(mty=14.127.87/45.10860.227.8故均值1的95%的置信区间是[7.13,9.41].Minitab巳决徊锻撤驯袋对除蹄困埠猾狄桨猫疥陨叙耶剃重鄙城哗奠扒掩僵劝