第6章方差分析方差分析方差分析的思想单因素方差分析双因素分析问题的提出:1.影响平均收入的因素有:专业、性别、职业、身材、容貌(颜值)不同专业毕业的学生在第一年工作中所获得的平均收入是否有显著差别?2.影响期望寿命的因素有:地理位置、基因、人种、生活习惯地理位置对人的期望寿命是否有显著差别?3.影响温度的因素有:地理位置、季节不同地区在第一季度的平均温度是否有显著差别?6.1方差分析方差分析:分析某个(两个)因素对多个总体的均值是否有显著影响?在各总体方差相等的前提下,分析某个因素对多个因素水平均值的影响是否显著?在各总体方差相等的前提下,检验多个总体的均值是否相等?方差分析的前提条件:被检验的样本为服从正态分布总体中的随机样本,各个总体的标准差相等,并且样本的选择是独立的方差分析的原理假设各总体的均值相等,没有显著差异在原假设成立的条件下,抽样,利用样本的信息检验原假设如果检验结果,不拒绝原假设,认为因素水平对总体均值没有显著影响如果检验结果,拒绝原假设,认为因素水平对总体均值有显著影响k211k210:H:H方差分析的原理通过比较样本方差,来检验原假设在方差分析中通常用两个方差来衡量:一个是基于样本均值之间差异的因素水平间方差,组间方差。另一个是基于样本内部差异的因素水平内方差,组内方差如果这两个方差的比值近似为1,方差分析的结果可以得到总体均值相同。如果这两个方差的比值偏离1,方差分析的结果可以得到总体均值不相同方差分析中所用到的概率分布是分布,该分布是为纪念著名统计学家R.A.Fisher(1890-1962)而得名。因素水平间方差和因素水平内方差之比也服从分布。FF因素水平内方差因素水平间方差F6.2单因素方差分析水平抽样结果平均A1A2A3Akx11x12x13x1rx21x22x23x2rx31x32x33x3rxk1xk2xk3xkr2xk3210:Hrx1x3x单因素方差分析是只针对一个因素进行分析,旨在分析该因素对样本的观察值是否产生影响,各因素水平的样本容量大小可以一致,也可以不一致。单因素方差分析一般分为:(1)建立原假设和备择假设;(2)确定显著性水平;(3)建立检验统计量;F(4)确定临界值;(5)计算F统计量值,并与临界值比较(6)做出决策6.2单因素方差分析k211k210:H:Hrxxr1iijjkxrkxxjij1.做出原假设和备择假设2.计算每一种因素水平下的样本均值3.计算总均值6.2单因素方差分析在单因素方差分析中,有三个平方和(SS):总离差平方和SST、因素水平间离差平方和SSR、因素水平内离差平方和SSE。这三个平方和之间存在以下关系式:SSESSRSSTSSESSTSSR)4(xxSSR)3(]xx[SSE2nxxxxSST12j2jjij222ij)()(6.2单因素方差分析将F统计值与临界值比较方差类型离差平方和SS自由度df均方误差MSF值因素水平间方差SSRk-1SSR/(k-1)=MSRMSR/MSE因素水平内方差SSEn-kSSE/(n-k)=MSE总方差SSTn-1))kn(,1k(F)kn/(SSE)1k/(SSR))1r(k,1k(F不能拒绝原假设)),kn(,1k(FF拒绝原假设)),kn(,1k(FF6.3双因素方差分析同时考虑两个因素对多个总体均值的影响如同时考虑专业和性别对工资收入的影响同时考虑品种和地理位置对粮食产量的影响分为:1.无交互作用的双因素方差分析2.有交互作用的双因素方差分析6.3无交互作用的双因素方差分析两个因子对现象的影响是相互独立的两个因素各自对现象有影响两个因素搭配在一起对现象没有影响6.3有交互作用的双因素方差分析两个因素各自对现象有影响两个因素的搭配对现象也有影响两个因素的不同搭配水平对现象有不同的影响利用EXCEL的方差分析功能进行计算和分析本章小结方差分析是基本的统计分析方法之一在各总体方差相等的前提下,检验总体的均值是否有差异单因素方差分析:只考虑一个影响因素对各总体均值水平的影响双因素方差分析:同时考虑两个因素水平对各总体均值水平的影响1.无交互作用2.有交互作用