第六章-方差分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第六章方差分析(ANOVA)1、方差分析的原理2、单因素方差分析3、双因素方差分析方差分析的基本问题•例题:•某饮料生产企业研制出一种新型饮料。饮料颜色共有四种,见表。这四种饮料营养含量、味道、价格、包装等可能影响销售量的因素全都相同。现从地理位置、经营规模相仿的五家超级市场上随机收集了前一期该种饮料的销售量。问饮料的颜色是否对销售量产生影响。饮料在五家超市的销售情况超市无色粉色橘黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8•表中,20个数据各不相同。原因有:1、销售地点的影响。即使颜色相同,在不同的超市销量也不同。但是由于五个超市地理位置等相似,因此把不同地点产品的销量的差异看成是随机因素的影响。2、颜色不同,销量不同。这种不同,有可能是抽样随机性造成,也有可能由于人们对不同颜色有所偏爱。方差分析中的概念•因素:一个独立变量,方差分析的研究对象。一般用大写字母A、B、C等表示。•水平:因素中的内容。一般用r表示。•单因素方差分析:只有一个因素。本例中颜色这个因素有4个水平。方差分析原理•数据观察值之间的差异来自两个方面:一方面:相同颜色在不同超市销量不同,此为随机性差异(产生水平内部方差)另一方面:颜色不同,销路不同,是由于随机因素和系统性差异造成(产生水平之间的方差)•若不同颜色对销量没有影响,则水平内部方差与水平之间方差近似,即•若不同颜色对销量产生影响,水平之间的(系统差异+随机差异)就大于水平内部方差,即。当达到某临界值,就能够判断不同颜色之间存在显著性差异。1=组内方差组间方差1组内方差组间方差F分布•为一个统计量,服从F分布。•特征:F为大于零的正数F分布曲线为正偏态组内方差组间方差F第二节单因素方差分析1、分析步骤2、F检验方差分析步骤•第一步:计算均值水平均值总均值jniijjnxxj1nxxij超市无色粉色橘黄色绿色126.531.227.930.8228.728.325.129.6325.130.828.532.4429.127.924.231.7527.229.626.532.8合计136.6147.8132.2157.3水平均值27.3229.5626.4431.46个数5555总均值28.695•第二步:计算离差平方和•总离差平方和•误差项离差平方和(反映水平内部)•水平项离差平方和(反映水平之间)•SST=SSE+SSA2)(xxSSTij])([2jjiijxxSSE2)(xxSSAj•第三步:计算方差(离差平方和/自由度)–SST的自由度为n-1–SSA的自由度为r-1–SSE的自由度为n-r•方差为:MSA=SSA/(r-1)MSE=SSE/(n-r)•第四步:计算F值486.10MSEMSAF•第五步:均值的F检验显著性水平0.05下,•结论:因为F=10.4863.24,所以拒绝原假设,颜色对销量有显著影响。43210:H不全相等43211,,,:H24.3)16,3(),1(05.0FrnrF•英语教师欲了解自己所教3个不同专业学生的英语成绩是否与他们所属的专业有关,分别从统计、会计、金融3个不同专业中各随机抽取4名,将他们的成绩整理列于下表。假定这3个不同专业学生在其他各方面条件基本相同。•试检验不同专业学生的英语成绩有无显著差异。(显著性水平为0.05)专业英语成绩甲乙丙丁统计62789189金融52586975会计51635975双因素方差分析(例题分析)不同品牌的彩电在各地区的销售量数据品牌因素地区因素地区1地区2地区3地区4地区5品牌1品牌2品牌3品牌4365345358288350368323280343363353298340330343260323333308298【例】有4个品牌的彩电在5个地区销售,为分析彩电的品牌(品牌因素)和销售地区(地区因素)对销售量是否有影响,对每种品牌在各地区的销售量取得以下数据。试分析品牌和销售地区对彩电的销售量是否有显著影响?(=0.05)数据结构数据结构jx..ix是行因素的第i个水平下各观察值的平均值),,2,1(1.kirxxrjiji是列因素的第j个水平下的各观察值的均值),,2,1(1.rjkxxkiijj是全部kr个样本数据的总平均值xkrxxkirjij11分析步骤(提出假设)•提出假设–对行因素提出的假设为•H0:1=2=…=i=…=k(i为第i个水平的均值)•H1:i(i=1,2,…,k)不全相等–对列因素提出的假设为•H0:1=2=…=j=…=r(j为第j个水平的均值)•H1:j(j=1,2,…,r)不全相等分析步骤(构造检验的统计量)计算平方和(SS)–总误差平方和–行因素误差平方和–列因素误差平方和–随机误差项平方和kirjijxxSST112kirjixxSSR112.kirjjxxSSC112.kirjjiijxxxxSSE112..分析步骤(构造检验的统计量)总离差平方和(SST)、水平项离差平方和(SSR和SSC)、误差项离差平方和(SSE)之间的关系kirjjiijkirjjkirjikirjijxxxxxxxxxx11..112.112.112SST=SSR+SSC+SSE分析步骤(构造检验的统计量)计算均方(MS)–误差平方和除以相应的自由度–三个平方和的自由度分别是•总离差平方和SST的自由度为kr-1•行因素的离差平方和SSR的自由度为k-1•列因素的离差平方和SSC的自由度为r-1•随机误差平方和SSE的自由度为(k-1)×(r-1)分析步骤(构造检验的统计量)计算均方(MS)–行因素的均方,记为MSR,计算公式为–列因素的均方,记为MSC,计算公式为–随机误差项的均方,记为MSE,计算公式为1kSSRMSR1rSSCMSC)1)(1(rkSSEMSE分析步骤(构造检验的统计量)计算检验统计量(F)–检验行因素的统计量–检验列因素的统计量)1)(1(,1~CrkrFMSEMSCF)1)(1(,1~RrkkFMSEMSRF

1 / 24
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功