第十五章方差和协方差分析AnalysisofVarianceandCovariance2020/2/262内容提要单因子方差分析多因子方差分析协方差分析重复测量的方差分析多元方差分析【案例】结果和过程哪个重要?双因素理论良好的结果是顾客满意的必备条件良好的过程只是锦上添花公平理论结果佳时,过程如何不太重要结果不佳时,过程是否公平很重要为了验证上述理论,Hui(2004)进行了一项实验研究。2020/2/263实验1的结果CustomerSatisfactionOutcomeQualityLowHighProcessQuality:HighProcessQuality:Low2020/2/2642020/2/265方差和协方差分析考察两组或两组以上均值或中位数差异的方法统称为方差和协方差分析。方差分析(analysisofvariance,ANOVA)中必须有一个定量的因变量,以及一个或多个定类的自变量(因子)。如果自变量中也包含定量变量,就称为协方差分析(analysisofcovariance,ANCOVA)。2020/2/266一、单因子方差分析营销管理人员经常需要考察因变量在单一自变量(因子)的各种状态下均值之间的差异,例如:男女消费者在品牌忠诚度上有差异吗?产品的不同标价方式对其销量是否有显著影响?……2020/2/267单因子方差分析的步骤确定自变量和因变量总变差分解测量作用大小检验显著性结果解读定义问题定义问题为了做出正确的营销决策,我们常常对各组人群之间的差异感兴趣,例如:不同的广告诉求对消费者广告态度、品牌态度和购买意愿的影响2020/2/2682020/2/269确定因变量与自变量因变量与自变量的确定取决于研究问题与目的。因变量以Y表示(例如广告态度)自变量以X表示,X是定类变量,共有c类(诉求类型)在X每个类别中有n个Y的观测值,如表1所示表1变量的定义2020/2/26102020/2/2611Y的总变差,表示为SSy,可以分解为两部分:SSy=SSbetween+SSwithinSSbetween代表X类别之间的变差,也表示为SSx;SSwithin是Y的变差中与X组内变差有关的部分,也称为SSerror。总变差分解2020/2/261221)(NiiyYYSS21)(cjjxYYnSScjnijijerrorYYSS112)(iY个别观测值JY第j类均值Y总样本均值或总均值ijY第j类的第i个观测值2020/2/2613测量自变量的作用X对Y的作用可以用SSx来测量,X对Y的作用强度可以由以下公式衡量:η2的值在0和1之间变动,各组均值相等时,其值为0,表示X对Y无作用;当Y在X的每组内无差异,组间有差异时,η2的值为1。yerroryyxSSSSSSSSSS)(22020/2/2614显著性检验与结果解读单因子方差分析的目的就是检验组均值相等的零假设,即:H0:μ1=μ2=μ3=……=μc零假设可以用F统计量来检验:errorxerrorxMSMScNSScSSF)/()1/(2020/2/2615【例】单因子方差分析应用问题:考察不同店内促销水平对销售额的影响。因变量:销售额(万元)自变量:店内促销强度:高,中,低随机将30家分店分为三组,然后开展三种不同强度(高、中、低)的促销活动,同时对每家店的销售额进行1个月的追踪。。表2不同促销组的平均月销售额2020/2/2616促销水平商店数月均销售额(万元)高10830中10620低10370合计30606表3店内促销对销售额的方差分析2020/2/2617方差分解SSdfMSF值显著概率SSX1060670253033517.9430.000SSerror7980002729556SSY18586702964092SSY=SSX+SSerror=1060670+79800=1858670MSX=1060670/2=530335MSerror=798000/27=29556促销作用强度测量X对Y作用的强度测量如下:=1060670/1858670=0.571店内促销强度可以解释销售额变差中的57%。2XYSSSS2020/2/2618促销作用的显著性检验促销作用的显著性可以根据F检验的结果判断:530330/29560=17.9442020/2/2619errorerror/(1)/()XXSScMSFSSNcMS2020/2/2620方差分析中的假设方差分析中的假设可以概括如下:1.自变量的类别通常是固定的,这种情况被称为固定效应模型。2.误差呈正态分布,均值为0,方差固定,误差与X的类别无关。3.误差之间无关。如果误差是相关的,F比值可能被严重扭曲。2020/2/26北京大学光华管理学院涂平教授212020/2/2622二、多因子方差分析在市场营销研究中,研究者经常需要同时研究一个以上的因子。例如:在不同价格和分销水平下,消费者购买量会有什么样的变化?……为了考察以上作用,可以使用多因子方差分析(n-wayanalysisofvariance)。2020/2/2623方差的分解总变差表示如下:SSy=SSx1+SSx2+SSx1x2+SSerror两个因子的联合作用强度被称为总效应,或多重η2,其测量如下:yxxxxSSSSSSSS)(212122020/2/2624显著性检验总效应的显著性(significanceoftheoveralleffect)可以用F检验来检验。dfn分子自由度(c11)+(c21)+(c11)(c21)dfd分母自由度=Nc1c21212error1,2,12error1,2,12error()/dfSS/df/df/dfXXXXndXXXXndXXXXSSSSSSFSSSSMSMS交互作用的显著性如果总效应是显著的,下一步就要检验交互效应的显著性(significanceoftheinteractioneffect)。dfn=(c11)(c21)dfd=Nc1c22020/2/262512error12error/df/dfXXndXXSSFSSMSMS因子相对重要性2020/2/2626error2totalerror(df)XxSSMSSSMSANOVA中最常用的指标是ω2,这个指标能够表明因变量变差中有多少比例与特定因子相关。ω2只用于解释统计上显著的作用。【例】多因子方差分析应用问题定义:考察促销水平和赠券对销售额的影响,以及两者之间的交互作用。定义变量:因变量:标准化销售额(1-10)自变量:•店内促销水平(高,中,低)•赠券(有,无)来源:马尔霍特拉,2009。2020/2/26272020/2/2628表4.总变差分解及显著性检验变差来源平方和自由度均方F显著性ω2主效应店内促销106.067253.03354.8620.0000.557赠券53.333153.33355.1720.0000.280联合159.400353.13354.9660.000交互效应3.26721.6331.6900.206模型162.667532.53333.6550.000残差(误差)23.200240.967合计185.867296.4092020/2/2629表4续店内促销赠券计数均值高是59.200高否57.400中是57.600中否54.800低是55.400低否52.000单元均值促销赠券计数均值高108.300中106.200低103.700是157.400否154.733总均值306.067因子水平均值解读结果促销和赠券可以显著增加销售额(主效应显著);促销和赠券的作用是相互独立的(交互效应不显著);促销和赠券对销售额的影响都很大(0.15),但促销相对更重要。2020/2/26302020/2/2631三、协方差分析考察与控制自变量作用有关的因变量均值差异时,通常有必要考虑非控制自变量的影响。例如:研究收看不同电视广告的组别对品牌的评价时,可能有必要控制对该品牌的先期知识。。。。在这些情况下,可以使用协方差分析(analysisofcovariance)。ANCOVA至少包括一个定类的自变量,及一个定量的自变量,后者称为协变量(covariate)。【例】协方差分析应用定义问题:在控制客源的影响之后,考察促销和赠券对销售额的影响。确定变量:因变量—标准化销售额(1-10)自变量•促销(高,中,低)•赠券(有,无)协变量—客源状况(1-10)2020/2/2632SumofMeanSig.SourceofVariationSquaresdfSquareFofFCovarianceClientele0.83810.8380.862.363MaineffectsPromotion106.067253.03354.546.000Coupon53.333153.33354.855.000Combined159.400353.13354.649.000InteractionPromotion*Coupon3.26721.6331.680.208Model163.505627.25128.028.000Residual(Error)22.362230.972TOTAL185.867296.409CovariateRawCoefficientClientele-0.078表5.总变差分解和显著性检验解读结果控制客源的作用后:促销和赠券对销售额有显著影响两者之间的交互作用不显著客源对销售额的影响不显著。2020/2/26342020/2/2635四、重复测量的方差分析在市场营销研究中,调查对象之间往往千差万别,如果能将个体差异与自变量的作用和实验误差进行有效区分的话,将大大提高实验的灵敏度。控制受试对象差异的方法之一就是在各种实验条件下观察每个对象,即每个对象以自我作为对照。例如,要求每个调查对象对不同的广告诉求都进行评估。这种设计被称为对象内设计或者重复测量方差分析(repeatedmeasuresanalysisofvariance)。2020/2/2636总变差分解在只有一个因子的情况下,重复测量的总变差可以分为人际间变差和个人内变差:SStotal=SSbetweenpeople+SSwithinpeople总变差的自由度为nc-1,人际间变差的自由度为n-1,个人内变差自由度为n(c-1)。内部变差可以进一步分为两个来源:SSwithinpeople=SSx+SSerror处理变差的自由度为c-1,残差的自由度为(c-1)(n-1)。2020/2/2637自变量XSubjectCategoriesTotalNo.SampleX1X2X3…Xc1Y11Y12Y13Y1cY12Y21Y22Y23Y2cY2::::nYn1Yn2Yn3YncYNY1Y2Y3YcYBetweenPeopleVariation=SSbetweenpeopleTotalVariation=SSyBetweenCategoryVariation=SSwithinpeopleCategoryMean表6.总变差分解:重复测量的方差分析显著性检验对于组均值相等的零假设的检验方法如下:2020/2/2638errorerror/(1)/(1)(1)XXSScMSFSSncMS2020/2/2639【例】产品类别和诉求形式对广告态度的影响3.413.833.953.263.203.403.603.804.004.20牛奶高档手表产品种类广告态度功能诉求形象诉求资料来源:陈丹,2004。五、多元方差分析当存在两个或两个以上相关的因变量时,需要采用多元方差分析(multivariateanalysisofvariance,MANOVA)。MANOVA与方差分析(ANOVA)类似,但ANOVA是检验一个因变量的组间差异,而MANOVA是同步检验多个