第10方差分析参考文件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

试验8:方差分析一、试验目标与要求1.帮助学生深入了解方差及方差分析的基本概念,掌握方差分析的基本思想和原理2.掌握方差分析的过程。3.增强学生的实践能力,使学生能够利用SPSS统计软件,熟练进行单因素方差分析、两因素方差分析等操作,激发学生的学习兴趣,增强自我学习和研究的能力。二、试验原理在现实的生产和经营管理过程中,影响产品质量、数量或销量的因素往往很多。例如,农作物的产量受作物的品种、施肥的多少及种类等的影响;某种商品的销量受商品价格、质量、广告等的影响。为此引入方差分析的方法。方差分析也是一种假设检验,它是对全部样本观测值的变动进行分解,将某种控制因素下各组样本观测值之间可能存在的由该因素导致的系统性误差与随即误差加以比较,据以推断各组样本之间是否存在显著差异。若存在显著差异,则说明该因素对各总体的影响是显著的。方差分析有3个基本的概念:观测变量、因素和水平。观测变量是进行方差分析所研究的对象;因素是影响观测变量变化的客观或人为条件;因素的不同类别或不通取值则称为因素的不同水平。在上面的例子中,农作物的产量和商品的销量就是观测变量,作物的品种、施肥种类、商品价格、广告等就是因素。在方差分析中,因素常常是某一个或多个离散型的分类变量。根据观测变量的个数,可将方差分析分为单变量方差分析和多变量方差分析;根据因素个数,可分为单因素方差分析和多因素方差分析。在SPSS中,有One-wayANOVA(单变量-单因素方差分析)、GLMUnivariate(单变量多因素方差分析);GLMMultivariate(多变量多因素方差分析),不同的方差分析方法适用于不同的实际情况。本节仅练习最为常用的单因素单变量方差分析。三、试验演示内容与步骤单因素方差分析也称一维方差分析,对两组以上的均值加以比较。检验由单一因素影响的一个分析变量由因素各水平分组的均值之间的差异是否有统计意义。并可以进行两两组间均值的比较,称作组间均值的多重比较。主要采用One-wayANOVA过程。采用One-wayANOVA过程要求:因变量属于正态分布总体,若因变量的分布明显是非正态,应该用非参数分析过程。若对被观测对象的试验不是随机分组的,而是进行的重复测量形成几个彼此不独立的变量,应该用RepeatedMeasure菜单项,进行重复测量方差分析,条件满足时,还可以进行趋势分析。假设某汽车经销商为了研究东部、西部和中部地区市场上汽车的销量是否存在显著差异,在每个地区随机抽取几个城市进行调查统计,调查数据放置于数据文件“汽车销量调查.sav”中。在SPSS中试验该检验的步骤如下:步骤1:选择菜单Analyze→Comparemeans→One-WayANOVA,打开One-WayANOVA对话框。依次将观测变量sales移入Dependentlist列表框,将因素变量region移入Factor列表框。图4.1One-WayANOVA对话框单击postHoc按钮,弹出PostHocMultipleComparisons对话框,如图,该对话框用于进行多重比较检验,即各因素水平下观测变量均值的两两比较。方差分析的原假设是各个因素水平下的观测变量均值都相等,备择假设是各均值不完全相等。假如一次方差分析的结果是拒绝原假设,我们只能判断各观测变量均值不完全相等,却不能得出各均值完全不相等的结论。各因素水平下观测变量均值的更为细致的比较就需要用多重比较检验。图4.2PostHocMultipleComparisons对话框EqualVariancesAssumed选项栏中给出了在观测变量满足不同因素水平下的方差齐性条件下的多种检验方法。这里选择最常用的LSD检验法;EqualVariancesNotAssumed选项栏中给出了在观测变量不满足方差齐性条件下的多种检验方法。这里选择Tamhane’sT2检验法;Significancelevel输入框中用于输入多重比较检验的显示性水平,默认为5%。单击Options按钮,弹出options子对话框,如图所示。在对话框中选中Descriptive复选框,输出不同因素水平下观测变量的描述统计量;选择Homogeneityofvariance复选框,输出方差齐性检验结果;选中Meansplot复选框,输出不同因素水平下观测变量的均值直线图。图4.3Options子对话框在主对话框中点击ok按钮,可以得到单因素分析的结果。试验结果分析:表4.1给出了不同地区汽车销量的基本描述统计量以及95%的置信区间。表4.1各个地区汽车销量描述统计量DescriptivesNMeanStd.DeviationStd.Error95%ConfidenceIntervalforMeanMinimumMaximumLowerBoundUpperBound西10157.9022.2787.045141.96173.84120194中9176.4419.7176.572161.29191.60135198东7196.1430.92711.689167.54224.75145224Total26174.6227.8455.461163.37185.86120224表4.2给出了Levene方差齐性检验结果。从表中可以看到,Levene统计量对应的p值大于0.05,所以得到不同地区汽车销量满足方差齐性的结论。表4.2各地区汽车销量方差齐性检验表Levene统计量对应的p值大于0.05,所以得到不同地区汽车销量满足方差齐性的结论。TestofHomogeneityofVariancesLeveneStatisticdf1df2Sig.1.262223.302表4.3是单因素方差分析,输出的方差分析表解释如下:总离差SST=19384.154,组间平方和SSR=6068.174,组内平方和或残差平方和SSE=13315.979,相应的自由度分别为25,2,23;组间均方差MSR=3034.087,组内均方差578.956,F=5.241,由于p=0.0130.05说明在α=0.05显著性水平下,F检验是显著的。即认为各个地区的汽车销量并不完全相同。表4.3单因素方差分析结果ANOVA销量SumofSquaresdfMeanSquareFSig.BetweenGroups6068.17423034.0875.241.013WithinGroups13315.97923578.956Total19384.15425表4.4多重比较检验结果MultipleComparisonsDependentVariable:销量(I)地区(J)地区MeanDifference(I-J)Std.ErrorSig.95%ConfidenceIntervalLowerBoundUpperBoundLSD西中-18.54411.055.107-41.414.33东-38.243(*)11.858.004-62.77-13.71中西18.54411.055.107-4.3341.41东-19.69812.126.118-44.785.39东西38.243(*)11.858.00413.7162.77中19.69812.126.118-5.3944.78Tamhane西中-18.5449.635.199-44.056.96东-38.24313.648.054-77.10.61中西18.5449.635.199-6.9644.05东-19.69813.410.436-58.3118.91东西38.24313.648.054-.6177.10中19.69813.410.436-18.9158.31*Themeandifferenceissignificantatthe.05level.如前所述,拒绝单因素方差分析原假设并不能得出各地区汽车销量均值完全不等的结论。各地区销量均值的两两比较要看表4.4所示的多重比较检验结果。表中上半部分为LSD检验结果,下半部分为Tamhane检验结果。由于方差满足齐性,所以这里应该看LSD检验结果。表中的Meandifference列给出了不同地区汽车销量的平均值之差。其中后面带“﹡”号的表示销量有显著差异,没有带“﹡”号的表示没有显著差异。可以看出,东部和西部汽车销量存在显著差异,而中部与东部、中部与西部汽车销量并没有什么显著差异。这一结论也可以从表中Sig列给出的p值大小得到印证。四、备择试验1.用SPSS进行单因素方差分析。某个年级有三个小班,他们进行了一次数据考试,现从各班随机地抽取了一些学生,记录其成绩如表。原始数据文件保存为“数学考试成绩.sav”。试在显著性水平0.05下检验各班级的平均分数有无显著差异。数学考试成绩表ⅠⅡⅢ7366887768418960783179598245487856684393916291538036517671797377859671157879748087757687568597892.某学校给3组学生以3种不同方式辅导学习,一个学期后,学生独立思考水平提高的成绩如表所示。学生独立思考水平提高的成绩方式137424243414245464140方式249484848474546474849方式333333532313534323233问:该数据中的因变量是什么?因素又是什么?如何建立数据文件?对该数据进行方差分析,检验3种方式的影响是否存在显著差异?试验9:相关分析与回归分析一、试验目标与要求本试验项目的目的是学习并使用SPSS软件进行相关分析和回归分析,具体包括:(1)皮尔逊pearson简单相关系数的计算与分析(2)学会在SPSS上实现一元及多元回归模型的计算与检验。(3)学会回归模型的散点图与样本方程图形。(4)学会对所计算结果进行统计分析说明。(5)要求试验前,了解回归分析的如下内容。参数α、β的估计回归模型的检验方法:回归系数β的显著性检验(t-检验);回归方程显著性检验(F-检验)。二、试验原理1.相关分析的统计学原理相关分析使用某个指标来表明现象之间相互依存关系的密切程度。用来测度简单线性相关关系的系数是Pearson简单相关系数。2.回归分析的统计学原理相关关系不等于因果关系,要明确因果关系必须借助于回归分析。回归分析是研究两个变量或多个变量之间因果关系的统计方法。其基本思想是,在相关分析的基础上,对具有相关关系的两个或多个变量之间数量变化的一般关系进行测定,确立一个合适的数据模型,以便从一个已知量推断另一个未知量。回归分析的主要任务就是根据样本数据估计参数,建立回归模型,对参数和模型进行检验和判断,并进行预测等。线性回归数学模型如下:在模型中,回归系数是未知的,可以在已有样本的基础上,使用最小二乘法对回归系数进行估计,得到如下的样本回归函数:回归模型中的参数估计出来之后,还必须对其进行检验。如果通过检验发现模型有缺陷,则必须回到模型的设定阶段或参数估计阶段,重新选择被解释变量和解释变量及其函数形式,或者对数据进行加工整理之后再次估计参数。回归模型的检验包括一级检验和二级检验。一级检验又叫统计学检验,它是利用统计学的抽样理论来检验样本回归方程的可靠性,具体又可以分为拟和优度评价和显著性检验;二级检验又称为经济计量学检验,它是对线性回归模型的假定条件能否得到满足进行检验,具体包括序列相关检验、异方差检验等。三、试验演示内容与步骤1.连续变量简单相关系数的计算与分析在上市公司财务分析中,常常利用资产收益率、净资产收益率、每股净收益和托宾Q值4个指标来衡量公司经营绩效。本试验利用SPSS对这4个指标的相关性进行检验。操作步骤与过程:打开数据文件“上市公司财务数据(连续变量相关分析).sav”,依次选择“Analyze→Correlate→Bivariate”打开对话框如图,将待分析的4个指标移入右边的Variables列表框内。其他均可选择默认项,单击ok提交系统运行。图5.1BivariateCorrelations对话框结果分析:表给出了Pearson简单相关系数,相关检验t统计量对应的p值。相

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功