实训五用Excel进行统计相关回归分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

〖实训五〗用Excel进行统计相关分析目的与要求:掌握利用相关系数对相关关系进行测定,并且掌握相关系数的性质,明确相关分析与回归分析各自特点以及它们的区别与联系,建立回归直线方程,计算估计标准误差,理解估计标准误差的意义。案例15:用EXCEL进行相关与一元线性回归分析一、用EXCEL绘制散点图[例1]近年来国家教育部决定将各高校的后勤社会化。某从事饮食业的企业家认为这是一个很好的投资机会,他得到十组高校人数与周边饭店的季销售额的数据资料,并想根据高校的数据决策其投资规模。操作过程:①打开Excel工作簿,输入原始数据如图7-1所示,该表为相关表。图7-1②从“插入”菜单中选择“图表”选项,打开“图表向导”对话框如图7-2所示。在“图表类型”列表中选择XY散点图,单击“下一步”按钮。图7-2③在数据区域中输入B2:C11,选择“系列产生在—列”,如图7-3所示,单击“下一步”按钮。图7-3④打开“图例”页面,取消图例,省略标题,如图7-4所示。图7-4⑤单击“完成”按钮,便得到XY散点图如图7-5所示。图7-5二、计算相关系数050100150200250051015202530用EXCE计算相关系数有两种方法,一是利用相关系数函数,另一种是利用相关分析宏。[例2]10个学生身高和体重的情况如下:学生身高(公分)体重(公斤)1234567891017116717715416917516315217216053566449556652475850要求对身高和体重作相关和回归分析。操作步骤如下:首先把有关数据输入EXCEL的单元格中,如图7-6图7-6EXCEL数据集在EXCEL中,提供了两个计算两个变量之间相关系数的方法,CORREL函数和PERSON函数,这两个函数是等价的,这里我们介绍用CORREL函数计算相关系数:第一步:单击任一个空白单元格,单击插入菜单,选择函数选项,打开粘贴函数对话框,在函数分类中选择统计,在函数名中选择CORREL,单击确定后,出现CORREL对话框。第二步:在array1中输入B2:B11,在array2中输入C2:C11,即可在对话框下方显示出计算结果为0.896。如图7-7所示:图7-7CORREL对话框及输入结果2.用相关系数宏计算相关系数第一步:单击工具菜单,选择数据分析选项,在数据分析选项中选择相关系数,弹出相关系数对话框,如图7-8所示:图7-8相关系数对话框第二步:在输入区域输入$B$1:$C$1,分组方式选择逐列,选择标志位于第一行,在输出区域中输入$E$1,单击确定,得输出结果如图7-9图7-9相关分析输出结果在上面的输出结果中,身高和体重的自相关系数均为1,身高和体重的相关系数为0.896,和用函数计算的结果完全相同。三、用EXCEL进行一元线性回归分析EXCEL进行回归分析同样分函数和回归分析宏两种形式,其提供了9个函数用于建立回归模型和预测。这9个函数分别是:INTERCEPT返回线性回归模型的截距SLOPE返回线性回归模型的斜率RSQ返回线性回归模型的判定系数FORECAST返回一元线性回归模型的预测值STEYX计算估计的标准误TREND计算线性回归线的趋势值GROWTH返回指数曲线的趋势值LINEST返回线性回归模型的参数LOGEST返回指数曲线模型的参数用函数进行回归分析比较麻烦,我们这里介绍使用回归分析宏进行回归分析。第一步:单击工具菜单,选择数据分析选项,出现数据分析对话框,在分析工具中选择回归,如图7-10图7-10数据分析对话框第二步:单击确定按钮,弹出回归对话框,在Y值输入区域输入$B$2:$B$11,在X值输入区域输入$C$2:$C$11,在输出选项选择新工作表组,如图7-11所示:图7-11回归对话框第四步:单击确定按钮,得回归分析结果如图7-12所示图7-12EXCEL回归分析结果在上面的输出结果中,第一部分为回归统计,该部分给出了回归分析中的一些常用统计量,Multiple指相关系数,RSquare指判定系数,Adjusted指调整后的判定系数,标准误差指估计的标准误,观测值指样本容量;第二部分为方差分析,该部分给出了自由度(df),回归平方和、残差平方和、总平方和(SS),回归和残差的均方(MS),F检验的显著性水平(SignificanceF),p值(F),该部分在主要作用是对回归方程的线性关系进行显著性检验;第三部分是参数估计的有关内容,包括回归方程的截距(Intercept)、斜率(XVariable1)Coefficient指系数,用于检验的回归系数的t统计量(tstat)、P_值(P-value),以及截距和斜率的置信区间(Lower95%和Upper95%)。※案例16多元线性回归分析我们以中国民航客运量预测为例进行多元线性回归分析。第一步确定因变量。我们以预测目标——中国民航客运量,作为因变量。第二步确定自变量。在定性分析的基础上,我们确定国内生产总值()、实际利用外资额()、民航线里程()、来华旅游入境人数()为自变量。搜集样本资料如表7.4.1所示。表7.4.1年份民航客运量(万人)y国内生产总值(亿元)x1实际利用外资额(亿美元)x2民航线里程(万公里)x3旅游入境人数(万人)x419833915934.519.8122.91947.71984554717127.0526.021285.219857478964.446.4727.721783.3198699710202.272.5832.432281.91987131011962.584.5238.912690.21988144214928.3102.2637.383169.51989128316909.2100.5947.192450.11990166018547.9102.8950.682746.21991217821617.8115.5455.913335.01992288626638.1192.02383.663811.51993338334634.4389.696.084152.71994403846759.4432.13104.564368.41995511758478.1481.37112.94638.71996555567884.6548.04116.655112.81997563074462.6644.08142.505758.81998575578345.2585.57150.586347.81999609482067.5526.59152.227279.62000672289442.2593.56150.298344.42001752495933.3496.72155.368901.3依据上述样本资料,计算出因变量与每个自变量的相关系数yjR,利用Excel软件得到下列相关系数yjR(见表7.4.2)表7.4.2X1X2X3X4y0.9915570.9549220.984550.965219利用Excel计算相关系数的步骤如下:“工具”→“数据分析”→“相关系数”→“确定”→在“输入区域”输入y与x1数字区域→在“输出区域”输入A1单元格→“确定”就得到y与x1之间的相关系数0.991557。其余相关系数以此类推。第三步建立模型,进行参数估计。由表7.4.2知,自变量国内生产总值、实际利用外资额、民航线里程、来华旅游入境人数分别与因变量y间的简单线性相关系数都较高,都在0.95以上。不妨我们建立四元线性回归模型:011223344yxxxxu。依据表7.4.1中的样本资料,利用Excel软件计算有关结果如输出结果7.4.3所示(操作步骤如一元线性回归)。输出结果7.4.1回归统计MultipleR0.994469RSquare0.988968AdjustedRSquare0.985816标准误差282.3387观测值19方差分析dfSSMSFSignificanceF回归分析41E+0825011161313.75681.58E-13残差14111601279715.12总计181.01E+08Coefficients标准误差tStatP-valueIntercept-139.555232.7273-0.599650.55832XVariable10.0363560.0142192.5568060.022814XVariable21.6114441.4682661.0975150.290935XVariable37.5153439.558490.7862480.444827XVariable40.2125190.1426651.4896330.158502第四步进行有关统计显著性检验从F统计量角度看,四元线性回归模型通过检验(SignificanceF1.57571E-130.05)。从t检验角度看,只有国内生产总值通过t检验(P-value=0.0228140.05)。不妨我们先剔除统计量(tStat)最小的那个自变量,重新建立回归模型。因为3t0.786248“XVariable3tStat”(0.786248)最小,所以我们先剔除自变量民航线里程,重新建立三元线性回归模型。利用Excel软件计算出三元线性回归模型有关信息如输出结果7.4.2所示。输出结果7.4.2回归统计MultipleR0.994224RSquare0.988481AdjustedRSquare0.986177标准误差278.7221观测值19方差分析dfSSMSFSignificanceF回归分析39999536533331788429.05779.32E-15残差15116529077686.03总计181.01E+08Coefficients标准误差tStatP-valueIntercept-54.3332203.3073-0.267250.792919XVariable10.0385910.0137542.8057660.013304XVariable22.4270051.0258482.3658530.03188XVariable30.2651210.1243922.1313460.05001从F统计量角度看,三元线性回归模型通过检验(Significance9.32E-150.05)。从t检验角度看,国内生产总值通过t检验(P-value=0.0133040.05)和实际利用外资额通过t检验(P-value=0.031880.05),而来华旅游入境人数没有通过t检验(P-value=0.050010.05),但相差很小。如果我们再剔除华旅游入境人数这个自变量,重新建立二元线性回归模型的话会降低整体模型的优良性。(见输出结果7.4.3)输出结果7.4.3回归统计MultipleR0.992468RSquare0.984992AdjustedRSquare0.983116标准误差308.0371观测值19方差分析dfSSMSFSignificanceF回归分析29964246549821233525.05932.57E-15残差16151819094886.86总计181.01E+08Coefficients标准误差tStatP-valueIntercept315.5839117.01662.6969160.015872XVariable10.0643190.0072858.8289261.51E-07XVariable21.3822710.9959421.3879030.184192综上所述,对于本例我们可以建立下列三元线性回归模型:12-54.33320.0385912.4270050.265121yxx3xu式中,代表民航客运量;代表国内生产总值;代表实际利用外资额;代表来华旅游入境人数。第五步进行预测1、点预测当国内生产总值为=100000亿元,实际利用外资额为=600亿美元,来华旅游入境人数=9000万人次时,民航客运量为:0ˆ-54.33320.0385911000002.4270056000.26512190

1 / 17
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功