回归分析的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

回归分析的应用第1页共11页1、问题的提出请使用回归分析解释最后一列和前八列的关系。7.308.007.107.707.207.207.007.60-1.507.808.707.208.407.508.107.307.10-2.577.207.407.107.507.207.107.007.000.397.308.407.207.907.508.507.307.10-2.457.707.807.208.407.607.407.107.10-0.357.307.607.208.107.307.207.007.00-0.048.308.307.708.507.807.807.207.80-1.709.609.809.309.808.809.909.4010.00-5.999.108.808.609.107.809.308.508.50-3.779.509.709.009.608.909.809.2010.00-5.937.808.508.309.108.009.507.607.90-3.228.608.907.809.008.008.707.807.80-3.158.509.108.109.308.008.307.808.50-4.079.209.108.009.408.509.608.608.90-4.458.209.207.909.107.808.307.508.20-3.927.007.507.107.407.107.107.007.70-0.549.709.909.109.709.0010.009.609.90-5.849.809.909.509.809.0010.009.709.90-5.908.609.408.209.508.709.808.309.50-5.488.809.007.908.508.109.308.009.80-4.869.309.809.309.808.7010.009.309.30-5.547.507.907.208.107.307.707.107.20-0.889.009.307.809.108.209.408.108.50-3.948.909.708.909.508.609.709.409.20-5.949.9010.009.709.909.4010.009.909.90-5.897.207.207.007.907.107.107.007.300.607.007.107.007.207.007.007.007.000.867.307.507.107.607.307.907.107.60-0.309.009.008.109.107.809.307.707.10-2.337.508.507.208.508.008.907.207.60-2.829.109.708.609.609.109.909.507.60-4.307.608.007.208.907.407.607.107.20-1.087.708.307.408.407.508.307.408.50-2.957.707.907.308.707.407.707.308.30-1.65回归分析的应用第2页共11页8.108.407.908.907.908.607.707.00-1.988.509.608.709.208.409.308.308.70-4.929.809.809.709.908.909.909.809.90-6.169.209.208.109.608.409.608.809.20-4.999.909.909.709.909.1010.009.709.80-5.748.908.707.909.008.409.708.407.50-2.809.9010.009.209.909.0010.009.308.00-3.457.508.507.508.207.508.707.909.40-4.778.909.608.809.308.409.909.209.10-5.717.708.707.408.507.708.307.307.10-2.727.308.007.107.707.207.207.007.60-1.507.808.707.208.407.508.107.307.10-2.577.207.407.107.507.207.107.007.000.397.308.407.207.907.508.507.307.10-2.457.707.807.208.407.607.407.107.10-0.357.307.607.208.107.307.207.007.00-0.048.308.307.708.507.807.807.207.80-1.709.609.809.309.808.809.909.4010.00-5.999.108.808.609.107.809.308.508.50-3.779.509.709.009.608.909.809.2010.00-5.937.808.508.309.108.009.507.607.90-3.228.608.907.809.008.008.707.807.80-3.158.509.108.109.308.008.307.808.50-4.079.209.108.009.408.509.608.608.90-4.457.308.007.107.707.207.207.007.60-1.507.308.007.107.707.207.207.007.60-1.502、模型的准备多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法。并通过计算机对相关的数据进行分析得到相应的结果。本文通过建立多元统计分析方法中的多元回归分析模型并使用SPSS软件来分析数据得到多元回归方程。2.1多元回归分析原理与模型回归分析是一种处理变量的统计相关关系的一种数理统计方法。回归分析的基本思想是:虽然自变量和因变量之间没有严格的、确定性的函数关系,但可以设法找出最能回归分析的应用第3页共11页代表它们之间关系的数学表达形式。回归分析主要解决以下几个方面的问题:(1)、确定几个特定的变量之间是否存在相关关系,如果存在的话,找出它们之间合适的数学表达式;(2)、根据一个或几个变量的值,预测或控制另一个变量的取值,并且可以知道这种预测或控制能达到什么样的精确度;(3)、进行因素分析。例如在对于共同影响一个变量的许多变量(因素)之间,找出哪些是重要因素,哪些是次要因素,这些因素之间又有什么关系等等。多元回归分析是研究多个变量之间关系的回归分析方法,按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析),按回归模型类型可划分为线性回归分析和非线性回归分析。设随机变量y与m个自变量存在线性关系:(1)(1)式称为回归方程,式中为回归系数,为随机误差。现在解决用估计y的均值的问题,即且假定,,是与无关的待定常数。设有n组样本观测数据:回归分析的应用第4页共11页其中ijx表示jx在第i次的观测值,于是有:(2)其中为m+1个待定参数,为n个相互独立的且服从同一正态分布的随机变量,(2)式称为多元(元)线性回归的数学模型。(2)式亦可写成矩阵形式,设,,,则(2)式变为:(3)(3)式称为多元线性回归模型的矩阵形式。用最小二乘法估计参数(0,1,……,m),使残差平方和2)^...(21101112immiininiixxxySEE(4)达到最小,根据微积分中求极值的原理,SSE分别对0,1,……m求偏微商,经整理后用矩阵形式表示为0)(XyXT(5)回归分析的应用第5页共11页直接用矩阵运算求解为yXXXbTT1)((6)从而得多元线性经验回归方程mmxxxy...22110(7)回归方程建立后要对回归模型进行检验,一般包括一级检验和二级检验。一级检验又称统计学检验,主要是利用统计学的抽样理论来检验样本回归方程的可靠性,具体分为拟合优度评价和显著性检验;二级检验又称经济计量学检验,它是对线性回归模型的假定条件能否得到满足进行检验,包括残差正态性检验和序列相关检验等。对被解释变量进行方差分析,得到方差分析表,见表1。方差来源离差平方和自由度均方差F值解释变量niyiSSRy12)(K-1MSR=SSR/(K-1)F=MSR/MSE剩余变量niiiySSEy12)(N-KMSE=SSE/(N-K)总变量niiyySST12)(表1回归模型方差分析表其中SST=SSR+SSE,SST称为总离差平方和,反映被解释变量的总变动;SSR称为回归平方和,反映了被解释变量的总变动中能够被回归方程解释的部分;SSE称为残差平方和,反映了被解释变量的总变动中由随机因素引起的变动,即不能被回归方程解释的部分。回归方程的拟合优度评价可用决定系数来衡量,反映因变量y的全部变异中能够通过回归关系被自变量解释的比例。即解释变差占总变差的比重:回归分析的应用第6页共11页SSTSSESSTSSRR12(8)对回归方程整体显著性进行检验可建立如下假设:0...:210mH,即回归方程整体不显著;jH:1不全等于0(j=1,2...m),即回归方程整体显著。由表1中的F统计量及其对应的显著水平p来进行检验。若p小于要求的显著水平,则拒绝原假设,可以认为回归方程总体显著;反之不能拒绝原假设,应认为回归方程总体不显著。对回归系数的显著性检验可以建立假设:0:0jH(j=1,2...m),即第j个回归系数不显著;0:1jH(j=1,2...m),即第j个回归系数显著;构造t统计量:nijijjjxxt12)((9)其中2)(12nyyniii(10)由计算出的t统计量及其对应的显著水平p来进行检验。若p小于要求的显著水平,则拒绝原假设,可以认为第j个回归系数显著;若p大于要求的显著水平则不能拒绝原假设,应认为第j个回归系数不显著。2.2SPSS简介SPSS(StatisticalPackagefortheSocialScience)社会科学统计软件包是世界最著名的统计分析软件之一。该软件包理论严谨,各种统计分析功能齐全,其内容覆盖了从描述统计、探索性数据分析到多元分析的几乎所有统计分析功能,目前已经在国内逐渐流行起来。SPSS的基木功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般回归分析的应用第7页共11页线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。每类中又分好几个统计过程,比如回归分析中又分线性回归分析、曲线估计、Logistic回归、Probit回归、加权估计、两阶段最小二乘法、非线性回归等多个统计过程,而且每个过程中又允许用户选择不同的方法及参数。SPSS软件多元线性回归操作步骤如下:(1)多元线性回归所用命令语句与一元线性回归相同,同样可以通过单击主菜单Analyze/Regression/Linear…,进入设置对话框如图1所示。从左边变量表列中把因变量选入到因变量(Dependent)框中,把自变量选入到自变量(Independent)框中。图1(2)点击Method后面的下拉框,在Method框中选择一种回归分析的方SPSS提供下列几种变量进入回归方程的方法:·Enter选项,强行进入法,即所选择的自变量全部进入回归模型,该选项是默认方式。·Remove选项,消去法,建立回归方程时,根据设定的条件剔除部分自变量。回归分析的应用第8页共11页·Forward选项,向前选择法,根据在Option对话框中所设定的判据,从无自变量开始,在拟合过程中,对被选择的自变量进行方差分析,每次加入一个F值最大的变量,直到所有符合判据的变量都进入模型为止。第一个引入回归模型的变量应该与因变

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功