多元线性回归的计算方法摘要在实际经济问题中,一个变量往往受到多个变量的影响。例如,家庭消费支出,除了受家庭可支配收入的影响外,还受诸如家庭所有的财富、物价水平、金融机构存款利息等多种因素的影响,表现在线性回归模型中的解释变量有多个。这样的模型被称为多元线性回归模型。多元线性回归的基本原理和基本计算过程与一元线性回归相同,但由于自变量个数多,计算相当麻烦,一般在实际中应用时都要借助统计软件。这里只介绍多元线性回归的一些基本问题。但由于各个自变量的单位可能不一样,比如说一个消费水平的关系式中,工资水平、受教育程度、职业、地区、家庭负担等等因素都会影响到消费水平,而这些影响因素(自变量)的单位显然是不同的,因此自变量前系数的大小并不能说明该因素的重要程度,更简单地来说,同样工资收入,如果用元为单位就比用百元为单位所得的回归系数要小,但是工资水平对消费的影响程度并没有变,所以得想办法将各个自变量化到统一的单位上来。前面学到的标准分就有这个功能,具体到这里来说,就是将所有变量包括因变量都先转化为标准分,再进行线性回归,此时得到的回归系数就能反映对应自变量的重要程度。这时的回归方程称为标准回归方程,回归系数称为标准回归系数,表示如下:Zy=β1Zx1+β2Zx2+…+βkZxk注意,由于都化成了标准分,所以就不再有常数项a了,因为各自变量都取平均水平时,因变量也应该取平均水平,而平均水平正好对应标准分0,当等式两端的变量都取0时,常数项也就为0了。多元线性回归模型的建立多元线性回归模型的一般形式为Yi=β0+β1X1i+β2X2i+…+iiiihx=1,2,…,n其中k为解释变量的数目,j=(j=1,2,…,k)称为回归系数(regressioncoefficient)。上式也被称为总体回归函数的随机表达式。它的非随机表达式为E(Y∣X1i,X2i,…Xki,)=β0+β1X1i+β2X2i+…+βkXkiβj也被称为偏回归系数(partialregressioncoefficient)多元线性回归的计算模型一元线性回归是一个主要影响因素作为自变量来解释因变量的变化,在现实问题研究中,因变量的变化往往受几个重要因素的影响,此时就需要用两个或两个以上的影响因素作为自变量来解释因变量的变化,这就是多元回归亦称多重回归。当多个自变量与因变量之间是线性关系时,所进行的回归分析就是多元性回归。设y为因变量X1,X2…Xk为自变量,并且自变量与因变量之间为线性关系时,则多元线性回归模型为:Y=b0+b1x1+…+bkxk+e其中,b0为常数项X1,X2…Xk为回归系数,b1为X1,X2…Xk固定时,x1每增加一个单位对y的效应,即x1对y的偏回归系数;同理b2为X1,X2…Xk固定时,x2每增加一个单位对y的效应,即,x2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:Y=b0+b1x1+…+bkxk+e其中,b0为常数项,X1,X2…Xk为回归系数,b1为X1,X2…Xk固定时,x2每增加一个单位对y的效应,即x2对y的偏回归系数,等等。如果两个自变量x1,x2同一个因变量y呈线相关时,可用二元线性回归模型描述为:y=b0+b1x1+b2x2+e建立多元性回归模型时,为了保证回归模型具有优良的解释能力和预测效果,应首先注意自变量的选择,其准则是:(1)自变量对因变量必须有显著的影响,并呈密切的线性相关;(2)自变量与因变量之间的线性相关必须是真实的,而不是形式上的;(3)自变量之彰应具有一定的互斥性,即自变量之彰的相关程度不应高于自变量与因变量之因的相关程度;(4)自变量应具有完整的统计数据,其预测值容易确定。多元性回归模型的参数估计,同一元线性回归方程一样,也是在要求误差平方和(Σe)为最小的前提下,用最小二乘法求解参数。以二线性回归模型为例,求解回归参数的标准方程组为解此方程可求得b0,b1,b2的数值。亦可用下列矩阵法求得即多元线性回归分析预测法多元回归分析预测法,是指通过对两上或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。多元线性回归模型的检验多元线性回归模型与一元线性回归模型一样,在计算出回归模型之后,要对模型进行各种检验。多元线性回归模型的检验方法有:判定系数检验(R检验),回归系数显着性检验(T检验),回归方程显着性检验(F检验)。1、判定系数检验。多元线性回归模型判定系数的定义与一元线性回归分析类似。判定系数R的计算公式为:R=R接近于1表明Y与X1,X2,…,Xk之间的线性关系程度密切;R接近于0表明Y与X1,X2,…,Xk之间的线性关系程度不密切。2、回归系数显着性检验。在多元回归分析中,回归系数显着性检验是检验模型中每个自变量与因变量之间的线性关系是否显着。显着性检验是通过计算各回归系数的t检验值进行的。回归系数的t检验值的计算公式为:=(j=1,2,…,k),式中是回归系数的标准差。在多元回归模型中,某个变量回归系数的t检验没有通过,说明该变量与因变量之间不存在显着的线性相关关系,在回归分析时就可以将该变量删去,或者根据情况作适当的调整,而后用剩下的自变量再进行回归分析。3、回归方程的显着性检验。回归方程的显着性检验是检验所有自变量作为一个整体与因变量之间是否有显着的线性相关关系。显着性检验是通过F检验进行的。F检验值的计算公式是:F(k,n-k-1)=多元回归方程的显着性检验与一元回归方程类似,在此也不再赘述。回归方程的显着性检验未通过可能是选择自变量时漏掉了重要的影响因素,或者是自变量与因变量间的关系是非线性的,应重新建立预测模型。多元线性回归预测模型的公式多元线性回归预测模型一般公式为:多元线性回归模型中最简单的是只有两个自变量(n=2)的二元线性回归模型,其一般形式为:下面以二元线性回归分析预测法为例,说明多元线性回归分析预测法的应用。二元线性回归分析预测法,是根据两上自变量与一个因变量相关关系进行预测的方法。二元线性回归方程的公式为:式中::因变量;x1,x2:两个不同自变量,即与因变量有紧密联系的影响因素。a,b1,b2:是线性回归方程的参数。a,b1,b2是通过解下列的方程组来得到。(2)多元线性回归模型预测的精准度多元线性回归模型表示一种地理现象与另外多种地理现象的依存关系,这时另外多种地理现象共同对一种地理现象产生影响,作为影响其分布与发展的重要因素。设变量Y与变量X1,X2,…,Xm存在着线性回归关系,它的n个样本观测值为=1,2,n)。可采用最小二乘法对上式中的待估回归系数β0,β1,…,βm进行估计,求得β值后,即可利用多元线性回归模型进行预测了。计算了多元线性回归方程之后,为了将它用于解决实际预测问题,还必须进行数学检验。多元线性回归分析的数学检验,包括回归方程和回归系数的显著性检验。多元线性回归模型的精度,可以利用剩余标准差来衡量。S越小,则用回归方程预测Y越精确;反之亦然。总结多元线性回归模型因为其操作简单方便,预测能到达一定精准度,已经在我国的社会科学、自然科学的各个领域发挥了巨大作用。该模型还可以应用于经济学、生物学、心理学、医疗卫生、体育、农业、林业、商业、金融等各个领域。