3-1(上)管理人网-免费海量下载第三章财务预警的模型与方法(上)3-2(上)管理人网-免费海量下载第三章财务预警的模型与方法(上)第一节一元线性回归第二节多元线性回归3-3(上)管理人网-免费海量下载(上)管理人网-免费海量下载什么是回归分析?(内容)1.从一组样本数据出发,确定变量之间的数学关系式;2.对这些关系式的可信程度,进行各种统计检验,并从影响某一特定变量的诸多变量中,找出哪些变量的影响显著,哪些不显著;3.利用所求的关系式,根据一个或几个变量的取值,来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。回归方程一词是怎么来的3-5(上)管理人网-免费海量下载相关分析中,变量x变量y处于平等的地位;回归分析中,变量y称为因变量,处在被解释的地位,x称为自变量,用于预测因变量的变化;2.相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量;3.相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量x对变量y的影响大小,还可以由回归方程进行预测和控制。3-6(上)管理人网-免费海量下载(上)管理人网-免费海量下载一、回归模型与回归方程3-8(上)管理人网-免费海量下载回答“变量之间是什么样的关系?”2.方程中运用1个数字的因变量(响应变量)被预测的变量1个或多个数字的或分类的自变量(解释变量)用于预测的变量3.主要用于预测和估计。3-9(上)管理人网-免费海量下载一元线性回归模型(概念要点)1.当只涉及一个自变量时称为一元回归,若因变量y与自变量x之间为线性关系时,称为一元线性回归;2.对于具有线性关系的两个变量,可以用一元线性方程来表示它们之间的关系;3.描述因变量y如何依赖于自变量x和误差项的方程,称为回归模型。3-10(上)管理人网-免费海量下载一元线性回归模型(概念要点)对于只涉及一个自变量的简单线性回归模型可表示为y=b0+b1x+模型中,y是x的线性函数(部分)加上误差项;线性部分反映了由于x的变化而引起的y的变化;误差项是随机变量反映了除x和y之间的线性关系之外的随机因素对y的影响;是不能由x和y之间的线性关系所解释的变异性。b0和b1称为模型的参数。3-11(上)管理人网-免费海量下载一元线性回归模型(基本假定)1.误差项ε是一个期望值为0的随机变量,即E(ε)=0。对于一个给定的x值,y的期望值为E(y)=b0+b1x;2.对于所有的x值,ε的方差σ2都相同;3.误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0,σ2);独立性意味着对于一个特定的x值,它所对应的ε与其他x值所对应的ε不相关;对于一个特定的x值,它所对应的y值与其他x所对应的y值也不相关。3-12(上)管理人网-免费海量下载回归方程(概念要点)1.描述y的平均值或期望值,如何依赖于x的方程,称为回归方程;2.简单线性回归方程的形式如下E(y)=b0+b1x方程的图示是一条直线,因此也称为直线回归方程;b0是回归直线在y轴上的截距,是当x=0时y的期望值;b1是直线的斜率,称为回归系数,表示当x每变动一个单位时,y的平均变动值。3-13(上)管理人网-免费海量下载估计(经验)的回归方程1.总体回归参数和是未知的,必需利用样本数据去估计;0b1b2.用样本统计量和代替回归方程中的未知参数和,就得到了估计的回归方程;0ˆb1ˆb0b1b3.简单线性回归中估计的回归方程为xy10ˆˆˆbb+其中:是估计的回归直线在y轴上的截距,是直线的斜率,它表示对于一个给定的x的值,是y的估计值,也表示x每变动一个单位时,y的平均变动值。0ˆb1ˆb3-14(上)管理人网-免费海量下载二、参数b0和b1的最小二乘估计3-15(上)管理人网-免费海量下载最小二乘法(概念要点)1.使因变量的观察值与估计值之间的离差平方和达到最小来求得和的方法。即0ˆb1ˆb最小niiniieyyQ121210)ˆ()ˆ,ˆ(bb2.用最小二乘法拟合的直线,来代表x与y之间的关系与实际数据的误差,比其他任何直线都小。3-16(上)管理人网-免费海量下载最小二乘法(图示)xy(xn,yn)(x1,y1)(x2,y2)(xi,yi)}ei=yi-yi^xy10ˆˆˆbb+01yxbb+3-17(上)管理人网-免费海量下载最小二乘法(和的计算公式)0ˆb1ˆb根据最小二乘法的要求,可得求解和的标准方程如下0ˆb1ˆb3-18(上)管理人网-免费海量下载估计方程的求法(实例)【例】根据例1中的数据,拟合人均消费金额对人均国民收入的回归方程。根据和的求解公式得0ˆb1ˆb3-19(上)管理人网-免费海量下载估计(经验)方程人均消费金额对人均国民收入的回归方程为y=54.22286+0.52638x05001000150005001000150020002500人均消费与人均国民收入的回归3-20(上)管理人网-免费海量下载估计方程的求法(Excel的输出结果)SUMMARYOUTPUT回归统计MultipleR0.998703821RSquare0.997409322AdjustedRSquare0.997173806标准误差14.94967766观测值13Coefficients标准误差tStatP-valueLower95%Upper95%Intercept54.222863928.993978696.0287968.56501E-0534.427240374.0184875XVariable10.526377140.0080885565.076821.39842E-150.508574350.544179930ˆb1ˆb+niiyxxxnSnt12220)()(1)2(ˆbniiyxxSnt1221)()2(ˆb3-21(上)管理人网-免费海量下载三、回归方程的显著性检验3-22(上)管理人网-免费海量下载的取值是不同的,y取值的这种波动称为变差。变差来源于两个方面由于自变量x的取值不同造成的;除x以外的其他因素(如x对y的非线性影响、测量误差等)的影响。2.对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差来表示。yy3-23(上)管理人网-免费海量下载离差平方和的分解(图示)xyyxy10ˆˆˆbb+yy{}}yyˆyyˆ),(iiyx离差分解图01yxbb+3-24(上)管理人网-免费海量下载离差平方和的分解(三个平方和的关系)1.从图上看有yyyyyy+ˆˆ2.两端平方后求和有+niiniiniiyyyyyy121212ˆˆ总变差平方和(SST){回归平方和(SSR){残差平方和(SSE){SST=SSR+SSE3-25(上)管理人网-免费海量下载离差平方和的分解(三个平方和的意义)1.总平方和(SST)反映因变量的n个观察值与其均值的总离差。2.回归平方和(SSR)反映自变量x的变化对因变量y取值变化的影响,或者说,是由于x与y之间的线性关系引起的y的取值变化,也称为可解释的平方和。3.残差平方和(SSE)反映除x以外的其他因素对y取值的影响,也称为不可解释的平方和或剩余平方和。3-26(上)管理人网-免费海量下载样本决定系数(判定系数r2)1.回归平方和占总离差平方和的比例2.反映回归直线的拟合程度;3.取值范围在[0,1]之间;4.r21,说明回归方程拟合的越好;r20,说明回归方程拟合的越差;5.判定系数等于相关系数的平方,即r2=(r)23-27(上)管理人网-免费海量下载回归方程的显著性检验(线性关系的检验)1.检验自变量和因变量之间的线性关系是否显著;2.具体方法是将回归离差平方和(SSR)同剩余离差平方和(SSE)加以比较,应用F检验来分析二者之间的差别是否显著。如果是显著的,两个变量之间存在线性关系;如果不显著,两个变量之间不存在线性关系。3-28(上)管理人网-免费海量下载回归方程的显著性检验(检验的步骤)1.提出假设H0:线性关系不显著2.计算检验统计量F3.确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F4.作出决策:若FF,拒绝H0;若FF,接受H03-29(上)管理人网-免费海量下载回归方程的显著性检验(方差分析表)(续前例)Excel输出的方差分析表方差分析dfSSMSFSignificanceF回归19464919464914234.991.39842E-15残差112458.42223.493总计12948949平方和均方3-30(上)管理人网-免费海量下载实际观察值与回归估计值离差平方和的均方根;2.反映实际观察值在回归直线周围的分散状况;3.从另一个角度说明了回归直线的拟合程度;4.计算公式为注:上例的计算结果为14.9496783-31(上)管理人网-免费海量下载回归系数的显著性检验(要点)1.检验x与y之间是否具有线性关系,或者说,检验自变量x对因变量y的影响是否显著;2.理论基础是回归系数的抽样分布;1ˆb3.在一元线性回归中,等价于回归方程的显著性检验。3-32(上)管理人网-免费海量下载回归系数的显著性检验(样本统计量的分布)1.是根据最小二乘法求出的样本统计量,它有自己的分布2.的分布具有如下性质分布形式:正态分布数学期望:标准差:由于未知,需用其估计量Sy来代替得到的估计的标准差3-33(上)管理人网-免费海量下载回归系数的显著性检验(样本统计量的分布)的抽样分布12()yiSSxxb11()Ebb1b1b3-34(上)管理人网-免费海量下载回归系数的显著性检验(步骤)1.提出假设H0:b1=0(没有线性关系)H1:b10(有线性关系)2.计算检验的统计量3.确定显著性水平,并进行决策tt,拒绝H0;tt,接受H03-35(上)管理人网-免费海量下载回归系数的显著性检验(实例)对前例的回归系数进行显著性检验(=0.05)1.提出假设H0:b1=0人均收入与人均消费之间无线性关系H1:b10人均收入与人均消费之间有线性关系2.计算检验的统计量3.t=65.0