第一节古典回归模型第二节回归模型的参数估计第三节回归模型的统计检验第四节非线型回归模型第二章回归模型一、回归分析二、模型的随机设定三、古典回归模型的基本假定练习题及参考资料返回第一节古典回归模型一、回归分析和回归模型(一)相关分析和回归分析1.相关分析变量性质:都是随机变量且关系对等。分析方法:图表法和相关系数。分析目的:判定变量之间相关的方向和关系的密切程度。第一节古典回归模型2.回归分析变量性质:自变量与因变量的关系不对等。分析方法:建立回归方程。分析目的:变量之间的数量依存关系,并根据自变量的数值变化去推测因变量数值变化。第一节古典回归模型确定性变量随机变量举例说明:假设一个总体由60户家庭组成,为了研究家庭消费支出Y与家庭收入X之间的关系,将这60户家庭按人均月收入划分成组内收入水平大致相同的10个组。表2-1列出了每组各个家庭的人均月消费支出和收入情况。第一节古典回归模型表2-1某总体的家庭收支情况单位:元/月人均月收入X人均月消费支出Y条件均值E(Y)180155160165170175165200165170174180185188177220179184190194198189240180193195203208213215201260202207210216218225213280210215220230235240225300220236240244245237320235237240252257260262249340237245255265275289261360250252275278280285291273第一节古典回归模型图2-1不同收入水平的家庭消费支出散点分布图120150180210240270300160180200220240260280300320340360380消费支出收入总体回归函数第一节古典回归模型从图2-1的散点分布可以看出,虽然各个家庭的消费支出存在着差异,但各组家庭的平均消费支出随着收入水平的提高也在不断增加。第一节古典回归模型㈡回归模型1、总体回归模型利用图2-1中的直线可以分析家庭消费支出与家庭收入之间的相关关系。这条直线(即解释变量x取各个给定值时y均值的轨迹)称为总体回归直线,所对应的方程E(yi)=ƒ(xi)=a+bxi第一节古典回归模型称为总体回归方程,常数a、b称为总体回归参数(或回归系数)。回归分析的主要任务就是设法求出总体回归参数的具体数值,进而利用总体回归方程描述和分析总体的平均变化规律。第一节古典回归模型2、样本回归模型总体和样本的关系如下:第一节古典回归模型总体是我们研究的目的,但是不能知道总体的全部数据用总体中的一部分(样本)来推断总体的性质。总体样本样本样本X180200220240260280300320340360Y175170190195210215220240255285例如,从表2-1的总体中随机抽取一个样本列入表2-2:表2-2总体中的一个样本根据这10组观察值绘制成散点图(图2-2)如下:第一节古典回归模型图2-2总体回归直线与样本回归直线120150180210240270300160180200220240260280300320340360380总体回归函数样本回归函数第一节古典回归模型iixbayˆˆˆ从图2-2的散点分布可以看出,散点分布仍然呈现出明显的线性趋势;现设法确定一条直线来较好地拟合这些样本观察值,称这条直线为样本回归直线,其对应的方程:称为样本回归方程,分别为总体回归参数a、b的估计。baˆ,ˆ第一节古典回归模型如果估计误差较小,即估计值与真实值比较接近,则可以用样本回归方程近似地代替总体回归方程,即利用样本回归方程近似地描述总体的平均变化规律。注:在参数(或变量)字母上面加上符号“^”,表示是该参数(或变量)的估计值或估计量,以后将一直采用这种习惯表示方法。第一节古典回归模型因此,回归分析的主要内容可以概括成:根据样本观察值确定样本回归方程;检验样本回归方程对总体回归方程的近似程度;利用样本回归方程分析总体的平均变化规律。第一节古典回归模型二、回归模型的随机设定(一)随机误差项从表2-1和图2-1都可以看出,单个家庭的消费支出yi与平均消费支出E(yi)之间存在着一定的离差,用εi表示,即:εi=yi-E(yi)=yi-(a+bxi)第一节古典回归模型相应地,若样本回归方程为,则实际值yi与估计值的离差用ei表示,即:iixbayˆˆˆ其中εi是一个不可观测的、可正可负的随机变量,称为随机误差项。yi=E(yi)+εi=a+bxi+εi称为总体回归模型的随机设定形式。iyˆ第一节古典回归模型称ei为残差(或拟合误差),它可以作为随机误差εi的估计。而方程:)ˆˆ(ˆiiiiixbayyyeiiiiiexbaeyyˆˆˆ称为样本回归方程的随机设定形式。第一节古典回归模型(二)随机误差产生的原因客观现象本身的随机性。模型本身的局限性。模型函数形式的设定误差。数据的测量与归并误差。随机因素的影响(如自然灾害等)第一节古典回归模型三、古典回归模型的基本假定1.解释变量x为非随机变量。2.零均值假定:E(εi)=03.同方差假定:D(εi)=σ2(常数)4.非自相关假定:Cov(εi,εj)=0(i≠j)5.解释变量与随机误差项不相关假定:Cov(xi,εi)=0(或E(xiεi)=0)第一节古典回归模型6.无多重共线性假定;7.εi服从正态分布,即εi~N(0,σ2),yi~N(a+bxi,σ2)。第一节古典回归模型课外练习题及参考资料一、练习题1、总体回归方程与样本回归方程的区别。2、随机误差产生的原因。3、古典回归模型的基本假定包括哪些。二、参考资料1、《经济计量学》李长风编著,上海财大出版社,1997年版2、《经济计量学》张保法编著,经济科学出版社,2000年版一、最小二乘估计(OLS)二、一元线性回归模型的参数估计三、多元线性回归模型的参数估计四、最小二乘估计的性质五、系数的估计误差与置信区间返回第二节回归模型的参数估计一、最小二乘估计(OLS)对于一元线性回归模型:yi=a+bxi+εi假设从总体中获取了n组观察值(x1,y1),(x2,y2),…,(xn,yn)。对于平面中的这n个点,可以使用无数条曲线来拟合。选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。第二节回归模型的参数估计描述这一标准最常用的是普通最小二乘法(OrdinaryLeastSquare,OLS):所选择的回归模型应该使所有观察值的残差平方和达到最小。即:222)ˆˆ()ˆ(iiiiixbayyye=最小第二节回归模型的参数估计二、一元线性回归模型的参数估计由于是关于的二次函数并且非负,所以存在最小值。利用微分学中求极值的方法,可以求得的值。根据)ˆ,ˆ(bafQ22)ˆˆ(iiixbayebaˆ,ˆbaˆ,ˆ0)ˆˆ(2ˆiixbayaQ0)ˆˆ(2ˆiiixxbaybQ0)ˆˆ(iixbay0)ˆˆ(iiixxbay第二节回归模型的参数估计iiiiiiiyxbxayxxbanyˆˆˆˆ从而得到:第二节回归模型的参数估计解正规方程组可得:xxxyiiiSSxnxyxnyxbxbya22ˆˆˆ正规方程组(2-1)其中,由于式(2-1)是根据(普通)最小二乘法得到的,所以称为参数的最小二乘估计,简记成OLS估计。iyny1ixnx1))((yyxxsiixy2)(xxsixxbaˆ,ˆ第二节回归模型的参数估计【例1】我国税收预测模型。表2-3列出了我国1985~1998年期间税收收入Y和国内生产总值X的统计资料(时间序列数据),试利用EViews软件建立一元线性回归模型。第二节回归模型的参数估计表2-3我国税收与GDP统计资料单位:亿元年份税收YGDP年份税收YGDP1985204189641992329726638198620911020219934255346341987214011963199451274675919882391149281995603858478198927271690919966910678851990282218548199782347446319912990216181998926379396第二节回归模型的参数估计(1)建立工作文件:第二节回归模型的参数估计启动EViews,点击File\New\Workfile,弹出工作文件对话框(图2-3),选择数据的时间频率、起始期和终止期。时间频率年度半年季度月度周日非时序数据起始期终止期命令方式:在EViews命令窗口中键入CREATE时间频率类型起始期终止期例如:CREATEA8598(2)输入统计资料:在命令窗口键入数据输入/编辑命令DATAYX将显示数组窗口(图2-4),此时可以按全屏幕编辑方式输入每个变量的统计资料。第二节回归模型的参数估计图2-4数组窗口第二节回归模型的参数估计(3)估计回归模型:数组窗口中点击Procs\Makeequation,定义方程,点击OK,则弹出有关估计结果(右图)。我国税收模型的估计式为:xy0946.054.987ˆ常数和解释变量参数标准差T统计量值双侧概率判定系数调整的判定系数回归方程的标准差残差平方和似然函数的对数德宾-瓦森统计量被解释变量均值被解释变量标准差赤池信息准则施瓦兹信息准则F统计量F统计量的概率参数估计值第二节回归模型的参数估计命令方式,键入:LS被解释变量C解释变量例如:LSYCX【例2】中国城镇居民消费函数。表2-5列出了我国城镇居民家庭1998年平均每人全年消费性支出Y和可支配收入X的统计资料(横截面数据,单位:元/年),试利用EViews软件,通过在命令窗口中直接键入命令的方式建立城镇居民消费函数。常数第二节回归模型的参数估计表2-5我国城镇居民家庭1998年收支情况收入等级人均消费支出Y人均可支配收入X困难户2214.472198.88最低收入户2397.62476.75低收入户2979.273303.17中等偏下户3503.244107.26中等收入户4179.645118.99中等偏上户4980.886370.59高收入户6003.217877.69最高收入户7593.9510962.16第二节回归模型的参数估计依次键入:建立工作文件:CREATEU8输入统计资料:DATAYX估计回归模型:LSYCX操作演示右图是输出结果,我国城镇居民的消费函数为:xy6237.071.924ˆ第二节回归模型的参数估计三、多元线性回归模型的参数估计对于多元线性回归模型利用OLS法,有:22)ˆ(yyeiiikikiiixbxbxbby22110),,2,1(nimin)ˆˆˆˆ(222110kikiiixbxbxbby第二节回归模型的参数估计0)xxˆˆˆ(y2ˆ.........0)xxˆˆˆ(y2ˆ0)xˆˆˆ(y2ˆkiki110i21iki110i12ki110i02kikikiikiibxbbbebxbbbebxbbbe第二节回归模型的参数估计分别求关于模型参数的一阶偏导数,并令其等于零,得到:整理得:2221102222121202121221110122110ˆˆˆˆ.........ˆˆˆˆˆˆˆˆˆˆˆˆkikikiikikiikikiikiiiiiikiikiiiiiikikiiixbxxbxxbxbyxxxbxbxxbxbyxxxbxxbxbxbyxxbx