【西南财大课件计量经济学】JLJJ二章

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

12作进行回归分析的具体操运用Eviews目的要求:通过一元线性回归模型的建立过程,了解(重温)回归分析方法的基本统计思想。掌握:总体回归函数与样本回归函数的实质和联系;线性回归的基本假定及其意义;普通最小二乘估计及其性质;参数的点估计与区间估计;参数的假设检验;拟合优度的意义和作用;对因变量个别值和平均值的点预测和区间预测;30102030051015YX散点图第一节回归分析与回归方程一、回归与相关(一)经济变量之间的相互关系1、相互关系函数关系:统计(相关)关系:2、相关关系的类型1)从相关关系涉及的变量数量:简单(一元)相关;多重(复)相关2)从变量相关的表现形式:线性相关;非线性相关3)从变量相关关系变化的方向:正相关;负相关(变量间变化彼此没有联系时,称为不(零)相关)4(二)相关系数(复习)变量X、Y的总体相关系数变量X、Y的样本相关系数注意:1、变量X、Y都是随机变量,且相互对称,所以2、相关系数只反映两变量间线性相关的程度,不能说明其非线性相关关系4、相关系数虽能度量变量的线性相关程度,但不能确定变量之间的因果关系,也不能说明它具体接近哪一条直线。r3、样本相关系数是总体相关系数的估计量,随着取样的不同,两者之间有误差,其统计显著性有待检验。5例以下资料是Whitney公司连续26周销售额和广告成本以及该城市各主要百货公司的销售总额(含Whitney公司的)和估计的竞争对手的广告费(美元)周次Whitney公司百货公司销售总额其它百货公司的广告费X2销售额Y广告费X112170787119003710113200021994291149003369873—……………251680685109002819941—262266506980038976892500这些数据是否能揭示出Whitney公司所做的报纸广告带来的真实收益?6广告费与销售额的散点图16000001800000200000022000002400000260000001000020000300004000050000YX17广告费与市场占有率的散点图0.540.560.580.600.620.6401000020000300004000050000WX188217.08(三)回归分析1、“回归”一词的古典意义英国生物学家F.高尔顿(FrancisGalton)在遗传学研究中首先提出的…92、“回归”一词的现代意义:“回归”是关于一个被解释变量(或因变量)对一个或多个解释变量(或自变量)依存关系的研究。目的:根据已知的或固定的解释变量的值,去估计或预测被解释变量的总体均值。回归分析就是要根据X和Y的观测数据,确定其变动的具体统计规律性。例:个人可支配收入和个人消费支出即XY平均变动轨迹(该函数称为回归函数)103、回归分析与相关分析的联系和区别联系:都是研究相关关系的方法。区别:相关分析:*所涉及的变量都为随机变量。回归分析:*需要区分变量之间的因果关系;*则要通过建立回归方程,去估计(预测)因变量的平均值;*因变量是随机变量(有一定的概率分布),自变量是非随机变量。*主要是为刻画变量间的相关程度;*不考虑变量之间的因果关系,不区分解释变量和因变量,两变量对称.11二、总体回归函数(PRF)(一)一个人为的例子(P17):N=100户家庭分为10组分析:每一收入组的家庭消费支出•对给定的,所有可能出现的Y值服从一定的分布,称为X给定时Y的条件分布iX•X取某定值时,Y取各种值的概率,称为Y的条件概率,记为)(iXYP例如:X=60,Y取4个值中任一个值的条件概率各为41)60(iXYPX=90,Y取6个值中任一个值的条件概率各为61)90(iXYP•称为Y的条件均值(条件期望)554158415741544151)60(iXYE例如结果列于表2.1.2(P18))(iiiXYPYXYE)(12)()(iiXfXYEiiXXYE21)((二)总体回归函数的概念“条件期望(均值)”的运动轨迹称为回归函数。*Y对X的回归直线:回归函数形式为直线*Y对X的回归曲线:回归函数形式为曲线*总体回归函数(PRF):总体因变量Y的条件期望表示为解释变量X的某种函数*特别:总体回归函数为线性函数,即注意:总体回归函数的设定(通过定性分析、散点(布)图)回归系数)—是未知参数(、其中:22113(三)“线性”一词的含义(有两种解释)1、模型就变量而言是线性的,例如iiXXYE21)(iiXXYE21)(2、模型就参数而言是线性的,例如221)(iiXXYEXXYEi1)(21注:在计量经济学中,从回归理论的发展、参数的估计方法来说,主要考虑的是模型就参数而言是线性的情形。14三、随机扰动项*随机扰动项(ui):因变量Yi与总体条件均值(期望)E(Y/Xi)的偏差(离差)。)(iiiXYEYuiiXXYE21)(即*总体回归函数可以表示为:iiiXYEY)(iiiXY21条件期望形式:说明X对Y的条件期望影响随机设定形式ui说明除了X对Y的影响以外,其余未被纳入模型的诸多因素对Y的综合影响156、变量的内在随机性总体回归函数中引进随机扰动项的主要原因:1、作为未知影响因素的代表2、作为无法取得数据的已知因素的代表3、作为众多细小影响因素的综合代表4、模型的设定误差5、变量的观测误差16四、样本回归函数(SRF)(一)样本回归直线(回归曲线):以样本数据拟合的直线(曲线),它是总体回归线的近似反映。仍以家庭可支配收入与消费支出的关系为例,从总体中各抽取10户观测,两随机样本的结果为(P21表2.1.3、表2.1.4)。将资料绘成散布(点)图,每个随机样本的10对观察值的点都呈现明显的线形趋势,拟合两条(样本回归)直线:SRF(1)SRF(2)17总体回归函数样本1回归函数样本2回归函数18iiieXY21ˆˆiiiiieXeYY21ˆˆˆiiieYYˆie(二)样本剩余项(残差):因变量与样本条件均值的离差(偏差),记为即回归分析的目的:用样本回归函数(SRF)去估计总体回归函数(PRF)即用iiXY21ˆˆˆ去估计iiXXYE21)(iiiXY2119第二节简单线性回归模型的最小二乘法一、古典(基本)假定简单线性回归模型:iiiuXY211)重复抽样中,解释变量是一组固定的值或虽然是随机的,但与干扰项独立;iXiu(二)对随机扰动项(或分布)的假定iuiY(一)对变量和模型的假定2)无测量误差;iX3)模型设定正确(不存在设定误差)20假定1:干扰项的均值为零,即0)|(iiXuEiiiXXYE21)|(21假定2:同方差性或的方差相等,即2)|(iiXuVar2)|(iiXYVar22),0(~2Nui假定3:无自相关假定,即0),(jiuuCov0),(jiYYCov假定4:扰动项与解释变量之间不相关0),(iiXuCov假定5:随机扰动项服从正态分布),(221~iiXNY23二、普通最小二乘法(OLS)),(,),,(),,(2211nnYXYXYX最小二乘法的数学原理:将观察值在直角坐标系中绘制出来iiiuXY21iXY21ˆˆˆiieˆ2422)ˆ(iiiYYeQ最小二乘法的基本思想(原则):寻找实际值与拟合值的离差平方和为最小的回归直线。22122)ˆˆ()ˆ(iiiiiXYYYe根据微积分中求极值的原理2121()ˆˆ2()0ˆiiieYX0)ˆˆ(2ˆ)(2122iiiiXXYeiiXY21ˆˆˆiiYYˆ设样本回归方程为:实际值与拟合值的离差:离差平方和:2522121ˆˆˆˆiiiiiiXXYXXnY222)(ˆiiiiiiXXnYXYXn))())((ˆ(222XXYiiiSSXXYYXX解方程组得XXxiiYYyii22ˆiiixyxXY21ˆˆ1ˆ2ˆ2ˆ注:令截距项:当解释变量为零时,被解释变量的取值;斜率项:当解释变量每变动一个单位时,被解释变量平均变动个单位。12ˆˆˆiiYX26)7.1.2(ˆˆˆ21iiXYYYyiiˆˆ)8.1.2(ˆˆ21iiieXY)()(XXyii2121ˆˆˆˆˆiiixXXy22ˆˆˆ)(样本回归函数的表现形式:)()16.2.2(ˆˆ2离差表现形式iixy注:27例讨论家庭收入X对家庭消费支出Y的影响问题。如果通过调查得到一组数据:(百元)187.76461.62121114413232013400260430229006605402116008406502725001350770384900266089039810035109100551000060501012066144007920合计540299.74300822893.62XXYXY284845.054043008107.2995406.22893102805.3ˆˆ21XYXY4845.0805.3ˆ222)(ˆiiiiiiXXnYXYXn例:P2529三、OLS回归直线的性质(数值性质)),(YXiYYˆ0ie或e=0(一)回归直线通过样本均值点XY21ˆˆ12ˆˆYX(二)估计值的均值等于实际观测值的均值nXnYii)ˆˆ(ˆ21nXXYi]ˆ)ˆ[(22nXXYi)]ˆˆ([(22YnXXYi)(ˆ2(三)剩余项(残差)的和为零或均值为零iiiYYeˆ0)ˆˆ(2ˆ)(2112iiiXYe(P24)0)ˆˆ()ˆ(21iiiiiXYYYe0neei30(四)预测(估计)值与剩余项不相关,即(五)解释变量与剩余项不相关,即0),(iieXCOV0),ˆ(iieYCOV由协方差的定义有),(iieYCOVˆ)()ˆ(ˆiiiieEeYEYE])ˆ[(iieYYE]ˆ[iieyE0ˆneyii0ˆiiey(证明见教材P27)),iieXCOV()()(iiiieEeXEXE))((1XXeeniiiiXen10)ˆˆ(121iiiXXYn由正规方程组第二个方程得:0)ˆˆ(2ˆ)(2122iiiiXXYe31③残差和为零⑤自变量与残差不相关②平均数相等④拟合值与残差不相关iiiiieXeYY21ˆˆˆ①回归直线过点),(YXiYYˆ00eei或0),ˆ(iieYCOV0),(iieXCOV32四、最小二乘估计式的统计性质(前提:满足古典(基本)假定)iY1ˆ2ˆ1、线性性:、都是的线性函数;注:正态分布的线性组合仍服从正态布22ˆiiixyx2)(iiixYYxXY21ˆˆ),0(~2Nui),(221~iiXNY22))((iiiiiixnYxxYxi2iixYXYx2(01)iiiiiiixKKKKXx注:令,(是常数),且;i21()iixXYnxiiiiiYKYxx2332、无偏性证:)(1ˆE)ˆ(2XYE)ˆ()(2EXYE1221)XX(11ˆ()E22)ˆ(E证:)(2ˆE)(iiiYxxE2)(2iiiYExx2212)(iiiiuXExx343、最小方差性1ˆ2ˆ

1 / 101
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功