虚拟变量和分布滞后

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

3.4虚拟变量一、虚拟变量及其作用二、虚拟变量的设定三、虚拟变量的特殊应用一、虚拟变量(dummy)及其作用•1、定义:数值只取0和1的人工变量。用符号D来表示。如•2、作用:⑴可以描述和测量定性因素的影响。⑵便于处理异常数据。一是直接剔除;二是修匀;三是设置虚拟变量。01D城镇居民农村居民01D政策紧缩政策宽松01D异常时期正常时期二、虚拟变量的设定1.虚拟变量的引入方式(1)加法方式(2)乘法方式(3)一般方式2.虚拟变量的设置原则(1)一个因素两个类型(2)一个因素多个类型(3)多个因素各两种类型二、虚拟变量的设定1.虚拟变量的引入方式(1)加法方式---影响截距家庭教育费用支出函数Yi=a+bxi+αDi+εi虚拟变量:上式等价为:无适龄子女支出函数(Di=0):Yi=a+bxi+εi有适龄子女支出函数(Di=1):Yi=(a+α)+bxi+εi01D有适龄子女无适龄子女•加法方式引入虚拟变量,反映定性因素对截距的影响D=0D=1aa+αα二、虚拟变量的设定(2)乘法方式------影响斜率Yi=a+bxi+βXDi+εi其中:XDi=Xi*Di,上式等价于:当Di=0时:Yi=a+bxi+εi当Di=1时:Yi=a+(b+β)xi+εi二、虚拟变量的设定•乘法方式引入虚拟变量,可反映定性因素对斜率的影响D=0D=1aβ(3)一般方式同时引入加法与乘法方式。再利用t检验判断α、β是否显著的不等于零。进而确定虚拟变量的具体引入方式。•SCATXY绘制相关图例7.表列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。前3个和后5个差异大。反映“收入层次”这一定性因素的影响,设置虚拟变量:01D中高收入家庭低收入家庭同时引入加法和乘法方法,再进行t检验。彩电需求函数设成:Yi=a+bxi+αDi+βXDi+εiDATAD1GENRXD=X*D1LSYCXD1XD我国城镇居民彩电需求函数的估计结果为:iiiiXDDxy0088.08731.310119.061.57ˆ对应的t统计量值α、β的t检验都是显著的,故影响截距和斜率。各自的需求函数为(略):对应的t统计量值2.虚拟变量的设置原则⑴一个因素多个类型一个因素m个不同类型,应设m-1个虚拟变量。例:设公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素的影响,应该设置两个虚拟变量:而将年薪模型取成(假设以加法方式引入):Yi=a+bxi+α1D1i+α2D2i+εi011D本科其他012D研究生其他其等价于:Yi=a+bxi+εi大专以下(D1=D2=0)Yi=(a+α1)+bxi+εi本科(D1=1,D2=0)Yi=(a+α2)+bxi+εi研究生(D1=0,D2=1)通过检验、α1、α2的显著性,可以判断学历层次对职员的年薪是否有显著影响。大专以下本科研究生工龄年薪α2-α1α1(2)多个因素各两种类型如果有m个定性因素,且每个因素各有两个不同的属性类型,则引入m个虚拟变量。例如,研究居民住房消费函数时,考虑到城乡的差异以及不同收入层次的影响,将消费函数取成:Yi=a+bxi+α1D1i+α2D2i+εi其中y,x分别是居民住房消费支出和可支配收入,虚拟变量这样可以反映各类居民家庭的住房消费情况:011D农村居民城镇居民012D高收入家庭低收入家庭城市低收入家庭(D1=0,D2=0)Yi=a+bxi+εi城市高收入家庭(D1=0,D2=1)Yi=(a+α2)+bxi+εi农村低收入家庭(D1=1,D2=0)Yi=(a+α1)+bxi+εi农村高收入家庭(D1=1,D2=1)Yi=(a+α1+α2)+bxi+εi推广到更一般的情况,如果有些因素有多个属性水平,则参照“一个因素多种类型”的设置原则来设置虚拟变量。三、虚拟变量的特殊应用1、调整季节波动2、检验模型结构的稳定性3、分段回归4、混合回归三、虚拟变量的特殊应用1、调整季节波动例如,利用季度数据分析某公司利润y与销售收入x关系时,考虑季节性影响,引入三个虚拟变量(设第1季度为基础类型):取利润函数为:Yi=a+bxi+α1D1i+α2D2i+α3D3i+εi则a、α1、α2、α3分别反映了一、二、三、四季度对利润的影响,据t检验判断季节因素对利润是否显著影响。01iD第i+1季度i=1,2,3其他季度2、检验模型结构的稳定性设根据两个样本估计的回归模型分别为:样本1:Yi=a1+b1xi+εi样本2:Yi=a2+b2xi+εi设置虚拟变量:估计以下模型:Yi=a1+b1xi+(a2-a1)Di+(b2-b1)XDi+εi01D样本2样本1利用t检验判断D、XD系数的显著性,可以得到四种检验结果:(1)两个系数均等于零,即a2=a1,b2=b1,表明两个回归模型之间没有显著差异,称之为“重合回归”。(2)D的系数不等于零,XD的系数等于零,即a2≠a1,b2=b1。称之为“平行回归”。(3)D的系数等于零,XD的系数不等于零,即a2=a1,b2≠b1。称之为“汇合回归”。(4)D、XD的系数均不等于零,即a2≠a1,b2≠b1。表明两个回归模型完全不同,称之为“相异回归”第(1)种情况下模型结构是稳定的,其余情况都表明模型结构不稳定。3、分段回归有些经济关系需要用分段回归加以描述:临界水平x*分段回归模型设置成:Yi=a+bxi+β(xi-x*)Di+εi其中,x*是已知的临界水平。这样各段的函数为:Yi=a+bxi+εixx*Yi=(a-βx*)+(b+β)xi+εixx*01Dxx*xx*使用虚拟变量既能如实描述不同阶段的经济关系,又未减少估计模型时样本容量,保证了模型的估计精度。4、混合回归获得时序数据和横截面数据。在合并样本之前,需在比较使用不同样本估计的模型之间是否有显著差异。只要模型参数不随时间而改变,并且在各个横截面之间没有差异,就可以使用混合样本估计模型。例8.我国城镇居民1998年、1999年全年人均消费支出和可支配收入的统计资料。试使用混合样本数据估计我国城镇居民消费函数。设1998年、1999年我国城镇居民消费函数分别为:1998年:Yi=a1+b1xi+εi1999年:Yi=a2+b2xi+εi设置虚拟变量:并且合并两年的数据,估计以下模型:Yi=a1+b1xi+αDi+βXDi+εi其中α=a2-a1,β=b2-b1。估计过程如下:CREATEU16DATAYX(输入1998、1999年消费支出和收入的数据,1~8期为1998年资料,9~16期为1999年资料)01D1999年1998年SMPL18样本期调为1998年GENRD1=0输入虚拟变量的值SMPL916样本期调为1999年GENRD1=1输入虚拟变量的值SMPL116样本期调至1998~1999年GENRXD=X*D1生成XD的值LSYCXD1XD利用混合样本估计模型估计结果为:操作演示根据t检验,D、XD的回归系数均不显著,这表明1998年、1999年函数并没有显著差异。因此,可以将两年的样本数据合并成一个样本来估计。iiiiXDDxy0080.01917.616327.07058.924ˆ一、滞后变量模型二、分布滞后模型的估计三、滞后效应分析四、因果关系检验3.5滞后变量一、滞后变量模型1、滞后变量将变量的前期值、即带有滞后作用的变量称为滞后变量(laggedvariable),含有滞后变量的模型称为滞后变量模型。2.产生滞后效应的原因(1)心理因素:(2)技术因素:(3)制度因素:3.5滞后变量3、滞后变量模型⑴分布滞后模型。滞后变量为解释变量x,即yt=a+b0xt+b1xt-1+…+bkxt-k+εt则称其为分布滞后模型。如消费函数:Ct=a+b0Yt+b1Yt-1+b2Yt-2+εt⑵自回归模型滞后变量为被解释变量y,即:yt=a+b0xt+b1yt-1+…+bkyt-k+εt则称其为(k阶)自回归模型。3.5滞后变量例如,消费函数:Ct=a+b0Yt+b1Ct-1+εt有限滞后模型(若滞后期有限)和无限滞后模型(若滞后期无限)。4、滞后变量模型的特点⑴滞后变量模型可以更加全面、客观地描述经济现象。⑵使计量经济模型成为动态模型。⑶定量地描述了经济变量的滞后效应,用以分析经济系统的变化和调整过程。但估计模型时也存在以下问题:(1)经济变量的各期值之间经常是高度相关的;(2)滞后变量个数的增加将会降低样本的自由度;(3)难以客观地确定滞后期的长度。3.5滞后变量二、分布滞后模型的估计1.经验加权法根据实际经验指定各期滞后变量的权数,再将各期滞后变量加权组合成新的解释变量wt,然后估计变换后的模型yi=f(wt)+εt,得到原模型中各参数的估计值。经常使用的权数类型有:(1)递减型:即各期权值是递减的。例如,消费函数中近期收入对消费的影响较大,而远期收入的影响将越来越小;如果设滞后期为2,各期权数取成:½¼1/63.5滞后变量则组合成新的解释变量:估计模型(此时模型已无多重共线性):yt=a+bwt+εt得到a、b的估计值,将wt代入原模型,得:21614121tttxxxwtttttxxxbayt)614121(21tttxbxbxbat21642tttxbxbxbat22110所以原参数的估计值为:6ˆˆ,4ˆˆ,2ˆˆ210bbbbbb3.5滞后变量(2)常数型:即各期权数值相等。设滞后期为2,权数均为1/3,则:估计模型:yt=a+bwt+εt则:i=0,1,2)(3121ttttxxxw(3)倒V型:先递增后递减。设滞后期为4,权数取成:1/6,1/4,1/2,1/4,1/6则:3ˆˆbbi43216141214161ttttttxxxxxw3.5滞后变量特点是简单易行,但权数设置的主观随意性较大。通常是多选几组权数分别估计模型,再通过各种检验(R2,F,t,DW)从中选择出一个较为合适的模型。2、阿尔蒙估计法(S.Almom)(1)阿尔蒙估计法的原理设有限分布滞后模型为yt=a+b0xt+b1xt-1+…+bkxt-k+εtbi可以用滞后期i的适当次多项式来逼近:bi=f(i)=α0+α1i+α2i2+…+αmim(mk)3.5滞后变量(2)阿尔蒙估计法的步骤分布滞后模型可以表示成:*****biibi=α0+α1i+α2i2*****biibi=α0+α1i+α2i2+α3i3**ikiititxbay03.5滞后变量设bi可以用二次多项式近似表示,即:bi=α0+α1i+α2i2将此代入分布滞后模型,整理得:ikikiititkiittxiixxay0022100定义:kikiittittkiittxiZixZxZ0022100,,称该变量变换为Almon变换;则原分布滞后模型可以表示成:ittttZZZay2211003.5滞后变量利用OLS法估计系数a,α0,α1,α2,进而得到bi的估计值。0ˆˆob(3)阿尔蒙估计法的特点阿尔蒙估计法的原理巧妙、简单两个问题:滞后期长度和多项式的次数。2101ˆˆˆˆ,b,......,ˆ4ˆ2ˆˆ2102b2210ˆˆˆˆkkbk3.5滞后变量滞后期长度可以根据经济理论或实际经验加以确定,也可以通过相关系数、调整的判定系数、施瓦兹准则SC等统计检验获取信息。多项式次数可以依据经济理论和实际经验加以确定。一般取m=1~3。(4)阿尔蒙估计的EViews软件实现其命令格式为:LSYCPDL(X,k,m,d)其中,k为滞后期长度,m为多项式次数,d是对分布滞后特征进行控制的参数。3.5滞后变量在LS命令中使用PDL项,应注意以下几点:①必须指定

1 / 50
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功