计量经济学第八章虚拟变量回归

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第八章虚拟变量回归第一节虚拟变量的概念一、问题的提出计量经济学模型对变量的要求——可观测、可计量。但在现实经济问题中,存在定性影响因素,比如1、属性(品质)因素的表达。在经济活动中,有的经济变量的变动要受到属性因素(或品质因素)的影响。如收入在形成过程中,不同的性别所得到的收入是不一样的;在城乡、不同地区等收入存在差距;再比如,在我国,经济的发展水平对于不同的区域有不同的表现。2、异常值现象。当经济运行过程中,可能会受到突发事件的影响,那么,其值有可能出现异常,偏离正常轨迹很远,对这类现象需要加以修正。3、季节因素的影响。有的经济现象存在明显的季节特征,如啤酒的消费。那么,在建模过程中,季节变动这一因素怎样考虑?4、离散选择现象的描述。如公共交通与私人交通的选择、商品购买与否的决策、求职者对职业的选择等。第1、2、3种情况属于解释变量为定性变量,第4情况为被解释变量属于定性变量。称前一种情况为虚拟解释变量,后一种为虚拟被解释变量。本章主要介绍虚拟解释变量的内容。二、虚拟变量的定义1、定义。设变量D表示某种属性,该属性有两种类型,即当属性存在时D取值为1;当属性不存在时D取值为0。记为不具有该属性具有某种属性01D2、虚拟变量引入的规则。(1)在模型里存在截距项的条件下,如果一个属性存在m个相互排斥类型(非此即彼),则在模型里引入m-1个虚拟变量。否则,会出现完全的多重共线性。但要注意,在模型无截距项的情况下,如果一个属性存在m个类型,即便引入m个变量,不会出现多重共线性问题。(请思考为什么?)(2)虚拟变量取值为0,意味着所对应的类型是基础类型。而虚拟变量取值为1,代表与基础类型相比较的类型,称为比较类型。例如“有学历”D为1,“无学历”D为0,则“无学历”就是基础类型,“有学历”为比较类型。(3)当属性有m个类型时,不能把虚拟变量的取值设成如下情况D=0,第一个类型;D=1,第二个类型;……D=m-1,第m个类型。原因是上述情况没有反映出属性类型的相互排斥性。第二节虚拟解释变量的回归一、加法引入规则1、加法引入规则,虚拟解释变量与别的解释变量以相加的关系出现在模型里。加法引入虚拟变量对模型产生的结果是只改变截距项。设模型为123iiiiYXDu式中,iD为虚拟变量,它与其它解释变量是相加的关系。如果虚拟变量按这种方式引入模型,则称虚拟变量按加法类型引入。2、加法引入虚拟变量的应用。(1)模型中只有一个定性解释变量。设模型形式为12iiiYDuni,,3,2,1其中,iD为具有两个属性类型的定性变量,如在教材第217页,设iY为居民的年可支配收入,iD为虚拟变量,其取值表示为:iD=1表示城镇居民;iD=0表示农村居民。即1,0iD城镇居民,农村居民,1,2,3,,in该方程的意义在于,在其它因素不变的条件下,城镇居民与农村居民的收入是否具有显著性差异。由此得到城镇居民的年平均收入:12(|1)iiEYD。农村居民的年平均收入为:1(|0)iiEYD为了检验城镇居民和农村居民的差异对年平均收入的影响是否具有显著性,可构造假设:0212:0;:0HH对上述模型进行回归,利用样本统计量对假设作出判断(t检验)。只有一个定性解释变量往往可用于检验一个属性因素对被解释变量的影响是否显著性存在。(2)模型中有一个定量解释变量和一个定性解释变量。设模型形式为123iiiiYXDu式中,iY为消费支出;iX为收入;iD为虚拟变量,即1,0iD城镇居民,农村居民,1,2,3,,in上述表达式的意义在于,在收入不变的条件下,研究城镇居民和农村居民对消费的不同影响,即判断城乡居民在消费上是否存在显著性差异。农村居民年平均消费:12(,|,0)iiiiEYXDX城镇居民年平均消费:122(,|,1)()iiiiEYXDX可以看出,城镇居民和农村居民两种收入类型的斜率系数一样,但截距不同。说明两种类型的居民在收入的水平上存在2的规模差异。这一假定也可通过对2的显著性检验来判断。(3)模型中有一个定量解释变量和一个定性解释变量,但有多个属性类型。设模型形式为12233iiiiiYDDXu式中,iY为年医疗保健费支出;iX为居民年可支配收入;如果将受教育程度分为三种类型:高中以下、高中、大专及大专以上,则引入虚拟变量为如下两个231,0,iiDD1,高中及高中以上0,其他大专及大专以上其他高中以下的年平均医疗保健费支出:231(|,0,0)iiiiiEYXDDX高中的年平均医疗保健费支出:2312(|,1,0)()iiiiiEYXDDX大专及大专以上年平均医疗保健费支出:2313(|,0,1)()iiiiiEYXDDX对于模型12233iiiiiYDDXu有类型假定高中以下023123:0;:0HH与至少有一个不为高中0212:0::0HH大专及大专以上0313:0::0HH(4)模型中有一个定量解释变量和两个以上定性解释变量,每个定性解释变量有两个或以上属性类型。设模型形式为12233iiiiiQDDYu式中,iQ为卷烟需求量;iY为居民可支配收入,考虑两种不同属性:不同区域的居民,即城镇居民与农村居民;不同性别,即男与女。因此各引入一个虚拟变量231,01,0,iiDD城镇居民,农村居民男性女性农村女性居民:231(|,0,0)iEQYDDY农村男性居民:2313(|,0,1)()iEQYDDY城镇女性居民:2312(|,1,0)()iEQYDDY城镇男性居民:23123(|,1,1)()iEQYDDY(5)对模型中存在异常值的修正。设模型形式为12tttYXu由于某种突发因素的干扰,使得在0tt时刻随机误差产生系统性偏离,即000,()(0),tttEucctt这时,可引入虚拟变量000,1,tttDtt则12ttttYXcDv其中,tttvucD,对tv求数学期望,有()()0tttEvEucD表明新的随机误差项tv满足零均值假定,从而可用OLS法对引入虚拟变量的模型求参数的估计。当0tt时,12(|,1)()ttttEYXDcX当0tt时,12(|,0)ttttEYXDX还有一种情况,研究消费行为,认为消费水平C主要受到收入水平Y的影响,但对于正常年份和反常年份,消费行为的表现是不同的,这时可考虑引入虚拟变量1,0tD正常年份,反常年份则012ttttCYDu有当正常年份时,021(|,1)()ttttECYDY当反常年份时,01(|,0)ttttECYDY进一步对参数估计,利用样本统计量对总体参数2作检验,从而可判断正常年份消费行为与反常年份消费是否存在差异。(6)对季节因素的修正。假设iY是具有某种季节特征的消费行为(如啤酒、汗衫等商品的消费),这时需要对季节波动进行调整,下面介绍利用虚拟变量来调整季节变化。设模型形式为1tttYXu季节为属性因素,按自然属性有4个不同的季节(春、夏、秋、冬),即4个属性类型。因此,在有截距项的前提下,可引入3个虚拟变量,即2341,11,21,3,0,0,0,tttDDD季度季度季度,其它其它其它引入季节虚拟变量的模型为1223344ttttttYDDDXu第1季度,23412(|,1,0)()ttttttEYXDDDX第2季度,32413(|,1,0)()ttttttEYXDDDX第3季度,42314(|,1,0)()ttttttEYXDDDX第4季度,2341(|,0)ttttttEYXDDDX二、乘法引入规则1、以乘法形式引入虚拟变量,是在所设定的模型里,将虚拟解释变量与其它解释变量用乘积作为新的解释变量。乘法引入虚拟解释变量将改变模型中的斜率系数。设模型为12()tttttYXXDu或者1212()tttttYXDDu其中,tX为定量解释变量,12,,tttDDD均为虚拟变量。按上述形式引入虚拟变量即为乘法引入。2、乘法引入虚拟解释变量的应用。(1)检验模型的结构是否发生了变化。设模型形式为1212()ttttttYDXDXu式中,tY为储蓄总额,tX为收入总额,tD为虚拟变量,即1,0,tD改革开放前改革开放后改革开放后,平均储蓄额为11(|,0)ttttEYXDX改革开放前,平均储蓄额为1212(|,1)()()ttttEYXDX在上式中2被称为截距差异系数,2被称为斜率差异系数,它们分别代表改革开放前后储蓄函数的截距与斜率存在的差异。结构变化的专门检验——邹氏检验(在EViews里的记号为CHOW检验,该内容自学)。(3)交互效应。在实际经济活动中,多个定性解释变量对被解释变量的影响可能存在一种交互影响,即一个变量的边际效应可能要依赖于另外变量的变动(即由于变量间的交互作用而对解释变量的影响)。这时可用乘法引入虚拟变量的方法来表示。设模型形式为iiiiiuXDDY33221其中,iY为农副产品生产总收益,iX为农副产品生产投入,iD2为油菜籽生产虚拟变量,iD3为养蜂生产虚拟变量。其它发展养蜂生产其它发展油菜生产,0,1,0,132iiDD但上述模型不能反映发展油菜生产,同时又发展养蜂生产,而在它们中间存在着一定的交互作用,这种交互作用对农副产品生产总收益可能会带来更大的影响。因此,反映交互作用可通过按乘法引入虚拟变量来解决。iiiiiiiuXDDDDY)(32433221不发展油菜生产,也不发展养蜂生产:iiiiiXDDXYE132)0,0,|(同时发展油菜生产和养蜂生产:iiiiiXDDXYE)()1,1,|(432132在实证分析中,可利用交互效应虚拟解释变量系数4的显著性来加以判断。(4)分段线性回归。在经济活动中,有时会存在影响因素在达到某个临界值时发生结构性变化,这时可利用虚拟变量来区分这种结构性变化,即用虚拟变量表示来不同的截距和斜率的回归。以研究销售额对提取奖金的影响为例。设模型的形式为*012()tttttYXXXDu式中,tY为奖励额度,tX为销售额,*X为销售公司按销售额的一定比例计提奖励的目标水平值,即销售额在*X以下和以上计提的奖励的方法不同(或计提的额度不同),则引入虚拟解释变量为**1,0,tXXDXX当销售额度低于*X时,01(|,0)ttttEYXDX当销售额度高于*X时,*0212(|,1)()()ttttEYXDXX第三节虚拟被解释变量一、问题的提出虚拟被解释变量的出现,其主要作用是对某一经济现象或活动作出选择或决策。这一类问题的特征是被研究对象在收到多因素影响时,它的取值只有两种(可能的)状态:是与否。在计量经济学建模中,称这类模型为二元型响应模型或离散选择模型。本小节侧重介绍这类模型参数的估计及专门分析这类问题的模型。二、线性概率模型1、线性概率模型的概念。设家庭购买住房的选择主要受到家庭的收入水平,则用如下模型表示12iiiyxu其中ix为家庭的收入水平,iy为家庭购买住房的选择,即家庭无购买住房家庭已购买住房01y由于y是取值为0和1的随机变量,并定义y取值为1的概率是p,则y的分布为y01概率1-pp这样y的数学期望为()0(1)1Eypp显然(1)()iPyxpEy

1 / 13
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功