虚拟变量

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二节虚拟变量一、虚拟变量及其作用经济变量的影响因素中间有时还包括一些定性因素,例如,消费习惯、地区差异将直接影响居民的消费支出;季节因素对产品的生产和销售都会产生影响。舍弃定性因素,一方面不能真实地描述经济变量之间的相关关系,增大模型的设定误差,同时也不能计量这些定性因素的影响。10D,1为城镇居民,0为农村居民10D,1为销售旺季,0为销售淡季10D,1政策紧缩,0为政策宽松10D,1为本科以上学历,0以本科以下学历在计量经济模型中引入虚拟变量有以下作用:(1)可以描述和测量定性因素的影响(2)能够正确反映经济变量之间的相互关系,提高模型的精度。(3)便于处理异常数据;当样本资料中存在异常数据时,一般有三种处理方式,一是在样本容量较大的时候直接剔除异常数据;二是用平均数方式修匀异常数据;三是设置虚拟变量:虚拟变量的设置有规律吗?练习:中日关系的冷热也是一个定性因素,如果让你设置,你怎么设置呢?表一个局部数据列表个人编号WAGEEDUCgenderMARRIED1234……5255253.103.243.006.00……11.563.501112118……16141100……100101……10012wagefemaleeduu问:如果1表示女性,0表示男性,那么1的经济含义是什么呢^-^通过图形来说明。二、虚拟变量的设定(一)虚拟变量的引入方式:加法方式,乘法方式,一般方式。1.加法方式居民家庭的教育费用支出除了受收入水平的影响之外,还与子女的年龄结构密切相关。如果家庭中有适龄子女,教育支出就多一些。10D,1为有适龄子女,0为无适龄子女。将家庭教育费用支出函数取成:012iiiiYXD这样,就形成了两个函数:没有适龄子女家庭的教育费用支出:01iiiYX有适龄子女家庭的教育费用支出:012iiiYX=021()iiX画出样本回归方程的图像可知,以加法方式引入虚拟变量时,反映的是定性因素对截矩的影响,即平均水平的差异情况。以加法方式加入虚拟变量时,暗含着什么意思呢^-^2.乘法方式定性因素的影响不仅表现在截矩上,有时可能还会影响斜率。例如,随着收入水平的提高,家庭教育支出的边际消费倾向可能会发生变化。于是用乘法方式引入,将家庭教育费用支出函数取成:012iiiiYXXD其中,iiiXDXD该支出函数等价于以下两个等式:通过画图可以说明,以乘法方式引入虚拟变量,反映的是定性因素对斜率的影响,系数2描述了定性因素的影响程度。3.一般方式用不同方式引入虚拟变量将反映不同的经济效果,所以最初是大致判断定性因素的影响类型,然后用加法方式或乘法方式在模型中设置虚拟变量。但是在实际应用中,却不是这样。实际做法是:先都引入,再进行回归,对D和XD前的系数进行T检验,决定以什么样的方式来加入。表:我国城镇居民家庭抽样调查资料关于彩电拥有量收入等级彩电拥有量Y(台/百台)人均收入X(元/年)困难户最低收入户低收入户中等偏下户中等收入户中等偏上户高收入户最高收入户83.6487.0196.75100.90105.89109.64115.13122.542198.882476.753303.174107.265118.996370.597877.6910962。16作法:1.设置虚拟变量。2.以两种方式同时引入,进行回归。3.进行经济解释。(二)虚拟变量的设置原则:一个因素多个类型,多个因素两种类型1.一个因素多个类型例如,某公司职员的年薪与工龄和学历有关。学历分成三种类型:大专以下、本科、研究生。为了反映“学历”这个定性因素,应该设置几个虚拟变量呢?(假设以加法形式引入)A方案:2,1,0,iD研究生本科大专以下年薪函数取成:012iiiiYXD方案A好吗?B方案:11,0,D本科其他,21,0,D研究生其他,31,0,D大专以下其他方案B好吗?C方案:好在哪里?总结规律。一个定性因素,M个属性,设M-1个虚拟变量。对上例进行图解说明。课堂练习:已知冷饮的销售量Y除受变量X的影响外,还受春、夏、秋、冬四季变化的影响,要考察该四季的影响,只需引入哪几个虚拟变量呢?2.多个因素两种类型研究居民住房消费函数时,考虑到城乡差异以及不同收入层次的影响,将消费函数取成:012132iiiiiYXDD其中,Y,X分别是居民住房消费支出和可支配收入,虚拟变量110D,其中,1指农村居民,0指城镇居民210D,其中,1指高收入家庭,0指低收入家庭这样,可以反映各类居民家庭的住房消费情况:四类:因此,如果有M个定性因素,且每个因素各有两个不同的属性类型,则引入M个虚拟变量。三、虚拟变量的特殊应用(一)调整季节变动利用季节资料建立模型时,经常存在着季节波动。例如,利用季度数据分析某公司利润Y与销售收入X之间的相互关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量1,10iID第季度其他季度I=123取利润函数为:01213243iiiiiiYXDDD系数分别反映了第一、二、三、四季度对利润的平均影响,根据这些系数的T检验可以判断季节因素对利润是否存在影响。(二)检验模型结构的稳定性利用不同的样本数据估计同一形式的计量经济模型,可能会得到不同的估计结果。如果估计的参数之间存在着显著差异,则称模型结构是不稳定的,反之则认为是稳定的。例如:可以利用我国改革开放前后的统计资料建立储蓄函数,通过比较两个时期的回归方程,可以分析改革开放前后居民的储蓄行为是否发生了明显变化。又如,利用我国发达地区和不发达地区GDP和投资的资料分别建立模型,可以比较不同地区投资对经济增长影响的差异情况。可以用Chow检验法。也可以用虚拟变量来进行检验。设根据两个样本估计的回归模型分别为:样本1:02iiiYX样本2:02iiiYX设置虚拟变量:10D,1指样本2,0为样本1。将样本1和样本2的数据合并,估计以下模型:0124iiiiiYXDXD其中,iiiXDXD。利用T检验判断D、XD系数的显著性,(三)分段回归在实际经济问题的研究中,有些经济关系需要用分段回归加以描述:当解释变量X低于某个已知的临界水平X*时,Y与X之间是某种线性相关关系,而大于这个临界水平时,又是另一种线性相关关系。例如,假设某企业的成本和产量成线性关系,产量超过一个值后,成本会急速上升,办法之一是进行分段回归,但也带来问题。可以取虚拟变量为:1,0,xxDxx将分段回归模型设置成:012()iiiiiYXXXD这样就将各段的奖金函数表示为:作业:1.试在消费函数01YX(以加法形式)引入虚拟变量,用以反映季节因素(淡、旺季)和收入层次差异(高、中、低)对消费需求的影响,并写出各类消费函数的具体形式。2.现有如下估计的利润函数:221.370.453778.630.0037iiiiYXDXDt=(35.78)(8.86)(2.86)其中,Y、X分别为销售利润和销售收入,D为虚拟变量,旺季时D=1,淡季时D=0;XD=X·D,试分析:(1)季节因素的影响情况;写出模型的等价形式。3.考察1990年前后的中国居民的总储蓄-收入关系是否已发生变化。(用两种方法)表中给出了中国1979~2001年以城乡储蓄存款余额代表的居民储蓄以及以GNP代表的居民收入的数据。266表5.1.11979~2001年中国居民储蓄与收入数据(亿元)90年前储蓄GNP90年后储蓄GNP19792814038.21991910721662.51980399.54517.8199211545.426651.91981523.74860.3199314762.434560.51982675.45301.8199421518.846670.01983892.55957.4199529662.357494.919841214.77206.7199638520.866850.519851622.68989.1199746279.873142.719862237.610201.4199853407.576967.219873073.311954.5199959621.880579.419883801.514922.3200064332.488228.119895146.916917.8200173762.494346.419907034.218598.4

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功