一.虚拟变量的概念及作用1.虚拟变量的内涵:建立计量经济模型的一个基本要求,就是模型中的所有变量多时可以用数值计算的。因此我们前面讨论的变量都是可以直接获取观测资料的数值变量。如收入.产出.商品需求量.价格.成本.资金.就业人数.消费支出.产值和利润等等。但是在现实的经济生活中,影响经济变量变动的因素除了这些可以直接获得实际观测数据的定量变量外,有时还包括一些本质上为定性(或属性)因素的变量。例如:性别.民族.地区.职业.季节.文化程度.战争.自然灾害.政府政策的变动等因素。在计量经济学中,我们把反映定性(或属性)因素变化,取值为0和1的人工变量称为虚拟变量(dummyvariable)习惯上用字母D表示。如:失业就业女性男性01;01DD属性因素往往很难直接度量它们的大小。只能用“Yes—D=1”或”No—D=0”来度量它们2.引入虚拟变量的作用(1)可以描述和测量定性(或属性)因素的影响。(2)能够正确反映经济变量之间的相互关系,提高模型的精度。(3)便于处理异常数据。二.虚拟变量的设置1.分类设虚拟变量D有m种取值:D:={d1,d2,…,dm}.则称之为m分类的变量.如,“居民”可分为2类(城镇居民,农村居民);“受教育程度”可分为3类(大专以下,本科,研究生).2.设置规则(一个因素多个属性)设D是有m个分类的虚拟变量D:={d1,d2,…,dm}.则可用m-1个2阶梯函数表示它:其他其他其他01...............0101112211mmdDdDdD其中yt为第t个居民住房消费支出,xt为第t个居民可支配收入。为了将城镇居民和农村居民两种不同类型的居民对住房消费支出的影响反映到上述模型中,我们需要引入区分城镇居民和农村居民的虚拟变量Dtttuxy10举例例1.将居民住房消费函数设定为tttuxy10举例例1.将居民住房消费函数设定为此时,居民住房消费函数为:ttttuDxyD21001农村居民城镇居民例2.公司职员y与工龄x和学历D有关,学历分为三种类型:大专以下,本科,研究生(一个定因素,三个不同属性)。为了反映“学历”这个定因素的影响,应该设置两个虚拟变量:可以将年薪函数模型写成:其他研究生其他本科010121DDttuDDxy231210该模型描述了大专以下.本科和研究生三类年薪函数的差异情况。1、大专以下(即D1=D2=0)的年薪函数:2、本科(即D1=1,D2=0)的年薪函数:3、研究生(即D1=0,D2=1)的年薪函数:ttuxy210ttuxy120)(ttuxy130)(其他大专以下=其他研究生=其他本科010101321DDD:3m,.,21个虚拟变量若引入但此例中薪是否有显著影响的年以判断学历层次对职员可的显著性和通过检验对于每一个职员,只能有一个Di=1,其他的等于0,即D1+D2+D3=1,模型存在完全多重共线性。结论对于m个不同类型的定性因素,应该设置m-1个虚拟变量来反映该因素的影响。仰恩大学03082第五学习小组计量经济学课外调查研究报告课题:关于仰恩大学学生上网费用问题的研究变量:被解释变量y:=月上网费;解释变量x1:=月生活费解释变量x2:=上网兴趣程度注:上网兴趣程度分为:很兴趣.兴趣.一般.不兴趣.完全没兴趣五种类型)(1)(25)(50)(75)(100全没兴趣没兴趣一般兴趣很兴趣x)(0)(1)(0)(121其它兴趣其它很兴趣xx)(0)(13其它一般x)(0)(14其它没兴趣x该组的量化方法两种量化方法那种好?三.虚拟变量模型的处理1.思路.设D是个对模型中的被解释变量有重要影响的虚拟变量.则可用第二节介绍的方法,把它数量化为通常的解释变量包含在模型中.对美国一所大学教师年薪进行调查,取得样本.可见,年薪y与教龄x2及性别D有密切关系.1.把性别数量化为数值型变量x12.建立二元线性回归模型(y:=年薪;x2:=教龄):y=0+1x1+2x2+u3.转换样本成新样本4.用MOLS估计得样本方程21301.1334.3969.17ˆxxy5.样本方程的应用分别把x1=0,x1=1代入样本方程中,各得:女教师平均年薪方程:男教师平均年薪方程:2371.1303.21ˆxy2371.1969.17ˆxy年薪y教龄x2性别量化x123千元1年男119.5千元1年女024千元2年男121千元2年女025千元3年男122千元3年女026.5千元4年男123.1千元4年女025千元5年女028千元5年男129.5千元6年男126千元6年女0年薪y教龄x2性别量化x127.5千元7年女031.5千元7年男129千元8年女0年薪y教龄x2性别量化x1