第7章虚拟变量回归

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第七章虚拟变量回归计量经济学1在对在校学生的消费行为进行的调查中,发现在校生的消费行为呈现多元化的结构。人际交往消费、手机类消费、衣着类消费、化妆品类消费、电脑类消费、旅游类消费占有较大的比例;而食品类消费、学习用品类消费不突显。显然,男女生在消费上存在差异。为了了解男、女生的消费支出结构差异,应当如何建立模型?面临的问题:如何把男女生这样的非数量变量引入方程?引子:男女大学生消费真有差异吗?2问题的一般性描述在实际建模中,一些定性变量具有不可忽视的重要影响。例如,研究某个企业的销售水平,产业属性(制造业、零售业)、所有制(私营、非私营)、地理位置(东、中、西部)、管理者的素质、不同的收入水平等是值得考虑的重要影响因素,但这些因素共同的特征是定性描述的。如何对非定量因素进行回归分析?采用“虚拟变量”对定性变量进行量化一种思路。3第八章虚拟变量回归本章主要讨论:●虚拟变量●虚拟解释变量的回归●虚拟被解释变量的回归(选讲,不包括)4第一节虚拟变量本节基本内容:●基本概念●虚拟变量设置规则5一、基本概念定量因素:可直接测度、数值性的因素。定性因素:属性因素,表征某种属性存在与否的非数值性的因素。基本思想:直接在回归模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的。6计量经济学中,将取值为0和1的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母D或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。对定性变量的量化可采用虚拟变量的方式实现。虚拟变量的定义7虚拟变量的设置规则涉及三个方面:1.“0”和“1”选取原则2.属性(状态、水平)因素与设置虚拟变量数量的关系3.虚拟变量在回归分析中的角色以及作用等方面的问题二、虚拟变量设置规则8“0”和“1”选取原则虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。“0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。9例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。例1问题:为何只选0、1,选2、3、4行吗?为什么?D1男(1)=0女D()1改革开放以后2=0改革开放以前1D天气阴()其他13=02D()1天气雨4=0其他10定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。属性的状态(水平)数与虚拟变量数量的关系(0,1)(0,0)DD12(1,0)天气阴如:(,)=天气雨其他111.若定性因素具有个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入个虚拟变量;2.当回归模型无截距项时,则可引入个虚拟变量;否则,就会陷入“虚拟变量陷阱”。(为什么?)虚拟变量数量的设置规则()m2-1mmm12研究居民住房消费支出和居民可支配收入之间的数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?为了对“城镇居民”、“农村居民”进行区分,分析各自在住房消费支出上的差异,设为城镇;为农村,则模型为(模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态(),故只设定一个虚拟变量。)一个例子(虚拟变量陷阱)iXiY011iiiY=+X+u()01112iiiY=+X+D+u()1=1iDiY1=0iD2m13若对两个相互排斥的属性“居民属性”,仍然引入个虚拟变量,则有则模型(1)为则对任一家庭都有:,即产生完全共线,陷入了“虚拟变量陷阱”。“虚拟变量陷阱”的实质是:完全多重共线性。21=0iD农村居民城镇居民0111223iiiYXDDu()121D+D=11=0iD城镇居民农村居民1210D+D-=2m14虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。本课程只是讨论虚拟解释变量的问题虚拟变量在回归模型中的角色15第二节虚拟解释变量的回归本节基本内容:●加法类型●乘法类型●虚拟解释变量综合应用16在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即实质:加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。0tttYXu1D1tttYXu2tXD0112iiiY=+βX+u=+D=+D原模型加法方式引入乘法方式引入:17以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。分为四种情形讨论:(1)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;(2)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;一、加法类型18(3)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;(4)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量;思考:四种加法方式引入虚拟变量会产生什么效应?19(1)一个两种属性定性解释变量而无定量变量的情形010iiiiYY城市()0101()iiiiiiiYfDDYD模型形式:例如:010E=1=+E=0=iiiiY|DY|D那么:()10iD城市其中:=(比较的基础:农村)农村农村20(2)一个定性解释变量(两种属性)和一个定量解释变量的情形010110iiiiiiiiiiY=f(DX)+μDY=D+X+μYXD模型形式,例如:城市其中:-支出;-收入;农村010|,1|,0iiiiiiiiEYXDXEYXDX()()010iiiiiiY=++X+μY=+X+μ()城市农村21共同的特征:截距发生改变(?)YX22(3)一个定性解释变量(两种以上属性)和一个定量解释变量的情形120112233123()564110010iiiiiiY=fXDD...+μYXDYDDDXDDD模型形式(如:民族有种特性;季度有种特性)例如:啤酒售量、人均收入、季度;一季度二季度其中:其它其它三季度其它,,,2311230112130213120311230E,1,0E,1,0()E,1,0()E,0iiiiiiiiY|XDDDXY|XDDDXY|XDDDXY|XDDDX一季度:二季度:三季度:四季度:基准:四季度()24(4)两个定性解释变量(均为两种属性)和一个定量解释变量的情形25夏季、城市居民夏季、农村居民1201E=1,=0=+iiiY|X,DDX()+120E|,0,0iiiYXDDX12012E|,1,1iiiYXDDX()1202E|,0,1()iiiYXDDX冬季、城+市居民冬季、农村居民26上述图形的前提条件是什么?DD121,1DD120,10DD121,00DD12,YX27运用OLS得到回归结果,再用t检验讨论因素是否对模型有影响。01122...tttkktttYDDDXu加法方式引入虚拟变量的一般表达式:基本分析方法:条件期望。1201122E(/,,...,)...tttktttkkttYDDDDDDX28加法方式引入虚拟变量的主要作用为:1.在有定量解释变量的情形下,主要改变方程截距;2.在没有定量解释变量的情形下,主要用于方差分析。29基本思想以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟解释变量与其它解释变量的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的。乘法引入方式:(1)截距不变;(2)截距和斜率均发生变化;分析手段:仍然是条件期望。二、乘法类型30模型形式:例:研究消费支出受收入、年份状况的影响(1)截距不变的情形YX12121()10E|,1()E|,0ttttttttttttttYXDXYXDYXDXYXDX反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份的基础上进行比较,(只有斜率系数发生改变)。12,,tttttY=fXDXuDD31(2)截距和斜率均发生变化例,同样研究消费支出、收入、年份状况间的影响关系。011201121()10E|,1()E|,0tttttttttttttttYXDDXYXDYXDXYXDX反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份基础上比较,截距和斜率系数都改变,为什么?模型形式:YX0112,,,ittttYfXDDXDDD32不同截距、斜率的组合图形重合回归:截距斜率均相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同33三、虚拟解释变量综合应用所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。基本分析方式仍然是条件期望分析。本课主要讨论(1)结构变化分析;(2)交互效应分析;(3)分段回归分析34(1)结构变化分析结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。35例:比较改革开放前、后我国居民(平均)“储蓄—收入”总量关系是否发生了变化?模型的设定形式为:1212()1:10ttttttttYDXDXuYXD其中为储蓄总额,为收入总额。改革开放后改革开放前36显然,只要、不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生变化。回归方程:2121211E|,12E|,0(3)ttttttYXDXYXDX改革开放后()()改革开放前237问题:1.本例中,平行、共点回归、不同的回归三模型的经济学背景解释是什么?2.如何进行结构变化判断?3.是否可对(2)、(3)分别进行OLS估计?为什么?4.若分别对(2)、(3)进行OLS估计应注意什么?38(2)交互效应分析交互作用:一个解释变量的边际效应有时可能要依赖于另一个解释变量。为此,Klein和Morgen(1951)提出了有关收入和财产在决定消费模式上相互作用的假设。他们认为消费的边际倾向不仅依赖于收入,而且也依赖于财产的多少——较富有的人可能会有不同的消费倾向。39为了捕获该影响,设。假设边际消费倾向依赖于财产。一个简单的表示方法就是。代入消费函数,有:由于捕获了收入和财产之间的相互作用而被称为交互作用项。显然,刻画交互作用的方法,在变量为数量(定量)变量时,是以乘法方式引入虚拟变量的。CYuCYYZu12Z12ZYZ40例:是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响研究。模型设定为:(1)式中,以加法形式引入虚拟变量暗含何假设?122

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功