第八章-虚拟变量回归

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第八章虚拟变量回归计量经济学引子:定性因素对房地产价格有显著影响吗不断走高的房地产价格已经成为人们关注的重点。很多研究认为,影响商品房价格的因素有多个方面。有关研究表明1,影响商品房价格的因素可分为两类:一类是比较容易量化的定量因素。例如:成本费用因素、房地产供求因素、经济因素、人口因素等。另一类则是不易量化的定性因素。例如:社会因素、区域因素、个别因素、房地产投机因素、自然因素等。这些因素的基本特征则是不易量化的定性因素。21.徐静;武乐杰,房地产价格影响因素的解释结构模型分析,金融经济,2009年10期显然,在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。能否把定性的因素也引入计量经济模型中呢?怎样才能在模型中有效地表示这些定性因素的作用呢?34问题的一般性描述在前面各章的分析中,被解释变量主要是受可以直接度量的定量因素的影响,如收入、产出、商品需求量、价格、成本、资金、人数等。但现实经济生活中,影响被解释变量变动的因素,除了可以直接观测数据的定量变量外,可能还包括一些本质上为定性因素的影响,例如性别、种族、职业、季节、文化程度、战争、自然灾害、政府经济政策的变动等。在实际的经济分析中,这些定性因素有时具有不可忽视的重要作用。例如,研究居民收入水平时,职业、性别、文化程度、就业的地域等因素,通常是值得考虑的影响因素。因此,在计量经济学的建模中有必要将定量因素和定性因素同时纳入回归模型之内。5本章要研究的主要问题是:1.如何将作为解释变量的定性因素引入回归模型?2.这些定性解释变量在回归模型中有何特殊的作用?67第八章虚拟变量回归本章主要讨论:●虚拟变量●虚拟解释变量的回归●虚拟被解释变量的回归(选讲,不包括)8第一节虚拟变量本节基本内容:●基本概念●虚拟变量设置规则9一、基本概念定量因素:可直接测度、数值性的因素。定性因素:属性因素,表征某种属性存在与否的非数值性的因素。基本思想:直接在回归模型中加入定性因素存在诸多的困难(那些困难?),是否可将这些定性因素进行量化,以达到定性因素能与定量因素有着相同作用之目的。10计量经济学中,将取值为0和1的人工变量称为虚拟变量。虚拟变量也称:哑元变量、定性变量等等。通常用字母D或DUM加以表示(英文中虚拟或者哑元Dummy的缩写)。对定性变量的量化可采用虚拟变量的方式实现。虚拟变量的定义11虚拟变量的设置规则涉及三个方面:1.“0”和“1”选取原则2.属性(状态、水平)因素与设置虚拟变量数量的关系3.虚拟变量在回归分析中的角色以及作用等方面的问题二、虚拟变量设置规则12“0”和“1”选取原则虚拟变量取“1”或“0”的原则,应从分析问题的目的出发予以界定。从理论上讲,虚拟变量取“0”值通常代表比较的基础类型;而虚拟变量取“1”值通常代表被比较的类型。“0”代表基期(比较的基础,参照物);“1”代表报告期(被比较的效应)。13例如,比较收入时考察性别的作用。当研究男性收入是否高于女性时,是将女性作为比较的基础(参照物),故有男性为“1”,女性为“0”。例1问题:为何只选0、1,选2、3、4行吗?为什么?D1男(1)=0女D()1改革开放以后2=0改革开放以前1D天气阴()其他13=02D()1天气雨4=0其他14定性因素的属性既可能为两种状态,也可能为多种状态。例如,性别(男、女两种)、季节(4种状态),地理位置(东、中、西部),行业归属,所有制,收入的分组等。属性的状态(水平)数与虚拟变量数量的关系(0,1)(0,0)DD12(1,0)天气阴如:(,)=天气雨其他151.若定性因素具有个相互排斥属性(或几个水平),当回归模型有截距项时,只能引入个虚拟变量;2.当回归模型无截距项时,则可引入个虚拟变量;否则,就会陷入“虚拟变量陷阱”。(为什么?)虚拟变量数量的设置规则()m2-1mmm16研究居民住房消费支出和居民可支配收入之间的数量关系。回归模型的设定为:现在要考虑城镇居民和农村居民之间的差异,如何办?为了对“城镇居民”、“农村居民”进行区分,分析各自在住房消费支出上的差异,设为城镇;为农村,则模型为(模型有截距,“居民属性”定性变量只有两个相互排斥的属性状态(),故只设定一个虚拟变量。)一个例子(虚拟变量陷阱)iXiY011iiiY=+X+u()01112iiiY=+X+D+u()1=1iDiY1=0iD2m17若对两个相互排斥的属性“居民属性”,仍然引入个虚拟变量,则有则模型(1)为则对任一家庭都有:,即产生完全共线,陷入了“虚拟变量陷阱”。“虚拟变量陷阱”的实质是:完全多重共线性。21=0iD农村居民城镇居民0111223iiiYXDDu()121D+D=11=0iD城镇居民农村居民1210D+D-=2m综上可知:1.引入虚拟变量的个数与两个因素有关;一是定性变量的属性多少,一是有无截距项;2.对虚拟变量的运用要谨慎,虚拟变量的使用得当常能发挥积极的作用,但在模型中引入虚拟变量的数量要适当,引入的虚拟变量的数量过度,则可能带来负面的影响。1819虚拟变量既可作为被解释变量,也可作为解释变量,分别称其为虚拟被解释变量和虚拟解释变量。虚拟被解释变量的研究是当前计量经济学研究的前沿领域,如MacFadden、Heckmen等人的微观计量经济学研究,大量涉及到虚拟被解释变量的分析。本课程只是讨论虚拟解释变量的问题虚拟变量在回归模型中的角色20第二节虚拟解释变量的回归本节基本内容:●加法类型●乘法类型●虚拟解释变量综合应用21在计量经济学中,通常引入虚拟变量的方式分为加法方式和乘法方式两种:即对上式可分解为:实质:加法方式引入虚拟变量改变的是截距;乘法方式引入虚拟变量改变的是斜率。0tttYXu1D1tttYXu2tXD0112iiiY=+βX+u=+D=+D原模型加法方式引入乘法方式引入:22以加法方式引入虚拟变量时,主要考虑的问题是定性因素的属性和引入虚拟变量的个数。分为四种情形讨论:(1)解释变量只有一个定性变量而无定量变量,而且定性变量为两种相互排斥的属性;(2)解释变量分别为一个定性变量(两种属性)和一个定量解释变量;一、加法类型23(3)解释变量分别为一个定性变量(两种以上属性)和一个定量解释变量;(4)解释变量分别为两个定性变量(各自分别是两种属性)和一个定量解释变量;思考:四种加法方式引入虚拟变量会产生什么效应?24(1)一个两种属性定性解释变量而无定量变量的情形010iiiiYY城市()0101()iiiiiiiYfDDYD模型形式:例如:010E=1=+E=0=iiiiY|DY|D那么:()10iD城市其中:=(比较的基础:农村)农村农村25(2)一个定性解释变量(两种属性)和一个定量解释变量的情形010110iiiiiiiiiiY=f(DX)+μDY=D+X+μYXD模型形式,例如:城市其中:-支出;-收入;农村010|,1|,0iiiiiiiiEYXDXEYXDX()()010iiiiiiY=++X+μY=+X+μ()城市农村26共同的特征:截距发生改变(?)YX27(3)一个定性解释变量(两种以上属性)和一个定量解释变量的情形120112233123()564110010iiiiiiY=fXDD...+μYXDYDDDXDDD模型形式(如:民族有种特性;季度有种特性)例如:啤酒售量、人均收入、季度;一季度二季度其中:其它其它三季度其它,,,2811230112130213120311230E,1,0E,1,0()E,1,0()E,0iiiiiiiiY|XDDDXY|XDDDXY|XDDDXY|XDDDX一季度:二季度:三季度:四季度:基准:四季度()29(4)两个定性解释变量(均为两种属性)和一个定量解释变量的情形30夏季、城市居民夏季、农村居民1201E=1,=0=+iiiY|X,DDX()+120E|,0,0iiiYXDDX12012E|,1,1iiiYXDDX()1202E|,0,1()iiiYXDDX冬季、城+市居民冬季、农村居民31上述图形的前提条件是什么?DD121,1DD120,10DD121,00DD12,YX32运用OLS得到回归结果,再用t检验讨论因素是否对模型有影响。01122...tttkktttYDDDXu加法方式引入虚拟变量的一般表达式:基本分析方法:条件期望。1201122E(/,,...,)...tttktttkkttYDDDDDDX33加法方式引入虚拟变量的主要作用为:1.在有定量解释变量的情形下,主要改变方程截距;2.在没有定量解释变量的情形下,主要用于方差分析。34基本思想以乘法方式引入虚拟变量时,是在所设立的模型中,将虚拟解释变量与其它解释变量的乘积,作为新的解释变量出现在模型中,以达到其调整设定模型斜率系数的目的。或者将模型斜率系数表示为虚拟变量的函数,以达到相同的目的。乘法引入方式:(1)截距不变;(2)截距和斜率均发生变化;分析手段:仍然是条件期望。iX二、乘法类型35模型形式:例:研究消费支出受收入、年份状况的影响(1)截距不变的情形YX12121()10E|,1()E|,0ttttttttttttttYXDXYXDYXDXYXDX反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份的基础上进行比较,(只有斜率系数发生改变)。12,,tttttY=fXDXuDD36(2)截距和斜率均发生变化例,同样研究消费支出、收入、年份状况间的影响关系。011201121()10E|,1()E|,0tttttttttttttttYXDDXYXDYXDXYXDX反常年份其中:消费支出;收入;正常年份反常年份正常年份在正常年份基础上比较,截距和斜率系数都改变,为什么?模型形式:YX0112,,,ittttYfXDDXDDD37不同截距、斜率的组合图形重合回归:截距斜率均相同平行回归:截距不同斜率相同共点回归:截距相同斜率不同交叉(不同)回归:截距斜率均不同38三、虚拟解释变量综合应用所谓综合应用是指将引入虚拟解释变量的加法方式、乘法方式进行综合使用。基本分析方式仍然是条件期望分析。本节主要讨论(1)结构变化分析;(2)交互效应分析;(3)分段回归分析39(1)结构变化分析结构变化的实质是检验所设定的模型在样本期内是否为同一模型。显然,平行回归、共点回归、不同的回归三个模型均不是同一模型。平行回归模型的假定是斜率保持不变(加法类型,包括方差分析);共点回归模型的假定是截距保持不变(乘法类型,又被称为协方差分析);不同的回归的模型的假定是截距、斜率均为变动的(加法、乘法类型的组合)。40例:比较改革开放前、后我国居民(平均)“储蓄—收入”总量关系是否发生了变化?模型的设定形式为:1212()1:10ttttttttYDXDXuYXD其中为储蓄总额,为收入总额。改革开放后改革开放前41显然,只要、不同时为零,上述模型就能刻画改革开放前后我国居民储蓄收入模型结构是否发生变化。回归方程:2121211E|,12E|,0(3)ttttttYXDXYXDX改革开放后()()改革开放前242问题:1.本

1 / 69
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功