第八讲虚拟变量©SchoolofManagementandEconomics,2010计量经济学EconometricsYX怎样得到估计值?估计值可靠吗?是否符合经典假定?X是否列满秩?X是虚拟变量第八讲虚拟变量©SchoolofManagementandEconomics,2010第八讲虚拟变量(教材第6章6.4节、6.5节)第八讲虚拟变量©SchoolofManagementandEconomics,2010什么是虚拟变量?许多经济变量是可以定量度量的,如:商品需求量、价格、收入、产量等。但也有一些影响经济变量的因素无法定量度量,如:职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等等。为了在模型中能够反映这些因素的影响,通常是通过引入“虚拟变量(dummyvariables)”来完成。第八讲虚拟变量©SchoolofManagementandEconomics,2010比较某省三个地区(东部、中部和西部)公立学校教师平均薪水在统计上的差异。各个地区之间是否存在差异?统计上怎样检验?如果存在差异,那么地理位置是否是影响其差异的关键因素?引言第八讲虚拟变量©SchoolofManagementandEconomics,2010从某省的51个县(市)收集了当地教师的平均年薪数据,并处理成Excel文档(data_8.1)。在这51个县(市)中,有13个县(市)属于东部,21个县(市)属于中部,17个县(市)属于西部。引言描述性统计分析仅从均值来看,你的结论是什么?怎样检验东部和西部在均值是否存在显著差异?从t检验来看,你的结论是什么?第八讲虚拟变量©SchoolofManagementandEconomics,2010进行简单统计分析是必要的,但不能深入分析相关问题。除了地理位置,还存在其他因素吗?地理位置真的是影响教师薪水差异的关键因素吗?怎样排除其他因素的影响进行检验?思考题例子:不同地理区域公立学校教师的薪水(data_8.2)比较某省三个地区(东部、中部和西部)公立学校教师平均薪水在统计上的差异。为什么三个地区只设两个虚拟变量?12233121010iiiiiiiYDDYiDD第个县的平均薪水若该县位于某省中部其它若该县位于某省西部其它1212121312123(|1,0)(|0,1)(|0,0)0iiiiiiiiiEYDDEYDDEYDD中部平均薪水:西部平均薪水:东部平均薪水:因此,平均薪水是否有显著差异转化为,是否显著异于12132iiiiYDD给定:数据从回归结果来看,你的结论是什么?根据回归结果,你有什么建议?第八讲虚拟变量©SchoolofManagementandEconomics,2010仅仅是地区因素吗?根据回归结果,你的结论是什么?根据新的回归结果,政府应该补贴哪个地区的教师?第八讲虚拟变量©SchoolofManagementandEconomics,2010虚拟变量的设置原则每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果有m个定性变量,只在模型中引入m-1个虚拟变量。在同一个方程中,可以引入多个虚拟变量来考察多种定性因素的影响。012345iiiiiiiPRICELOTAGEBEFIREBEACHD房屋价格房屋的土地面积建筑年龄卧室数目是否有壁炉是否面朝海滩第八讲虚拟变量©SchoolofManagementandEconomics,2010虚拟变量的引入加法形式:考察截距的不同乘法形式:考察斜率的不同混合形式:截距和斜率同时发生变化iiiiDXY210tttttXDXC210iiiiiiXDDXY)(4310单独采用乘法形式的情况极少。例:考察1992年前后的中国居民的总储蓄-收入关系是否已发生变化。以Y为储蓄,X为收入。1992年前:Yi=1+2Xi+1ii=1,2…,n11992年后:Yi=1+2Xi+2ii=1,2…,n2则有可能出现下述四种情况中的一种:1.1=1,且2=2,称为重合回归。2.11,但2=2,差异仅在其截距,称为平行回归。3.1=1,但22,差异仅在其斜率,称为同截距回归4.11,且22,两个回归完全不同,称为非相似回归。可以运用邹检验。这一问题也可通过引入虚拟变量来解决。将n1与n2次观察值合并,估计以下回归方程:iiiiiiXDDXY)(4310于是有:iiiiXXDYE10),0|(iiiiXXDYE)()(),1|(4130可分别表示1992年后期与前期的储蓄函数。Di为引入的虚拟变量:01iD1992年前1992年后具体的回归结果为:由3与4的t检验可知:参数显著地不等于0,强烈示出两个时期的回归是相异的。1992年前:1992年后:(-6.11)(22.89)(4.33)(-2.55)iiiiiXDDXY4765.03.138028881.015452ˆ2R=0.9836iiXY4116.07.1649ˆiiXY8881.015452ˆ储蓄函数分别为:第八讲虚拟变量©SchoolofManagementandEconomics,2010小结虚拟变量的设置原则虚拟变量的引入形式加法形式乘法形式战略引资与中资银行信用风险第八讲虚拟变量©SchoolofManagementandEconomics,2010中资银行引进境外战略投资者什么是合格的战略投资者?战略引资的现状和特点研究背景第八讲虚拟变量©SchoolofManagementandEconomics,2010战略投资者战略投资者:以资本合作为基础,通过长期持股寻求战略合作关系的投资者。唐双宁“2005中国论坛”:战略投资者应该是注重长期利益、与所入股银行结成利益共同体的投资者。第八讲虚拟变量©SchoolofManagementandEconomics,2010合格的战略投资者1.持股比例不低于5%2.股权持有期在三年以上3.派驻董事4.提供管理经验和技术支持5.入股同质银行不超过两家1.长期持股2.优化治理3.业务合作4.竞争回避五项标准:四项原则:第八讲虚拟变量©SchoolofManagementandEconomics,20102003年12月,银监会出台《境外金融机构投资入股中资金融机构管理办法》:单个境外金融机构向中资金融机构投资入股比例不得超过20%。多个境外金融机构对非上市中资金融机构投资入股比例合计达到或超过25%的,对该非上市金融机构按照外资金融机构实施监督管理。少数股权的特征:5%+20%+25%入股限制:少数股权入股限制:少数股权第八讲虚拟变量©SchoolofManagementandEconomics,2010战略引资的目的监管层意图:用股权换机制、换管理、换技术合作效益和合力效益实现体制和机制的创新迅速提升国有银行竞争力第八讲虚拟变量©SchoolofManagementandEconomics,2010中资银行31家:境外投资者38家4家国有大商业银行:交通银行(2004)、建设银行(2005)、中国银行(2005)、工商银行(2006)10家股份制银行15家城市商业银行2家农村商业银行战略引资现状战略引资现状第八讲虚拟变量©SchoolofManagementandEconomics,2010引进境外战略投资者能否真正提高中资银行的风险管理能力?能?为什么?不能?为什么?怎样检验?战略引资现状研究问题第八讲虚拟变量©SchoolofManagementandEconomics,2010检验中资银行哪方面的风险管理能力?信用风险?流动性风险?操作风险?战略引资现状研究设计选择哪种风险?第八讲虚拟变量©SchoolofManagementandEconomics,2010信用风险不良贷款率流动性风险存款准备金比率同业拆借率存贷比操作风险很难找到合适的代理变量战略引资现状研究设计第八讲虚拟变量©SchoolofManagementandEconomics,2010数据收集能否得到中资银行信用风险方面的数据?收集那些数据?战略引资现状研究数据第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方案方案一:直接比较引资银行与非引资银行的差异方案二:比较引资银行在引资前后的差异那种方案更好呢?方案一存在选择性偏差:引资银行本身就比非引资银行好方案二避免了选择性偏差,但用于估计的样本偏少;更重要的是,不能直接检验引资效果:在相同的时期内,非引资银行也可能发生了显著的变化是否有更好的研究方案呢?第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方法对于方案一,可选用的研究方法:描述性统计分析:均值与中位数的比较回归分析表1中资银行信用风险水平的描述性统计及比较检验指标描述性统计均值标准差中值最小值最大值观测值不良贷款率全部样本8.2612.484.820.00100.00228引资银行6.846.224.380.3328.43109非引资银行9.5716.155.330.00100.00119差异性检验-2.73*-0.95描述性统计结果显示:引资银行的信用风险水平低于非引资银行。问题是:这是因战略引资导致的吗?第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方法研究方法:描述性统计分析:均值与中位数的比较通常不可少,但太简单回归分析第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方法回归分析采用一元回归可以吗?,1,itiitRiskFSIFSI为是否引资虚拟变量,引资银行取1,非引资银行取0。第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方法多元回归分析控制变量,123,1231,2,3,itiiiittttitititRiskJSCBCCBGDPInflationIRSpreadScalFSIeBusinessCAR第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方案方案一:直接比较引资银行与非引资银行的差异方案二:比较引资银行在引资前后的差异那种方案更好呢?方案一存在选择性偏差:引资银行本身就比非引资银行好方案二避免了选择性偏差,但用于估计的样本偏少;更重要的是,不能直接检验引资效果:在相同的时期内,非引资银行也可能发生了显著的变化是否有更好的研究方案呢?第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方案方案一:直接比较引资银行与非引资银行的差异方案二:比较引资银行在引资前后的差异方案三:同时采用引资银行与非引资银行的面板数据,将引资变量作为控制变量,考虑一个引资前后的虚拟变量(AfterFSI)作为解释变量:,12,4,31231,2,3,itiitiiittttitititRiskJSCBCCBGDPInflationIRSpreadScaleBusinAfterFFSIessCARSI在银行完成首次引资前(包括引资当年)取值为0,在引资后取值为1。为什么要这样设定?是否还有类似的问题?第八讲虚拟变量©SchoolofManagementandEconomics,2010研究方案怎样解释回归结果?,12,4,31231,2,3,itiitiiittttiti