第八章一、名词解释1、虚拟变量:在建立模型时,有一些影响经济变量的因素无法定量描述,如职业、性别对收入的影响,教育程度,季节因素等往往需要用定性变量度量。为了在模型中反映这类因素的影响,并提高模型的精度,需要将这类变量“量化”。根据这类边另的属性类型,构造仅取“0”或“1”的人工变量,通常称这类变量为“虚拟变量”2、虚拟变量陷阱:一般在引入虚拟变量时要求如果有m个定性变量,字在模型中引入m-1个虚拟变量。否则,如果引入m个虚拟变量,就会导致模型解释变量间出现完全共线性的情况。我们一般称由于引入虚拟变量个数与定性因素个数相同出现的模型无法估计的问题,称为“虚拟变量陷阱”二、单项选择题1、B:“地区”一个,“季节”三个2、A:将D=1代入估计后的方程即可3、D:“季节”包含4个类型,只能用3个虚拟变量,用4个虚拟变量会出现完全多重共线的问题,参数将无法估计4、C:“地区”只有两个类别,引入两个虚拟变量会出现完全多重共线问题5、A:1体现了城镇和农村截距上的差异,1体现了城镇和农村斜率上的差异,当它们为0时,表示无差异6、A:斜率相同,仅截距不同7、D:此问题表现为1000前后斜率的变化,B表示截距的变化,不合适;C在D=0时没有解释变量,不正确;A和D相比,D更合适,A会造成曲线在临界值出断开,但D会保证曲线的连贯的。8、A:虚拟变量表示性别、季节等时,只表示属性的不同,没有等级之分,作为质的因素;表示收入高低时,高与低是有级别的,属于有序数据,可以表示数量的因素。9、A/B:这题比较牵强,按书上原话应该选择B;但当用加法引入虚拟变量时,会存在问题。【当用加法形式引入虚拟变量时,用一个虚拟变量作为截距项,取值全部为1;其他m-1个表示该因素的前三个类型。如果不引入截距项,当虚拟变量都取0时不能解释该因素第四个类型的作用。】10、D:概念性三、多项选择题1、BCD:A太绝对,也可以表示数量因素;E太绝对2、ABCDE:A加法方式;B乘法方式;C临界指标的虚拟变量;D在ABC基础上可构造分段回归3、AB:C当虚拟变量取0或2时,过程一样,但参数的意义稍作调整;D见书P207倒数第二段。四、判断题,并说明理由1、错。理由是2的估计值减半,12,的估计值不变。2、错。理由是虚拟变量的引入并没有违背OLS法的基本假设条件,所以其估计值仍是无偏的。五、计算分析题1、(1)1D参数的经济意义是当销售收入和公司股票收益保持不变时,lnln0.158YY金交,即,金融业CEO的薪水要比交通运输业CEO的薪水多15.8个百分点,其他2个类似解释。(2)公用事业和交通运输业之间的估计薪水的近似百分比差异就是以百分数解释的3D的参数,即28.3%,由于参数的t统计值为-2.895,它的绝对值大于1%显著性水平下,自由度为203的t分布的临界值1.96,故统计显著。(3)由于消费品工业和金融业相对于交通运输业的薪水百分比差异分别为15.8%和18.1%,所以它们之间的差异为8.1%-15.8%=2.3%,一个能直接检验显著性的方程是:01122122334LnYLnXXDDD其中,4D为交通运输业的虚拟变量,对比基准为金融业。2、(1)选择b模型,因为该模型中的D的系数估计值在统计上显著。(2)如果b模型确实更好,而选择了a模型,则犯了模型设定错误,丢失相关解释变量。(3)D的系数表明了现实中比较普遍的现象,男生体重大于女生。3、由于在利率r0.08时,投资I仅取决于利润X;而当利率r≥0.08时,投资I同时取决于利润X和一个固定的级差利润R,故可以建立如下模型来表达上述关系:(a)Ii=β0+β1Xi+RDi+µi其中,08.0,008.0,1rrD假设µi仍服从经典假设E(µi)=0,则有利率r≥0.08时的投资期望:(b)E(Ii|Xi,Di=1)=(β0+R)+β1Xi利率r0.08时的投资期望:(c)E(Ii|Xi,Di=0)=β0+β1Xi从以上看出,假设利率R0,两个投资函数的斜率相同而截距水平不同;当斜率相同的假设成立,对投资函数是否受到利率差异影响的假设检验,可由检验模型(b)和(c)是否具有相同截距加以描述,原假设H0:投资函数不受利率影响。若(a)中参数R估计值的t检验在统计上是显著的,则可以拒绝投资函数不受利率影响的假设。4、(1)从咖啡需求函数的回归方程看,P的系数-0.1647表示咖啡需求的自价格弹性;I的系数0.5115示咖啡需求的收入弹性;P’的系数0.1483表示咖啡需求的交叉价格弹性。(2)咖啡需求的自价格弹性的绝对值较小,表明咖啡是缺乏弹性。(3)P’的系数大于0,表明咖啡与茶属于替代品。(4)从时间变量T的系数为-0.01看,咖啡的需求量应是逐年减少,但减少的速度很慢。(5)虚拟变量在本模型中表示咖啡需求可能受季节因素的影响。(6)从各参数的t检验看,第一季度和第二季度的虚拟变量在统计上是显著的。(7)咖啡的需求存在季节效应,回归方程显示第一季度和第二季度的需求比其他季节少。六、上机练习题1、(1)对利润函数01YX按加法方式引入虚拟变量2D,3D,4D:01223341YDDDX其中2D1,第二季度0,其他季度3D1,第三季度0,其他季度4D1,第四季度0,其他季度EViews软件下,选择“Quick\EstimateEquations”,在出现的对话框中输入“YC@seas(2)@seas(3)@seas(4)X”得如下表所示的估计结果。DependentVariable:YIncludedobservations:24VariableCoefficientStd.Errort-StatisticProb.C6685.8461711.6183.9061550.0009@SEAS(2)1322.463638.42582.0714440.0522@SEAS(3)-218.1681632.1991-0.3450940.7338@SEAS(4)182.169654.35680.2783940.7837X0.0382650.0114833.3322520.0035R-squared0.525596Meandependentvar12838.54AdjustedR-squared0.425721S.D.dependentvar1433.284S.E.ofregression1086.16Akaikeinfocriterion17.00174Sumsquaredresid22415107Schwarzcriterion17.24716Loglikelihood-199.0208F-statistic5.262563Durbin-Watsonstat0.38838Prob(F-statistic)0.005024即有如下OLS估计模型:234ˆ6685.81322.5218.2182.20.0038YDDDX(3.91)(2.07)(-0.35)(0.28)(3.33)20.5256R5.26F..0.388DW回归结果表明,只有销售额与第二季度对利润有显著的影响。销售额增加1美元,则平均利润可增加4美分;第一季度的平均利润水平是6685.8美元,而在第二季度中则可提高1322.5美元。由于其他季度的影响不显著,故可只引入第二季度虚拟变量2D,得如下回归:2ˆ6513.11331.60.0393YDX(4.01)(2.70)(3.72)20.5156R11.18F..0.470DW(2)如果季度因素对利润率产生影响,则可按乘法方式引入虚拟变量:0122334ˆYDXDXDXXEViews软件下,选择“Quick\EstimateEquations”,在出现的对话框中输入“YC@seas(2)*X@seas(3)*X@seas(4)*XX”得如下表所示的估计结果。DependentVariable:YIncludedobservations:24VariableCoefficientStd.Errort-StatisticProb.C6965.8521753.6423.972220.0008@SEAS(2)*X0.0086040.0042372.0305390.0565@SEAS(3)*X-0.0013980.004241-0.3297360.7452@SEAS(4)*X0.0008930.0042590.2095880.8362X0.0364710.0123532.9524150.0082R-squared0.528942Meandependentvar12838.54AdjustedR-squared0.429771S.D.dependentvar1433.284S.E.of1082.323Akaikeinfo16.9946regressioncriterion6Sumsquaredresid22257030Schwarzcriterion17.24009Loglikelihood-198.9359F-statistic5.333675Durbin-Watsonstat0.418713Prob(F-statistic)0.004722可以看出,仍然是第二季度对利润有影响,其他季度的影响不显著,因此只引入第二季度虚拟变量,得如下回归结果:2ˆ6839.20.00870.0372YDXX(4.23)(2.76)(3.51)20.5208R11.41F..0.485DW由此可知,在其他季度,利润率为0.0372,第二季度则增加到0.0459。2、(1)从图形可以看出,酒销售量随时间呈现出逐年增长的趋势,并表现出明显的季节变化态势,每年的第一季度明显高于同年的其他季度。(2)设置如下三个季度虚拟变量1D=10第一季度其它;2D=10第二季度其它;3D=10第三季度其它DependentVariable:YMethod:LeastSquaresDate:06/30/08Time:21:36Sample:1982Q11985Q4Includedobservations:16VariableCoefficientStd.Errort-StatisticProb.C79.132502.28993434.556670.0000@TREND1.3325000.1804727.3834140.0000D116.922502.3461377.2129210.0000D22.5650002.3111701.1098270.2907D31.9075002.2899340.8329930.4226R-squared0.902249Meandependentvar94.47500AdjustedR-squared0.866703S.D.dependentvar8.842511S.E.ofregression3.228383Akaikeinfocriterion5.432146Sumsquaredresid114.6470Schwarzcriterion5.673580Loglikelihood-38.45717F-statistic25.38277Durbin-Watsonstat0.775141Prob(F-statistic)0.000017由于D2、D3的系数不显著,可剔除:DependentVariable:YMethod:LeastSquaresDate:06/30/08Time:21:38Sample:1982Q11985Q4Includedobservations:16VariableCoefficientStd.Errort-StatisticProb.C80.87351.65921248.742160.00008@TREND1.3012200.1736157.4948570.0000D115.369111.8482738.3