《计量经济学导论》伍德里奇-第四版-笔记和习题答案(2-8章)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

使用普通最小二乘法,此时最小化的残差平方和为211niiiyx利用一元微积分可以证明,1必须满足一阶条件110niiiixyx从而解出1为:1121niiiniixyx当且仅当0x时,这两个估计值才是相同的。2.2课后习题详解一、习题1.在简单线性回归模型01yxu中,假定0Eu。令0Eu,证明:这个模型总可以改写为另一种形式:斜率与原来相同,但截距和误差有所不同,并且新的误差期望值为零。证明:在方程右边加上0Eu,则0010yxu令新的误差项为0eu,因此0Ee。新的截距项为00,斜率不变为1。2.下表包含了8个学生的ACT分数和GPA(平均成绩)。平均成绩以四分制计算,且保留一位小数。studentGPAACT12.82123.42433.02643.52753.62963.02572.72583.730(Ⅰ)利用OLS估计GPA和ACT的关系;也就是说,求出如下方程中的截距和斜率估计值01ˆˆGPAACT^评价这个关系的方向。这里的截距有没有一个有用的解释?请说明。如果ACT分数提高5分,预期GPA会提高多少?(Ⅱ)计算每次观测的拟合值和残差,并验证残差和(近似)为零。(Ⅲ)当20ACT时,GPA的预测值为多少?(Ⅳ)对这8个学生来说,GPA的变异中,有多少能由ACT解释?试说明。答:(Ⅰ)变量的均值为:3.2125GPA,25.875ACT。15.8125niiiGPAGPAACTACT根据公式2.19可得:1ˆ5.8125/56.8750.1022。根据公式2.17可知:0ˆ3.21250.102225.8750.5681。因此0.56810.1022GPAACT^。此处截距没有一个很好的解释,因为对样本而言,ACT并不接近0。如果ACT分数提高5分,预期GPA会提高0.1022×5=0.511。(Ⅱ)每次观测的拟合值和残差表如表2-3所示:表2-3iGPAGPA^ˆu12.82.71430.085723.43.02090.379133.03.2253-0.225343.53.32750.172553.63.53190.068163.03.1231-0.123172.73.1231-0.423183.73.63410.0659根据表可知,残差和为-0.002,忽略固有的舍入误差,残差和近似为零。(Ⅲ)当20ACT,则0.56810.1022202.61GPA^。(Ⅳ)残差平方和为:21ˆ0.4347niiu,而211.0288niiyy,则判定系数为:21SSR/SST10.4377/1.02880.577RGPA的变异中,有57.7%能由ACT解释。3.令kids表示一名妇女生过的孩子数目,educ表示该妇女接受过教育的年数。生育率对受教育年数的简单回归模型为01kidseducu其中,u是无法观测到的误差。(Ⅰ)u中包含什么样的因素?它们可能与受教育程度相关吗?(Ⅱ)简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。答:(Ⅰ)收入、年龄和家庭背景(如兄弟姐妹的数量)都可能包含在误差项中。它们可能是与受教育程度相关的:收入和受教育程度是呈正相关的;年龄与受教育程度是呈负相关的;兄弟姐妹的数量与受教育程度是负相关的。(Ⅱ)假定(Ⅰ)中所列举的因素固定不变,即以误差项的形式呈现在回归方程中,但是误差项与解释变量是相关的,因此0Eueduc,经典假定被推翻,因此简单回归分析不能解释教育对生育率在其他条件不变下的影响。4.假设你对估计花在SAT备考课程上的小时数(hours)对SAT总分(sat)的影响感兴趣。总体是某一年内所有计划上大学的中学高年级学生。(Ⅰ)假设你有权进行一项控制实验。请说明为了估计hours对sat的引致效应,你将如何构建实验。(Ⅱ)考虑一个更加实际的情形,即由学生选择在备考课程上花多少时间,而你只能随机地从总体中抽出sat和hours的样本。将总体模型写作如下形式:01sathoursu其中,与通常带截距的模型一样,我们可以假设0Eu。列举出至少两个u中包含的因素。这些因素与hours可能呈正相关还是负相关?(Ⅲ)在(Ⅱ)的方程中,如果备考课程有效,那么1的符号应该是什么?(Ⅳ)在(Ⅱ)的方程中,0该如何解释?答:(Ⅰ)构建实验时,首先随机分配准备课程的小时数,以保证准备课程的时间与其他影响SAT的因素是独立的。然后收集实验中每个学生SAT的数据,建立样本1,:,,iisathourin,n表示试验中所包括的学生的数量。根据方程2.7,应该尝试采用尽可能多的有差异的“小时数”。(Ⅱ)误差项还可能包含以下三个因素:天赋能力、家庭收入以及考试当天的健康状况。如果学生拥有天赋能力,那么他们不需要为考试花费太多时间,能力与时间是负相关的。家庭收入与学习时间呈正相关关系,因为家庭收入越高,就能负担去越多的课时费用。排除慢性的健康问题,考试当天的健康状况与为准备考试花费的时间是无关的。(Ⅲ)如果备考课程有效,1的符号应该为正,在其他因素相同的情况下,备考时间越多,sat越高。(Ⅳ)截距有一个有用的解释:因为0EU,0表示备考时间为0时学生获得的平均sat总分。5.考虑储蓄函数01savincu,uince其中,e是一个随机变量,且有0Ee和2Varee,假设e独立于inc。(Ⅰ)证明:若|0Euinc,则满足零条件均值的关键假设(假定SLR.4)。[提示:若e独立于inc,则|EuincEe](Ⅱ)证明:若2Var|euincinc,则不满足同方差假定SLR.5。特别地,sav的方差随着inc而增加。[提示:若e和inc独立,则Var|Vareince。](Ⅲ)讨论支持储蓄方差随着家庭收入递增的证据。证明:(Ⅰ)计算inc的条件期望值时,inc变为一个常数,因此|0EuincEinceincincEeinc。(Ⅱ)inc的方差为:22Var|VarVareuincinceincinceincinc。(Ⅲ)低收入家庭支出的灵活性较低,因为低收入家庭必须首先支付衣食住行等必需品。而高收入家庭具有较高的灵活性,部分选择更多的消费,而另一部分家庭选择更多的储蓄。这种较高的灵活性暗示高收入家庭中储蓄的变动幅度更大。6.令0ˆ和1ˆ分别为OLS截距和斜率估计量,并令u为误差(不是残差)的样本均值。(Ⅰ)证明:1ˆ可写成111ˆniiiwu,其中/SSTiiiwd和iidxx。(Ⅱ)利用(Ⅰ)及10niiw,证明:1ˆ和u无关。[提示:要求你证明11ˆ0Eu](Ⅲ)证明0ˆ可写成0011ˆˆux。(Ⅳ)利用(Ⅱ)和(Ⅲ)证明:2220ˆVarSSTxnx//。(Ⅴ)(Ⅳ)中的表达式能简化成方程(2.58)吗?[提示:2121SST/nxiinnxx。]证明:(Ⅰ)该理论推导与公式2.52的推导本质上是一样的,区别只是将/SSTiiiwd带到求和的里面。(Ⅱ)因为111ˆˆcovuEu,,公式右边等于0。从(Ⅰ)可知,1111ˆnniiiiiiEuEwuwEuu。因为误差项两两互不相关,则0ihEuu,ih,22//iiEuuEunn。因此22111//0nnniiiiiiiwEuuwnnw。(Ⅲ)最小二乘估计的截距公式为:0ˆˆyx,代入01yxu,则0011011ˆˆˆxuxux。(Ⅳ)因为1ˆ和u是不相关的,则有:222222201xˆˆVarVarVar//SST//SSTxuxnxnx(Ⅴ)能。根据2121SST/nxiinnxx,则2202122221211ˆVarSST//SST/SST/SSTxxnniixiixnxnxxxnx7.利用KielandMcClain(1995)有关1988年马萨诸塞州安德沃市的房屋出售数据,如下方程给出了房屋价格(price)和距离一个新修垃圾焚化炉的距离(dist)之间的关系:2log9.400.312log1350.162pricedistnR^,(Ⅰ)解释logdist的系数。它的符号是你所预期的吗?(Ⅱ)你认为简单回归给出了price对dist在其他条件不变下弹性的无偏估计量吗?(考虑一个城市决定放置焚化炉的地点的决策。)(Ⅲ)还有哪些其他因素影响房屋的售价?这些因素会与距离焚化炉的远近相关吗?答:(Ⅰ)符号为正,与预期相符。logdist的系数表示距离焚化炉的距离越远,价格就越高,价格的距离弹性是0.312,即距离远1%,价格上升0.312%。(Ⅱ)如果城市决定将焚化炉放置在远离较贵的居民区的地方,则logdist与房价是正相关的。这将违背假定4,而OLS估计是有偏的。(Ⅲ)房屋的面积、洗手间的数量、占地面积大小、房龄社区质量(包括学校质量)都会影响房屋的售价。这些与距离焚化炉的远近是有关的。8.(Ⅰ)令0ˆ和1ˆ为iy对ix进行回归的截距和斜率(有n次观测);1c和2c为常数且20c;0和1为1icy对2icx进行回归的截距和斜率。证明120ˆˆ/cc1且010ˆˆc,从而验证了2.4节中关于度量单位的命题。[提示:为得到1,把改变了度量单位的x和y代入方程(2.19)。然后用方程(2.17)求0,确定代入的是进行度量单位变换后的x和y以及正确的斜率。(Ⅱ)现在令0和1得自(1icy)对(2icx)的回归(对1c和2c不加任何限制)。证明:11ˆˆ且00121ˆˆˆcc。(Ⅲ)令0ˆ和1ˆ为logiy对ix回归的OLS估计值,其中我们必须假定对所有i,都有0iy。对10c,令0和1为1logicy对ix回归的截距和斜率.证明:11ˆˆ且010ˆˆlogc。(Ⅳ)现在假定对所有i,都有0x。令0和1为iy对2logicx回归的截距和斜率。1和1与iy对logix回归的截距和斜率相比如何?答:(Ⅰ)因为11cycy,2xcxcx,当为1icy对2icx进行回归时,可以通过方程2.19得到方程的斜率:2211121112222221111112221ˆˆ=nniiiiiinniiiiniiiniicxcxcycyccxxyycxcxcxxxxyyccccxx根据公式2.17可得截距项为:0112112121110ˆˆˆˆˆ/cycxcycccxcyxc(Ⅱ)使用与(Ⅰ)相同的方法,可得11cycy,22cxcx。因此1111iiicycycycyyy,22iicxcxxx。在(1icy)对(2icx)的回归中,1c和2c被完全排除在斜率公式以外,以及11ˆˆ。截距为:011211211210121ˆˆˆˆˆˆˆcycxcycxyxcccc。(Ⅲ)因为11logloglogiicycy,令1c代替1logc,iy代替logiy,且

1 / 80
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功