12第一章绪论1-14.计量经济模型中为何要包括随机误差项?简述随机误差项形成的原因。答:由于客观经济现象的复杂性,以至于人们目前仍难以完全地透彻地了解它的全貌。对于某一种经济现象而言,往往受到很多因素的影响,而人们在认识这种经济现象的时候,只能从影响它的很多因素中选择一种或若干种来说明。这样就会有许多因素未被选上,这些未被选上的因素必然也会影响所研究的经济现象。因此,由被选因素构成的数学模型与由全部因素构成的数学模型去描述同一经济现象,必然会有出入。为使模型更加确切地说明客观经济现象,所以有必要引入随机误差项。随机误差项形成的原因:①在解释变量中被忽略的因素;②变量观测值的观测误差;③模型的关系误差或设定误差;④其他随机因素的影响。第二章一元线性回归模型例1、令kids表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为educkids10(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗?(2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。解答:(1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。(2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰动项相关的情形,基本假设4不满足。例2.已知回归模型NE,式中E为某类公司一名新员工的起始薪金(元),N为所受教育水平(年)。随机扰动项的分布未知,其他所有假设都满足。(1)从直观及经济角度解释和。(2)OLS估计量ˆ和ˆ满足线性性、无偏性及有效性吗?简单陈述理由。(3)对参数的假设检验还能进行吗?简单陈述理由。解答:(1)N为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金为,因此表示没有接受过教育员工的平均起始薪金。是每单位N变化所引起的E的变化,即表示每多接受一年学3校教育所对应的薪金增加值。(2)OLS估计量ˆ和仍ˆ满足线性性、无偏性及有效性,因为这些性质的的成立无需随机扰动项的正态分布假设。(3)如果t的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立在的正态分布假设之上的。例6.对于人均存款与人均收入之间的关系式tttYS使用美国36年的年度数据得如下估计模型,括号内为标准差:)011.0()105.151(067.0105.384ˆttYS2R=0.538023.199ˆ(1)的经济解释是什么?(2)和的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话,你可以给出可能的原因吗?(3)对于拟合优度你有什么看法吗?(4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么?解答:(1)为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变化量。(2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此符号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期的符号为正。实际的回归式中,的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对截距项的估计产生影响;另一种可能就是线性设定可能不正确。(3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度,表明收入的变化可以解释储蓄中53.8%的变动。(4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。双变量情形下在零假设下t分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09,截距项计算的t值为384.105/151.105=2.54。可见斜率项计算的t值大于临界值,截距项小于临界值,因此拒绝斜率项为零的假设,但不拒绝截距项为零的假设。2-22.假设王先生估计消费函数(用模型iiiubYaC表示),并获得下列结果:iiYC81.015,n=19(3.1)(18.7)R2=0.98这里括号里的数字表示相应参数的T比率值。要求:(1)利用T比率值检验假设:b=0(取显著水平为5%);(2)确定参数估计量的标准方差;(3)构4造b的95%的置信区间,这个区间包括0吗?解:⑴这是一个横截面序列回归。(图略)⑵截距2.6911表示咖啡零售价在t时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在t时刻,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯;⑶不能;⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值及与之对应的Y值。第三章、多元线性回归模型例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为fedumedusibsedu210.0131.0094.036.10R2=0.214式中,edu为劳动力受教育年数,sibs为该劳动力家庭中兄弟姐妹的个数,medu与fedu分别为母亲与父亲受到教育的年数。问(1)sibs是否具有预期的影响?为什么?若medu与fedu保持不变,为了使预测的受教育水平减少一年,需要sibs增加多少?(2)请对medu的系数给予适当的解释。(3)如果两个劳动力都没有兄弟姐妹,但其中一个的父母受教育的年数为12年,另一个的父母受教育的年数为16年,则两人受教育的年数预期相差多少?解答:(1)预期sibs对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下,子女越多的家庭,每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义,sibs前的参数估计值-0.094表明,在其他条件不变的情况下,每增加1个兄弟姐妹,受教育年数会减少0.094年,因此,要减少1年受教育的时间,兄弟姐妹需增加1/0.094=10.6个。(2)medu的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时,母亲每增加1年受教育的机会,其子女作为劳动者就会预期增加0.131年的教育机会。(3)首先计算两人受教育的年数分别为10.36+0.13112+0.21012=14.45210.36+0.13116+0.21016=15.816因此,两人的受教育年限的差别为15.816-14.452=1.364例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X1)与利润占销售额的比重(X2)为解释变量,一个有32容量的样本企业的估计结果如下:099.0)046.0()22.0()37.1(05.0)log(32.0472.0221RXXY其中括号中为系数估计值的标准差。(1)解释log(X1)的系数。如果X1增加10%,估计Y会变化多少个百分点?这在经济上是一个很大5的影响吗?(2)针对R&D强度随销售额的增加而提高这一备择假设,检验它不虽X1而变化的假设。分别在5%和10%的显著性水平上进行这个检验。(3)利润占销售额的比重X2对R&D强度Y是否在统计上有显著的影响?解答:(1)log(x1)的系数表明在其他条件不变时,log(x1)变化1个单位,Y变化的单位数,即Y=0.32log(X1)0.32(X1/X1)=0.32100%,换言之,当企业销售X1增长100%时,企业研发支出占销售额的比重Y会增加0.32个百分点。由此,如果X1增加10%,Y会增加0.032个百分点。这在经济上不是一个较大的影响。(2)针对备择假设H1:01,检验原假设H0:01。易知计算的t统计量的值为t=0.32/0.22=1.468。在5%的显著性水平下,自由度为32-3=29的t分布的临界值为1.699(单侧),计算的t值小于该临界值,所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下,t分布的临界值为1.311,计算的t值小于该值,拒绝原假设,意味着R&D强度随销售额的增加而增加。(3)对X2,参数估计值的t统计值为0.05/0.46=1.087,它比在10%的显著性水平下的临界值还小,因此可以认为它对Y在统计上没有显著的影响。例3.下表为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值(括号内为p-值)(如果某项为空,则意味着模型中没有此变量)。数据为美国40个城市的数据。模型如下:statetaxlocaltaxunemppopchangincomevaluedensityghou76543210sin式中housing——实际颁发的建筑许可证数量,density——每平方英里的人口密度,value——自由房屋的均值(单位:百美元),income——平均家庭的收入(单位:千美元),popchang——1980~1992年的人口增长百分比,unemp——失业率,localtax——人均交纳的地方税,statetax——人均缴纳的州税变量模型A模型B模型C模型DC813(0.74)-392(0.81)-1279(0.34)-973(0.44)Density0.075(0.43)0.062(0.32)0.042(0.47)Value-0.855(0.13)-0.873(0.11)-0.994(0.06)-0.778(0.07)Income110.41(0.14)133.03(0.04)125.71(0.05)116.60(0.06)Popchang26.77(0.11)29.19(0.06)29.41(0.001)24.86(0.08)Unemp-76.55(0.48)Localtax-0.061(0.95)Statetax-1.006(0.40)-1.004(0.37)RSS4.763e+74.843e+74.962e+75.038e+7R20.3490.3380.3220.3122ˆ1.488e+61.424e+61.418e+61.399e+6AIC1.776e+61.634e+61.593e+61.538e+6(1)检验模型A中的每一个回归系数在10%水平下是否为零(括号中的值为双边备择p-值)。根据检验结果,你认为应该把变量保留在模型中还是去掉?(2)在模型A中,在10%水平下检验联合假设H0:i=0(i=1,5,6,7)。说明被择假设,计算检验统计值,说明其在零假设条件下的分布,拒绝或接受零假设的标准。说明你的结论。(3)哪个模型是“最优的”?解释你的选择标准。6(4)说明最优模型中有哪些系数的符号是“错误的”。说明你的预期符号并解释原因。确认其是否为正确符号。解答:(1)直接给出了P-值,所以没有必要计算t-统计值以及查t分布表。根据题意,如果p-值0.10,则我们拒绝参数为零的原假设。由于表中所有参数的p-值都超过了10%,所以没有系数是显著不为零的。但由此去掉所有解释变量,则会得到非常奇怪的结果。其实正如我们所知道的,多元回去归中在省略变量时一定要谨慎,要有所选择。本例中,value、income、popchang的p-值仅比0.1稍大一点,在略掉unemp、localtax、statetax的模型C中,这些变量的系数都是显著的。(2)针对联合假设H0:i=0(i=1,5,6,7)的备择假设为H1:i=0(i=1,5,6,7)中至少有一个不为零。检验假设H0,实际上就是参数的约束性检验,非约束模型为模型A,约束模型为模型D,检验统计值为462.0)840/()7763.4()37