1第二章回归模型思考与练习参考答案2.1参考答案⑴答:解释变量为确定型变量、互不相关(无多重共线性);随机误差项零的值、同方差、非自相关;解释变量与随机误差项不相关。现实经济中,这些假定难以成立。要解决这些问题就得对古典回归理论做进一步发展,这就产生了现代回归理论。⑵答:总体方差是总体回归模型中随机误差项i的方差;参数估计误差则属于样本回归模型中的概念,通常是指参数估计的均方误。参数估计的均方误为MSEiibbˆ=E2ˆiibb=Dibˆ=iiu12即根据参数估计的无偏线,参数估计的均方误与其方差相等。而参数估计的方差又源于总体方差。因此,参数估计误差是总体方差的表现,总体方差是参数估计误差的根源。⑶答:总体回归模型iiixyEy样本回归模型iiieyyˆi是因变量y的个别值iy与因变量y对ix的总体回归函数值ixyE的偏差;ie为因变量y的观测值iy与因变量y的样本回归函数值iyˆ的偏差。ie在概念上类似于i,是对i的估计。对于既定理论模型,OLS法能使模型估计的拟和误差达最小。但或许我们可选择更理想的理论模型,从而进一步提高模型对数据的拟和程度。⑷答:2R检验说明模型对样本数据的拟和程度;F检验说明模型对总体经济关系的近似程度。kknRRknModelTotalkModelkmErrorkModelF111122由02RF可知,F是2R的单调增函数。对每一个临界值F,都可以找到一个2R与之对应,当22RR时便有FF。⑸答:在古典回归模型假定成立的条件下,OLS估计是所有的线形无偏估计量中的有效估计量。⑹答:如果模型通过了F检验,则表明模型中所有解释变量对被解释变量的影响显著。但这并不说明多个解释变量的影响都是显著的。建模开始时,常根据先验知识尽可能找出影响被解释变量的所有因素,这样就可能会选择不重要的因素作为解释变量。对单个解释变量的显著性检验可以剔除这些不重要的影响因素。⑺答:考虑两个经济变量y与x,及一组观测值},,2,1,,niyxii。2若假定这两个变量都是随机的,要确定相关关系的存在性及相关程度,则相应的统计分析就是相关分析。若假定两变量一为随机变量一为确定变量,则相应的统计分析就是回归分析。回归分析以随机变量为因变量而确定型变量为自变量,研究自变量对因变量的影响,对因变量值进行预测。相关分析是回归分析的基础,进行回归分析之前,通常要检验自变量与因变量间、自变量与自变量间是否存在相关关系。2.2参考答案答:考虑一元线形回归模型,iiibxayI=1,2,……,n根据古典回归模型的假定,我们有:0)(iE;0)(,JIE,ji;2)(iD。从而①iiiibxaEbxayE)()(②2)()()(iiiiDbxaDyD③0),()])([(),(jijjiijiEEyyEyyEyyCov2.3参考答案答:对于样本回归模型eBxyˆ,使用OLS法求解Bˆ的微分极值条件为0ex。展开X矩阵,有,,1[1xex…,0]exk①0111121eeeeeni②0)(ˆˆ)ˆ(ˆˆˆˆˆ2121exBexBeBxeyeeeyyyeynnii2.4参考答案答:注意区分模型与函数、总体与样本。模型是满足某些假设条件的方程;样本是来自总体的随机抽样。3总体回归模型:iiiiibxaxyEy)(总体回归函数:iibxaxyE)(样本回归模型:iiiiiexbaeyyˆˆˆ样本回归函数:iixbayˆˆˆ因此,⑵⑷⑺正确。2.5参考答案证:设有一元样本回归模型形式如下:exbbeyy110ˆ1ˆˆ令1110nIMn,则0M为离差幂等阵,并且有010M和eeM0。由)ˆ()ˆ1ˆ(ˆ11011000xbMxbbMyM,从而回归模型的判定系数为yMyxMxbyMybxMbxyMyyMyR01012101011002)ˆ()ˆ()ˆ(ˆˆy与x的相关系数为2101011101210101012101010121010101][ˆ][ˆ][)ˆ(][1yMyxMxbxMxyMyxMxyMxyMyxMxeyMxyMyxMxyMxryx进而yMyxMxbryx0101212)ˆ()(1因此22)(1Rryx证毕。注意:证明过程中隐含了OLS法求解的微分极值条件011exex。于是,有eeeneenIeMn0)1(1111100101exeMx42.6参考答案解:1)ˆ(ˆ2tbSbbprobiii)ˆ(ˆ)ˆ(ˆ22iiiiibStbbbStb,置信度%100)1(。2.7参考答案证:显著性水平为时,2tti。此处隐含了一个零假设0:0bH。从而2)ˆ(ˆ)ˆ(ˆtbSbbSbbtiiiiii即)ˆ(ˆ2iibStb于是,置信度为%100)1(的置信区间]ˆ,ˆ[tSbtSbii必不包含0。2.8参考答案解:ib的95%置信域为)]ˆ(ˆ),ˆ(ˆ[025.0025.0iiiibStbbStb。当所取样本容量30n时,2025.0t。此时,ib的95%置信域为[)]ˆ(2ˆ),ˆ(2ˆ[iiiibSbbSb。对于例4,Lb的置信域近似地为]27.0220.1,27.0220.1[kb的置信域(95%)近似地为]05.0283.0,05.0283.0[①边际产出LMP和KMP的95%置信域②42.4Lt和53.14Kt,均大于1.2)1217(025.0t这表明Lb和Kb的95%置信域均不包含零。换句话说,显著性水平为0.05时,Lb和Kb均显著非零。2.9参考答案答:判定系数2R是解释变量个数K的单调增函数,即0)(2KR。为克服这种缺陷,可采用调整后的判定系数2R。2R可以消除K的影响,即0)(2KR。由1112nTotalknErrorR。可知样本容量n充分大时,221RTotalErrorR。52.10参考答案解:①5.0lnlnxy为收入需求弹性;2.0lnlnpy为价格需求弹性。②%10lnppp,则%102.0lnyyy③价格上涨10%,即%10lnp;需求水平保持不变,即0lny。由pxyln2.0ln5.0ln,得%4lnxxx2.11参考答案解:回归方程下,第一行圆括号内的数值为)ˆ(ibS,第二行为it。在零假设0H:0ib的条件下,)ˆ()0ˆ(iiibSbt。由51.1731.1052.180及16.55.0)58.2(,可以判定各统计量的属性。2.12参考答案解:选择模型的步骤及准则:①先验检验:不合经济原理的模型要排除;②2R检验;③t检验:2t的参数被认为不显著。2.13参考答案解:①ttxy100.098.862ˆ)ˆ(ibS63.580.002it13.5748.54itprob0.0000.0006AdjustedR-squared0.992S.E.ofregression197.89Fprob0.0000100.0xy表明GNP每增一亿,则财政收入增加0.1亿。②00.86318.78017100.098.862100.098.862ˆ19981998xy点预测值。1.2)120(11ˆ025.019981998KtnSyyn=20,k=1S=197.8983.425ˆ19981998yy因此,1998年财政收入的95%置信域为[8205.17,9056.83],这也就是显著性水平为0.05的预测区间。2.14参考答案解:①②2191.005.053.158ˆtttxxy)ˆ(ibS121.810.0050.99it1.3010.55–0.92itprob0.230.0000.38AdjustedR-squared0.93S.E.ofregression20.22Fprob0.00拟合优度高,F检验显著,但t检验表明常数虚拟变量和变量2x均不显著。③2120184.000038.06837.2)(ttttxxxy)ˆ(ibS0.99703.83E-050.0081it2.699.99-2.27itprob0.0270.000.052AdjustedR-squared0.927S.E.ofregression0.16F-statistic57.40Fprob0.00被解释变量经修改后消除了价格因素的影响,从而反映了“实际”的消费支出。这种改变在回归模型上的最直接影响是回归标准差uˆ大大降低,从而参数估计标准差也随之降低,t统计量变大。修改后的模型拟合优度仍旧高,F检验亦显著。在0.05的显著性水平下,常数虚变量和变量1x均显著;若把显著性水平放宽至0.06,则全部解释变量均显著。修改后的模型的回归标准差uˆ=0.16,相对于修改前大大降低。这表明模型预测值大大提高。对城镇居民消费品需求函数模型的调整还可以考虑吸收利率、储蓄、职业、种族、受教育程度等因素作为解释变量。此外。还可以考虑是否可以采用非线形模型的形式等。2.15参考答案解:⑴、⑵:Yhat=87.740-0.730X1+8.045X2Std.Error17.9200.0993.508t-Statistic4.895-7.3762.293R-squared=0.890F-statistic=36.45584⑶略。2.16参考答案答:(1))ln(082.1)ln(954.0014.070735)n(lˆKLtyt)(ibS2.4620.0110.0560.385it-3.1411.34217.0902.808Prob|t|0.0080.2020.0000.015AdustedR-squared0.998S.E.ofregression0.029F-statistic3528578ProbF0.00(2)所谓线性化后的CES生产函数实际为CES生产函数对数化后的泰勒级数近似。理论上CES生产函数的参数与对数化CES生产函数的参数存在一一对应的,因此CES生产函数模型参数可恰好识别。求解过程略。8CES生产函数模型的基本形式为:Y=A(rnLK)21其中,待估参数A为效率参数,是广义技术进步水平的反映,显然A〉0;1和2为分配系数,均为正数并满足1+2=1;为替代参数;m则为规模报酬参数。