第三章课后作业1.多元线性回归模型的基本假设是什么?试说明在证明最小二乘估计量的无偏性和有效性的过程中,哪些基本假设起了作用?答:多元线性回归模型的基本假定有:(1)解释变量是非随机的或固定的,且相互之间互不相关(不存在多重共线性);(2)随机扰动项具有0均值、同方差以及不存在序列相关(不存在自相关);(3)解释变量与随机扰动项不相关;(4)随机扰动项服从正态分布;(5)样本容量趋于无穷时,各解释变量的方差趋于有界常数;(6)回归模型的设定是正确的。在证明最小二乘估计量的无偏性中,利用了解释变量与随机误差项不相关的假定。在有效性的证明中,利用了随机项独立同方差假定。βμXXXβμXβXXXYXXXβ11=′′+=+′′=′′=−−−)()())()(())(()ˆ(1EEEE2.在多元线性回归分析中,t检验和F检验有何不同?在一元线性回归中,二者是否具有等价的作用?解:多元回归中,t检验是针对某一个偏回归系数的显著性检验,而F检验则是针对回归方程总体线性关系的显著性检验。在一元线性回归中,二者具有等价的作用。实际上,在一元线性回归中二者存在如下的关系:2tF=。3.为什么说对模型参数施加约束条件后,其回归的残差平方和一定不比未施加约束的残差平方和小?在什么样的条件下,受约束回归和不受约束回归的结果相同?解:假设无约束样本回归的矩阵表达式为:eXY+=βˆ受约束样本回归的矩阵表达式为:∗∗+=eXYβˆ则受约束样本回归的残差平方和RSSR为:)ˆˆ(ˆˆˆβββββ−−=−+=−=∗∗∗∗XeXeXXYe所以于是eeee**′≥′)ββX(X)ββ(eeee****ˆˆˆˆ−′′−+′=′4.在一项调查大学生一学期平时成绩(Y)与每周在学习(X1)、睡觉(X2)、娱乐(X3)与其它(X4)各种活动所用的时间的关系的研究中,建立如下的回归模型:iiiiiiXXXXYμβββββ+++++=443322110如果这些活动所用时间的总和为一周的总小时数168。问:保持其它条件不变,改变其中一个变量的说法是否有意义?该模型是否违背基本假设的情况?如何修改此模型以使其更加合理?解:保持其它条件不变,改变其中一个变量的说法没有意义;该模型违背了解释变量间不存在多重共线性的基本假设;不能将四个解释变量同时纳入回归模型。5.考虑如下两个模型:(a)iiiiXXYμααα+++=22110(b)iiiiiXXXYνβββ+++=−221101要求:(1)证明:1ˆˆ11−=αβ,00ˆˆαβ=,22ˆˆαβ=(2)证明:残差的最小二乘估计量相同,即:iiuνˆˆ=(3)在何种情况下,模型(b)的拟合优度22R会小于模型(a)拟合优度21R。解:(1)根据OLS估计原理可得:1ˆ)()(ˆ123323222233232222332322223332223323222232332221−=−=−−=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑αβiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiixxxxxxxxxxxxxxxxxxxyxxxyxxxxxxxxxyxxxxyx&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&223323222323222222332322233222223323222233222222ˆ)()(ˆαβ=−=−−=∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑∑iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiixxxxxxxxxxxxxxxxxxyxxxyxxxxxxxxxyxxxxyxx&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&&(2)0221112211122110ˆˆˆ)(ˆ)1ˆ()(ˆˆˆβββααααα=−−−=−−−−=−−=XXXYXXXYXXY证毕。(3)设:iiiXYZ1−=(a)式的拟合优度为:∑∑−−=−=222)(ˆ11YYuTSSESSRiia(b)式的拟合优度为:∑∑−−=−=222)(11ZZTSSESSRiibν在(2)中已经证得iiuνˆˆ=成立,即二式分子相同,若要模型(b)的拟合优度2bR小于模型(a)的拟合优度2aR,必须满足:22)()(YYZZii−−∑∑。6.考虑下列三个实验步骤:(1)对iiiiXXYμβββ+++=22110进行回归;(2)对iiiXXναα++=2101进行回归,计算残差iνˆ;(3)对iiiiwXY+++=2210ˆγνγγ进行回归。试证明11ˆˆγβ=,并直观的解释该结果。证明:根据OLS估计原理依次求解上述待估参数可证明。或由回归方程(2)可得残差iνˆ为:iiiXX2101ˆˆˆααν−−=,将其带入回归方程(3)可得:iiiiiiiiwXXwXXXY+−++−=++−−+=21121101022210110)ˆ()ˆ()ˆˆ(αγγγαγγγααγγ将上式与回归方程(1)比较,可得到:∧∧−==−=)ˆ(ˆˆˆ)ˆ(ˆ1122110100αγγβγβαγγβ7.考虑如下过原点回归:iiiieXXY++=2211ˆˆββ(1)求参数的OLS估计量;(2)对该模型,是否仍然有结论∑=0ie;∑=01iiXe;∑=02iiXe解:(1)222112)ˆˆ(iiiiXXYeQββ−−==∑∑所以OLS估计的正规方程组为:⎪⎪⎩⎪⎪⎨⎧=⇒=−−−=∂∂=⇒=−−−=∂∂∑∑∑∑00)()ˆˆ(2ˆ00))(ˆˆ(2ˆ22221121122111iiiiiiiiiiiiXeXXXYQXeXXXYQββββββ此时,正规方程组仅包含两个正规方程。∑=0ie将不再成立,而∑=01iiXe和∑=02iiXe仍然成立。8.对下列模型:(a)iiiiuzxy+++=2βα(b)iiiiuzxy+−+=ββα求出β的最小二乘估计值;并将结果与下面的三变量回归方程的最小二乘估计值作比较:(c)iiiiuzxy+−+=γβα,你认为哪一个估计值更好?将模型⑴改写成iiiiuxzy++=−βα)2(,则β的估计值为:∑∑−−−=2)()2)((ˆxxzyxxiiiiβ将模型⑵改写成iiiiuzxy+−+=)(βα,则β的估计值为:∑∑+−−+−−=2)()(ˆzxzxyzxzxiiiiiβ这两个模型都是三变量回归模型⑶在某种限制条件下的变形。如果限制条件正确,则前两个回归参数会更有效;如果限制条件不正确则前两个回归参数会有偏。9.下表给出三变量模型的回归结果:方差来源平方和(SS)自由度(d.f.)平方和的均值来自回归65965——来自残差———总离差(TSS)6604214要求:(1)样本容量是多少?(2)求RSS?(3)ESS和RSS的自由度各是多少?(4)求2R和2R?(5)检验假设:2X和3X对Y无影响。你用什么假设检验?为什么?(6)根据以上信息,你能否确定2X和3X各自对Y的贡献吗?解:(1)样本容量为16。(2)RSS=TSS-ESS=66042-65965=77(3)ESS的自由度为2;RSS的自由度为13。(4)9988.06604277112=−=−==TSSRSSTSSESSR9987.0)116(66042)1216(771)1/()1/(12=−−−−=−−−−=nTSSknRSSR(5)检验假设:2X和3X对Y无影响。将用到方程总体线性显著性的F检验。(6)不能确定。11.下表给出了中国2000年30个省级单位(西藏自治区没被纳入)GDP总值Y(亿元)、资本存量K(亿元)以及劳动力人数L(万人)的数据。地区GDPKL北京24797041622天津16393846407河北508994863441山西164432051419内蒙古140124611017辽宁466975971813吉林182133721079黑龙江325357551635上海455110809673江苏8583156423559浙江6036107982700安徽303853913373福建392062811660江西200332811935山东8542146944662河南513886255572湖北427651852508湖南369257223462广东9662160843861广西205034052530海南5181275334重庆158929101636四川401073444436贵州99422822046云南195541332295陕西166142491813甘肃98316801182青海264739239宁夏266820274新疆13643673672设定生产函数为μβαeLAKY=(1)利用上述资料,进行回归。(2)回答:中国2000年各地区的生产呈现规模报酬不变状态吗?