1四、习题参考答案2-1.答:⑴总体回归函数是指在给定iX下的Y的分布的总体均值与iX有函数关系。⑵样本回归函数指对应于某个给定的X的Y值的一个样本而建立的回归函数。⑶随机的总体回归函数指含有随机误差项的总体回归函数,形如:iiiuXY21⑷线性回归模型指对参数为线性的回归,即只以它的1次方出现,对X可以是或不是线性的。⑸随机误差项也称误差项,是一个随机变量,针对总体回归函数而言。⑹残差项是一随机变量,针对样本回归函数而言。⑺条件期望又称条件均值,指X取特定iX值时的Y的期望值。⑼回归系数(或回归参数)指1、2等未知但却是固定的参数。⑽回归系数的估计量指用1、2等表示的用已知样本所提供的信息去估计出来的量。⒀估计量的标准差指度量一个变量变化大小的标准。⒁总离差平方和用TSS表示,用以度量被解释变量的总变动。⒂回归平方和用ESS表示,用以度量由解释变量变化引起的被解释变量的变化。⒃残差平方和用RSS表示,用以度量实际值与拟合值之间的差异,是由除解释变量以外的其他因素引起的。⒄协方差用Cov(X,Y)表示,是用来度量X、Y二个变量同时变化的统计量。2-2.答:错;错;错;错;错。(理由见本章其他习题答案)2-3.答:⑴线性回归模型的基本假设(实际是针对普通最小二乘法的基本假设)是:解释变量是确定性变量,而且解释变量之间互不相关;随机误差项具有0均值和同方差;随机误差项在不同样本点之间是独立的,不存在序列相关;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。违背基本假设的计量经济学模型还是可以估计的,只是不能使用普通最小二乘法进行估计。⑸判定系数TSSRSSTSSESSR12,含义为由解释变量引起的被解释变量的变化占被解2释变量总变化的比重,用来判定回归直线拟合的优劣。该值越大说明拟合得越好。⑽不是。2-8.证明:由于21ˆtttXYX,因此)()()()ˆ(122221ttttttttttXVarXXYXXVarXYXVarVar222222222)()()(ttttttXXXVarXX2-9.证明:⑴根据定义得知,)()()(21212121XYnXnnYnXnYXYYYeiiiiiiiXY210ie从而使得:0neei证毕。⑵00)1()(()()()ˆˆ())(ˆ(iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiXenXeXeXeXeYXXeXYYXXYeYXXeYYXXYYXYXYXXYXXYYXe证毕。⑶30)(ˆ212121iiiiiiiiieXneXeeXeYe证毕。2-14.答:线性回归模型:tttxy中的0均值假设0)E(2u不可以表示为:101nttn,因为前者表示取完所的可能的样本组合后的平均状态,而后者只是一个样本的平均值。2-16.证明:niiniiiniixyxxnyxy1211ˆˆniiiniininiiiiiniiiyxxyyxyyxyx11111)(iniininiiiniiniiyxxnyxxxny)1(ˆ1211121证毕。2-17.证明:ˆˆ和满足正规方程0)ˆˆ(1niiixyiixyˆˆˆ0)ˆ(1iniiyy即表明Y的真实值与拟合值有共同的均值。证毕。2-18.答:他的论据是错误的。原因是他忽略了随机误差项iu,这个随机误差项可取正值和负值,但是0)E(iu,将iC与iY的关系表达为iiYC是不准确的,而是一个平均关系。2-19.证明:4设:,ˆˆˆ10iixy,ˆˆˆ10iiyx由于:2222222)((1)(iiiiiiiiyyxxyxyxR线性回归的斜率估计量:1221ˆ1/)(1ˆiiiiiiyyxxyx证毕。2-20.证明:∵2xyx又∵12nxSx,12nySy∴ryxyxnynxxyxSSyx2222211证毕。2-22.解:⑴这是一个横截面序列回归。(图略)⑵截距2.6911表示咖啡零售价在t时刻为每磅0美元时,美国平均消费量为每天每人2.6911杯,这个数字没有经济意义;斜率-0.4795表示咖啡零售价与消费量负相关,在t时刻,价格上升1美元/磅,则平均每天每人消费量减少0.4795杯;⑶不能;⑷不能;在同一条需求曲线上不同点的价格弹性不同,若要求出,须给出具体的X值及与之对应的Y值。2-23.解:⑴168nXXi,111nYYi177201111681011101681111680204200)())((YXXYXYYXYYXXiiiiii5331601681681031540010102)2()(222222XXXXXXXXXiiii又5344.03316017720)())((22XXYYXXiii22.211685344.011121XY⑵8)ˆˆ2(210)ˆ(2ˆ22222iiiiiiiYYYYYYneiiXY5344.022.21ˆ81.62016805344.022.2123154005344.05344.022.2122.21102042005344.02111022.212133300)25344.0222.212()ˆˆ2(2122221222iiiiiiiiiiXXYXYYYYYY60.77881.620ˆ281.73331601031540060.77)()(2221XXnXVarii,5913.881.73)(1se0023.03316060.77)(222ixVar,0484.00023.0)(2se⑶222)(1YYerii,10090123210133300)(,81.62022YYeii又9385.01009081.62012r⑷%95)306.2(tp,自由度为8306.25913.822.21306.21,解得:110315.414085.1为的95%的置信区间。同理,306.20484.05344.0306.22,解得:646.04227.02为2的95%的置信区间。6由于02不在2的置信区间内,故拒绝零假设:02。2-24.解:⑴由于参数估计量的T比率值的绝对值为18.7且明显大于2,故拒绝零假设0:0H,从而在统计上是显著的;⑵参数的估计量的标准方差为15/3.1=4.84,参数的估计量的标准方差为0.81/18.7=0.043;⑶由⑵的结果,的95%的置信区间为:043.0)2(81.0(975.0nt,091.081.0()043.0)2(81.0975.0nt,)091.081.0,显然这个区间不包括0。2-25.解:⑴65)80(iXYE77)100(iXYE89)120(iXYE101)140(iXYE113)160(iXYE125)180(iXYE137)200(iXYE149)220(iXYE161)240(iXYE173)260(iXYE