2.5一元线性回归模型的预测

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

§2.4一元线性回归分析的应用:预测问题一、Ŷ0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计二、总体条件均值与个值预测值的置信区间对于一元线性回归函数iiXY10ˆˆˆ给定样本以外的解释变量的观测值X0,可以得到被解释变量的预测值Ŷ0,可以此作为其条件均值E(Y|X=X0)或个别值Y0的一个近似估计。严格地说,这只是被解释变量的预测值的估计值,而不是预测值。原因:(1)参数估计量不确定;(2)随机项的影响说明一、Ŷ0是条件均值E(Y|X=X0)或个值Y0的一个无偏估计对总体回归函数E(Y|X=Xi)=0+1Xi,X=X0时E(Y|X=X0)=0+1X00100ˆˆˆXY于是0101000100)ˆ()ˆ()ˆˆ()ˆ(XEXEXEYE可见,Ŷ0是条件均值E(Y|X=X0)的无偏估计。对总体回归模型Yi=0+1Xi+i,当X=X0时Y0=0+1X0+0于是E(Y0)=E(0+1X0+0)=0+1X0+E(0)=0+1X00101000100)ˆ()ˆ()ˆˆ()ˆ(XEXEXEYE二、总体条件均值与个值预测值的置信区间1、总体均值预测值的置信区间由于0100ˆˆˆXY),(~ˆ2211ixN),(~ˆ22200iixnXN于是0101000)ˆ()ˆ()ˆ(XEXEYE)ˆ()ˆ,ˆ(2)ˆ()ˆ(12010000VarXCovXVarYVar可以证明2210/)ˆ,ˆ(ixXCov因此222022022202)ˆ(iiiixXxXXxnXYVar200222222XXXXnXnXxii))((20222XXnxxii))(1(2202ixXXn故)))(1(,(~ˆ22020100ixXXnXNY)2(~)(ˆ0ˆ0100ntSXYtY))(1(ˆ2202ˆ0iYxXXnS于是,在1-的置信度下,总体均值E(Y|X0)的置信区间为0202ˆ00ˆ0ˆ)|(ˆYYStYXYEStY其中2、总体个值预测值的预测区间由Y0=0+1X0+0知:),(~20100XNY于是)))(11(,0(~ˆ220200ixXXnNYY)2(~ˆ00ˆ00ntSYYtYY式中:))(11(ˆ2202ˆ00iYYxXXnS从而在1-的置信度下,Y0的置信区间为00202ˆ000ˆ0ˆˆYYYYStYYStY在上述收入-消费支出例中,得到的样本回归函数为:iiXY777.0172.103ˆ则在X0=1000处,Ŷ0=29.37277425000)21501000(10113402)ˆ(20YVar而05.61)ˆ(0YS142.4+0.670Xi142.4+0.670×1000=812.42734760.427.6因此,总体均值E(Y|X=1000)的95%的置信区间为:812.4-2.30627.6E(Y|X=1000)812.4+2.30627.6或(748.8,875.9)同样地,对于Y在X=1000的个体值,其95%的置信区间为:812.4-2.30659.1Yx=1000812.4+2.30659.1或(676.1,948.7)•总体回归函数的置信带(域)(confidenceband)•个体的置信带(域)-142.4+0.670Xi对于Y的总体均值E(Y|X)与个体值的预测区间(置信区间):(1)样本容量n越大,预测精度越高,反之预测精度越低;(2)样本容量一定时,置信带的宽度当在X均值处最小,其附近进行预测(插值预测)精度越大;X越远离其均值,置信带越宽,预测可信度下降。

1 / 12
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功