统计学——利用线性回归进行预测

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

利用线性回归进行预测回归分析的主要目的是根据所建立的估计的回归方程进行预测或控制。预测是通过自变量x的取值来预测因变量y的取值。控制是根据一个想要的y值,求得所要求的x的值(与预测恰好相反)。我们这里讲的主要是预测方面的内容利用线性回归进行预测1点估计2区间估计点估计点估计1.对于自变量x的一个给定值,根据回归方程得到因变量y的一个估计值就是点估计2.点估计值有y的平均值的点估计y的个别值的点估计3.在点估计条件下,平均值的点估计和个别值的的点估计是一样的,但在区间估计中则不同。0x平均值的点估计利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的平均值的一个估计值E(y0),就是平均值的点估计个别值的点估计利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的一个个别值的估计值,就是个别值的点估计.0ˆy案例区间估计区间估计1.对于自变量x的一个给定值,根据回归方程得到因变量y的一个估计值的区间就是区间估计。2.点估计值也有y的平均值的区间估计——置信区间y的个别值的区间估计——预测区间3.在区间估计条件下,即使对于同一个平均值的区间估计和个别值的的区间估计也是不一样的,预测区间要比置信区间宽一些。0x0x置信区间估计y的期望值的置信区间估计1.利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的期望值E(y0)的估计区间,这一估计区间称为置信区间2.E(y0)在1-置信水平下的置信区间为niiexxxxnSty1220201ˆ记作:,表示标准差的估计量sy0ˆ0ˆy预测区间估计y的个别值的预测区间估计1.利用估计的回归方程,对于自变量x的一个给定值x0,求出因变量y的一个个别值的估计区间,这一区间称为预测区间2.y0在1-置信水平下的预测区间为注意!置信区间、预测区间、回归方程xnxy10ˆˆˆyxx案例3案例1选取了广东省高等学校在校生人数从1995年到2009年共15年的两个时间序列数据为样本进行分析和预测,数据分别见表1-1。问题:运用适当模型对2010年的在校生数进行预测。我国的高等学校在校生人数的修正指数曲线为所以,将t=16代入,可以得到2010年的高等学校在校生人数的预测值tty)1453.1(112.213778.1465.17016)^1453.1x(112.213778.14ˆy(万人)案例2根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:计算:⑴建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义。⑵若2002年人均收入14000元,试推算该年商品销售额。9n546x260y234362x16918xy解:⑴回归系数b的含义:人均收入每增加1元,商品销售额平均增加0.925万元。⑵x=14000元,2229169185462600.925934362546nxyxybnxx2605460.92527.2399aybx27.230.925cyabxx27.230.9251400012922.77cy进入区间估计案例3根据5位同学西方经济学的学习时间(x)与成绩(y)计算出如下资料:5n40x310y2370x220700y16918xy计算:⑴编制以学习时间为自变量的直线回归方程。(要求计算结果保留2位小数)⑵若某位同学的西方经济学的学习时间为X=10,以95%的概率估计其西方经济学的成绩。解:(1)72.4105.2020.40y22252740403105.20537040nxyxybnxx310405.2020.405520.405.20caybxyabxx(2)当x=10时,(置信区间估计)1824.3)25()2(025.02tnt查表的因此,当西方经济学的学习时间为X=10时,可以以95%的概率估计西方经济学的分数均值在35~109.79之间。得置信区间为:0yE当x=10时,4.721020.54.20ˆy(预测区间估计)得预测区间为:因此,当西方经济学的学习时间为X=10时,可以以95%的概率估计西方经济学的分数均值在-7.57~152.37之间。案例文档

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功