第3章回归预测法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《统计预测和决策》讲稿第三章回归预测法第1页共7页第三章回归预测法第一节一元线性回归预测法一元线性回归预测法是指成对的两个变量数据分布大体上呈直线趋势时,采用适当的计算方法,找到两者之间特定的经验公式,即一元线性回归模型,然后根据自变量的变化,来预测因变量发展变化的方法。一、建立模型一元线性回归模型可表述为:iiiuxbby10,ni,,1。其中0b、1b是未知参数;iu为剩余残差(或随机扰动)二、估计参数三、进行检验一元线性回归模型:.),0(...;,,1,210Ndiiuniuxbbyiiii诸㈠标准误差niiiyynnSSEMSESE12)(212㈡可决系数SSTSSESSTSSRyyyyyyxxyyxxRniiniiniiniiniii1)()()()())((12121212212㈢相关系数niiniiniiiyyxxyyxxr12121)()())((说明:可查《概率论与数理统计教程》中的相关系数的临界值表。㈣回归系数显著性检验《统计预测和决策》讲稿第三章回归预测法第2页共7页0H:01bvs1H:01b,由于,)2(~)2()2(112211ntlnSSEbbnSSElbbxxxx,所以当0H为真时,统计量)2(~)2(1ntlnSSEbtxx。㈤F检验(用于对回归模型作检验)0H:回归方程不显著vs1H:回归方程显著统计量)2,1(~)2()(1)(1212nFMSEMSRnyyyyFniiinii㈥德宾-沃森统计量(WD)(用于检验iu之间是否存在自相关关系)如前所述,回归模型的剩余项iu之间应该是相互独立的。也就是说,各个iu之间不存在自相关问题。如果存在自相关问题,那么,用回归模型进行预测就要失真。德宾-沃森统计量(WD)是检验模型是否存在自相关的一种有效方法,其公式为:niiniiiuuuWD12221)(其中,iiiyyu。显然,WD的取值域在4~0之间。把上式计算的WD值,与德宾-沃森给出的不同显著性的WD值之上限Ud和下限Ld(它们与样本容量n和自变量个数m有关,见附表一)进行比较,WD检验法则为:●在2WD情况下若LdWD,则认为iu之间存在正自相关;《统计预测和决策》讲稿第三章回归预测法第3页共7页若UdWD,则认为iu之间无自相关;若ULdWDd,则不能确定iu之间是否有自相关。●在2WD情况下若LdWD4,则认为iu之间存在负自相关;若UdWD4,则认为iu之间无自相关;若LUdWDd44,则不能确定iu之间是否有自相关。根据经验,WD统计量在5.2~5.1时,表示没有显著自相关问题。例题(第36页表3-1给出的数据)由example3_1_3.m可计算得:WD1.93797022002406㈦进行正态性检验(正态概率纸、夏皮洛-威尔克检验等)和方差齐性检验四、进行预测(见第41页)由于,)])()(1[,(~212200100100niixxxxnxbbNxbby,)2(~22nSSE,且0y与eS相互独立,所以,)2(~)()(12)(2)()(1)(1220010012200100ntxxxxnnSSExbbynSSExxxxnxbbyniinii。从而可得0100)(xbbyE的1的置信区间是:niixxxxnSEnty12202/10)()(1)2(。由于,)])()(11[,0(~2122000niixxxxnNyy,从而有:《统计预测和决策》讲稿第三章回归预测法第4页共7页)2(~)()(112122000ntxxxxnnSSEyynii。从而可得0y的1的预测区间是:niixxxxnSEnty12202/10)()(11)2(。第二节多元线性回归预测法一、估计参数二、拟合优度和置信范围㈠拟合优度指标⒈标准误差niiiyypnpnSSEMSESE12)(111⒉可决系数可决系数的计算公式:SSTSSESSTSSRyyyyRniinii1)()(12122⒊相关系数对于多元回归分析而言,多元相关系数似乎是多余的,它并不提供任何新的信息,只是可决系数的平方根。㈡置信范围(要注意在什么条件下求得的)三、自相关和多重共线性问题㈠自相关检验仍可用德宾-沃森统计量(WD)作为检验指标,采用前面提出的经验法则,WD统计量在5.2~5.1时,表示没有显著自相关问题。如果发现了自相关问题,则需采用迭代法、差分法等方法处理。㈡多重共线性检验《统计预测和决策》讲稿第三章回归预测法第5页共7页近年来,关于多重共线性的诊断及多重共线性严重程度的度量是统计学家们讨论的热点,已经提出了许多可行的判断方法,如方差扩大因子法、特征根判定法、直观判定法等。具休可参见有关这方面的资料。若发现解释变量中存在严重的多重共线性时,我们要设法消除这种共线性。四、进行正态性检验和方差齐性检验五、进行回归系数的显著性检验和对模型的F检验第三节非线性回归预测法一、配曲线问题二、一些常见的函数图形第四节应用回归预测时应注意的问题随着我国社会主义市场经济的发展,人们将不断地借助回归预测法对市场经济中出现的各种数量关系进行描述、分析、控制和预测。然而,在具体运用时,应注意以下几个问题:一、关于定性分析问题社会现象之间的相互关系和发展规律性,取决于马克思主义的理论分析。在理论上证实社会现象或社会现象指标之间确实存在相关关系性质后,才能再利用回归预测法具体研究和测定社会现象相关关系的数量表现。回归分析不能代替马克思主义理论对社会现象相关关系的质的分析,只有在马克思主义理论的质的分析的基础上,才能测定社会现象在数量上的相关关系。这应该成为统计上运用回归预测法的一条基本原则。因此,我们首先应该进行定性分析,在马克思主义理论指导下,依靠研究人员的理论知识、专业知识、实际经验和分析研究能力,来确定各种变量之间的相关关系及其影响程度。应该指出,我们必须积极把握事物从量变到质变的“度”的界限。在许多情况下,现象之间只是在一定的范围内才具有相关关系,超出了这个范围,就可能成为荒谬。例如,施肥量和农作物生产量只有在一定范围内才具有正相关关系,施肥量超过了一定的限度,产量不但不会增加,反而会减少。农作物的耕作深度与每亩收割量之间的关系也是如此。因此,在运用时要注意它的作用与范围,超过了这个范围去推断或预测,可能会得出错误的结论。二、关于回归预测不能任意外推的问题回归分析的应用,仅仅是限于原来数据所包含的范围,相关关系只限于x和y两方面的数值从最小值到最大值的范围;回归分析中的回归关系限于x方面原数值从最小值到最大值的范围(以x推算y时)。所谓外推,是指把相《统计预测和决策》讲稿第三章回归预测法第6页共7页关关系或回归关系用于超出上述范围之外。由于原来资料只提供了一定范围内的数量关系,在此范围以外是否存在同样的关系,尚未得知。如果有进行外推的充分根据和需要,也应十分慎重,而且不能离开原来的范围太远。统计学已阐明,回归方程实际观察值y的偏差不仅与显著性水平有关(越小,越大),与n有关(n越大,越小),而且与观察值0x有关。当0x靠近x时,就小;当0x远离x时,就大。也即,当0x处于x时,回归直线效果最好,回归直线任意外推,预测远期目标,误差就大,往往会得出不正确的结论。当然,这不能一概而论,但一般来说,直线回归只适宜做中、短期预测,不宜于做长期预测。三、关于对数据资料的要求问题在利用回归分析进行预测时,还必须注意数据资料的准确性、可比性和独立性问题。㈠关于数据资料的准确性问题㈡关于数据资料的可比性和独立性问题㈢关于社会经济现象基本稳定的问题小结⒈一元线性回归预测是指成对的两个变量数据分布大体上呈直线趋势时,运用合适的参数估计方法,求出一元线性回归模型,然后根据自变量与因变量之间的关系,预测因变量的趋势。由于很多社会经济现象之间都存在相关关系,因此,一元线性回归预测具有很广泛的应用。进行一元线性回归预测时,必须选用合适的统计方法估计模型参数,并对模型及其参数进行统计检验。⒉社会济现象的变化往往受到多个因素的影响,因此,一般要进行多元回归分析,我们把包括两个或两个以上自变量的回归称为多元回归。多元回归与一元回归类似,可以用最小二乘法估计模型参数。也需对模型及模型参数进行统计检验。选择合适的自变量是正确进行多元回归预测的前提之一,多元回归模型自变量的选择可以利用变量之间的相关矩阵来解决。⒊在社会现实经济生活中,很多现象之间的关系并不是线性关系,对这种类型现象的分析预测一般要应用非线性回归预测,通过变量代换,可以将很多的非线性回归转化为线性回归。因此,可以用线性回归方法解决非线性回归预测问题。⒋应用回归预测法时,应首先确定变量之间是否存在相关关系。如果变量之间不存在相关关系,对这些变量应用回归预测法就会得出错误的结果。正确应用回归分析预测时应注意:⑴用定性分析判断现象之间的依存关系;⑵避免回归预测的任意外推;⑶应用合适的数据资料。《统计预测和决策》讲稿第三章回归预测法第7页共7页实例分析问题:国际旅游外汇收入是国民经济发展的重要组成部分,影响一个国家或地区旅游收入的因素包括自然、文化、社会、经济、交通等多方面的因素,本例研究第三产业对旅游外汇收入的影响。《中国统计年鉴》把第三产业划分为12个组成部分,分别为1x农林牧渔服务业,2x地质勘查水利管理业,3x交通运输仓储和邮电通信业,4x批发零售贸易和餐饮业,5x金融保险业,6x房地产业,7x社会服务业,8x卫生体育和社会福利业,9x教育文化艺术和广播,10x科学研究和综合艺术,11x党政机关,12x其他行业。选取1998年我国31个省、市、自治区的数据(见第3章例题数据.xls)。自变量单位为亿元人民币,以国际旅游外汇收入为因变量y(百万美元)。试建立线性回归模型。解后退法取05.0出时,利用regstats函数,最终结果为:119832483.178608.276279.216156.36899.201xxxxy。复决定系数2R0.8322,调整的复决定系数2aR0.8000。取1.0出时,利用stepwise函数,最终结果为:111098300.1362.1137.1720.2032.476.184xxxxxy。复决定系数2R0.8515,调整的复决定系数2aR0.8159。取05.0进,1.0出时,利用stepwise函数,最终结果为:111032644.114786.219751.44965.117xxxy。复决定系数2R0.7911,调整的复决定系数2aR0.7601。

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功