《技术经济学》讲义本科教学文件第1页共38页第三篇:技术经济预测技术经济分析的一个重要特征就是“预测”性,是在项目尚未实施前进行分析和研究、论证。因此熟悉和掌握现代的预测方法是进行技术经济分析的一个至关重要的基本技能。目前在众多的技术经济分析方法里所介绍的是线性预测,即把所要求讨论的两个(或等多)的变量之间的关系认定为线性关系,与之相对应的有套较完整的回归方法和检验手段。但是,这还远远不够,因为在实践中,我们所遇到的问题中,变量与变量之间的关系往往是非线性的,要求我们用相应的非线性预测方法来讨论和建立变量之间的函数问题。第七章:线性回归线性回归的前提假设是:所研究的变量之间具有线性的关系。变量之间所构成的函数关系为线性的——一次函数。§7.1一元线性回归我们知道,变量之间存在着两种关系,第一种是确定性关系。即变量之间相互制约,通过一些已知的变量就可以精确地求出另外一些变量的值。如:运动定律中的F=am知道其中任何两个变量的值。就能够求出第三个变量的值;第二种是非确定性关系。然而,非确定关系中,有些变量之间仍然存在着某些相关的因素,如我们常说的市场需要量与人们的收入之间的关系。在非确定性关系中,还有些变量之间毫无关系,如人的体重与树木的高度等,这种关系称为完全无关系。确定性关系是函数关系,导数学领域里的事情;非确定性关系是数理统计的内容。所谓回归分析就是研究相关关系的变量之间的关系。一、一元线形回归模型的建立如果两个相关的变量有一序列的原始数据{(x1,y1)(x2,y2)……,(xn,yn)}在直角平面坐标系中的离散图呈线性分布趋势。则用线形回归方法求其近似表达式(回归模型)。baxy*),(*jjyx.....),(jjyx1、设回归方程式为《技术经济学》讲义本科教学文件第2页共38页baxy*(ba,为两待定参数)2、设定误差显然,这里得出的估计值与实际值y之间有误差。即:jjjyy*3、最小二乘法原理为了使描述的直线最能代表离散图的趋势,根据最小二乘法的原则,必须使这些误差的平方和为最小。Qminnjnjjjjyy112*2)(4、极值原理根据njjjbaxyQ12)(min,这里有两个待定参数ba和,于是,依极值原理有:解联立方程组00bQaQnjjjnjjjjbaxyxbaxy110)1)((20))((222222)()(jjjjjjjjjjjjjxxnyxxyxbxxnyxyxna………………………(1)二、一元线性回归应用[例1:某一亩实验田每年使用化肥和粮食的产量如下表所示,求:当化肥施用到150斤和180斤时,相应的粮食灿烂是多少?各年所施化肥量7074807885929095各年粮食产量510600680700900102010001100各年所施化肥量92108115123130138145各年粮食产量1150110011801220125012801300解:设化肥的施用量为x,粮食产量为y《技术经济学》讲义本科教学文件第3页共38页于是根据以上的统计资料有抽样序列15),(jjyx,已知15n计算数据:1511515jjx;15114990jjy;1512161125jjx;1511591940jjjyx;2295225)(2151jjx于是,由一元线形回归方程的待定系数公式有:5627.282295225161125151591940151514990161125)(6116.9229522516112515149901515159194015)(22222jjjjjjjjjjjjjxxnyxxyxbxxnyxyxna故其回归方程为:5627.286116.9*xy于是,当x=150时,得出150y=1470(公斤)当x=180时,得出180y=1950(公斤)[*附录:当自变量x为年(或其他时间表示时),可以简化系数ba,的表达式①当年数为奇数时,则以中间的一年为原点。即:令中x=0并将x的值以一年为计算单位。此时,时间的序列就相应地变为:……-3,-2,-1,0,1,2,3,……②当年的系数为偶数时,则以中间两年之中点为原点。令其为零,并将x的值以半年为计算单位。此时,时间序列就相应地变为:……-5,-3,-1,1,3,5……因此有:njjx10得出:nybxyxajjjj2…………………………(2)《技术经济学》讲义本科教学文件第4页共38页[例2:已知某产品1974年至1985年的销售资料如下表。请预测1988年的销量。单位(吨)197419751976197719781979198019811982198319841985500510480600600660580700680740790960解:设时间序列为,因为是偶数年,故取1979到1980年的中间点为原点。于是列表如下所示:年份197419751976197719781979198019811982198319841985jx-11-9-7-5-3-11357911jy500510480600600660580700680740790960计算:0jx5722jx;7800jy;10020jjyx所以根据回归方程有6001278001252.17100205722jjjjybxyxa故回归方程为:y=17.52x+650当1988年时,x=17y=17.52×17+650=947.5吨§7.2多元线性回归假定因变量y与自变量kxxx,,,21之间存在线形关系。一、多元线性回归模型的建立1、取样本点nkjjjjxxxy),,,,(21即:knnnnkkkxxxyxxxyxxxyxxxy21323133222122121111《技术经济学》讲义本科教学文件第5页共38页2、设定多元线性回归模型回归方程:kkxbxbxbby22110*…………………(3)3、取误差变量*jjjyy=kjkjjjxbxbxbby22110(nj,,2,1)………(4)4、最小二乘法原理njjjyyQ12*)(min=njkjkjjjxbxbxbby1222110)(…………………..(5)5、极值原理0))((20))((20)1)((2221101221101221100kjkjkjjjkjkjkjjjkjkjjjxxbxbxbbybQxxbxbxbbybQxbxbxbbybQ…………….(6)二、多元线性回归的矩阵形式1、引进向量、矩阵的概念(1)矩阵:knnnkkxxxxxxxxxA212221212111111(2)向量:《技术经济学》讲义本科教学文件第6页共38页nyyyyY321kbbbbb210n321(3)线性方程组:nknknnnkkkkxbxbxbbyxbxbxbbyxbxbxbby2211022222121021121211101………………………(7)简化形式为:AbY………………………(8)2、简化模型njjjyyQ12*)(=njj12=T=)()(AbYAbYT=))((AbYAbYTTT=AbAbYAbAbYYYTTTTTT………………………(9)∵YAbAbYTTTT)(又∵AbYT是一个数,∴YAbAbYTTT于是有:AbAbYAbYYQTTTTT20)(22bAAYAbQTT…………………………(10)3、假设条件如果满足条件:AAT可逆,则有:YAAAbTT1)(………………………………(11)《技术经济学》讲义本科教学文件第7页共38页§7.3回归模型的检验上面得出的回归模型是以假定两个相关变量存在着线形相关的基础上的,然而,这种线形假定究竟是否符合客观实际?它们之间的线形相关程度究竟如何?还要进一步用统计理论加以检验。目前,检验一元线形回归最常用的方法是检验和t检验.一、检验(相关系数的检验)1、计算相关系数22)()())((yyxxyyxxjjjj………………………(12)[其中:nxxj;nyyj(平均值)]将平均值公式代入(12)有:])(][)([2222jjjjjjjjyynxxnyxyxn…………………(13)2、判别通过(12)或(13)式的计算可知,]1,1[(1)当=1时:说明变量yx,完全线形相关。所有的经验点njjyx),(都严格地分布在一条直线上,且y为x的增函数。(2)当=0时:说明变量yx,不存在线形关系。(①x与y毫无关系;②x与y属于非线形关系)(3)当=-1时:说明变量yx,完全线形相关,且y为x的减函数(4)一般地,在(-1,1)之间,而且的绝对值越大,说明x与y有较强的线性关系,线性回归效果越好;反之,的绝对值越小,说明x与y的线性关系越差,《技术经济学》讲义本科教学文件第8页共38页线性回归效果越差。yx3、取置信水平为置信水平,一般取在0.1~0.001之间,(取得越小,表明越严格),同时查——表格(相关系数检验数表),求出4、比较与在实际检验中,先计算出的值,并取一置信水平,然后查表得出在置信水平下的标准相关系数,然后再用与比较。当>时,则认为在置信水平下,x与y是线性相关的;当<时,则认为在置信水平下,x与y是线性无关的。[例3:对例1进行检验,取置信水平=0.05解:则有:])(][)([2222jjjjjjjjyynxxnyxyxn=]2247001001593710015][229522516112515[149901515159194015=0.8848由n=15,=0.05查表得=0.53240.8848=>=0.5324所以在置信水平x=0.05下,x与y是线形相关的(回归效果良好)。二、t检验1、对给定的问题,求出回归模型之后,计算下列数据r=1r=-1《技术经济学》讲义本科教学文件第9页共38页nxxjnyyjnxxxxjjj222)()(nyyyyjjj222)()(222)()(xxayyjj2)()(222nxxayySjj2)(xxSaj2、取置信水平取置信水平,且查t分布表求得:)2(2nt3、比较(1)如果2)(xxSaj>)2(2nt,则说明在此置信水平下,回归效果良好;(2)如果2)(xxSaj<)2(2nt,则认为在此置信水平下,回归效果不好。[例4:仍对例1进行t检验解:因为x=101y=999.33所以8110)(2xxj957095)(2yyj而6116.9a4.922a所以,222)()(xxayyjj=2077312)()(222nxxayySjj=4.12621520773