编号(学号):12914008优化理论课程论文(08级1班)题目:最小二乘法在经济预测中的应用学院:理学院专业:信息与计算科学姓名:刘天政指导教师:张永祥完成日期:2011年12月18日最小二乘法在经济预测中的应用摘要:由于经济发展呈现一种鹏飞的状态及其可能的动荡会引起严重的后果,使得经济预测成为了一个必然产物,预测会使人们在将来经济上可能出现的波动有所准备降低损失或增加收益.本文选择了经济预测中的其中一种方法最小二乘法的基本原理,并且利用了线性回归预测模型.同时对相关系数和标准偏差进行检验.最后给出了利用最小二乘法进行经济预测的实例.实现对产品生产的预测让各方面对产品的产量有个简单的了解.关键词:最小二乘法;线性回归;产品生产预测一.引言随着改革开放的步伐带动各地的经济发展状态呈现一片大好的形势,由于地域人文不同各地经济特色也各显风骚.本文以某县为例,该县是全国经济百强县之一,全县大都以染料、纺织和布匹等生产加工为主.笔者了解到支撑该县经济支柱的大部分是以生产加工上述产品的中小企业甚至家庭型企业.由于他们规模不是很大,因此相应的各技术部门没有很好的配备,所以进行生产管理的方式没有像大型企业那样规范,他们产品的年产量往往根据企业主近几年摸爬滚打中积累起来对市场的判断来制订的,而没有进行科学的经济预测,这常常导致大量产品销售不够或大量产品积压在家,给企业带来严重影响.经济预测是进行经济决策活动的一个重要组成部分.在实际经济活动中,预测的结果可以揭示经济现象在未来时期发展变化的情况和发现经济发展过程中存在的问题,从而为进行决策、制订计划、提高经济管理水平以及获取较好的经济效益提供了科学依据.运用定量预测模型进行预测的方法有很多,依据笔者对许多家庭型企业的了解及对企业主知识层次的分析,本文介绍的最小二乘法在经济预测中的应用方法简单明了,比较适合这些企业在进行预测产品产量时参考,从而能够避免盲目的生产和经营,尽可能地为企业获得最大利润.二.最小二乘法最小二乘法是由实验或调查的数据,建立线性型公式的一种常用方法.在建立线性型公式中,虽然有很多种不同的方法来求样本回归函数(即,真实总体回归函数的估计值),但是,在回归分析中最广泛应用的方法是最小二乘法.如果变量yx和有精确的线性关系比如说baxy,那么iiyy即观测值与回归值是相等的.事实上现实世界中的诸多变量的关系未必都是如此,由于受诸多随机因数的干扰使得物与物之间没有那种很明确的对应关系.比如说人的身高和体重就是一个对应,我们都知道长的高的人不一定就重,同理长的矮的人也不一定就轻,但身高和体重的确存在着一定的关系,而这种关系并非是baxy所能确定的.那么我们要寻求身高和体重之间的关系就需要通过数学的方法.首先调查统计得出数据;其次把数据描绘出来;然后拟合一条跟已有的图象最接近的曲线,这样就可以相对地将身高和体重之间的关系表示出来.在处理类似的事情中常常用到最小二乘法.所谓最小二乘法就是:选择参数10,bb,使得全部观测的残差平方和最小.用数学公式表示为:21022)()(miniiiiixbbYYYe为了说明这个方法,先解释一下最小二乘原理.iiixBBY10(一元线性回归方程)由于总体回归方程不能进行参数估计,我们只能对样本回归函数来估计即:iiiexbbY10)...2,1(ni(1.1)从(1.1)公式可以看出:残差ie是iY的真实值与估计值之差,估计总体回归函数最优方法是,选择10,BB的估计量10,bb,使得残差ie尽可能的小.总之,最小二乘原理就是选择样本回归函数使得所有Y的估计值与真实值差的平方和为最小,这种确定10,bb的方法叫做最小二乘法.在经济关系中,往往某一指标与多个因素有关,如果这种关系具备一定的线性相关性,就可以用多元回归分析来处理,假设由观测得到一组数据:),...,,(),...,,...,,(),,...,,(212222111211nmnnmmxxxxxxxxx1y2y,…,ny令向量分别为:),...,(),...,,(),...,,(),...,(2,121222122121,111nnmmmmnnyyyYxxxXxxxXxxxX 如果向量组mXXX,...,,21与Y存在线性关系,得到n元线性预测公式mmXaXaXaaY...22110(1.2)其矩阵形式为:nyyy21mnmnnmmaaaxxxxxxxxx10212222111211111(1.3)其中maaa,...,,10为待定常数,亦称回归系数.如何来确定maaa,...,,10的值呢?将每组观测值代入(1.3)就得到:immiiixaxaxaaY...22110)...2,1(ni特别地1n时xaaY10(1.4)iY与iy间存在差异.记ieiiYy我们选择这样的maaa,...,,10使每个偏差ie)...2,1(ni都尽量小,因为偏差(iiYy)有正有负,所以偏差的代数和)(iiYy并不能反映总体偏差的大小,而iiYy数学上处理起来也比较繁杂,所以通常采用使偏差平方和2ie为最小.即niS1222110)...(immiiixaxaxaay最小(1.5)显然,偏差平方和随maaa,...,,10的变化而取不同的值,可把S视为maaa,...,,10的多元函数,并求极值得:niaS100)1()...(222110immiiixaxaxaayniaS110)()...(2122110iimmiiixxaxaxaaynimaS10)()...(222110imimmiiixxaxaxaay整理得:nininininiiimmimiimiimimninininiiiimimiiiniininininiiimmiiyxxaxxaxxaxayxxxaxxaxaxayxaxaxana11111222110111111212211110111122110......... (1.6)将上述m+1个方程式联立起来就maaa,...,,10求解,则得到公式(1.5)的待定系数值,从而确定了多元线性预测公式.特别地当1n时,10,aa的估计公式为:niniiinininiiiiininiiixxnyxyxnanxaya112211111110)((1.7)三.相关系数与标准偏差3.1相关系数R以两个变量的情况为例,因为只要任意给定两个变量yx,的一组数据,都可以经过计算给出一个经验公式,这个公式在多大程度上反映了yx,的关系呢?因为只要通过最小二乘法采取强拟合我们同样可以把一组毫无线性关系的数据表成线性关系,但这条直线并不能很好地反映了变量yx和的实际关系,缺乏应用价值,例如:012345678910111213141513579111315原始散点图强拟合后散点图为此我们一方面要建立从经验上认为有意义的方程,另一方面我们必须用数学方法进行拟合效果和显著性相关检验.其公式如下:我们称R=yyxxxyLLL为yx和的相关系数,其中:))((1yyxxyxnxyLiixy222)()(1xxxnxLixx222)()(1yyynyLiyyixnx1iyny1由上可推算:yyLRS)1(2由0S,0yyL有012R,所以10R,R越接近1,S越接近0,yx,的线性关系越好.(1)当0,1SR时,即ie=0,称yx,完全线性关系.(2)当0,0xyLR时。说明yx,无关,即不存在线性关系.(3)当10R时,可选定相关系数的显著性水平,按2n的值查相关系数显著性检验表求出临界值.(4)当R时,说明ix的值的变化对iy的值的变化影响很大,yx,存在强相关关系.(5)当R时,所求相关关系是无效的,即经验公式是无意义的.3.2标准偏差2)(1iixyYynS其中:xyS-------标准偏差iy--------实例值iY--------预测值n--------数据点个数四.预测实例经验公式xaaY10是平面上统计点的分布呈线性时的表示形式,同时它也是小二乘理论的形之根本,即无论是线性的还是非线性的最后都是要化为这种形式.下面我们就散点图呈曲线的情况进行预测.例:对纺织品销售额的拟合.我们选取销售额为因变量,单位为万元,拟合销售额关于时间x的趋势曲线.以1991年为基准年,取值x=1,2001年x=11,1991—2001年的数据如表一.表一年份x19911992199319941995199619971998199920002001y19.825.640.049.068.092.0112.0138.0182.0238.0432.0作出表一所给数据的分布图:销售额趋势图050100150200250300350400450199119931995199719992001年份销售额年份由散布图可以看出统计点是非线性的,它大致呈指数形分布.我们就取经验公式xey(1.8)来拟合这条曲线.这个经验公式所反映的点的排列是非线性的,我们可以通过取对数将其转化为线性函数从而运用最小二乘法确定这个线性函数.即:BAxz其中ln,,lnBAyz,xylnln,进而计算,的值.取)11...2,1(ix;iy为各年的销售额;iiyzln,根据具体数据代入得到如下的表格.表二年份ixiy2ixiiyzlniizx1991119.812.9862.9861992225.643.2436.4861993340.093.68911.0671994449.0163.89215.5681995568.0254.22021.101996692.0364.52227.13219977112.0494.71833.02619988138.0644.92739.41619999182.0815.20446.836200010238.01005.47254.72200111432.01216.60866.748合计661396.450648.941325.085得出:002iiiiiizxxBxAznBxA即:941.481166085.32566506BABAln734327.21210536.3308285809.01210829.345BA查对数表得3994.15,将,代入(1.8)式中,因此得到了所求的经验公式为:xey285809.03994.15(1.9)下面计算相应系数进行显著性检查:924024.15)(1110)(1439.3112222znzLxnxLzxnxzLzzxxxz751.0853.41439.31.zzxxxzLLLR,那么751.0R查看关系表(按)92112,01.0n得到回归临界值735.0,因为751.0R735.0,说明yx,间存在强相关关系,可以按公式:xey285809.03994.15进行外推预测,预测该企业2002和2003年的销售额为:(万元)万元)9044.629(3277.4731312yy以上是根据散点分布趋势选取曲线来拟合得出的结果,那么如果我们强行用线性关系即BAxY来拟合曲线,会得出怎样的结果呢?同样根据数据表年份时间序号ix销售额(万元)