经济增长问题摘要本文主要应用数学建模中的多元回归模型,来拟合多个影响因素对一个变量的影响。最后通过统计分析,说明此模型在实践中的可行性,并对短期内的情况进行预测。其中第一问根据中国1978-2009年的国内生产总值、工业值、建筑业及农林渔业产值数据,考量它们之间的关连性,利用离散点拟合得到近似的函数关系为多元线性函数关系。然后据此线性关系,建立多元线性回归模型,利用matlab软件中相关命令求出回归系数,通过残差图、相关系数、F值和与F相对应的概率值确定模型的可用性。为了对未来经济进行预测,我们经过多次拟合得到最优模型,建立工业值、建筑业值、农林渔业值对年份的四次函数,分别预测出这三个行业的产值,继而通过上述多元线性回归模型预测出未来国内生产总值。类似于第一问,第二问建立了多元非线性回归模型,根据题目要求,利用题中已知数据带入非线性回归模型的函数,求出数据进行检验,证明出该模型是准确的。关键字:多元回归模型、拟合、残差图、预测、增长率一、问题重述1.1问题提出国内生产总值(GrossDomesticProduct,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和服务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。附件1:中国历年国内生产总值、工业值、建筑业及农林渔业产值数据;附件2:中国根据投资来源历年的固定投资数据;附件3:中国历年总人口的自然增长率。利用附件中的数据解决以下问题:(1)建立国内生产总值与工业值、建筑业及农林渔业产值之间的数量模型,利用数据对未来经济做出预测;(2)讨论国内生产总值增长与资本及劳动之间的关系。利用数据验证其结果。1.2问题分析按生产法核算国内生产总值,可以分为下列部门:工业、建筑业、农林渔业及其他行业。把以上部门生产的国内生产总值加总,考虑统计误差项,就可以得到用生产法计算的GDP了。因为本题只给出工业、建筑业、农林渔业的相关数据,不能够直接用上述经济学原理得出国内生产总值与工业值、建筑业及农林渔业产值之间的数量模型。通过已有数据建立回归模型,拟合出这四着之间的曲线方程。分别建立工业、建筑业、农林渔业随时间变化的函数,根据所建立的函数分别对工业、建筑业、农林渔业进行预测,将所得的数值带入已建立的回归模型中,进而对未来经济做出预测。资本,在经济学意义上,指的是用于生产的基本生产要素,即资金、厂房、设备、材料等物质资源。在金融学和会计领域,资本通常用来代表金融财富,特别是用于经商、兴办企业的金融资产。我们认为资本所产生的经济作用不会因为投入资本的主体的不同而有差异,所以我们把国家预算内资金、国内贷款、利用外资、自筹和其他资金看作一个整体。劳动力有广义和狭义之分。广义上的劳动力指全部人口。由于题中只给出了人口的增长率,因此在讨论国内生产总值增长与劳动之间的关系是可以用广义的劳动力定义,不考虑劳动年龄和劳动能力两个因素。通过建立国内生产总值增长与资本及劳动之间的回归模型,得出他们之间的关系。二、条件假设国内生产总值与工业值、建筑业及农林渔业产值之间的数量模型,并对未来经济做出预测;国内生产总值增长与资本及劳动之间的关系,为方便求解,我们做出如下合理假设:(1)所给数据完全合理;(2)工业值、建筑业及农林渔业产值是相互独立的;(3)经济的预测即为GDP的预测,所预测年份GDP正常变化,不考虑未知的大事件对经济所造成的非正常变化(4)按广义的劳动力定义,不考虑年龄和劳动能力两个因素,所有人口都是劳动力。三、符号假设1X-工业产值;2X-建筑业产值;3X-农林渔业产值;4X-资本;5X-劳动力;Y-国内生产总值;1Y-国内生产总值的增长率;i-回归系数;t-时间;四、模型建立4.1数量模型的建立求解4.1.1回归模型的建立为了大致的分析Y与123XXX、、的关系,利用附件1中给出的数据,分别作出Y对123XXX、、的散点图。02468101214x10400.511.522.533.5x105工业值国民生产总值国民生产总值与工业值的关系00.511.522.5x10400.511.522.533.54x105建筑业值国民生产总值国民生产总值与建筑业值的关系00.511.522.533.54x104-0.500.511.522.533.5x105农林渔业值国民生产总值国民生产总值与农林渔业值的关系从图随着X的增加,Y的值有比较明显的线性增长,可以看出国民生产总值与建筑业值、农林渔业值同样近似呈一元线性关系,所用的线性模型为:01YX不考虑数据的误差性,综上分析我们得到国民生产总值与工业值、建筑业值及农林渔业产值模型为:0112233YXXX(4)其中参数0123,,,为称为回归系数。4.1.2模型的求解利用matlab统计工具箱中命令函数regress求解回归模型Y的回归参数及关联参数,格式为:b,bint,r,rint,statsregress,'YX其中:b为回归系数估计值;intb为置信区间;stats包括判定系数2R,显著性检验F,概率p;r为残差;intr为置信区间。判定系数2R是衡量拟合优度的一个重要指标,它的取值介于0与1之间,2R越接近于1,拟合度越好,反之越差。得到的结果如下图:参数参数估计值参数置信空间0732.277[-589.637,2054.192]11.8560[1.667,2.044]23.9824[2.891,5.073]30.0306[-0.304,0.365]2R=0.9997F=30906.00P因为20.9997R极接近与1,并且30906.0F非常大,0,0.05pp,所以回归模型成立。123732.2771.85603.98240.0306YXXX4.1.3模型的残差分析在Matlab命令窗口输入:rcoplot(r,rint),得到残差图如图所示:再在matlab命令中输入:0112233YXXX;plot(X,Y,’k+’,X,Y,’r’)得到预测比较图所示:4.2经济预测模型的建立分别建立工业、建筑业、农林渔业关于时间t的函数。观察工业值随时间变化的散点图,建立以下模型:234101234Xtttt经过多次拟合,当该函数为四次多项式时已经非常接近于元散点图,如下图所示:19751980198519901995200020052010051015x104时间t工业值拟合值与实际值比较图*拟合-实际同理,建筑业、农林渔业产值与时间t的函数以此建立。得出三个函数的回归系数,如下表所示:1X2X3X08632443209402.232316265065433.762702699167505.711-17356447231.3914-4654357605.47519-5426642133.48965213086410.36637883507208.705576964085973.429689883-4385.29784341213-1174.57319405723-1367.3416923790340.5510745359184180.1475125550533540.171589058430804根据这三个函数,当2010t时分别预测出123XXX、、,123162183.763671875,25774.1645507813,39766.0649414063XXX24681012x1040.511.522.533.5x1050.511.52x1040.511.522.53x104将以上三个值带入回归模型预测出2010年国内生产总值为405605.216869239亿,查找相关资料,2010年实际的国内生产总值为397983亿,误差仅为1.9%。说明该模型非常正确。4.2GDP增长与资本劳动之间的关系模型的建立4.2.1回归模型的建立我们认为资本所产生的经济作用不会因为投入资本的主体的不同而有差异,所以我们把国家预算内资金、国内贷款、利用外资、自筹和其他资金看作一个整体,作为4X;按照广义的劳动力定义,可以将人口的自然增长率看做劳动力的增长率5X。为了大致的分析1Y与45XX、的关系,利用附件2、3中给出的数据,分别作出1Y对45XX、的散点图。00.050.10.150.20.250.30.350.040.060.080.10.120.140.160.180.20.220.24资本增长率GDP增长率GDP增长率与资本增长率的关系图0.050.0550.060.0650.070.0750.080.0850.090.0950.060.080.10.120.140.160.180.20.220.24劳动增长率GDP增长率GDP增长率与劳动增长率的关系图从图()可以发现,随着4X的增加,1Y的有比较明显的线性增长趋势,图中的的直线是用线性模型:1014YX拟合的,而在图()中,当5X增大时,1Y有向下弯曲减少的趋势,将题中的数据多次进行拟合,当曲线为三次多项式时已非常接近原散点图,图中的曲线用的三次函数模型为;2310152535YXXX拟合的。综合上面的分析,结合模型()和()建立如下的回归模型。231014253545YXXXX01234、、、、为回归系数。4.2.2模型的求解利用matlab统计工具箱中命令函数regress求解回归模型Y的回归参数及关联参数,格式为:b,bint,r,rint,statsregress,'YX其中:b为回归系数估计值;intb为置信区间;stats包括判定系数2R,显著性检验F,概率p;r为残差;intr为置信区间。判定系数2R是衡量拟合优度的一个重要指标,它的取值介于0与1之间,2R越接近于1,拟合度越好,反之越差。得到的结果如下图:系数值置信区间04.6232[-2.0695,11.3159]10.4916[-0.2672,1.2505]2-198.4373[-510.7721,113.8973]32813.2768[-1805.8417,7432.3953]4-13086.7285[-35136.3985,8962.9415]20.899413.4072RF、、0.0038p因为20.8894R,很接近于1,0.0038p,0.005p回归模型成立,模型为:2345554.62320.4916198.43732813.276813086.7285YXXXX4.2.3模型的残差分析在Matlab命令窗口输入:rcoplot(r,rint),得到残差图如图所示:1234567891011-0.06-0.04-0.0200.020.040.06ResidualCaseOrderPlotResidualsCaseNumber由残差图可以看出有一个异常点。将45XX、的数据带入得出的回归方程中,结果如下表:年份计算出的GDP增长率实际的GDP增长率19997.02%6.57%200010.17%10.76%20019.98%10.27%200210.77%10.20%200316.59%13.50%200415.54%18.06%200515.30%16.43%200618.90%17.07%200720.67%23.10%200819.17%18.10%由上表可以看出该模型较为准确。五、模型检验检验预测模型的合理性,我们认为当工业值、建筑业值、农林渔业值是关于时间t的4次函数时,不仅精确度非常高而且模型也比较简单。当模型为二次和三次函数时,拟合出的函数曲线与原数据的散点图的对比如图()、图()所示,当模型为四次函数是,如图()所示。19751980198519901995200020052010-202468101214x104工业值时间工业值关