1国内生产总值增长分析预测模型摘要国内生产总值是指一个国家或地区范围内的所有常住单位,在一定时期内生产最终产品和提供劳务价值的总和,是反映宏观经济的总量指标。国内生产总值能够提供经济状况的较完整的图像,不但可反映一个国家的经济表现,更可以反映一国的国力与财富。问题一,建立国内生产总值与工业值、建筑业及农林渔业产值之间的数量模型,对线形回归模型的创建过程如下:1分析国内生产总值GDP和工业值、建筑业及农林渔业产值之间的相互关系。2检验相关系数的显著性,判断相关系数的客观真实状况。3研究目的确定国内生产总值自变量和工业值、建筑业及农林渔业产值之间的为因变量并对未来经济预测。4采用最小二乘法求解参数0、1、2、3等,建立回归模型:3322110xxxy,其中:国内生产总值y、工业值1x、建筑业2x、农林渔业产值3x。直接利用MATLAB统计工具箱中的命令regress求解,得出回归残差图,分析图像,从残差图可以看出,有三个数据残差不包含零,则常把它们视为异常值,在回归中应把它们剔除,再进行回归,再进行四次异常值剔除及回归得到模型的回归系数估计值及其置信区间。为了增加结果的可靠性引入时间序列方法预测20102001的GDP,通过与模型的预测值和GDP一次回归模型的预测值比较分析,选择误差最小的数据作为预测值。问题二,回归模型的选择是基于传统的DouglasCobb生产函数形KALY,时间序列分析中首先遇到的问题是关于时间序列数据的平稳性。如果一个时间序列iX是非平稳的,则均值和方差将随时间t改变,采用ADF检验来判断序列的平稳性,虚拟假设都是,0:0H即存在一个单位根。式5包含有常数项和趋势项。实际检验带有常数项和趋势项开始,然后分别去掉常数项和趋势项。何时检验拒绝零假设,即原序列不存在单位根。为平稳序列,何时停止检验,否则就要继续就检验。然后采用杜宾两步法进行协整检验:第一步,用OLS法估计上述方程并计算非均衡误差;第二步,检验e的单整性最后得出估计的回归方程。关键词:回归分析异方差自相关时间序列协整检验2一、问题重述1.1问题背景国内生产总值(GDP)是指一个国家或地区范围内的所有常住单位,在一定时期内生产最终产品和提供劳务价值的总和,是反映宏观经济的总量指标。国内生产总值能够提供经济状况的较完整的图像,通过它可以判断经济是在萎缩还是在膨胀,是需要刺激还是需要抑制,是处于严重衰退还是通胀威胁之中。自从1985年以来,国内生产总值的核算已经成为我国经济管理部门了解经济运行状况的重要手段和制定经济发展战略、规划、年度计划以及各种宏观经济政策的重要依据.因此,研究和建立国内生产总值模型具有重要的现实意义。1.2问题提出利用附件中的数据解决以下问题:⑴建立国内生产总值与工业值、建筑业及农林渔业产值之间的数量模型,利用数据对未来经济做出预测;⑵讨论国内生产总值增长与资本及劳动之间的关系。利用数据验证其结果。二、模型假设1、误差项的方差不依赖于自变量x的值。2、误差服从正态分布。3、误差是独立的。4、国民生产总值是一时间序列。5、国民经济发展稳定,无大波动。6、在一个始终相对和平时期研究国民生产总值。三、符号说明y:GDP1x:工业值2x:建筑业值3x:农林渔业产值2R:复相关系数F:统计量值p:显著性概率L:劳动K:资本i:回归系数:随机误差1tecm:非均衡程度:协整向量四、模型的建立与求解4.1问题一4.1.1问题分析影响国民生产总值的因素比较多,三个产业的划分是世界上较为常用的产业结构分类,但各国的划分不尽一致。我国的三次产业划分是:第一产业是指农、林、牧、渔业;第二产业是指采矿业,制造业,电力、煤气及水的生产和供应业,建筑业;第三产业是指除第一、二产业以外的其他行业。根据附录1提供的数据,通过数据挖掘线性回归的分析得出建立国内生产总值与工业值、建筑业及农林渔业产值之间的数量模型,利用数据对未来经济做出预测。34.1.2对线形回归模型的创建过程⑴分析国内生产总值(GDP)和工业值、建筑业及农林渔业产值之间的相互关系。⑵检验相关系数的显著性,判断相关系数的客观真实状况。⑶研究目的确定国内生产总值自变量和工业值、建筑业及农林渔业产值之间的为因变量并对未来经济预测。⑷采用最小二乘法求解参数0、1、2、3等,建立回归模型:3322110xxxy4.1.3关系模型的建立定义国内生产总值为因变量y,工业值、建筑业及农林渔业生产总值为自变量分别记为1x、2x、3x,为了大致地分析y与1x、32xx和的关系,首先利用附件1的数据分别作出y对1x、2x和3x的散点图如下:图1:y对1x、2x和3x的散点图从图中可以发现,随着1x的增加,y的值有比较明显的线性增长趋势,图中的直线是用线性模型110xy1210xy2310xy3拟合(其中是随机误差)的。综合上面的分析,结合模型321、、建立如下的回归模型3322110xxxy44式右端的321xxx和、称为回归变量(自变量),3322110xxx是给定工业值1x、建筑业值2x、农林渔业产值3x时,国内生产总值的平均值,其中的参数3210、、、称为回归系数,由附录1的数据估计,影响y的其它因素作用都包含在随机误差中。如果模型选择得适合,应大致服从均值为零的正态分布。利用excel统计软件对数据进行多元线性回归求解得回归方程为:3210.03071X3.9824X1.8561X732.2431Y拟合预测图像为:4图2:拟合预测图拟合度检验:5320.999698092R,说明回归方程的上所述样本的解释能力为99.969809532%,回归的拟合度很好。参数检验:斜率的t检验系数标准误差t统计量t临界值p值显著性置信区间下限置信区间上限截距732.2431645.3421.134662.048410.26614不显著-589.68002054.166X11.8560790.0918920.19902.048413.12841显著1.66785162.044307X23.9824230.532847.474002.048413.85581显著2.89095585.073891X30.0307070.163430.187892.048400.85231不显著-0.3040670.365483方差分析和斜率的F检验自由度平方和平均平方和F统计量F临界值p值显著性回归32.780480292682672330905.5022.94668532.2646382显著剩余2883969347.2998905.3总计312.7813199预测分析:置信区间和预测区间估计Y预测值的均值估计:请输入X的值X1X2X3区间半宽1149.323167511607138.21027.5345426置信区间下限3147.56348285区间估计置信水平0.05置信区间上限5446.2098177矩阵计算值0.10530219684单个X对Y的影响:t统计量2.0452296111区间半宽3723.6080615Y预测值4296.8866503预测区间下限573.27858879预测区间上限8020.4947118直接利用MATLAB统计工具箱中的命令regress求解,得4的回归残差图如下:51015202530-6000-4000-20000200040006000ResidualCaseOrderPlotResidualsCaseNumber图3:残差图从残差图可以看出,有三个数据残差不包含零,则常把它们视为异常值,在回归中应把它们剔除,再进行回归。计算得:再进行四次异常值剔除及回归得到模型4的回归系数估计值及其置信区间(置信水平05.0)、检验统计量pFR,2,的结果见表1。6表1:模型4的计算结果5101520-1500-1000-5000500100015002000ResidualCaseOrderPlotResidualsCaseNumber图4:残差图结果分析:从图4可以看出,所有数据的残差图都包含零,且表1显示,99996.02R指因变量y(GDP)的%996.99可由模型确定,F值远远超过F检验的临界值,p远小于,因而模型4回归效果显著,从整体看模型时可用的。4.1.4对未来经济的预测与附录一相关数据绘出工业值、建筑业及农林渔业生产总值与时间的关系图如下:7图5:工业值、建筑业及农林渔业生产总值与时间的关系利用Matlab拟合求解工业总值与时间的拟合函数为:376.8589486308459.8653619555.21721xxy建筑业拟合曲线为:5683.1289319749449.1298767071.3222xxy农林渔业产值拟合曲线为:7695.1448278672579.1462819376.3623xxy对2001-2010年国民生产总值预测如表2。为了增加结果的可靠性引入其他方法进行预测2001-2010,通过比较分析各种方法预测的数据,选择误差最小的数据作为预测值:1时间序列设时间序列为,,2,1),(ttx嵌入维数为m,时间延迟为,则重构相空间为:),,2,1(,)))1((,),(),(()(NtRmtxtxtxtYm根据ensTak定理,对合适的嵌入维数m,时间延迟,重构相空间,在嵌入空间的“轨线”,在微分同胚意义下与原系统是“动力学等价的”,因而存在一个光滑映射:,mmRRf:给出相空间轨迹的表达式:,2,1));(()1(ttYftY上述映射问题可表示为时间序列:))(,),2(),((mtxtxtx=)))1((,),(),((mtxtxtxf利用SQ6统计软件计算得预测值如表二。2一元回归利用SQ6统计软件计算得回归方程如下:)e102.4069yx700971-609725.35(137预测值如表2.年份20012002200320042005时间序列预测值105206.48954112560.39271123836.605140317.363163212.402误差2.65%5.49%8.39%12.07%12.16%一元回归预测值111542.67129879.90151208.176013.204856.8271182726450171误差3.11%8.30%10.60%9.3359.30%模型一预测值111542.67271126048.6083138742.002152057.486165995.060误差5.4%5.8%2.6%4.7%10.6%实际值108068.22056119095.68927135173.976159586.748185808.559年份20062007200820092010时间序列预测值191904.62056227892.56238277708.258333657.238394957.693误差11.78%14.89%12.18%2.86%7.60%一元回归预测值238389.18018277369.31998322674.60984375323.49639误差8.75%3.46%2.00%8.49%模型一预测值227335.4693249663.0176273030.345297437.455322884.345误差4.5%6.7%13.6%13.4%实际值217522.66981267763.65878316228.825343464.6902011年国民生产总值综合预测值为394789.249194.2问题二4.2.1问题分析随着社会生产力的发展.人力、资本要素在经济增长中的作用日益显现.并成为社会经济增长和发展的决定性要素。改革开放以来,中国经济保持了高速的增长态势.取得了举世瞩