【数学建模】国家财政收入的影响因素的评价及预期收入的预测

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

国家财政收入的影响因素【摘要】国家的财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关。首先,我们根据所给数据,对数据进行描述性分析。之后,我们对数据进行了回归分析,构造了预测模型,获得了模型的回归系数估计值,然后,考虑到每个回归系数置信区间包含零点与否的情况,我们对模型进行了一系列的统计检验,并对模型进行了消除序列相关性的改进,使模型通过了各个统计的检验。之后,我们代入所给数据1953年-1980年的各项经济指标,得到预测值与实际值的拟合效果较好,预测较准确。最后,我们根据网络上查到的数据,利用该模型对1990年和2000年的财政收入作出预测,并对结果进行了分析。关键词:MATLABEviews财政收入回归模型LM检验序列相关性一、问题重述国家的财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关,根据所给数据,对数据进行分析,构造预测模型,并利用该模型对1990年和2000年的财政收入作出预测。二、问题假设1.财政收入只可能与问题重述中提到的6个因素有关,而与其它因素无关;2.所给数据真实准确,无录入错误。3.不考虑偏差大的数据,在建模中把异常点的数据剔除。三、符号说明y:财政收入;x1:国民收入;x2:工业总产值;x3:农业总产值;x4:总人口;x5:就业人口;x6:固定资产投资;β0,β1,β2,β3,β4,β5,β6:回归系数;E:随机误差。X1(-1),X3(-1),X6(-1):x1,x3,x6的一阶滞后项;YF:财政收入的预测值四、问题分析、模型的建立与求解1.问题的分析首先对数据作初步分析。分别用MATLAB作出财政收入与6个因素的散点图,从中找出异常的点,从而把异常的点所对应的数据剔除:500100015002000250030001002003004005006007008009001000国民收入财政收入(亿元图1x1-y散点图010002000300040005000600070001002003004005006007008009001000工业总产值财政收入(亿元图2x2-y散点图40050060070080090010001100120013001002003004005006007008009001000农业总产值财政收入(亿元图3x3-y散点图5.566.577.588.599.51010.5x1041002003004005006007008009001000总人口财政收入(亿元图4x4-y散点图2345678x1041002003004005006007008009001000就业人口财政收入(亿元图5x5-y散点图由该图可以明显看出,最右边有一个异常点:1981年就业人口攀升为73280,较之前有大幅度增长,但财政收入明显地低于预测值,为使个别数据不致影响整个模型,我们将该异常数据去掉。去掉后的x5-y散点图如下:22.533.544.5x1041002003004005006007008009001000就业人口财政收入(亿元图6去掉异常点后的x5-y散点图01002003004005006001002003004005006007008009001000固定资产投资财政收入(亿元图7x6-y散点图2.模型的建立从以上的散点图可以看出财政收入Y与x1~x6大致都呈现线性的关系,我们再引入一个常量回归系数β0,作出了初步的模型:y=β0+β1x1+β2x2+β3x3+β4x4+β5x5+β6x6+E(1)3.模型的求解首先我们剔除掉因为1981年就业人口对财政收入影响异常的特殊点(见图6),之后利用MATLAB统计工具箱中命令regress求解,得到模型(1)的回归系数估计值及其置信区间(置信水平α=0.05)、检验统计量R2,F,p的结果见表1。参数参数估计值参数置信区间β0-15.5344-366.5816335.5127β10.51000.23010.7898β2-0.0259-0.07690.0251β3-0.5905-0.9901-0.1908β40.0113-0.00280.0254β5-0.0230-0.04920.0032β60.3419-0.03870.7225R2=0.9840,F=225.8953,p=0.0000表1模型(1)的计算结果表1显示,R2=0.9840指因变量y(财政收入)的98.40%可由模型(1)的自变量的变化来解释,F值远远超过F检验的临界值,p=0远小于α,因而模型(1)从整体来看是可用的。表1的回归系数给出了模型(1)中β0,β1,β2,β3,β4,β5,β6的估计值,即-15.53440βˆ,5100.01βˆ,0259.0-2βˆ,5905.0-3βˆ,0113.04βˆ,0230.0-5βˆ,3419.06βˆ。检查它们的置信区间发现,β0,β2,β4,β5,β6的置信区间包含零点。从估计结果来看,模型可能存在多重共线性。原因如下:在5%的显著性水平下,由置信区间可以看出除x1与x3外,所有回归系数的t检验值均小于临界值;但F统计量的值225.8953远远大于临界值,且拟合优度很高,解释变量对被解释变量有显著的解释性能力。应用Eviews软件,采用菜单操作可得各解释变量之间的相关系数表,结果见表2:表2从上图可以看出六个解释变量之间两两简单相关关系都在80%以上,甚至有的在98%以上,超过了拟合优度,这表明模型存在严重的多重共线性。4.模型的改进根据以上的分析,我们采用逐步回归法来确定回归模型。第一步,用每个解释变量分别对被解释变量做简单回归,从而决定解释变量的重要程度,为解释变量排序。应用Eviews软件,采用菜单操作可得各解释变量与被解释变量的拟合优度:x1的拟合优度R2=0.951223x2的拟合优度R2=0.937951、x3的拟合优度R2=0.843960、X4的拟合优度R2=0.865832、x5的拟合优度R2=0.860956x6的拟合优度R2=0.939462根据t统计量的大小排序,可见解释变量的重要程度依次为:x1,x6,x2,x4,x5,x3。第二步,以Y=21.82266+0.3233378X1为基础,依次引入x6,x2,x4,x5,x3。根据逐步回归法的原则,最终确定的模型(2)为:Y=163.1010+0.406223X1-0.49127X3+0.330958X6(2)其中其模型的分析结果为:表3模型(2)的计算结果由上表可以看出,模型(2)的所有变量的参数都通过了t检验,且F值为440.9664,比模型(1)的F值大很多,这说明模型的显著性是可以通过的。但模型(2)的DW值是1.505283,又对于显著性水平α=0.05,n=29,k=3,查D-W分布表,得到检验的临界值dL=1.27和dU=1.56,由此可知,模型(2)的DW值位于临界值dL和dU之间,因此不能判断模型是否存在序列相关性。下面用LM检验检验模型(2)是否存在序列相关性,首先检验模型的一阶序列相关性。应用Eviews软件,采用菜单操作可得LM检验的结果,结果见表4:表4由上图可得,存在一阶序列相关的概率P=0.3586450.05,所以认为模型存在一阶序列相关性。下面检验模型是否存在两阶序列相关性。应用Eviews软件,采用菜单操作可得LM检验的结果,结果见表5:表5由上图可知,存在两阶序列相关的概率P=0.0364110.05,所以认为模型不存在两阶序列相关性。综上两点可知,模型(2)只存在一阶序列相关性,不存在两阶或两阶以上的序列相关性。下面应用Eviews软件,采用菜单操作运用广义差分法进行自相关的处理。所得结果为表6:表6修正后的模型(2)的计算结果由此可知,在Eviews软件包下,1阶广义差分的估计结果为:Y=170.0423+0.396846X1-0.49698410X3+0.36841X6+0.217615AR(1)(3)AR(1)前的参数值为随机干扰项的一阶序列相关系数。对于显著性水平α=0.05,n=28,k=3,查D-W分布表,得到检验的临界值dL=1.26和dU=1.56,又由上图可知,修正后的模型(2)的DW值为1.599760dU=1.56且4-dU,由此认为修正后的模型(2)不存在一阶序列相关性。所以修正后的模型为:Y-0.217615Y(-1)=163.1010(1-0.217615)+0.406223(X1-0.217615X1(-1))-0.49127(X3-0.217615X3(-1))+0.330958(X6-0.217615X6(-1))(4)5.结果分析从表面上看,经过用广义差分法修正后的模型(2)已经不存在序列相关性了,这就说明模型排除了序列相关性的干扰。用广义差分法修正后的模型(2)的拟合度已经达到了R2=0.98,这表明财政收入的98%可以由解释变量x1、x3、x6解释。残差E=F-FY可以作为随机误差的估计值,画出随机误差E的走势图(图8)能够从直观上判断ε的自相关性。图8修正后的模型(2)E的走势图从图8可以看出,随机误差项E的走势大概呈现标准正态分布的趋势,这表明E几乎不存在自相关性了。下面,我们将使用修正后的模型(2)对之前数据进行评价:年份1953195419551956195719581959实际值216248254268286357444预测值197.0488241.8454235.6226276.3688267.6546375.1301483.6987年份1960196119621963196419651966实际值506271230266323393466预测值517.5848305.6149233.9238255.0631301.5687377.6023431.3645年份1967196819691970197119721973实际值352303447564638658691预测值376.7942349.9542448.8678553.8521614.6158635.7772667.8887年份1974197519761977197819791980实际值655692657723922890826预测值662.9507718.7919672.9797723.4487829.0786878.6001893.5268表7财政收入的预测值与实际值对比19501955196019651970197519801002003004005006007008009001000YYF图9财政收入预测值与实际值的拟合图从上可以看到,预测值与实际值还是相当吻合的。之后,我们查阅了1990年及2000年的国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资,代入模型(2)。结果如下:年份国民收入工业总产值农业总产值总人口就业人口固定资产投资199011412.9622452.27514611295463931.94517200098000.575710.6913873.612674372116.7732917.7年份财政收入(预测值)财政收入(实际值)19903766.22821.8620004405213395.23表81990年和2000年财政收入预测值与实际值对比数据来源自《CNKI中国统计年鉴数据库》从表8可以看到,1990年预测值与实际值和2000年的预测值都相差较大,原因不一定是模型建立的偏差大,还有可能是其他原因,如在查阅数据时,我们就发现了2000年的工业总产值数据注明了“1990年不变价格”,而其余数据没有此说明项;且1980年后国家实行了改革开放的经济政策,经济的发展规律发生了很大的变化,用1980年以前的数据建立起来的模型去预测1980年后的一些经济数据自然会有较大的偏差。并且,在固定资产投资一栏,我们查到了非常详细的分类,固定资产投资资金来源中国家预算内资金,固定资产投资资金来源中国内贷款,固定资产投资资金来源中自筹和其他资金等备注,而题目并未给出,这给我们

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功