1(基于合作的改善财管2洪冬青)题目财政收入预测摘要财政收入是衡量一个国家综合实力的重要指标,对国家的经济走向有重大深远的影响。本文即通过对影响财政的六大因素进行具体深入分析,构建相应的预测模型。针对财政收入预测问题,本文建立了多元线性回归模型(模型一)和灰色预测模型(模型二)。并通过两种模型的建立与求解,给出题目问题的答案,并对结果进行了综合的分析与评价。模型一:首先,根据题目可知,财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等六种因素有关,并对数据进行回归性分析,(在附录中给出)运用EXCEL软件画出财政收入与六种要素的散点图,结合回归分析表格,挑选出对应变量y影响显著的那些来建立回归模型。接着得出财政收入与六种因素的解:1234560.5099880.025920.590470.0112950.022990.34187515.5344YXXXXXX其次,将1952-1981年的各项指标数据带入模型,得到预测值与实际值拟合效果较好。最后,我们用2000年的数据进行验证,得出预测值与实际值拟合良好,表示这个方程可以正确反映影响财政收入各因素的情况。由此最终确定上述模型是确实可用的。模型二:首先,本文根据所给数据,对数据进行描述性分析。之后,对数据进行了回归分析,构造了预测模型,并获得了模型的回归系数估计值及其置信区间。然后,考虑到每个回归系数置信区间包含零点与否的情况,我们对模型进行了改进,并得到了其交互式画面。考虑到数据的时间序列属性,我们对模型进行了自相关性诊断,作出残差散点图,初步判定其大部分点落在1,3象限,随机误差表现出正自相关趋势。但在之后的D-W检验中,我们计算出了DW值,自相关系数估计值ˆ,依照样本容量和回归变量数目,查阅了D-W分布表,得到检验的临界值dL和dU。在分析DW所在区间时,我们发现模型的自相关状态不能确定。之后,我们代入所给数据1952年-1980年的各项经济指标,得出的预测值与实际值相当吻合。最后,我们根据网络上查到的数据,利用该模型对1990年和2000年的财政收入作出预测,并对结果进行了分析得到最优解为:x63320.0x50223.0x40108.00.5958x3x20.0250-x15146.0ˆy模型二建立在大量的现实数据之上,分析了各个因素之间的联系,有较强的实用性与通用性。运用MATLAB求解,数据精确。此外,模型二对现实财政问题有较高的参考价值。关键词财政收入预测多元线性回归模型回归分析EXCELMATLAB软件2一、问题重述财政收入预测问题:财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资等因素有关。附件列出了1952-1981年的原始数据,对这些数据进行分析并构造预测模型。二、问题假设1、假设财政收入至于上述六种要素有关,不考虑技术、管理等因素对财政收入的影响;2、假设我们所统计和分析的数据,都是客观真实的;3、影响财政收入的各个因素中,波动较大的数据可以进行剔除;4、在数据计算过程中,假设误差在合理范围之内,对数据结果的影响可以忽略;三、问题分析本题属于预测类数学问题,解决此类我们一般采用回归的分析方法。首先我们利用EXCEL绘制散点图,逐步分析财政收入于各个因素之间的关系,通过散点图我们得出财政收入大概与各个因素呈线性相关。因此我们考虑建立多元线性回归模型求解。先对各个因素进行线性拟合,得出它们间的线性系数。再结合散点图将不符合回归模型的数据视为特殊点进行剔除。然后将剔除特殊点后的数据进行整体的拟合,判断相关系数是否接近1,若接近1,则此方程成立。得出财政收入于各个因素的线性关系式,利用数据绘制散点图,将不符合的点进行标注说明。最后我们将2000年的财政收入于各个影响因素的数据代入验证得出结果与实际值拟合良好,最终确立模型。四、符号说明符号说明1Xt国民收入2Xt工业总产值3Xt农业总产值4Xt总人口5Xt就业人口6Xt固定资产投资Y财政收入(亿元)β0,β1,β2,β3,β4,β5,β6:待计的回归系数ε随机误差五、模型的建立与求解35.1模型的分析将数据录入统计软件EXCEL,建立统计数据库,先建立财政收入与国民收入、工业总产值、农业总产值、总人口、就业人口、固定资产投资的散点图。如下图所示:图一1XY散点图图二2XY散点图图三3XY散点图图三3XY散点图国民收入与财政收入y=23.172x-45083R2=0.8262y=76.098x-148199R2=0.8942050010001500200025003000350019501960197019801990国民收入(亿元)财政收入(亿元)线性(国民收入(亿元))线性(财政收入(亿元))线性(财政收入(亿元))线性(国民收入(亿元))农业总产与财政收入y=25.273x-48977R2=0.8578y=23.172x-45083R2=0.8262020040060080010001200140019501960197019801990农业总产值(亿元)财政收入(亿元)线性(农业总产值(亿元))线性(财政收入(亿元))工业总产与财政收入y=206.69x-403897R2=0.8706y=23.172x-45083R2=0.8262-100001000200030004000500060007000800019501960197019801990工业总产值(亿元)财政收入(亿元)线性(工业总产值(亿元))线性(财政收入(亿元))线性(工业总产值(亿元))线性(财政收入(亿元))4图四4XY散点图图五5XY散点图图六6XY散点图固定资产与财政收入y=23.172x-45083R2=0.8262y=15.857x-30909R2=0.70490100200300400500600700800900100019501960197019801990固定资产投资(亿元)财政收入(亿元)线性(财政收入(亿元))线性(固定资产投资(亿元))就业人口与财政收入y=975.74x-2E+06R2=0.7128y=23.172x-45083R2=0.82620100002000030000400005000060000700008000019501960197019801990就业人口(万人)财政收入(亿元)线性(就业人口(万人))线性(财政收入(亿元))总人口与财政收入y=1543.6x-3E+06R2=0.9814y=23.172x-45083R2=0.826202000040000600008000010000012000019501960197019801990总人口(万人)财政收入(亿元)线性(总人口(万人))线性(财政收入(亿元))5由散点图就业人口与财政收入可以看到1981年就业人口上升为73280,与之前就业人口有大幅度增长,但财政收入明显低于预测值,因此此数据作为特殊点去掉。(注:1981年国民收入、工业总产值、农业总产值、总人口、固定资产都增加了,从而就业人口增加,故作为特殊点不予考虑)得到下图:图五去掉特殊点后的5XY散点图图七5.2模型的建立:由上几幅图进行分析可知各类别因素和财政收入大致呈线性增长。利用EXCEL软件求得:表一:影响因素回归系数判断系数2R回归方程1β2β国民总产值0.323421.8230.951210.323421.823YXt工业总产值0.118189.610.93820.118189.61YXt农业总产值0.9162-169.990.84430.9162169.99YXt总人口0.0154-710.010.865840.0154710.01YXt就业人口0.0305-463.40.86150.0305463.4YXt固定资产投资1.3004127.480.939561.3004127.48YXt通过以上图的判断系数2R可看出财政收入与国民收入、工业总产值、农业总产值、总人口、固定资产投资线性关系较强且呈正线性相关,和总人口线性关系中等。说明得出的回归方程较可靠。说明财政收入Y与图六6XY散点图呈线性关系,所以设多元线性回归模型为:εβ6x6x5β5x4β4x3β3x2β2x1β1y利用EXCEL电子表格软件得出财政收入预测相关系数:财政预测回归分析结果:就业人口与财政收入05000100001500020000250003000035000400004500019501960197019801990就业人口(万人)财政收入(亿元)6首先剔除掉1981年作为特殊点就业人口对财政收入影响,然后用EXCEL回归分析工具对数据进行分析求解,多变量回归分析结果如下图:表二多变量相关系数X1X2X3X4X5X6X7X8X11X20.9886971X30.9772290.9619111X40.9697210.9528060.9546031X50.9660940.9458280.9452130.99681X60.9386360.9436660.8676160.8660870.8673821Y0.9753070.9684790.9186730.9305010.9278770.96925815.3模型的求解表三残差分析Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-15.5344169.2713-0.091770.927709-366.582335.5127-366.582335.5127X10.5099880.1349463.7791910.0010320.2301260.7898490.2301260.789849X2-0.025920.024599-1.05370.303455-0.076930.025095-0.076930.025095X3-0.590470.192694-3.064290.005679-0.99009-0.19085-0.99009-0.19085X40.0112950.006821.656020.111913-0.002850.025439-0.002850.025439X5-0.022990.012646-1.818170.082681-0.049220.003234-0.049220.003234X60.3418750.1835151.862930.075879-0.038710.722461-0.038710.722461如上图求得财政收入与各因素的最优解为:1234560.5099880.025920.590470.0112950.022990.34187515.5344YXXXXXX5.4模型的检验利用EXCEL中的“回归”分析工具得到方差分析表格:表四方差分析dfSSMSFSignificanceF回归分析61329611221601.9225.89531.31E-18残差2221581.86980.99387总计281351193表三:表三残差分析Coefficients标准误差tStatP-valueLower95%Upper95%下限95.0%上限95.0%Intercept-15.5344169.2713-0.091770.927709-366.582335.5127-366.582335.5127X10.5099880.1349463.7791910.0010320.2301260.7898490.2301260.789849X2-0.025920.024599-1.05370.303455-0.076930.025095-0.076930.025095X3-0.590470.192694-3.064290.005679-0.99009-0.19085-0.99009-0.19085X40.0112950.006821.656020.111913-0.002850.025439-0.002850.