北京航空航天大学研究生课程论文第1页共12页逐步回归法建立国家财政收入回归模型SY1107405秦金涛摘要:论文建立含有总人口X1(万人)、农林牧渔业总产值X2(亿元)、国内工业生产总值X3(亿元)、国内建筑生产总值X4(亿元)、社会商品零售总额X5(亿元)、就业人员X6(万人),受灾面积X7(万公顷)、能源生产总量X8(万吨标准煤)、共8个因素的国家财政收入回归模型,应用逐步回归法,通过统计软件SPSS13.0的计算,分析各个因素对国家财政收入的影响程度。关键词:国家财政收入、回归模型、逐步回归法、SPSS软件北京航空航天大学研究生课程论文第2页共12页摘要:论文建立含有总人口X1(万人)、农林牧渔业总产值X2(亿元)、国内工业生产总值X3(亿元)、国内建筑生产总值X4(亿元)、社会商品零售总额X5(亿元)、就业人员X6(万人),受灾面积X7(万公顷)、能源生产总量X8(万吨标准煤)、共8个因素的国家财政收入回归模型,应用逐步回归法,通过统计软件SPSS13.0的计算,分析各个因素对国家财政收入的影响程度。关键词:国家财政收入、回归模型、逐步回归法、SPSS软件。北京航空航天大学研究生课程论文第3页共12页引言国家财政收入的影响因素有很多,例如:工农业产值、总人口、受灾面积等等。有些因素对国家财政收入的影响大,而有些影响却很小;有些与国家财政收入呈线性关系,有些则呈其他复杂的曲线关系。本论文仅仅讨论各个因素与财政收入的直线关系,使用逐步回归法建立模型。通过SPSS12.0的计算分析,达到深入学习多元线性回归模型和初步应用数理统计软件的学习目的。逐步回归分析和模型的建立逐步回归分析的主要计算步骤(1)确定检验值在进行逐步回归计算前要确定检验每个变量是否显著的检验水平,以作为引人或剔除变量的标准。(2)逐步计算计算全部候选变量中最大F值的P值引入最小值,检验是否剔出,再次计算P值,满足条件再次引入,直至没有变量可以引入。逐步计算的每一步总是先考虑剔除变量,仅当无剔除时才考虑引入变量。本例中建立含有总人口X1(万人)、农林牧渔业总产值X2(亿元)、国内工业生产总值X3(亿元)、国内建筑生产总值X4(亿元)、社会商品零售总额X5(亿元)、就业人员X6(万人),受灾面积X7(万公顷)、能源生产总量X8(万吨标准煤)、共8个因素的国家财政收入回归模型如下:其中b0、b1、b2、b3、b4、b5、b6、b7、b8均是未知参数,是不可观测的随机误差。28877666655443322110)(,0)(VarEXbXbXbXbXbXbXbXbXbbY北京航空航天大学研究生课程论文第4页共12页应用SPSS17.0计算分析1.原始数据输入年份财政收入Y(亿元)总人口X1(万人)农林牧渔业总产值X2(亿元)国内工业生产总值X3(亿元)国内建筑生产总值X4(亿元)社会商品零售总额X5(亿元)就业人员X6(万人)受灾面积X7(万公顷)能源生产总量X8(万吨标准煤)19956242.212112120340.924950.65793.7523613.868065458241290341996740812238922353.729447.68282.2528360.2689504699113303219978651.112362623788.432921.49126.4831252.969820534271334601998987612476124541.934018.410061.9933378.17063750145129834199911444.112578624519.135861.511152.8635647.97139449980131935200013395.212674324915.840033.612497.639105.7720855468813504820011638612762726179.643580.615361.5643055.47302552215143875200218903.612845327390.847431.318527.1848135.97374047119150656200321715.312922729691.854945.523083.8752516.37443254506171906200426396.5129988362396521029021.45595017520037106196648200531649.2913075639450.976912.934552.167176.67582538818216219200638760.213144840810.891310.941557.16764107640041091232167200751321.7813212948893110534.951043.71892107699048992247279200861330.3513280258002.2130260.262036.81108487.77748039990260552200968518.313347460361135239.976807.74132678.47799547214274618表1《中国统计年鉴》2010北京航空航天大学研究生课程论文第5页共12页2.计算结果及分析2.1各变量间的Pearson相关性由相关系数表(见SPSS文件output1的output1-Correlations表)可知变量人口X1(万人)、农林牧渔业总产值X2(亿元)、国内工业生产总值X3(亿元)、国内建筑生产总值X4(亿元)、社会商品零售总额X5(亿元)、就业人员X6(万人),受灾面积X7(万公顷)、能源生产总量X8(万吨标准煤)与财政收入Y(亿元)的Pearson相关系数依次为0.892,0.995,0.998,0.996,0.994,0.902,0.419,0.975。显著性检验单尾P值(相关系数为0的概率)除X7外其他均为0。初步分析X1,X2,X3,X4,X5,X6,X8对财政收入影响较大,X7影响不大。北京航空航天大学研究生课程论文第6页共12页2.2逐步回归法各变量的引入和剔除由SPSS17.0计算得到下表:表2逐步回归法各变量的引入和剔除上表给出了逐步回归法各变量的引入和剔除以及引入和剔除的标准。变量进入方程的标准:当候选变量中最大F值的P值小于或等于0.050时,引入相应的变量;已进入方程的变量中,最小F值的P值大于或等于0.10时,剔除相应的变量。由上表中可以看出,逐步回归法最先引入变量X3(国内工业生产总值),建立了模型1,没有变量被剔除,故模型1中含有变量X3;接着引入了变量X4(国内建筑生产总值),没有变量被剔除,故模型2中含有变量X3和X4;接着引入了变量X8(能源生产总量),没有变量被剔除,建立了模型3,故模型3中含有变量X3、X4和X8。北京航空航天大学研究生课程论文第7页共12页2.3各模型的拟合情况由SPSS17.0计算得到下表:表3各模型的拟合情况由上表可以看出:从模型1到模型3,复相关系数(R)、判定系数(RSquare)、调整判定系数(AdjustedRSquare—若作用不显著的变量引入方程,则该系数减小)逐渐增大,而估计值的标准误差(Std.ErroroftheEstimate)逐渐减小。故模型3是六个模型中最好的。模型3的复相关系数(R)为0.999,判定系数(RSquare)为0.999,调整判定系数(AdjustedRSquare)为0.999,估计值的标准误差(Std.ErroroftheEstimate)为748.4398。模型3的复相关性非常显著。北京航空航天大学研究生课程论文第8页共12页2.4各模型的方差分析结果由SPSS17.0计算得到下表表4各模型的方差分析结果由上表可以看出:模型3经过方差分析,F=3400.564P=0.000,按=0.1水平,认为Y(财政收入)与X3(国内工业生产总值)、X4(国内建筑生产总值)和X8(能源生产总量)之间有直线关系。北京航空航天大学研究生课程论文第9页共12页2.5偏回归系数表5各模型的偏回归系数由上表可得:根据模型3建立的多元线性回归方程为:Y=1656.647+0.411X3+0.396X4-0.070X8。方程中的常数项b0为1656.647,偏回归系数b1为0.411,b2为0.396,b3为0.070。经t检验,b1,b3,b6的P值均为0.000,b2的P值为0.041,按=0.10水平,具有显著性意义。多元线性回归方程为:Y=1656.647+0.411*X3+0.396*X4-0.070*X8北京航空航天大学研究生课程论文第10页共12页2.6未引入统计量的检验表6方程外各模型变量的有关统计量每次在模型中加未引入变量中P值小于1最小的一个,在模型3种可以看出未引入变量X1,X2,X5,X6,X,7的P值为0.372,0.823,0.632,0.723,0.672发现均大于0.10不能引入,模型合理。北京航空航天大学研究生课程论文第11页共12页结论在回归方程求出来后,我们分别用2000年和2009年的数据进行检验。由表1可知:2000年,国内工业生产总值X3为40033.6(亿元),国内建筑生产总值X4为12497.6(亿元),能源生产总量X8(万吨标准煤)为135048.0。代入回归函数可得:y*=13606.1462,而实际数据y=13395.2,误差率为1.5%。2009年,国内工业生产总值X3为135239.9(亿元),国内建筑生产总值X4为76807.7(亿元),能源生产总量X8(万吨标准煤)为274618.0。代入回归函数可得:y*=68432.8351,而实际数据y=68518.3,误差率0.12%。故可以认为得到的回归函数的拟合效果较好。由上述分析可以得出以下结论:(1)Y(财政收入)受X3(国内工业生产总值)、X4(国内建筑生产总值)和X8(能源生产总量)影响显著,它们之间有直线关系。多元线性回归方程为:Y=1656.647+0.411X3+0.396X4-0.070X8(2)对Y(财政收入)的影响程度由大到小依次为:X3(国内工业生产总值)、X4(国内建筑生产总值)X8(能源生产总量)——由逐步回归法的建模过程可得。因此,工业企业是我国的纳税大户,工业企业的发展对我国的财政收入具有巨大促进作用。我国建筑业建筑业作为国家的支柱产业,其占财政收入的比重也比较大,应该保持其稳定的发展态势。能源是制约经济发展的重要因素。可能是为保证我国的能源供应(较低价供应),我国的能源税收水平较低。我国能源生产总量对财政收入的影响并不显著。北京航空航天大学研究生课程论文第12页共12页参考文献[1]孙海燕,周梦等《应用数理统计》北京航空航天大学数学系,2007[2]黄润龙.数据统计与分析技术—SPSS软件使用教程[M].北京:高等教育出版社,2005.[3]张文彤,董伟.SPSS统计分析高级教程[M].北京:高等教育出版社,2004.[4]中华人民共和国国家统计局《中国统计年鉴2010》中国统计出版社[5]韩於羹《应用数理统计》北京航空航天大学出版社,1989