[在此处键入]数理统计大作业(一)公共财政的逐步回归模型1数理统计大作业(一)公共财政收入的逐步回归模型指导教师院系名称材料科学与工程院学号SY1501201学生姓名2015年12月21日[在此处键入]数理统计大作业(一)公共财政的逐步回归模型2目录1引言..............................................................................................................11.1研究背景.............................................................................................11.2回归分析.............................................................................................11.2.1回归分析..................................................................................11.2.2回归分析方法...........................................................................21.2.3基本假设的检验........................................................................31.3研究内容和研究目的...........................................................................32.逐步回归分析................................................................................................42.1数据采集.............................................................................................42.2数据分析.............................................................................................42.2.1自变量的引入..........................................................................52.2.2模型可决系数及剔除的变量....................................................52.2.3模型显著性检验........................................................................72.2.4模型回归系数显著性检验及回归系数确定................................72.2.5共线性诊断...............................................................................82.2.6回归方程残差分析....................................................................9结论:............................................................................................................10参考文献........................................................................................................11[在此处键入]数理统计大作业(一)公共财政的逐步回归模型11引言1.1研究背景财政收入,是指政府为履行其职能、实施公共政策和提供公共物品与服务需要而筹集的一切资金的总和。财政收入表现为政府部门在一定时期内(一般为一个财政收入)所取得的货币收入。财政收入是衡量一国政府财力的重要指标,政府在社会经济活动中提供公共物品和服务的范围和数量,在很大程度上决定于财政收入的充裕状况。依据不同的标准,可以对财政收入进行不同的分类。国际上对财政收入的分类,通常按政府取得财政收入的形式进行分类。这种分类方法下,将财政收入分为税收收入、国有资产收益、国债收入和收费收入以及其他收入等。本文选取的相关影响因素包括国民生产总值、固定资产总投资、货物进出口总额、城镇人均可支配收入、教育经费总投入、人口数。1.2回归分析1.2.1回归分析回归分析(regressionanalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析.多元线性回归模型是指含有多个自变量的线性回归模型,用于解释因变量与其他多个自变量之间的线性关系。其中,因变量的变化可由两个部分解释:一是自变量变化引起的;二是由其他随机因素引起的。建立模型时,有多种引入变量[在此处键入]数理统计大作业(一)公共财政的逐步回归模型2的方法。1.2.2回归分析方法向前选择法与被解释变量有最大相关的变量首先进入方程,如果该解释变量没有通过F检验,则变量筛选过程结束,方程中没有引入任何变量;如果通过F检验,则在剩余的变量中寻找具有最大偏相关系数的变量,将其引入方程,并再次进行F检验,如果通过检验,则保留该变量在模型中,并继续寻找下一个候选变量,否则变量筛选过程结束,方程中仅有一个解释变量;以此类推,直至所有满足判据的变量都被引入模型位置为止。向后选择法与向前选择法的顺序相反,向后选择法首先将所有变量都引入模型,然后剔除最不显著的变量。如果剩余变量都通过显著性检验,则变量筛选过程结束;否则按同样的标准继续剔除不显著的变量,直至剩余的解释变量都满足显著性检验为止。逐步回归法逐步回归法的基本思想是将变量逐个引入模型,每引入一个解释变量后都要进行F检验,并对已经选入的解释变量逐个进行t检验,当原来引入的解释变量由于后面解释变量的引入变得不再显著时,则将其删除,以确保每次引入新的变量之前回归方程中只包含显著性变量。这是一个反复的过程,直到既没有显著的解释变量选入回归方程,也没有不显著的解释变量从回归方程中剔除为止,以保[在此处键入]数理统计大作业(一)公共财政的逐步回归模型3证最后所得到的解释变量集是最优的。1.2.3基本假设的检验异方差检验在回归模型的基本假设中,固定随机误差具有相同的方差,但在建立实际经济问题的回归模型时,经常存在与此相违背的情况。如果仍用最小二乘法将会引起严重的后果。常用的检验方法有残差图分析法,等级相关系数法,残差的独立性检验残差的独立性检验称为序列相关检验。如果随机误差不独立,那么对回归模型的任何估计与假设所做出的结论都是不可靠的。残差独立性检验师通过Durbin-watson检验完成的。多重共线性检验多元回归模型基本假设要求设计矩阵X中列向量之间不存在密切线性关系。当自变量存在多重共线性时,利用最小二乘法得到的参数估计不稳定,回归系数的方差随着共线性强度的增加而加速增长,会造成回归方程高度显著的情况下,所有回归系数都通不过显著性检验,甚至会造成回归系数正负号无法得到合理解释。但是有时候这样建立的模型对历史数据拟合的很好,从预测角度看不失为较好的模型。常用检验方法有方差扩大因子法(VIF)。1.3研究内容和研究目的本文选取的相关影响因素包括国民生产总值(X1)、固定资产总投资(X2)、货物进出口总额(X3)、城镇人均可支配收入(X4)、教育经费总投入(X5)、人口数(X6)。[在此处键入]数理统计大作业(一)公共财政的逐步回归模型4通过逐步回归的方法,建立公共财政财政收入与各因素之间的最优多元线性回归模型。通过建立的回归模型,分析影响公共财政收入的因素,并以此模型对公共财政未来财政收入做出分析和预计。2.逐步回归分析2.1数据采集本文数据来自国家统计局统计年鉴2014。其中教育经费总投入2013年数据缺失。数据是自1997年至2013年。因为我国自1997年开始的财税体制改革,导致97年前后的财政收入方式有较大差异,因此并未选择之前的数据。年份公共财政收入/亿元国民生产总值/亿元固定资产总投资/亿元货物进出口总额/亿元城镇人均可支配收入/元教育经费总投入/亿元人口数/万人19978651.1478973.0324941.1026967.205160.302531.7312362619989875.9584402.2828406.2026849.705425.102949.06124761199911444.0889677.0529854.7029896.205854.023349.04125786200013395.2399214.5532917.7039273.206280.003849.08126743200116386.04109655.1737213.5042183.606859.604637.66127627200218903.64120332.6943499.9051378.207702.805480.03128453200321715.25135822.7655566.6070483.508472.206208.27129227200426396.47159878.3470477.4095539.109421.607242.60129988200531649.29184937.3788773.60116921.8010493.008418.84130756200638760.20216314.43109998.20140974.0011759.509815.31131448200751321.78265810.31137323.90166863.7013785.8012148.07132129200861330.35314045.43172828.40179921.5015780.7614500.74132802200968518.30340902.81224598.80150648.1017174.6516502.71133450201083101.51401512.80251683.80201722.1019109.4419561.851340912011103874.43473104.05311485.10236402.0021809.7823869.291347352012117253.52519470.10374694.70244160.2024564.7227695.971354042013129209.64568845.21446294.10258168.9026955.101360722.2数据分析在进行多元线性回归分析时,将变量引入模型的方法有向前选择法、向后选[在此处键入]数理统计大作业(一)公共财政的逐步回归模型5择法以及逐步选择法。本文用逐步选择法引入变量,对变量进行逐步回归分析。2.2.1自变量的引入在SPSS软件中,选择线性回归分析,将财政收入加入因变量,其余因素加入自变量,方法选择逐步,步进方法标准是使用F的概率,F≤0.05时引入,F≥0.1时剔除,得到结果如表2.1所示。表2.1输入/移去的变量a模型输入的变量移去的变量方法1教育经费总投入亿元.步