统计调查分析报告题目:_关于我国国内生产总值的统计分析__时间:_2013年7月4日____________关于我国国内生产总值的统计分析内容摘要:本文首先通过网络工具对我国1980-2011年GDP、人口数、固定资产投资、进出口总额、国家财政支出数据;1980-2011年中南六省:湖北、湖南、河南、江西、广东、广西的GDP数据;我国各省(直辖市)2011年GDP数据进行数据收集。而后根据要求对数据进行适当的处理,根据所需要的分析结果,我们分别选择了excel和spss两种工具进行辅助分析。这其中既有关于GDP与人口数、固定资产投资、进出口总额、国家财政支出的相关性分析,也有各省GDP的方差分析,还有各省GDP的聚类分析。根据分析的结果对我国GDP水平进行适当的探讨以及给出一些经济发展规划的建议。关键词:GDP、相关分析、回归分析、方差分析、聚类分析一、问题的提出自1978年改革开放以来,我国经济飞速发展,国内生产总值日趋上升,经济总体处于供大于求的状态,虽然经历了1997金融风暴和2007金融危机,但是我国经济发展前景一片大好。国内生产总值(简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,更可以反映一国的国力与财富。一个国家或地区的经济究竟处于增长抑或衰退阶段,从这个数字的变化便可以观察到。一般而言,GDP公布的形式不外乎两种,以总额和百分比率为计算单位。当GDP的增长数字处于正数时,即显示该地区经济处于扩张阶段;反之,如果处于负数,即表示该地区的经济进入衰退时期。近来由于世界金融危机和我国经济转型的影响,以及我国自身的一些发展条件限制,我国经济发展速度逐渐放缓,因而对我国GDP水平的研究就显得尤为必要。由于对GDP的研究是一个非常复杂和庞大的过程,在这里,我们仅对下面三个问题做研究:(一)收集我国1980-2011年GDP、人口数、固定资产投资、进出口总额、国家财政支出数据,做GDP与其他指标因素的相关分析和回归分析。(二)收集1980-2011年中南六省:湖北、湖南、河南、江西、广东、广西的GDP数据,消除物价因素影响后,做方差分析。(三)收集我国各省(直辖市)2011年GDP数据,做聚类分析。通过对上面三个问题的研究来对我国GDP进行一些简要的分析,以此来为整个国民收入的研究解决一些基本问题。二、问题的求解(一)对我国GDP的相关分析和回归分析1、数据收集1980-2012年全国经济相关数据年份GDP(现价)(亿元)人口数(万人)固定资产投资(亿元)进出口总额(人民币:亿元)国家财政支出(亿元)19804545.62498705910.95701228.8319814891.5611100072961735.31138.4119825323.3511016541230.4771.31229.9819835962.65161030081430.1860.11409.5219847208.05171043571832.912011701.0219859016.03661058512543.22066.72004.25198610275.17921075073120.62580.42204.91198712058.61511093003791.73084.22262.18198815042.8231110264753.83821.82491.21198916992.31911127044410.441562823.78199018667.822411433345175560.13083.59199121781.49941158235594.57225.83386.62199226923.47651171718080.19119.63742.2199335333.924711851713072.3112714642.3199448197.856411985017042.120381.95792.62199560793.729212112120019.323499.96823.72199671176.591712238922913.524133.87937.55199778973.03512362624941.126967.29233.56199884402.279812476128406.226849.710798.18199989677.054812578629854.729896.213187.67200099214.554312674332917.739273.215886.52001109655.170612762737213.542183.618902.582002120332.689312845343499.951378.222053.152003135822.756112922755566.670483.524649.952004159878.337912998870477.4395539.128486.892005184937.36913075688773.6129116921.833930.282006216314.4259131448109998.162414097440422.732007265810.3058132129137323.9381166863.749781.352008314045.4258132802172828.3998179921.470262592.662009340902.8126133450224598.7679150648.063576299.932010401512.7952134091278121.8549201722.14789874.162011473104134735311485.1254236401.992109247.792、数据处理这里我们录入全国1980年到2011年的GDP,人口数,固定资产投资,进出口总额、国家财政支出数据。在相关性分析中,我们以GDP为参考,利用SPSS软件研究其他四种因素与GDP的相关性,由于做单个比较需要进行四次操作,因而我们在这里直接利用SPSS的相关功能直接给出五个量的两两相关系数,这之中自然包括我们所需要的GDP与其他四类因素的相关系数。在回归分析中,我们令GDP为因变量Y,将人口数,固定资产投资,进出口总额、国家财政支出四个数据作为自变量X1、X2、X3、X4,然后利用excel的数据分析工具做回归分析。3、分析步骤(1)相关性分析录入数据到SPSS→画出关于GDP的散点图→做大致分析→做相关性分析具体操作过程见附录一,所得散点图见附录二。(2)回归分析录入数据到excel→选择分析工具→定好自变量和因变量→做回归分析具体操作过程见附录三。4、结果分析(1)相关性分析下表是通过SPSS所做相互的两两相关系数表格:CorrelationsGDP人口数固定资产投资进出口总额国家财政支出GDPPearsonCorrelation1.798**.956**.984**.992**Sig.(2-tailed).000.000.000.000N3232323232人口数PearsonCorrelation.798**1.633**.781**.729**Sig.(2-tailed).000.000.000.000N3232323232固定资产投资PearsonCorrelation.956**.633**1.933**.974**Sig.(2-tailed).000.000.000.000N3232323232进出口总额PearsonCorrelation.984**.781**.933**1.969**Sig.(2-tailed).000.000.000.000N3232323232国家财政支出PearsonCorrelation.992**.729**.974**.969**1Sig.(2-tailed).000.000.000.000N3232323232**.Correlationissignificantatthe0.01level(2-tailed).从表中我们可以知道:1)GDP与人口数之间的相关系数是0.798,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着比较强的正相关性。2)GDP与固定资产投资之间的相关系数是0.956,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着非常强的正相关性。3)GDP与进出口总额之间的相关系数是0.984,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着比较强的正相关性。4)GDP与国家财政支出数据之间的相关系数是0.992,双尾检验的概率值为0,小于0.01,则相关水平是显著的,换句话说,我们有超过99%的把握认为,两者之间存在着非常强的正相关性。对于回归分析,我们可以利用excel中自带的会给分析予以分析。(2)回归分析下表是通过excel软件做出的回归分析结果:1)方差分析表方差分析dfSSMSFSignificanceF回归分析44.96E+111.24E+113400.954.65521E-36残差279.83E+0836423935总计314.96E+112)参数确定表由输出结果可以知道,线性回归方程为:1、Y=-149510+1.4495*X1+0.189964*X2+0.427531*X3+2.461343*X4。2、根据输出结果中的方差分析可知,SignificanceF=4.65521E-36α=0.05,说明回归方程是显著的。3、而由结果中的回归系数的tStat检测可知:a:P-value=1.25E-08α=0.05,b1:P-value=2.79E-09α=0.05,b2:P-value=0.031325α=0.05,b3:P-value=2.89E-06α=0.05,b4:P-value=0.000433α=0.05综上所述,因此回归方程是有效可靠的。(二)中南六省GDP方差分析1、数据收集:中南六省1980-2011年GDP数据(现价)年份湖北湖南河南江西广西广东国内生产总值指数(可比价,1978=100)1978151146.99162.928775.85185.851001979188.46178.01190.09104.1584.59209.34107.61980199.38191.72229.16111.1597.33249.65116.00811981219.75209.68249.69121.26113.46290.36122.09051982241.55232.52263.3133.96129.15339.92133.14811983262.58257.43327.95144.13134.6368.75147.59871984328.22287.29370.04169.11150.27458.74169.99831985396.26349.95451.74207.89180.97577.38192.89061986442.04397.68502.91230.82205.46667.53209.95441987517.77469.44609.6262.9241.56846.69234.2741988626.52584.07749.09325.83313.281155.37260.70141989717.08640.8850.71376.46383.441381.39271.29431990824.38744.44934.65419.54449.061471.84281.70931991913.38833.31045.73465.1518.591780.56307.567219921088.39997.7127