实验二:多元线性回归分析一.实验目的熟练应用EViews软件作多元线性回归分析。二.实验主题立用多元线性回归分析研究国家婴儿死亡率与妇女文盲率之间的关系。三.实验内容1、先验的预期CM和各个变量之间的关系。2、做CM对FLR的回归,得到回归结果。3、做CM对FLR和PGNP的回归,得到回归结果。4、做CM对FLR,PGNP和TFR的回归结果,并给出ANOVA。5、根据各种回归结果,选择哪个模型?为什么?6、如果回归模型(4)是正确的模型,但却估计了(2)或(3),会有什么后果?7、假定做了(2)的回归,如何决定增加变量PGNP和TFR?使用了哪种检验?给出必要的计算结果。四.实验报告要求:1、问题提出2、指标选择3、数据选择4、数据处理5、数据分析6、建立模型以及模型检验7、报告结论8、实验总结1、问题提出一个国家的婴儿死亡率关系到一个国家的未来发展,反映了国家人民的健康水平与国家的发展水平,这一指标也是政府采取相关政策的一个重要依据。在社会学中,一个国家的婴儿死亡率与妇女的文盲率之间存在一定的相关关系,但这两个指标之间存在着怎样的关系,为此,我们利用统计数据对这一问题进行实证分析。2、指标选择我们选取一个国家的婴儿死亡率CM,女性识字率FLR进行分析。考虑到影响婴儿死亡率的因素较复杂,尤其是经济发展状况、总生育率等也会对其产生重要影响,考虑到实验的准确性,同时研究人均GNP(PGNP)和总生育率(TFR)对婴儿死亡率的影响。预期:1)预期CM与FLR存在负相关关系。一方面,女性受教育程度越高,其知识越丰富,自我保护意识和能力就越强,则更善于保护自己和婴儿;另一方面,女性教育程度越高,其就业机会与收入获得途径就越多,可以更好的保障自己和婴儿的生活。因此,我们预期FLR的提高会导致CM降低。2)预期CM与PGNP存在负相关关系。人均GNP的提高使人们的物质生活水平得到提高,改善了人民、食、住、行等诸方面的条件,特别是使人们摄取的营业素增加,营养素结构合理,从而增加人们的体质;使人们从繁重的体力劳动和恶劣的工作环境中解脱出来,有充足的精力和时间来关心自己及其后代的身体健康,提高生活质量。因此,我们预期PGNP的提高会导致CM降低。3)预期CM与TFR存在正相关关系。总生育率直接或间接地影响着婴儿死亡率,总生育率提高,人口数量上升,人均GNP,人均受教育程度等一系列人均享受的权利和福利都会有所下降。因此,我们预期TFR的提高会导致CM降低。3、数据选择考虑到实验结果的普遍性,我们选择世界各地区64个国家的各项指标数据作为样本进行研究分析。数据由老师提供,详细数据见表1序号婴儿死亡率CM女性识字率FLR人均GNP(PGNP)总生育率TFR11283718706.662204221306.153202163107.004197655706.255967620503.816209262006.447170456706.198240293005.899241111205.891055552902.3611758711803.9312129559005.9913249317303.50141653111507.4115947711604.2116968012705.0017148305805.271898696605.2119161434206.50201184710806.1221269172906.1922189352705.0523126585606.1624128142401.8025167292404.7526135654304.10271078730206.6628726314207.2829128494208.12302763198305.2331152844205.7932224235306.50331425086407.1734104623506.6035287312307.0036416616203.9137312111906.7038778820904.2039142229005.4340262222306.5041215121406.254224693307.10431913110107.1044182193007.0045378817303.4646103357805.6647678513004.8248143789305.004983856904.7450223332008.4951240194506.5052312212806.5053127944301.695452832703.2555794313407.175661886703.5257168284106.0958289543702.86591214113104.88601156214703.8961186453006.9062478536304.1063178452206.0964142675607.20表14.数据处理表1中的实验数据可直接应用于研究分析,无需经过其他处理。5.数据分析1、观察表1数据,婴儿死亡率CM,女性识字率FLR,人均GNP(PGNP)和总生育率(TFR)中,不存在与现实意义不相符的数据,因此可以拿来进行问题的研究。2、通过EViews软件分析进行相关分析:1)CM与FLR的相关性04080120160200240280320020406080100FLRCM由散点图(图1)和相关系数(表2)知,这两组数据的相关性较高,且CM与FLR之间存在负相关关系。2)CM与PGNP的相关性0408012016020024028032004,0008,00012,00016,00020,000PGNPCM由散点图(图2)和相关系数(表3)知,这两组数据有一定的相关性,且CM与PGNP之间存在负相关关系。3)CM与TFR的相关性PGNPCMPGNP1.000000-0.407697CM-0.4076971.000000PGNPCMFLRCMFLR1.000000-0.818285CM-0.8182851.000000表2表3图1图204080120160200240280320123456789TFRCM由散点图(图3)和相关系数(表3)知,这两组数据具有一定的相关性,且CM与TFR之间存在正相关关系。通过相关分析可以发现,CM与FLR之间存在负相关关系,与PGNP之间存在负相关关系,与TFR之间存在正相关关系。6.建立模型以及模型检验1、分别做出CM对FLR、CM对FLR和PGNP以及CM对FLR,PGNP和TFR进行回归分析,建立回归模型2、分别对各个模型进行检验,包括经济检验及统计检验3.给出CM对FLR,PGNP和TFR回归结果的ANOVA6.1CM对FLR的回归模型建立及检验(1)建立回归模型根据图1,建立如下线性模型:iiiFLRCM10得出回归结果如下DependentVariable:CMMethod:LeastSquaresDate:04/15/16Time:11:44Sample:164Includedobservations:64VariableCoefficientStd.Errort-StatisticProb.FLR-2.3904960.213263-11.209170.0000C263.863512.2249921.583950.0000R-squared0.669590Meandependentvar141.5000PGNP1.000000-0.407697CM-0.4076971.000000图3表4AdjustedR-squared0.664261S.D.dependentvar75.97807S.E.ofregression44.02399Akaikeinfocriterion10.43810Sumsquaredresid120163.0Schwarzcriterion10.50556Loglikelihood-332.0191Hannan-Quinncriter.10.46468F-statistic125.6455Durbin-Watsonstat2.314744Prob(F-statistic)0.000000回归方程式:8635.263*390496.2FLRCM其中:Se=(0.213263)(12.22499)t=(-11.20917)(21.58395))0000.0)(0000.0(p669590.02R6455.125F(2)模型检验CM对FLR的回归模型的检验经济检验:斜率值为-2.390496,说明女性识字率(FLR)与婴儿死亡率(CM)负相关,且在其他条件不变的情况下女性识字率(FLR)增加1%,可导致婴儿死亡率(CM)减少2.390496%。统计检验:(1)拟合优度检验:拟合度R2=0.669590,说明所建模型整体上对样本数据还不算很好,即解释变量CM对FLR的大部分差异作出了解释,但可能还有其他因素影响婴儿死亡率。(2)t检验:变量β1和β2的原假设与备择假设为:H0:β0=0,β1≠0;H0:β1=0,β1≠0。查表可得,在5%的显著水平下,自由度为n-2=64-2=62的t的临界值为2.000。因为计算得到的β0的估计值的t值21.583952.000,所以拒绝原假设H0:β0=0,β1的估计值的t值-11.20917-2.000,所以拒绝原假设H0:β1=0。这说明在95%的置信水平下,解释变量女性识字率(FLR)通过了显著性检验,即解释变量女性识字率(FLR)对婴儿死亡率(CM)有显著影响。6.2CM对FLR和PGNP的回归模型建立及检验(1)建立回归模型根据图2,建立如下线性模型:iiiiPGNPFLRCM210得出回归结果如下:DependentVariable:CMMethod:LeastSquaresDate:04/15/16Time:11:49Sample:164Includedobservations:64VariableCoefficientStd.Errort-StatisticProb.C263.641611.5931822.741090.0000DependentVariable:CMFLR-2.2315860.209947-10.629270.0000PGNP-0.0056470.002003-2.8187030.0065R-squared0.707665Meandependentvar141.5000AdjustedR-squared0.698081S.D.dependentvar75.97807S.E.ofregression41.74780Akaikeinfocriterion10.34691Sumsquaredresid106315.6Schwarzcriterion10.44811Loglikelihood-328.1012Hannan-Quinncriter.10.38678F-statistic73.83254Durbin-Watsonstat2.186159Prob(F-statistic)0.000000回归方程式:6416.263*005647.0*231586.2PGNPFLRCM其中:)59318.11)(002003.0)(209947.0(Se)74109.22)(818703.2)(62927.10(t)0000.0)(0065.0)(0000.0(p707665.02R83254.73F(2)模型检验经济检验:所估计参数β1和β2的估计值均为负数,说明女性识字率(FLR)和人均GNP(PGNP)与婴儿的死亡率(CM)负相关,与预期假设相同。β1的估计值为-2.231586,表示在其他变量保持不变的情况下,女性识字率每增加1%,婴儿死亡率减少2.231586%。β2的估计值为-0.005647,表示在其他变量保持不变的条件下,人均GNP每增加1%,婴儿死亡率减少0.005647%。统计检验:(1)拟合优度检验:拟合度R2=0.7