多元线性回归模型案例分析——中国人口自然增长分析一·研究目的要求中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。影响中国人口自然增长率的因素有很多,但据分析主要因素可能有:(1)从宏观经济上看,经济整体增长是人口自然增长的基本源泉;(2)居民消费水平,它的高低可能会间接影响人口增长率。(3)文化程度,由于教育年限的高低,相应会转变人的传统观念,可能会间接影响人口自然增长率(4)人口分布,非农业与农业人口的比率也会对人口增长率有相应的影响。二·模型设定为了全面反映中国“人口自然增长率”的全貌,选择人口增长率作为被解释变量,以反映中国人口的增长;选择“国名收入”及“人均GDP”作为经济整体增长的代表;选择“居民消费价格指数增长率”作为居民消费水平的代表。暂不考虑文化程度及人口分布的影响。从《中国统计年鉴》收集到以下数据(见表1):表1中国人口增长率及相关数据设定的线性回归模型为:1222334tttttYXXXu三、估计参数利用EViews估计模型的参数,方法是:1、建立工作文件:启动EViews,点击File\New\Workfile,在对话框“WorkfileRange”。在“Workfilefrequency”中选择“Annual”(年度),并在“Startdate”中输入开始时间“1988”,在“enddate”中输入最后时间“2005”,点击“ok”,出现“WorkfileUNTITLED”工作框。其中已有变量:“c”—截距项“resid”—剩余项。在“Objects”菜单中点击“NewObjects”,在“NewObjects”对话框中选“Group”,并在“NameforObjects”上定义文件名,点击“OK”出现数据编辑窗口。年份人口自然增长率(%。)国民总收入(亿元)居民消费价格指数增长率(CPI)%人均GDP(元)198815.731503718.81366198915.0417001181519199014.39187183.11644199112.98218263.41893199211.6269376.42311199311.453526014.72998199411.214810824.14044199510.555981117.15046199610.42701428.35846199710.06780612.8642019989.1483024-0.8679619998.1888479-1.4715920007.58980000.4785820016.951080680.7862220026.45119096-0.8939820036.011351741.21054220045.871595873.91233620055.891840891.81404020065.382131321.5160242、输入数据:点击“Quik”下拉菜单中的“EmptyGroup”,出现“Group”窗口数据编辑框,点第一列与“obs”对应的格,在命令栏输入“Y”,点下行键“↓”,即将该序列命名为Y,并依此输入Y的数据。用同样方法在对应的列命名X2、X3、X4,并输入相应的数据。或者在EViews命令框直接键入“dataY2XX3X4…”,回车出现“Group”窗口数据编辑框,在对应的Y、X2、X3、X4下输入响应的数据。3、估计参数:点击“Procs“下拉菜单中的“MakeEquation”,在出现的对话框的“EquationSpecification”栏中键入“YCX2X3X4”,在“EstimationSettings”栏中选择“LeastSqares”(最小二乘法),点“ok”,即出现回归结果:表3.4根据表3.4中数据,模型估计的结果为:432005109.0047918.0000332.060851.15XXXYt(0.913842)(0.000134)(0.033919)(0.001771)t=(17.08010)(2.482857)(1.412721)(-2.884953)930526.02R915638.02RF=62.50441四、模型检验1、经济意义检验模型估计结果说明,在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,当年居民消费价格指数增长率每增长1%,人口增长率增长0.047918%;在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005109%。这与理论分析和经验判断相一致。2、统计检验(1)拟合优度:由表3.4中数据可以得到:930526.02R,修正的可决系数为915638.02R,这说明模型对样本的拟合很好。(2)F检验:针对0234:0H,给定显著性水平0.05,在F分布表中查出自由度为k-1=3和n-k=14的临界值34.3)14,3(F。由表3.4中得到F=62.50441,由于F=62.50441(3,21)3.075F,应拒绝原假设0234:0H,说明回归方程显著,即“国民总收入”、“居民消费价格指数增长率”、“人均GDP”等变量联合起来确实对“人口自然增长率”有显著影响。(3)t检验:分别针对0H:0(1,2,3,4)jj,给定显著性水平0.05,查t分布表得自由度为n-k=14临界值145.2)(2/knt。由表3.4中数据可得,与^1、^2、^3、^4对应的t统计量分别为17.08010、2.482857、1.412721、-2.884953除^3,其绝对值均大于145.2)(2/knt,这说明分别都应当拒绝0H:)4,2,1(0jj,也就是说,当在其它解释变量不变的情况下,解释变量“国民总收入”、“人均GDP”分别对被解释变量“人口自然增长率”Y都有显著的影响。^3的绝对值小于145.2)(2/knt,:这说明接受0H:03,X3系数对t检验不显著,这表明很可能存在多重共线性。所以计算各解释变量的相关系数,选择X2、X3、X4数据,点”view/correlations”得相关系数矩阵(如表4.4):表4.4由相关系数矩阵可以看出:各解释变量相互之间的相关系数较高,证实确实存在严重多重共线性。五、消除多重共线性采用逐步回归的办法,去检验和解决多重共线性问题。分别作Y对X2、X3、X4的一元回归,结果如表4.5所示:表4.5变量X2X3X4参数估计值0.0001340.0339190.001771t统计量2.4828571.412721-2.884950.8739150.3884950.886412按2R的大小排序为:X4、X2、X3以X2为基础,顺次加入其他变量逐步回归。首先加入X2回归结果为:40005397.02000350.035540.16ˆXXYt=(2.542529)(-2.970874)920622.02R当取05.0时,131.2)318(025.0)(2/ttkn,X2参数的t检验显著,加入X3回归得432005109.0047918.0000332.060851.15XXXYtt=(17.08010)(2.482857)(1.412721)(-2.884953)930526.02R915638.02RF=62.50441当取05.0时,145.2)418(2/t,X3参数的t检验不显著,予以剔除即40005397.02000350.035540.16ˆXXY,这是最后消除多重共线性的结果。在假定其它变量不变的情况下,当年国民总收入每增长1亿元,人口增长率增长0.000332%;在假定其它变量不变的情况下,在假定其它变量不变的情况下,当年人均GDP没增加一元,人口增长率就会降低0.005109%。金服131王亚平13019122