关于中国人口自然增长的多元回归分析(商院国际经济贸易马佳楠121090116)摘要:中国共产党十八届三中全会关于《中共中央关于全面深化改革若干重大问题的决定》中提出,坚持计划生育的基本国策,启动实施一方是独生子女的夫妇可生育两个孩子的政策,促进人口长期均衡发展。但是,由于我国人口基数过于庞大,每年出生人口仍有800万至1000万,相当于2年产生1个澳大利亚的人口,6年产生1个英国的人口。人口问题仍是我国的长期问题,是关系我国经济社会发展的关键性因素。因此有必要研究在新形势下人口自然增长率影响因素,为我国计划生育政策制定提出理论依据关键词:人口自然增长率、国民总收入、多元线性回归一、人口自然增长率理论分析人口自然增长率,是反映人口发展速度和制定人口计划的重要指标,也是计划生育统计中的一个重要指标,它表明人口自然增长的程度和趋势。人口自然增长率指在一定时期内(通常为一年)人口自然增加数(出生人数减死亡人数)与该时期内平均人数(或期中人数)之比,一般用千分率表示。因此,人口自然增长水平取决于出生率和死亡率两者之间的相对水平,它是反映人口再生产活动的综合性指标。中国从1971年开始全面开展了计划生育,使中国总和生育率很快从1970年的5.8降到1980年2.24,接近世代更替水平。此后,人口自然增长率(即人口的生育率)很大程度上与经济的发展等各方面的因素相联系,与经济生活息息相关,为了研究此后影响中国人口自然增长的主要原因,分析全国人口增长规律,与猜测中国未来的增长趋势,需要建立计量经济学模型。影响人口增长的主要因素有经济因素、地域因素以及医疗教育等因素:(1)经济因素对人口自然增长的作用主要表现在它决定了人口的增殖条件和生存条件,通过改变人口的出生率和死亡率来影响人口的自然增率。一般情况下,当人口数量不能满足经济发展对劳动力的需求时,人口自身的再生产必将会刺激;当人口数量超越了经济发展所能提供的消费总数后,人口自身的再生产必将受到遏制。在现代生产力水平下,人口的自然增长率往往随着经济水平的提高而下降。经济因素对人口机械增长也有重要影响。通常情况下,经济发达或发展速度较快的地区,对人口具有一种吸引力和凝聚力,人口机械增长为正值;相反,经济落后或经济发展速度缓慢的地区,对人口会产生一种排斥力和离散力,人口机械增长一般为负值。(2)文化因素这一因素更多地影响着人口的自然增长。随着科学文学水平的提高,人口自然增长率趋于下降,现代社会里这一趋势尤为明显,其表现主要在三个方面:一是由于人们接受教育年限的延长,平均婚龄也会相应推延;二是科学文化水平愈发达,人们的生理知识、育儿知识、保健知识就愈丰富,促成婴儿死亡率降低;三是人们的科学文化水平愈高,就愈加注意自身及其后代各项素质的提高,少生优育,把有限的收入用于将子女培养成具有更高科学文化素质的现代人。(3)医疗卫生因素医学的进步和医疗卫生事业的发展对人口出生率和死亡率有着直接影响。首先,它使得因各种疾病致死的死亡率下降,从而降低人口死亡率,延长人口平均寿命;其次,它对控制生育和实行优生优育有着积极的作用。二、模型设计和数据来源(1)模型设计为了全面反映中国“人口自然增长率”的全貌,选择人口自然增长率作为被解释变量,以反映中国人口的增长;选择“国民总收入”作为经济整体增长的代表;选择“城镇居民家庭人均可支配收入”作为居民收入的代表。选择“卫生总费用”作为医疗卫生事业发展的代表。暂不考虑文化程度及人口分布的影响。Y——人口自然增长率单位:‰X1——国民总收入单位:亿元X2——城镇居民家庭人均可支配收入单位:元X3——卫生总费用单位:亿元obsYX1X2X3198011.870004545.600477.6000143.2300198114.550004889.500500.4000160.1200198215.680005330.500535.3000177.5300198313.290005985.600564.6000207.4200198413.080007243.800652.1000242.0700198514.260009040.700739.1000279.0000198615.5700010274.40900.9000315.9000198716.6100012050.601002.100379.5800198815.7300015036.801180.200488.0400198915.0400017000.901373.900615.5000199014.3900018718.301510.200747.3900199112.9800021826.201700.600893.4900199211.6000026937.302026.6001096.860199311.4500035260.002577.4001377.780199411.2100048108.503496.2001761.240199510.5500059810.504283.0002155.130199610.4200070142.504838.9002709.420199710.0600078060.905160.3003196.71019989.14000083024.305425.1003678.72019998.18000088479.205854.0004047.50020007.58000098000.506280.0004586.63020016.950000108068.26859.6005025.93020026.450000119095.77702.8005790.03020036.010000134977.08472.2006584.10020045.870000159453.69421.6007590.29020055.890000183617.410493.008659.91020065.280000215904.411759.509843.34020075.170000266422.013785.8011573.9720085.080000316030.315780.8014535.4020094.870000340321.017174.7017541.9220104.790000399759.519109.4019980.3920114.790000468562.421809.8024345.9120124.950000516282.124564.7027846.84设定线性回归模型为Y=β0+β1X1+β2X2+β3X3+Ui其中:β1表示其他条件不变时,国民总收入每变动一个单位会导致人口自然增长率变动β1单位;β2表示在其他条件不变时,城镇居民人均可支配收入每变动一个单位会导致人口自然增长率变动β2个单位;β3表示其他条件不变时,卫生总费用每变动一个单位会导致人口自然增长率变动β3个单位。(2)数据来源:选取计划生育政策开始实施之后,即1980年—2012年的时序数据(共33年)进行研究。原始数据来源于2012中国统计年鉴。三、参数估计利用Eviews软件可以得到Y关于解释变量X1、X2、X3的散点图由图中可以看出,Y与X1、X2、X3都成线性相关关系。0100,000200,000300,000400,000500,000600,0004681012141618YX105,00010,00015,00020,00025,0004681012141618YX2DependentVariable:YMethod:LeastSquaresDate:11/30/14Time:17:57Sample:19802012Includedobservations:33VariableCoefficientStd.Errort-StatisticProb.C15.798720.40384739.120500.0000X19.09E-053.23E-052.8105400.0088X2-0.0029140.000352-8.2751910.0000X30.0004470.0004051.1016160.2797R-squared0.925063Meandependentvar9.980000AdjustedR-squared0.917310S.D.dependentvar4.031995S.E.ofregression1.159432Akaikeinfocriterion3.246951Sumsquaredresid38.98422Schwarzcriterion3.428346Loglikelihood-49.57469Hannan-Quinncriter.3.307984F-statistic119.3298Durbin-Watsonstat0.856926Prob(F-statistic)0.000000模型估计结果为Y=15.80+9.09E-05X1–0.0029X2+0.0004X3(39.120)(2.811)(-8.275)(1.102)R2=0.925F=119.33四、模型检验1、经济意义检验:05,00010,00015,00020,00025,00030,0004681012141618YX3模型估计结果说明,在假定其他变量不变的条件下,国民总收入每增加1亿元,人口自然增长率增加千分之9.09E-05;在其他变量不变的条件下,城镇居民家庭人均可支配收入每增加1元,人口自然增长率减少千分之0.003;在其他变量不变的条件下,卫生总费用每增加1亿元,人口自然增长率增加千分之0.0004。这一点符合实际。2、统计检验(1)拟合优度:由回归结果可得,R2=0.925,这说明模型拟合程度良好。(2)F检验:针对H0:β1=β2=β3=0,给定显著性水平0.05,K=4,N=33在F分布表中查出自由度为k-1=3和n-k=29的临界值Fα(3,29)=2.93,由于F=119.332.93,应拒绝原假设H0:β1=β2=β3=0,说明回归方程显著,即“国民总收入”、“城镇居民人均可支配收入”、“卫生总费用”等变量联合起来确实对“人口自然增长率”有显著影响。(3)t-检验:分别针对H0:βj=0(j=0,1,2,3),给定显著性水平0.05,查t分布表得自由度为N-K=29的临界值t=2.045。由表中数据可得,与β0、β1、β2、β3对应的t统计量分别为39.120、2.811、-8.275、1.102,除β3,其余统计量绝对值均大于2.045。这说明分别都应当拒绝H0:βj=0(j=0,1,2)。也就是说,当在其它解释变量不变的情况下,解释变量“国民总收入”、“城镇居民人均可支配收入”分别对被解释变量“人口自然增长率”Y都有显著的影响。β3的绝对值小于2.045,这说明接受H0,X3系数对t检验不显著,这表明很可能存在多重共线性。所以计算各解释变量的相关系数。得到如图相关系数矩阵。由相关系数矩阵可以看出,各解释变量相互之间的相关系数很高,证明确实存在严重多重共线性。五、消除多重共线性采用逐步回归的办法,检验和解决多重共线性的问题。分别对Y作X1、X2、X3的一元回归。结果如下表所示:变量X1X2X3参数估计值-2.29-0.005-0.0004t统计量-7.786-9.366-7.128R20.6620.7390.621按R2的大小排序:X2、X1、X3以X2为基础,顺次加入其他变量回归。首先加入X1回归结果为Includedobservations:33VariableCoefficientStd.Errort-StatisticProb.C15.775920.40475038.976940.0000X10.0001231.46E-058.3863130.0000X2-0.0031000.000310-10.001110.0000R-squared0.921927Meandependentvar9.980000AdjustedR-squared0.916722S