1中国人口增长的分析与预测模型摘要:本文主要以所给两个附表的数据为依据,结合国家统计局公布的人口抽样数据,根据Leslie人口模型思想,同时在假设城镇化水平的增长曲线大致表现为一条拉伸的“S”型Logistic曲线的情况下,建立了分性别、按年龄、分地区(城、镇、乡)、农村人口迁往城镇的动态差分方程组模型及其矩阵形式,通过参数拟合和模型求解,按照高、中、低三种总和生育率,分别预测了未来我国总人口增长、城镇化水平、生育率、性别比例、老龄化进程等人口指标,预测结果表明我国在2030年城镇化水平将达到60.74%,高、中、低三种方案下的总人口数将分别为14.85亿、14.48亿和14.11亿,男女性别比将为120:100,2005年至2020年我国将出现婴儿出生的高峰期。在高、中、低三种方案下,我国人口的最大值将分别在2040年、2030年和2025年出现。2050年城镇化水平达到61.22%,在未来的50年内将迎来总人口高峰、劳动年龄人口高峰和老年人口高峰,模型分析说明了影响我国人口增长的主要因素是生育率不断降低、老龄化进程加速,出生人口性别比例持续升高,以及乡村人口城镇化加快等。最后,给出了我国人口增长的中短期、长期增长预测结果。关键词:人口增长;Leslie模型;城镇化;老龄化;人口高峰21.问题的提出人类文明发展到今天,人们越来越意识到地球资源的有限性,我们感到地球在变小,人口资源之间的矛盾日渐突出。人口问题成为当今世界上最令人关注的问题之一,一些发展中国家的人口出生率过高,越来越严重地威胁着人类的正常生活,有些发达国家的自然增长率趋近于零,甚至变为负数,造成劳动力短缺,也是不容忽视的问题。中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。近年来,中国的人口发展出现了一些新的特点,例如:老年化进程加速,出生人口性别比持续升高,以及乡村人口城镇化等因素,随着我国经济的发展、国家人口政策的实施,这些都影响着中国人口的增长。无论是对于我国目前的经济发展状况还是未来的远景规划,对中国人口做出分析和预测具有十分重要的意义。就我国来说,要达到小康社会的生活水平,不仅要靠发展生产力,提高综合国力水平,而且取决于对它做中短期和长期趋势预测以及能否有效的控制人口增长。从中国的实际情况和人口增长的上述特点出发,我们建立了中国人口的差分方程组模型。2.问题的分析人口问题是一个比较重要的问题,有效地控制我国人口的增长,不仅是我国全面进入小康社会、到21世纪中叶建成富强民主文明的社会主义国家的需要,也是我们义不容辞的责任。认识人口数量的变化规律,建立人口模型,作出较准确的预报,是有效控制人口增长的前提。长期以来人们在这方面作了不少工作。二百多年前,英国人口学家马尔萨斯(Malthus,1766-1834)调查了英国一百多年的人口统计资料,得出了人口增长率不变的假设,并据此建立了著名的人口指数增长模型。记今年人口为0x,k年后人口为kx,年增长率为r,则kkrxx)1(0(1)它的微分方程形式是:0)0(,xxrxdtdx(2)在马尔萨斯后,荷兰数学家威赫尔斯特(Verhulst)又提出了阻滞增长模型(Logistic模型)。微分方程形式为:)1(mxxrxdtdx,0)0(xx其中r为固有增长率,mx为自然资源和环境条件所能容纳的最大人口量。[1]指数增长模型和阻滞增长模型(Logistic模型)只考虑人口总数和总的增长率,不涉及年龄结构和人口迁移。事实上,在人口预测中人口按年龄分布状况是十分重要的,因为不同年龄的生育率和死亡率有着很大的差别。两个国家或地区目前人口总数一样,如果一个国家或地区年轻人的比例高于另一个国家或地区,那么二者人口的发展状况将大不一样。同时随着我国城镇化进程的加速,大量的农村人口迁移到了城镇当中,由于城、镇、乡育龄妇女的生育率不同,只有考虑建立分性别、按年龄、按地区类型(城、镇、乡)、农村人口迁往城镇的动态人口模型,才能有效地揭示我国人口发展的规律和有效预测我国人口变化的趋势。3任何形式的人口预测都是在一定信息量的基础上进行的,本题可得的资料包括国家人口发展战略研究报告,01—05年按性别、年龄、地区的死亡率、生育率和人口抽样数据等。但是这些数据通常具有不完全性和随机性,所以本文在数据提取和模型建立上都提出了适当的简化处理方法,在克服数据不足困难和提供实用参考决策方面进行了探索。首先是数据的提取和异常数据的处理,附件2中给出01—05年中国人口1%调查数据不一定仅好为1%,通过国家统计局()公布的2005年全国人口数为13.0756亿,将2005年不同性别、不同类类型(城、镇、乡)的全国人口数按比例折算出来,未来我国人口的中短期预测我们用2005年的数据为基础,通过附件2中2001—2005年城、镇、乡女性生育率的数据,可以统计出相应年份的总和生育率,其中2003年的女性生育率出现异常,通过对比观察可以将2003年的女性生育率扩大10倍处理。由2001—2005年抽样数据中可以得出城镇化水平,即城镇人口比(为了便于模型结果和国家人口发展战略研究报告相对比,将城、镇合并为城镇),在假设城镇化水平的增长曲线大致表现为一条拉伸的“S”型Logistic曲线的情况下,可以找出农村人口迁移到城镇的规律。在计算城镇化水平的过程中,发现2003年城镇化水平出现异常,这可以解释为当年我国发生了的非典,农民工大量返乡造成的,此时,采用三次样条插值的方法进行异常数值的修正。根据附录中给出的2005年城、镇、乡各年龄段的男、女性别比率,可推算出我国过去的两次人口高峰和在2005—2020迎来的婴儿出生高峰,最后,还可根据附件2中的数据,分析城、镇、乡育龄妇女的生育模式和死亡率、出生婴儿性别比等参数。其次是模型的建立。由于城、镇、乡育龄妇女各年龄的生育率不同,因此应分地区、分年龄考虑,另外,基于只有妇女才有可能生育小孩的事实以及出生婴儿男女性别比不同,因此应将男女分开考虑,同时注意到在第t年,第i岁人口存活到1t时,变为了1i岁,这部分人口数是减少的,因为有死亡率。但是有第t年到第1t年这一年中新生的女、男婴儿加入到了人口行列中,因此我们可以借助Leslie模型思想,建立按年龄分布的差分方程组。再考虑农村人口以一定的规律迁移到城市,建立动态人口模型。最后通过对人口指标分析并给合我国人口发展的趋势,对我国的人口政策提出了一些参考性建议。3.模型假设和符号系统3.1模型的假设1)由于附件1,2调查的随机性,参加调查人员的随机性。可以假设附件1,2的数据是可靠的,并可以代表全国的平均水平。2)城镇和农村育龄妇女的生育率继续保持下降趋势,农村育龄妇女的生育率高于城镇。3)出生男女性别比继续保持上升趋势。4)假设市、镇、乡抽样调查比例相同。5)假设影响中国人口增长的主要因素为人口年龄老龄化加速,出生人口性别比例偏高,乡村人口城市化。6)不发生重大的自然灾害、战争等,医疗条件不断改善,死亡率逐年有所下降。7)主要考虑农村人口迁入城镇的情况,对于迁移国外和城镇人口迁入农村不做主要考虑。8)城镇化水平不断提高。9)每个育龄妇女每次生育一胞胎或双胞胎,生育三胞胎以上的情况给予忽略。3.2符号系统4()xt:第t年的总人口数;i表示年龄,1,2,3j分别表示城市、镇和农村地区,w表示女性,m表示男性;()jPt:第t年第j类地区的总人数;()wjxt:第t年第j类地区的女性总人数;()wijxt:第t年i岁的第j类地区的女性人数;()mijxt:第t年i岁的第j类地区的男性人数;()wijdt:第t年i岁第j类地区的女性死亡率;()mijdt:第t年i岁第j类地区的男性死亡率;()ijbt:第t年i岁第j类地区妇女的生育率;21ii:妇女的育龄期;()wijkt:第t年i岁第j类地区女性的人口比率;()ijpt:第t年i岁第j类地区出生的婴儿数;(1)wjt:第t年第j类地区生育的女婴儿总数;()mjt:第t年第j类地区的生育的男婴儿总数;0()wjdt:第t年第j类地区的女性婴儿死亡率;()jt:第t年第j类地区的妇女总和生育率;()PUt:第t年的城镇化水平,用第t年的城镇人口数与当年总人口数之比来定义;()URt:第t年的城乡人口比;()Mt:第t年由农村迁往城镇的人口数;4.模型建立4.1数据分析在进行人口分析与预测时必须要符合我国的实情,由于数据的不完全性和不确定性增加了预测的难度。因此如何从较少的数据中挖掘出较多的信息成为了预测的关键。首先我们从附录2中所给的数据挖掘出影响预测的信息。51)2005年城、镇、乡,不同年龄、不同性别的人数根据国家统计局公布的我国2005年总人口数为13.0756亿,抽样数据为16.985767亿,因此抽样比应为1.2990%,按此比例可折算出各类型男女人口和各年龄人口数。表12005年城、镇、乡男女统计人口数单位:亿年份城男城女镇男镇女乡男乡女20051.8149351.8091961.1276021.11172233.666083.3.5460602)男女性别比分析依据[1994,2005]出生的男女性别比数值可以绘制如下的直方图:图11994—2005年城、镇、乡出生婴儿性别比城、镇、乡男女性别比95100105110115120125130123456789101112年份男性数市镇村从直方图中可以看出,镇、村的男女出生性别比较市的要高,并且随着时间的推移,男女性别比在持续增高,不妨使用线性函数来拟合数据,得到男女性别比模型:0.52927.8409yt,其中,,ty表示年份表示该年男女性别比。拟合图如下图21994-2005年出生婴儿性别比拟合图19941996199820002002200420061081091101111121131141156由此模型可得1995-2020年的对应男女性别比分布情况预测:图3未来我国男女性别比条形图到2020年男女性别比将达到120:100,这说明进入婚育年龄的男性明显多于女性,婚育积压问题严重化。在近几十年中男女比率将会持续升高。3)女性生育率分析(生育模式)根据附录2中给出的01—05年育龄妇女的生育率数据,以2005年为例,可以得出生育率与年龄的关系,也就是常说的生育模式。应用MATLAB绘图如下[2]:1520253035404550020406080100120140160180年龄生育率乡镇城图42005年育龄妇女生育率分布图1995-2020年男女性别比变化情况100105110115120125199520002005201020152020年份性别比男女性别比7从分布图4中可以看出,生育率随年龄的变化而变化,在整个育龄期,生育高峰期限出现在20-30岁,其中城镇高峰期为25-30岁,农村在20-25岁之间。城镇生育高峰要比农村晚,这与我国的国情相符。以2005年城市女性生育率为例,使用MATLAB的曲线拟合工具箱cftool,以生育年龄为自变量,生育率为因变量,采用高斯分布[3]:21/11)2005,(cbrearh(3)来拟合。其它年份和类型的生育率可采用相同的方法进行。可得拟合图如下:图5利用高期分布拟合2005年城市女性生育率拟合函数表达式:2267.548.2585.95)2005,(xerh(4)根据拟合图像城市女性生育的高峰期出现在25岁左右,我们国家实行计划生育政策,提倡晚婚晚育,相当于使生育年龄、生育高峰期向后推移,实行生育第二胎的一些相关规定,可以使生育模式的波峰变缓,有利于人口控制。4)按时间分布的城、镇、乡生育率分析根据附录2中所给出1995年——2005年市、镇、乡育龄妇女生育率数据,其中所缺2000年数据可使用1999年和2001年的数据按线性插值的办法补全。然后应用MATLAB绘图命令可得分布图:8图61994—2005年城、镇、乡育龄妇女生生育率变化图通过图6可