1中国人口预测及综合评估模型【摘要】根据我国特有国情,我国现阶段人口状况面临四个问题:人口基数大,老龄化趋势剧烈,性别比例失衡,城镇化过快。本文针对上述几个问题展开讨论,建立模型对我国人口状况作出了预测评估,得到了相当好的效果。本模型系以差分方程和矩阵运算为理论基础,借鉴前人经验,汲取年龄移算模型和Leslie矩阵预测模型的优点改进而成,综合考虑了性别比例、迁移等问题。在模型参数的确定上,我们运用了概率统计分析的手段对附录数据作了恰当的处理获得参数并预测,并以严谨的理论性说明了操作的合理性;对于人口出生性别比这个规律性不明确的数据,本文采用了灰色系统理论建立了GM(1,1)预测模型,也得到了很好的预测效果;而对于人口的迁移(城镇化)问题,则从长远的角度建立了Logistic模型建立了城市化函数进行预测,也取得了相当好的效果。参数确定后,本文利用模型以各年附表数据为初值进行预测检验,验证了模型的精确性。然后根据短期固定不变的参数在2006~2015年对我国人口进行了预测,得到了总人口上升趋势渐缓、城市化进程过急、老龄化结构持续恶化等结论,并推算得在2015年末,我国总人口将达到13.30亿,城市化率达到53.8%左右的水平。对于人口的长期预测,我们对参数作了一定改进,用Weibull分布确定了妇女的生育模式函数,其系数值体现了政策规定的总和生育率(每对夫妻生育几个子女)和最低婚育年龄。因此,结合所建立的生育模式函数和城市化函数,可以对政府实施政策的长期效应进行预测,可以作为政策制定时的有用参考。长期模型表明,在一个固定的总和生育率条件下,人口总数不可能稳定(除了零点),而政策规定的总和生育率在2.04以下时,总人口在长期内将最终成下降趋势,此时规定总和生育率越低,则人口下降越快,人口峰值将提早到来,并且峰值减小。但同时,总和生育率的下降将导致更严重的人口老龄化,为了保证老龄化不致过于严重,总和生育率就不能调节得过低,为了使得抚养比最大不超过0.65,总和生育率不能低于1.5。实际上利用模型作长期检验,表明当严格限制每对夫妇只生育1个孩子时,我国总人口将在2006年达到最大值13.16亿,当限制为1.8时,将在2022年达到最大值13.95亿。【关键词】:Leslie矩阵预测模型灰色GM(1,1)模型Logistic模型生育模式函数Weibull分布21.问题的重述中国是一个人口大国,人口问题始终是制约我国发展的关键因素之一。根据已有数据,运用数学建模的方法,对中国人口做出分析和预测是一个重要问题。近年来中国的人口发展出现了一些新的特点,例如,老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,这些都影响着中国人口的增长。2007年初发布的《国家人口发展战略研究报告》(附录1)还做出了进一步的分析。关于中国人口问题已有多方面的研究,并积累了大量数据资料。附录2就是从《中国人口统计年鉴》上收集到的部分数据。试从中国的实际情况和人口增长的上述特点出发,参考附录2中的相关数据(也可以搜索相关文献和补充新的数据),建立中国人口增长的数学模型,并由此对中国人口增长的中短期和长期趋势做出预测;特别要指出你们模型中的优点与不足之处。2.问题的分析人口预测的数学模型是人们研究较多的数学模型之一,其理论也非常丰富,从指数函数到Logistic函数的连续模型,人口偏微分方程到著名的Leslie矩阵人口离散模型都可以对人口的发展趋势进行预测。但由中国独特国情决定,老龄化进程加速、出生人口性别比持续偏高,以及乡村人口城镇化等因素都影响着中国人口的发展态势,经分析以上几种模型都不能充分合理地反应现阶段中国人口的发展趋势。考虑到Leslie矩阵人口模型是以年龄移算为基础的离散建模,在一定的程度上可以反映人口结构的变化并且预测结果比较精确。但由于Leslie模型忽略了性别差异,在我国国情环境下偏差较大,考虑对Leslie模型进行改进,考虑男女性生育及迁移的交叉性,建立多转移矩阵离散模型,则可将此类因素综合考虑在内。改进的Leslie矩阵预测模型建立的关键是存活率(死亡率),年龄别生育率,出生人口性别比,迁入(出)人口四组参数的确立,其精度直接影响人口模型的好坏。对于中短期模型,死亡率,年龄别生育率都认为是五年来的平均,这是可以由概率理论保证的。由于出生人口性别比的波动性和影响其因素的复杂,其内部机理难以分析。因此对短期的出生人口性别比的估计,可用灰色GM(1,1)模型预测。迁入(出)人口可以由城镇化率间接得到,通过近年来中国城镇化的发展趋势和国家城镇化部署结合事物的普遍发展规律建立了城镇化Logistic模型,且有很好的拟合优度。这样既可对中短期的模型进行matlab求解。而对于长期模型,固定的参数不可能长期生效,而应该根据人口现状积极进行有利的调整。因此可以对参数进行函数化,令政策的影响体现在参数中,根据长期的预测的结果来评估政策的效果,这是长期政策的方向与作用。33.基本假设及符号说明3-1基本假设(1)假设所有妇女均正常婚配,均在育龄生育,不考虑多胞胎;(2)假设所有人口都是自然死亡,不考虑其余因素(自然灾害、战争、事故等);(3)假设在短期内,城乡各年龄男女的自然死亡率相对稳定;(4)不考虑地区、民族政策等额外因素带来的影响;(5)认为所有的出生、死亡都在每年年初进行;(6)只考虑0~90岁的人口状况,并且90岁的人一年后自然死亡;(7)假设国家对人口的宏观调控是有效的;(8)不考虑国际人口迁移;(9)假设所给数据真实可信。(个别异常数据酌情处理)3-2符号说明k年份,2001年时k=1,后依此类推;i人口年龄,从0到90;i0,i1育龄妇女的育期起止年龄i0=15,i1=49;m,f性别标识符,作为符号后缀,m表示男性,f表示女性;c,t,v城乡标识符,后缀,c为城市,t为城镇,v为乡村;P人口,例如P(k)为k年总人口,P(i,k)为k年i龄总人口,Pm(k)为k年男性总人口,Pmc(i,k)为k年i龄的城市男性人口,以下各符号命名规则类似,不另行说明;d死亡率;s存活率,等于1-d;b年龄别生育率,等于对应总生育数与该龄妇女总数之比;B0总和生育率,等于年龄别生育率的总和;r性别比,r等于妇女人数比总人数;r0人口出生性别比;g净人口迁移数,以迁入为正;M城镇化率,等于城镇人口比总人口;其余变量在使用时会另加说明4.建模前的准备4-1人口基数在数据表中,可以查得各年中国人口1%调查数据,据此可以求出2001~2005各年市、镇、乡男女人口占全国总人口的比例。由于从数据上看,抽查比率不可靠,我们并不以此预测各类人口的基数,只求出了比例,而另外引用了在中国统计年鉴网[1]上面发布的2001~2005全国人口总数,由此推算出了各年的市、镇、乡男女人口基数,见下表:4表12001~2005年全国市、镇、乡男女人口总数(万人)年份20012002200320042005市男1546616803167791667718149市女1542016804168431688918092镇男8394821399611006011276镇女815479049705990111117乡男4127140566392223936036661乡女3892338164367183710035461总计127627128453129227129988130756相应的条形图如下:4-1Leslie矩阵预测模型根据相关文献[2],以城市人口为例,人口的年际变迁符合如下年龄移算差分方程组:)90()89(),89()1,90()891()()1()1,1()1,()0()()(),()1,0(10cccccccciiicccccgskPkPiigiskiPkiPgibirkiPkP 其中,Pc(i)为城市i龄男女人口总数,rc(i)为i龄城市妇女所占Pc(i)的比例,bc(i)为i龄城市妇女的生育率,sc(i)为城市各年龄人群的存活率,gc(i)为城市迁入人口数。则除迁入外,上式意义如下:(1)式表示第k+1年新生婴儿等于第k年育龄妇女数生育的部分;(2)式表示第k+1年i龄人群等于第k年i-1龄人群存活的部分(自然成长);5(3)式表示第k+1年高龄人群等于89龄人群存活部分加上自身第k年存活的部分。国际著名人口学家Leslie将此模型用矩阵形式作了如下表述Pc(k+1)=APc(k)+gc)90()0(),90(),89(),1(),0(0)89(000000)1(0)0(00)49(49()15()15(00)1,90()1,89()1,1()1,0(cccccccccccccccccggkPkPkPkPsssbrbrkPkPkPkP5.短期模型的建立与求解5-1对Leslie模型的改进考虑到男女性参数的不同,将性别混合考虑的Leslie矩阵模型不能满足需要,现将男女人口分开讨论,对模型作如下改进:对女性人口:Pf(k+1)=APf(k)+rfg)90()0(),90(),89(),1(),0(0)89(000000)1(0)0(00)49()15(00)1,90()1,89()1,1()1,0(00ggrkPkPkPkPsssbrbrkPkPkPkPffffffffffffff对男性人口:Pm(k+1)=B1Pm(k)+B2Pf(k)+(1-rf)g)90()0()1(),90(),89(),1(),0(0000000)49()1()15()1(00),90(),89(),1(),0(0)89(000000)1(0)0(00)1,90()1,89()1,1()1,0(00ggrkPkPkPkPbrbrkPkPkPkPssskPkPkPkPfffffffmmmmmmmmmmm事先可以求出市、镇、乡的男女人口,然后只需确定矩阵A,B1,B2中系数的值以及迁入向量g的值,即可从前一年各龄城村男女人口状况推知下一年对应的状况,即达到了预测的目的。65-2模型参数的确定○1存活率(死亡率)的估计假设短期内国家医疗水平不变化,2001~2005年存活率参数应该有一个相对稳定的值。自然死亡X是一个随机事件,可以看作是概率为d(i)的两点分布(假设死亡为1,存活为0),d(i)的极大似然估计即是某年i龄人群死亡人数的样本均值,实际统计数据即是据此得到的。根据中心极限定理[3]P206,可证明此样本的均值服从均值为,方差为2/n的正态分布。则在2/n未知的条件下,n年内各年死亡率的均值则服从自由度为n-1的t分布[3]P276。可以认为统计样本足够大,那么可以用死亡率5年的均值的估计d(i)值(方差暂不考虑)作为短期内各年龄死亡率的估计值:20052001),(51)(ˆkkidid存活率)(ˆ1)(ˆidis作为例子,下面给出城市男女的死亡率曲线作为参考,所有数据见附表1。02040608010005%10%15%20%年龄死亡率图2城市男女的死亡率曲线城男城女○2年龄别生育率的估计假设短期内国家生育政策不变,则育龄妇女的年龄别生育率也应当有一个稳