基于MATLAB的人口预测模型摘要本文以1980-2014年中国年终总人口数据资料为依据,分别使用了一次拟合、灰色预测模型和时间序列模型进行拟合,最终得出时间序列模型的效果最优,得到了中国人口数量逐年增长,但同时增长速度逐渐放缓的结论,为政府制定人口、经济政策提供了一定的依据。关键词:人口数量;一次拟合;灰色预测;时间序列前言世界人口的迅猛增长引起了许多问题。特别是一些经济不发达国家的人口过度增长,影响了整个国家的经济发展、社会安定和人民生活水平的提高,给人类生活带来许多问题。为了解决人口增长过快的问题,人类必须控制自己,做到有计划地生育,使人口的增长与社会、经济的发展相适应,与环境、资源相协调。我国是世界上人口最多的发展中国家。人口数量多、增长快、可耕地少、国家底子薄,这是我国的基本国情。人口增长过快,严重制约着我国经济和社会发展的进程,影响着人民生活的改善和民族素质的提高。从而造成社会再生产投入不足,严重影响国民经济的可持续发展。认真分析我国目前的人口现状和特点,采取切实可行的措施控制人口的高速增长,提高人口的整体素质,已成为我国目前经济发展中需要解决的首要问题。本文以中国近35年的人口数据尝试建立模型,分别建立了一次模型、灰色预测GM(1,1)模型和时间序列AR模型,最终选取了拟合效果最好的时间序列模型,用于说明我国人口问题以及预测短期内人口数量变化,以及为我国即将面临的人口问题提供一些建议。概念与引理定义1[1]:人口问题,是由于人口在数量、结构、分布等方面快速变化,造成人口与经济、社会以及资源、环境之间的矛盾冲突。人口数量问题,主要由非均衡生育(多子化和少子化)以及人口迁移造成,只有通过均衡生育(发达国家2.17胎,发展中国家2.3胎)和调控迁移来解决。人口结构问题,主要包括年龄、性别、收入、人种、民族、宗教、教育程度、职业、家庭人数等人口结构问题;其中最为突出的是年龄(多子化、少子高龄化)、性别(男女比例失调)和收入(基尼系数高、中产塌陷)结构问题。人口年龄结构问题,只有通过均衡生育(发达国家2.17胎,发展中国家2.3胎)来解决。人口性别结构问题,只有通过限制堕胎来解决。人口收入结构问题,原因较复杂,但最终都只有通过壮大中产阶层,使中产阶层成为社会主体才能真正解决。人口分布问题,主要包括大城市病、高密度连绵城市群的环境污染问题、大片乡村缺少就近(200公里内)特大城市辐射带动的发展难题、生态气候等自然条件恶劣地区人口的生存困境、以及高密度大流量的人口迁移等问题。人口分布问题,主要是通过城镇化的合理布局,构建合理的城镇体系来解决。定义2[2]:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。最小二乘法还可用于曲线拟合。其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。原理:在我们研究两个变量x,y)之间的相互关系时,通常可以得到一系列成对的数据1,1,2,2…m,);将这些数据描绘在x−y直角坐标系中,若发现这些点在一条直线附近,可以令这条直线方程如(式1-1)。1(式1-1)其中:、1是任意实数为建立这直线方程就要确定和1,应用《最小二乘法原理》,将实测值与利用计算值1)(式1-1)的离差−)的平方和∑−)2最小为“优化判据”。令:∑−)2(式1-2)把(式1-1)代入(式1-2)中得:∑−−1)2(式1-3)当∑−)2最小时,可用函数对、1求偏导数,令这两个偏导数等于零。∑∑亦即:11−)(式1-4)−)(式1-5)∑)1(式1-6)∑)(∑2)1∑)(式1-7)得到的两个关于、1为未知数的两个方程组,解这两个方程组得出:∑)−1∑)(式1-8)1∑)∑∑(式1-9)∑∑∑这时把、1代入(式1-1)中,此时的(式1-1)就是我们回归的一元线性方程即:数学模型。在回归过程中,回归的关联式不可能全部通过每个回归数据点1,1,2,2…m,),为了判断关联式的好坏,可借助相关系数“R”,统计量“F”,剩余标准偏差“S”进行判断;“R”越趋近于1越好;“F”的绝对值越大越好;“S”越趋近于0越好。∑−∑∑)√(∑2−∑2)−∑2−∑2)(式1-10)*在(式1-10)中,m为样本容量,即实验次数;、分别为任意一组实验数据的数值。定义3[3]:灰色预测是一种对含有不确定因素的系统进行预测的方法。灰色预测通过鉴别系统因素之间发展趋势的相异程度,即进行关联分析,并对原始数据进行生成处理来寻找系统变动的规律,生成有较强规律性的数据序列,然后建立相应的微分方程模型,从而预测事物未来发展趋势的状况。其用等时距观测到的反应预测对象特征的一系列数量值构造灰色预测模型,预测未来某一时刻的特征量,或达到某一特征量的时间。GM(1,1)模型令x)x)1),x)),…,x))),x(0)=(x⑴,x⑵,…,x(n))作一次累加,生成消除数据的随机性和波动性,即x1))∑=1x)),1,,…,n有x1)(x1)1),x1)),…,x1)))x)1),x)1)x)),…,x)−1)x)))x可建立白化方程:dxaxu即gm1,1)dt该方程的解为:x1)k)x1)1)u)uaax(k+1)=(x⑴-u/a)exp()+u/a其中:α称为发展灰数;μ称为内生控制灰数定义4[4]:时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测。AR模型是一种线性预测,即已知N个数据,可由模型推出第N点前面或后面的数据(设推出P点),所以其本质类似于插值,其目的都是为了增加有效数据,只是AR模型是由N点递推,而插值是由两点(或少数几点)去推导多点,所以AR模型要比插值方法效果更好。主要结果数据:我国自1980—2013年的年末总人口数据(单位:万人)年份人口年份人口年份人口年份人口1980年987051990年1143332000年1267432010年1340911981年1000721991年1158232001年1276272011年1347351982年1016541992年1171712002年1284532012年1354041983年1030081993年1185172003年1292272013年1360721984年1043571994年1198502004年1299882014年1367821985年1058511995年1211212005年1307561986年1075071996年1223892006年1314481987年1093001997年1236262007年1321291988年1110261998年1247612008年1328021989年1127041999年1257862009年133450表1注:1981年及以前人口数据为户籍统计数;1982、1990、2000、2010年数据为当年人口普查数据推算数;其余年份数据为年度人口抽样调查推算数据。总人口和按性别分人口中包括现役军人,按城乡分人口中现役军人计入城镇人口。数据来源:国家统计局观察数据:使用MATLAB软件根据表1数据画散点图图1根据散点图可得,年末总人口数目随着时间的增长而增长,存在明显的正相关关系。模型的构建与分析模型一不考虑任何其他因素,直接使用表1数据使用线性最小二乘法进行一次拟合,可得图2图2根据图2可以明显看出一次拟合拟合的效果较差,需重新拟合寻找更优模型模型二在考虑到人口与时间的关系以及生物指数性增长的特征,使用灰色预测模型GM(1,1)进行拟合,可得图3图3根据图3可以明显看出灰色预测模型GM(1,1)的效果也比较差,需重新拟合寻找更优的模型模型三从较长的时间来看,人口增长遵循一点的规律,而从短期来看,波动较小,预测较简单。AR自回归模型在人口问题预测中既考虑了人口数量在时间序列上的依存性,又考虑了随机波动的干扰性,对于人口数量增长的短期趋势的预测准确率较高,是应用比较广泛的一种方法。作为人口问题的一个重要指标,年终总人口数量具有一定的稳定性和增长性,且与前几年的人口数量具有一定的关联性,因此可以采用时间序列方法对人口数量的增长建立预测模型。记原始时间序列数据为a1,,…,35),首先检验序列a是否是平稳的,对显著水平α.5可算得1,计算得统计量T=+∞,上α分位数的值tα).345,所以丨T丨tα(n−),故认为序列是非平稳的;因为,所以序列有上升趋势。图4为了构造平稳序列,对序列a1,,…,35)作一阶差分运算b=a+1−a,得到序列b1,,…,34)。从时间序列b散点图来看,时间序列是平稳的。可建立如下自回归模型(AR(2)模型)对b进行预测:yc1y1c2y2ε其中:c1,c2为待定参数;ε为随机扰动项。根据表1的数据,采用最小二乘法可计算得出b的预测模型为y1.144y1−.1661y2ε利用该模型,求得时间为2015年时,年终人口总数的预测值为138149.15根据已知数据对上述模型的预测和相对误差见表2以及图5,。可以看出该模型的拟合效果和预测精度是较高的。单位:万人年份年终总人口数据年终总人口预测数据相对误差1980987059870501981100072100072019821016541014390.002119831030081030210.000119841043571043750.000219851058511057240.001219861075071072180.002719871093001088740.003919881110261106670.003219891127041123930.002819901143331140710.002319911158231157000.001119921171711171900.000219931185171185380.000219941198501198840.000319951211211212170.000819961223891224880.000819971236261237560.001119981247611249930.001919991257861261280.002720001267431271530.003220011276271281100.003820021284531289940.004220031292271298200.004620041299881305940.004720051307561313550.004620061314481321230.005120071321291328150.005220081328021334960.005220091334501341690.005420101340911348170.005420111347351354580.005420121354041361020.005220131360721367710.005120141367821374390.00482015—138149—表2图5问题分析:从上述建模结果来看,我国未来人口还将继续增加,但增长速度有所放缓。虽然我国人口目前世界第一,增长率在世界上排名靠前,但这并不意味着要禁止人口增长,甚至减少人口,毕竟人口问题归咎到底是经济问题,控制人口的目的也是为了提高国民的物质生活水平和综合素质水平。先来看几个图片:自然增长率%20151050198019821984198619881990199219941996199820002002200420062008201020122014年份图6自然增长率自1987年后逐年下降,现在为5%左右。65岁及以上人口占比12.00%10.00%8.00%6.00%4.00%2.00%0.00%1994年1995年1996年1997年1998年1999年2000年2001年2002年2003年2004年2005年2006年2007年1990年1991