全国数学建模竞赛优秀论文集 2007 年生物医学工程与医学影像学院·数学与生物数学教研室前言数学建模是指利用数学方法和数学软件解决实际问题的过程,从1994年开始由教育部高教司和中国工业与应用数学学会共同主办数学建模竞赛,每年一次。是目前我国规模最大的一项课外科技活动之一,其目的是培养学生的综合素质、创新意识和实践能力等。我校2003年首次组织本科生参加全国大学生数学建模竞赛,得到训练部教务处的全力扶持和学员旅、护理系的大力支持,发展至今,已建立了一个以科室主任为领导核心的数学建模指导教师团队,营造了领导关心数学建模、教师支持数学建模、学生喜欢参与数学建模的良好氛围。2007年我校共有29队参赛,11个队参加甲组比赛,获全国一等奖2项、全国二等奖1项、重庆市一等奖6项;18个队参加乙组比赛,获全国一等奖3项、重庆市一等奖5项、重庆市二等奖6项。我校获得全国奖的比例高出全国平均水平11.37个百分点。我校参赛队数占重庆市高校参赛队数的5.66%,获全国一等奖队数的比例却高达35.71%,彰显我校实力,为我校争得荣誉。本册子收录了五篇在2007年全国大学生数学建模竞赛中获全国奖的优秀论文,都是在校大学生在三天之内完成的,问题来源于实际,文章思路清晰,方法多样,表述准确流畅,具有严密的逻辑性,具有一定的独到之处。可供参与数学建模竞赛的指导教师和学生参考。数学与生物数学教研室2008.4.10目录2007年获全国甲组一等奖中国人口增长的预测模型……………………………………………李阳等(4)2007年获全国甲组一等奖最佳公交线路的选择模型……………………………………………胡小刚等(22)2007年获全国乙组一等奖手机“套餐”优惠几何………………………………………………龚科等(40)2007年获全国乙组一等奖手机“套餐”优惠几何………………………………………………李江华等(60)2007年获全国甲组二等奖关于我国人口增长问题的研究………………………………………弓毅等(84)4 中国人口增长的预测模型李阳、罗虎、陈道森指导教师:罗万春摘要:本文研究的是根据中国实际情况,结合近年中国人口发展出现的新特点(老龄化加速、出生人口性别比持续升高以及乡村人口城镇化等),对中国人口的增长趋势做出中短期及长期预测的问题。首先,我们扩充了中国历年的总人口数据,建立了BP神经网络模型,对中国短、中、长期的人口增长分别做了简单预测;其次借用Logistic人口增长模型,将各种影响人口发展的因素归结到环境的容量因素中,建立了符合中国实际情况的人口增长模型,并编程求解。之后,我们对宋健人口模型进行了改进,建立了一阶偏微分方程模型,并借用高斯赛德尔迭代法的思想将已预测出的数据加以迭代来预测下一年的数据,使该模型具有更好的时效性,利用 Excel 对所给数据进行统计和筛选,并用 Matlab6.5 编程实现,对中国人口发展进行了预测。最后我们以改进的宋健模型为基础,将农村人口城镇化的因素纳入考虑范围,提出了人口城镇化影响因子,从而建立了人口城镇化进程中的人口增长模型四。四种模型均用 Matlab6.5 编程求解。从四个模型的结果中可以看出:短期预测时,Logistic人口模型预测结果准确,而中长期预测时,偏微分方程更加优越。在2045年左右,中国人口达到峰值约14.6亿,之后在一个较小的范围内波动。而城镇人口增长模型和乡村人口增长模型更是从图像上直观地反映出未来中国人口发展的趋势,先是缓慢上升,到2040年左右人口达到一个最大值14.5亿,之后人口缓慢下降,到2080年时,中国人口约为11.1亿。模型四最能刻划我国人口发展趋势的特点。本文的四种模型相互印证,相互补充,其中改进后的微分方程模型能推广用于多因素影响的预测问题。而模型四更是很好的描述了中国在城市化进程中的人口发展趋势,该模型不仅适用于中国,也同时适用与所有处于城市化阶段的发展中国家,有一定的创新。关键词:人口预测神经网络 Logistic 人口增长模型宋健人口模型偏微分方程人口城镇化5 1 问题重述(略) 2 模型假设(1)将出生人口数、死亡人口数、老龄化、人口迁移以及性别比作为衡量人口状态变化的全部因素,不再考虑其他方面对人口状态的影响;(2)所有表征和影响人口变化的因素都是在整个社会人口的平均意义下确定的;(3)人口死亡率函数只依赖于各个年龄段,而与时间的流逝无关,即针对同一年龄段,假设人口死亡率在各个年份是相同的。 3 符号说明 (1) ) (t N :时刻该地区的人口总数; (2) m r :人的最长寿命; (3) ) , ( t r F :人口函数,表示该地区在t时刻时一切年龄小于r的人口总数; (4) ) , ( t r p :人口年龄分布密度函数,表示在 t 时刻年龄为 r 的人口数, r F t r p¶¶= ) , ( ; (5) ) , ( t rm :人口死亡率,表示在t时刻年龄为r的人口的死亡率; (6) ) ( 0 r p :初始时刻的人口密度, ) 0 , ( ) ( 0 r p r p=; (7) ) (t f :婴儿出生率, ) ( ) , 0 ( t f t p=; (8) ) , ( t r k :女性性别比函数,表示时刻 t 年龄在 ) , [ dr r r+内的女性人数为 dr t r p t r k ) , ( ) , ( ; (9) ) (tb :总和生育率,表示平均每个女性一生的总和生育数; (10) ) , ( t r h :生育率分布函数,描述的是女性在各个年龄段生育率的高低; (11)s:人口迁移造成的妇女生育率改变的增长系数。 4 问题分析对于我国这样的人口大国来说,人口问题始终是制约我们经济、文化等各方面发展的重要因素。如何准确地用数学语言和较为符合中国国情的实际因素来刻画人口的增长状况,为人口的预测提供一个较好的参考,是关系到国计民生的重要问题,也是本文的战略性目标。6 由于近年来中国的人口发展出现了一些新的特点,比如说老龄化进程加速、出生人口性别比持续升高,以及乡村人口城镇化等因素,特别是计划生育政策的实施,都从不同程度影响着人口的增长,而这些因素是以前的人口预测中很难估料的。为此,如何综合考虑各方面的因素,较为准确地刻画出人口增长趋势,是本文要解决的重要问题。关于人口预测方面,中外大批的科学家进行了长期艰苦的探索,为我们积累了丰富的经验。比如阻滞增长模型(Logistic 模型)、神经网络等,它们均是总人口随时间变化的规律的预测,不能很好刻画中国人口发展的新特点,即多因素影响,而偏微分方程能够很好的描述这些因素对人口增长的影响,因此可以利用偏微分方程对人口增长作预测并与神经网络和Logistic模型作比较。 5 模型的建立与求解 5.1 BP 神经网络模型 BP(Back propagation反向传播)模型是一种用于前向多层神经网络的误差反向传播学习算法,它采用的是并行网络结构,包括输入层、隐含层和输出层,经作用函数后,再把隐节点的输出信号传递到输出节点,最后给出输出结果。该算法的学习过程由信息的前向传播和误差的反向传播组成。在前向传播的过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。第一层的神经元状态只影响下一层神经元的状态。如果在输出层得到不同期望的输出结果,则转入反向传播,将误差信号(目标值与网络输出之差)沿原来的连接通道返回,通过修改各层神经元权值,使得误差均方最小 [1] 。由于BP神经网络法在预测模型中运用广泛,因此我们首先考虑到运用这一方法对近些年来中国的人口数据进行学习和培训,从而得到一段时间内的人口预测数据;同时,为了提高预测精度,我们采用回归预测的方法,将输出层的数据反馈到输入层作为已知数据,继续培训。比如我们有 N 组数据,我们可以利用回归 BP 神经网络法,通过软件 Matlab6.5 预测出第 N+1 个数据,之后,我们将第N+1个数据添加到前面N组数据中,构成N+1个数据组,将这N+1个数据作为已知数据,利用同样的方法再去预测第 N+2 组数据,如此循环。我们将其用图形表示为:于是,我们得到第一个模型:模型一:图1 BP网络模型图示7ïïîïïíì-+=++=+=+ )) 1 ( ),..., 2 ( ), 1 ( ( ) ( ...... )) 1 ( ),..., 2 ( ), 1 ( ( ) 2 ( )) ( ),..., 2 ( ), 1 ( ( ) 1 ( t n P P P T t n P n P P P T n P n P P P T n P 模型说明: ) 1 (+ n P 代表第 1+ n 年的人口总数,T 是 BP 神经网络的内部函数, )) ( ),..., 2 ( ), 1 ( ( ) 1 ( n P P P T n P=+表示第 1+ n 年的人口数是前n年人口数的函数,依次类推。另外,由于题目所给的人口数据只限于5年之内,且部分数据与实际情况相差较大。对于BP神经网络法来说,数据太少,预测的效果往往很差,因此,我们通过查阅相关资料 [2] 扩充数据,得到1978~2005年我国的总人口数如表1所示:表1 我国1978~2005年人口数及构成按性别分按城乡分年份男女城镇总人口乡村总人口年底总人口(万)人口数比重(%)人口数比重(%)人口数比重(%)人口数比重(%) 1978 96259 49567 51.49 46692 48.51 17245 17.92 79014 82.08 1980 98705 50785 51.45 47920 48.55 19140 19.39 79565 80.61 1985 105851 54725 51.70 51126 48.30 25094 23.71 80757 76.29 1989 112704 58099 51.55 54605 48.45 29540 26.21 83164 73.79 1990 114333 58904 51.52 55429 48.48 30195 26.41 84138 73.59 1991 115823 59466 51.34 56357 48.66 31203 26.94 84620 73.06 1992 117171 59811 51.05 57360 48.95 32175 27.46 84996 72.54 1993 118517 60472 51.02 58045 48.98 33173 27.99 85344 72.01 1994 119850 61246 51.10 58604 48.90 34169 28.51 85681 71.49 1995 121121 61808 51.03 59313 48.97 35174 29.04 85947 70.96 1996 122389 62200 50.82 60189 49.18 37304 30.48 85085 69.52 1997 123626 63131 51.07 60495 48.93 39449 31.91 84177 68.09 1998 124761 63940 51.25 60821 48.75 41608 33.35 83153 66.65 1999 125786 64692 51.43 61094 48.57 43748 34.78 82038 65.22 2000 126743 65437 51.63 61306 48.37 45906 36.22 80837 63.78 2001 127627 65672 51.46 61955 48.54 48064 37.66 79563 62.34 2002 128453 66115 51.47 62338 48.53 50212 39.09 78241 60.91 2003 129227 66556 51.50 62671 48.50 52376 40.53 76851 59.47 2004 129988 66976 51.52 63012 48.48 54283 4