城市乘坐出租车人口的预测模型【摘要】在解决出租车规划的问题中,首先要解决的是出租车人口问题。本文利用已掌握的数据,对某城市的出租车人口进行的预测。模型的建立氛围三个步骤:1该城市的人口发展状况、2该城市居民的出行强度和出行总量、3该城市的出租车人口。【主要数学方法】三次样条插值、多元线性回归、OD矩阵的计算一、问题重述最近几年,出租车经常成为居民、新闻媒体议论的话题。某城市居民普遍反映出租车价格偏高,而另一方面,出租车司机却抱怨劳动强度大,收入相对来说偏低,甚至发生出租车司机罢运的情况,这反映出租车市场管理存在一定问题,整个出租车行业不景气,长此以往将影响社会稳定,值得关注。我国城市在未来一段时间内,规模会不断扩大,人口会不断增长,人民生活水平将不断提高,对出租车的需求也会不断变化。如何配合城市发展的战略目标,最大限度地满足人民群众的出行需要,减少环境污染和资源消耗,协调各阶层的利益关系,是值得深入研究的。(附录中给出了某城市的相关数据)。(1)考虑以上因素,结合该城市经济发展和自身特点,类比国内外城市情况,预测该城市居民出行强度和出行总量,同时进一步给出该城市当前与今后若干年乘坐出租车人口的预测模型。(2)给出该城市出租车最佳数量预测模型。(3)按油价调价前后(3.87元/升与4.30元/升),分别讨论是否存在能够使得市民与出租车司机双方都满意的价格调整方案。若存在,给出最优方案。(4)本题给出的数据的采集是否合理,如有不合理之处,请你给出更合理且实际可行的数据采集方案。(5)请你们站在市公用事业管理部门的立场上考虑出租车规划问题,并将你们的研究成果写成一篇短文,向市公用事业管理部门概括介绍你们的方案。二、基本假定1、未来若干年内该城市不会发生通货膨胀;2、居民人均可支配收人和人均生活消费支出的年均发展速度基本稳定;3、城市建成面积的增长率大致与该城市人口规模增长率相等;4、通过对出行特征的分析,把出行特征相近的人口划归为一类,常住人口和暂住人口称为第一类人口,短期及当日进出人口称为第二类人口;5、每类人口在城市的中心区和边缘区的分布是一致的;6、第一类人口与第二类人口的出行强度在未来若干年内服从同一增长规律;7、在短期内,人们从A地到B地所采用的出行方式相对固定;8、假设第一类人口、第二类人口中有出行的居民平均出行强度与常住人口的相同,即出行强度2相同;9、有出行居民的平均出行强度的增长规律同全部居民的相同;10、居民出行方式主要受OD分布影响,短期内人们选择某一出行方式的比例相对保持稳定。三、主要符号预定符号说明单位下标t年份(如t=2004,表示2004年)年下标j月份(如j=3,表示当年的3月份)月下标k某类人口(如k=1表示第一类人口,k=2表示第二类人口)pop人口数量人i人口增长率m城市建成面积km2PDI居民人均可支配收入元RI人均可支配收入的年增长率OQ出行强度次/人·日TC出行总量次/日四、乘坐出租车的人口的预测(问题一)1、问题分析要预测若干年后该城市乘坐的出租车人口,可以分为三个步骤。首先应该考虑该城市在未来若干年的人口发展状况,然后考察该城市居民的出行强度和出行总量两个因素,进而预测该城市未来乘坐出租车的人口。2、模型建立、应用与分析2.1人口规模发展预测我国城市在未来一段时间里,规模会不断扩大,人口会不断增多,人民的生活水平会不断提高。结合本题给出的该城市的总体规划人口数据(2004年、2010年、2020年),采用三次样条曲线进行插值,利用MATLAB进行数据处理,可以得到2004年——2020年各年预计的人口规模。具体过程如下:已采集到的人口规模数据包括总人口、常住人口、流动人口(分为暂住人口和短期及当日进出人口)。由于各类人口的出行特征存在显著差异,不同的出行特征将影响出行强度和出行总量。本文通过对出行特征的分析,把出行特征相近的人口划归为一类,常住人口和暂住人口称为第一类人口,短期及当日进出人口称为第二类人口,如图表1所示:图表1:城市总体规划人口规模(单位:万人)年限项目总体规划人口规模(万人)2004年2010年2020年常住人口185.15259321流动人口5580100其中暂住人口334860短期及当日进出人口223240合计240.15339421第一类人口218.15307381第二类人口223240根据已有数据,考虑到只有2004年、2010年和2020年的总体规划人口规模,如果采用阻滞增长模型(Logistic模型)来预测人口的增长,利用简单的线性最小二乘法估计这个模型的参数(人口增长率r和人口容量),则这样的估计误差过大,不采用。如果采用三次样条插值,可以以较低的代价实现较小的插值误差,稳定性也在可接受范围内,故本文采用三次样条插值法预测该城市的人口规模。利用MATLAB进行数据处理(具体过程参见附件),结果如表2所示:图表2:2004年——2020年预计的该城市的人口规模年份第一类人口第二类人口总人口2004218.1522240.152005235.2723.94259.212006251.4725.77277.242007266.7427.49294.232008281.0929.10310.192009294.5130.60325.112010307323392011318.5733.29351.852012329.2134.47363.682013338.9235.54374.462014347.7136.50384.212015355.5837.35392.932016362.5138.10400.612017368.5238.74407.262018373.6139.27412.882019377.7739.69417.45202038140421将该结果用图像表示,可以参见附件,这里仅展示总人口的增长趋势图像,如图表3所示。由图表3可以看出,用三次样条插值方法得到的结果基本符合人口增长的规律。图表3:三次样条插值预测总人口增长2.2居民的出行强度和出行总量出行强度指标用于衡量城市居民出行需求量,各类文献中有两种定义办法。一种认为指标应包含出行量与出行时耗的信息,将出行强度定义为出行次数与单程出行平均时耗的乘积;另一种将出行强度的定义简化为单位时间内的人均出行次数。由于本文所考察的内容与出行的时耗关系不大,故选择第二种定义方式,这也与题目附录给出的数据相符。根据参考文献《大中城市居民出行强度的聚类分析》(该文也采用第二种定义方式),与居民出行强度相关性最大的典型指标有4个:市区土地面积、社会消费品零售总额、居民消费价格总指数和市区居民人均可支配收入。由于本文假定未来几年里没有通货膨胀,则居民消费价格总指数的变化不大,对出行强度的影响相对小,可以忽略不计。社会消费品销售总额这个指标由于缺乏数据支撑,而且在很大程度上与居民的人均生活消费支出正相关,故本文采用居民的人均生活消费支出来替代。2.2.1出行强度各因素的计量与分析2.2.1.1城市的建成面积通过观察1980—1998年南京等各主要城市面积与城市人口规模增长率的变化规律,大致呈现城市面积随人口规模的增大而增大。但由于各城市的地理环境不同,具体的增长率亦有所不同。所以为简化起见,在此假定,该城市面积发展大致满足:城市面积的增长率大致与该城市人口规模增长率相等。又因为通过对人口的分类,可以发现,第一类人口对城市面积的发展起着决定性作用,而第二类人口作为短期和当日进出人口,对城市面积的扩大影响不大,所以,这里的人口增长率指的是第一类人口的增长率。由图表4可以看出,该城市2004年—2020年的人口增长率并不一致,2004年到2010年的人口增长相对稳定,2010年到2020年的人口增长率明显下降,明显不能用指数增长模型来解释。如果将人口增长率的测定划分为两个阶段:2004年—2010年和2010年—2020年。如此分段虽然可以缩小误差的剪刀差效应,但仍存在较大误差。该误差之大可从下文中的图表5处得到证明。图表4:阶段分析该城市的第一类人口增长趋势为此,本文对该城市的人口增长率的测定采用逐年测定法,即每年的第一类人口增长率等于该年相比上一年的第一类人口增长数与上一年的第一类人口基数的比例。用公式表示为其中,表示t年时第一类人口的增长率,表示t年时该城市的第一类人口数,表示t-1年时该城市的第一类人口数。根据假定,第一类人口的增长率也即该城市面积的增长率。通过EXCEL的计算,可以得到如图表5的结果。图表5:2004年——2020年预计的该城市的建成面积年份(t)第一类人口()相关增长率()城市建成面积()2004218.15——181.772005235.277.85%196.0352006251.476.89%209.53342007266.746.07%222.25682008281.095.38%234.21372009294.514.77%245.395720103074.24%255.80282011318.573.77%265.44342012329.213.34%274.3092013338.922.95%282.39972014347.712.59%289.72382015355.582.26%296.28142016362.511.95%302.05572017368.521.66%307.06342018373.611.38%311.30462019377.771.11%314.770820203810.86%317.46222.2.1.2居民的人均可支配收入观察题目附录给出的“某城市2002~2004年1~12月份居民累计收入与消费情况”,由于给出的数据有4个月份(1、2、11、12月)的累计数据缺失,故选用三年数据都完整的其余八个月份的数据。利用最小二乘的思想,找到一个合适的居民可支配收入的年增长率(RI):其中,RI表示居民人均可支配收入的年增长率,PDI表示居民人均可支配收入,表示t年j月该城市的累计人均可支配收入。通过直观观察数据和现实经验,居民的人均可支配收入的增长率一般不超过20%。所以本文使用MATLAB(具体过程参见附件),在0—20%的范围内,以3位小数的数据精度进行测试,得到最优的年增长率RI为11.1%。接着,根据2004年末的居民累计可支配收入额,作为2004年度的居民人均可支配收入,即由和可以得到2004年—2020年各年的居民人均可支配收入,如图表6所示:图表6:2004年—2020年预计的人均可支配收入年份20042005200620072008人均可支配收入8617.489574.0210636.7411817.4113129.15年份20092010201120122013人均可支配收入14586.4816205.5818004.420002.8922223.21年份20142015201620171018人均可支配收入24689.9927430.5830475.3733858.1437616.39年份20192020人均可支配收入41791.8146430.72.2.1.3居民的人均生活消费支出用类似的处理方法,可以得出该城市的居民人均消费支出的年增长率是10.7%,进而得到2004年—2020年各年的居民人均生活消费支出,如图表7所示:图表7:2004年—2020年预计的人均生活消费支出年份20042005200620072008人均生活消费支出6884.617621.2638436.7389339.46910338.79年份20092010201120122013人均生活消费支出11445.0412669.6614025.3215526.0317187.31年份20142015201620171018人均生活消费支出19026.3521062.1723315.8325810.6228572.35年份20192020人均生活消费支出31629.635013.962.2.2出行强度与相关因素的模型建立与修正之前提到出行强度主要受3个变量