基于打车软件的出租车供求匹配度模型研究与分析摘要目前城市“出行难”、“打车难”的社会难题导致越来越多的线上打车软件出现在市场上。“打车难”已成为社会热点。以此为背景,本文将要解决分析的三个问题应运而生。本文运用主成分分析、定性分析等分析方法以及部分经济学理论成功解决了这三个问题,得到了不同时空下衡量出租车资源供求匹配程度的指标与模型以及一个合适的补贴方案政策,并对现有的各公司出租车补贴政策进行了分析。针对问题一,根据各大城市的宏观出租车数据,绘制柱形图进行重点数据的对比分析,首先确定适合进行分析研究的城市。之后,根据该市不同地区、时间段的不同特点选择多个数据样本区,以数据样本区作为研究对象,进行多种数据(包括出租车分布、出租车需求量等)的采集整理。接着,通过主成分分析法确定模型的目标函数、约束条件等。最后运用spss软件工具对数据进行计算,求出匹配程度函数F与指标的关系式,并对结果进行分析。针对问题二,在各公司出租车补贴政策部分已知的情况下,综合考虑出租车司机以及顾客两个方面的利益,分别就理想情况与实际情况进行全方位的分析。在问题一的模型与数据结果基础上,首先分别从给司机和乘客补贴两个角度定性分析了补贴的效果。重点就给司机进行补贴的方式进行讨论,定量分析了目前补贴方案的效果,得出了如果统一给每次成功的打车给予相同的补贴无法改善打车难易程度的结论,并对第三问模型的设计提供了启示,即需要对具有不同打车难易程度和需求量的区域采取分级的补贴政策。针对问题三,在问题二的基础上我们设计了一种根据不同区域打车难易程度和需求量来确定补贴等级的方法。设计了相应的量化指标,以极大化各区域打车难易程度降低的幅度之和作为目标,建立该问题的规划模型。目的是通过优化求解该模型,使得通过求得的优化补贴方案,能够优化调度出租车资源,使得打车难区域得到缓解。通过设计启发式原则和计算机模拟的方法进行求解,并以具体案例分析得到,本文方法相对统一的补贴方案而言的确可以一定程度缓解打车难的程度。关键词:主成分分析法,供求匹配度,最优化模型,出租车流动平衡1一、问题重述出租车是市民出行的重要交通工具之一,“打车难”是人们关注的一个社会热点问题。随着“互联网+”时代的到来,有多家公司依托移动互联网建立了打车软件服务平台,实现了乘客与出租车司机之间的信息互通,同时推出了多种出租车的补贴方案。请你们搜集相关数据,建立数学模型研究如下问题:(1)试建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。(2)分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?(3)如果要创建一个新的打车软件服务平台,你们将设计什么样的补贴方案,并论证其合理性。二、模型假设(1)不考虑出租车换班时不接单以及拒载对大数据的影响;(2)假设所有安装有打车软件的司机不设置接单范围;(3)假设网络共享的数据真实可靠;(4)假设打车软件的使用率c为80%;三、符号说明x出租车分布的数量(辆);t被抢单时间(秒);z装有打车软件的打车客户需求量(人);h打车平均难易程度;P打车客户总需求量(人);M车费;aY2的权重;bt的权重;L车里程利用率(%);c打车软件的使用率,c0.8;Y服务的满意度;1YY的倒数;21F匹配程度函数;W出租车万人拥有量(辆);M车辆满载率(%);k补贴等级1,最少1k补贴等级2,中等2k补贴等级2,最多32四、数据处理4.1对地区的分析与选定截止2015年8月,中国地区共有23个省,四个直辖市,两个特别行政区,五个自治州。其中,我国23个省中分布有一线、二线、三线、四线等城市共计661个。在如此庞大的城市数据群的基础上,选择一个合适的城市进行深入调研,是进行出租车优化过程的第一步。一个合适的调研城市,有利于提高优化模型的精确性,增强模型应用的广泛性。选定城市后,针对该城市不同地区的特点进行地区划分与时间段的选取,是对出租车供求匹配程度进行分析的第二步前进方向。4.1.1杭州地区的选定地区选取标准:(1)经济发达,有足够规模大数据进行分析假设;(2)影响范围广,有条件进行出租车供求匹配的优化;(3)出租车万人拥有量或里程利用率居全国各城市的中等或中等偏下水平,保证可以代表我国的绝大部分水平,并有足够空间进行问题分析与优化;综合上述选取标准,本文初步决定围绕杭州进行调研。为验证其合理性,本文特分别在我国一线、二线、三线等城市中随机选取15个城市:北京、武汉、杭州、宁波等(百度百科)通过EXCEL等软件对其主城区出租车拥有量(辆)、主城区人口(万人)、出租车万人拥有量(辆)、里程利用率等进行柱形图对比分析,见图1、图2、图3、图4(详细数据见附录9.1):图1:各城市主城区出租车拥有量3图2:各城市主城区主人口图3:各城市出租车万人拥有量图4:各城市出租车里程利用率4衡量出租车供求的三大指标为里程利用率、车辆满载率、出租车万人拥有量。里程利用率指营业里程与行驶里程之比,L营业里程(公里)x100%行驶里程(公里)出租车万人拥有量表示一定城市规模内车辆占有量,是人均设备普指标。W主城区出租车数(辆)主城区人口(万人)车辆满载率是载客车数与总车数的比例关系反映出租车的供求匹配程度[1],M载客车数(辆)x100%总通过车数(辆)结合图1-图4可知,杭州市作为经济发达城市,二线城市中的领头羊,出租车万人拥有量a为19.6(辆/万人),位居15个城市中的12位,而里程利用率L以69.25%则位列第六位。在无各城市各时间段、各地区详细数据,所有城市均不考虑车辆满载率的情况下,结合各城市的a与L数据分析可知:杭州的出租车供求匹配程度并不高,且尚未达到其应有的水平。因此,杭州符合之前规定的选取标准。故本文将以杭州为调研地区进行数学建模,验证其出租车资源的供求匹配程度关系,优化出租车供求匹配问题。4.1.2西溪湿地地区与西湖地区的选定图5:杭州人流量最大地点示意图[2]5如图5所示,杭州人流量最大的几个地点中,西溪湿地与西湖名列其中。西溪湿地与西湖风景区是杭州的门户风景区,不仅受到外地游客的欢迎,更是本地居民休闲娱乐的好去处。因其独特地理位置、文化底蕴而导致的人流量高居不下等特点,符合数据样本地区选取的规则。因此选择西溪湿地附近与西湖风景区附近作为杭州地区内选择的第一处样本点,可以在一定程度上反映城市景区附近出租车供求匹配程度的大小。4.1.3火车东站地区与汽车南站地区的选定火车东站与汽车南站是本文选取的杭州地区第二处数据样本点。杭州火车东站号称“亚洲第一”铁路枢纽,站内汇集高铁、普铁、地铁、公交、出租、大巴等多种交通方式和配套服务设施于一体,并可实现立体无缝交通换乘。东站针对出租车出行的乘客专门进行了特殊的设计。地下到达/换乘层(地下一层),南北共设了6个出租车上客点,北侧3个,南侧3个。而坐出租车过来的乘客,可以直接通过新塘路上匝道和王家井街上匝道,直接到出发层,进入候车大厅。截止至2014年,东站客流量已高居全国第三。杭州汽车南站是杭州市最早投入服务的汽车站之一,日均发送班次近500班,出口高达1.1万余人每天。杭州东站与汽车南站的每日客流量大,出租车分布较密集。选取杭州东站与汽车南站作为数据样本点,既有针对性又可与其他人流密集地区进行对比,进行多层次分析。4.1.4武林广场地区与黄龙体育馆地区的选定武林广场商圈与黄龙体育馆地区是杭州市办公场所较集中的两个地区。由图5可知,武林广场地处杭州繁华地带,服务业完善、各大公司林立;黄龙体育馆是杭州本地群众以及外来游客访问量较大的场所之一,其完善的演唱会设施以及附近的散客中心为黄龙体育馆附近的人流量做出了很大的贡献。因此,除景区、交通枢纽外,武林广场与黄龙体育馆附近地区可作为本文中第三处数据样本点进行计算。4.1.5德胜社区与舟山东路附近地区的选定在选取了西溪湿地与西湖风景区地区、火车东站与汽车南站地区、武林广场与黄龙体育馆地区三块数据样本地区之后,本文的第四块数据样本地区选择在德胜社区附近与舟山东路附近地区。景区、交通枢纽、商圈与住宅区,掌握这四块地区的交通数据可较为全面地了解该城市的交通状况。住宅区人口较固定且出行有一定规律,因此选取住宅区做为第四处数据样本地区,同时可将住宅区数据做为其他样本地区数据样本的对比数据,弥补了其他三组数据样本地区的不足,使数据样本更加完善。64.2对基本数据的处理分析4.2.1打车客户总需求量P基于苍穹智能出行平台的大数据,分别选取9.7日杭州四块数据样本地区早高峰(7:00-9:00)、晚高峰(16:00-18:00)、平常时间(10:00、15:00、20:00)三个时间段的持有打车软件的客户需求量z,见表格1:表1:所截取各样本地区9.7日不同时间段z的大小时间段西溪湿地附近西湖风景区附近火车东站附近汽车南站附近武林广场附近黄龙体育馆附近德胜社区附近舟山东路附近(下城区)7:0025121311148:0010841121811109:003987111111116:005141312320151817:003611011411118:00751184211110:001772617914915:0013421843112420:003512111114假设打车软件的使用率c0.8,故打车客户总需求量Pzc(1)将P相关函数与表1相关数据带入计算软件中进行计算,得出结果有:表2:所截取各样本地区9.7日不同时间段P的大小及其平均值E(zc)时间段西溪湿地附近西湖附近火车东站附近汽车南站附近武林广场附近黄龙体育馆附近德胜社区附近舟山东路附近(下城区)7:0031.251.252.5016.251.251.251.255.008:00135.005.0013.7526.2510.001.251.2512.509:00497.508.751.251.251.2513.751.251.25E(zc)221.255.005.8314.584.175.421.256.2516:0063.755.0016.251.2528.7525.0018.7522.5017:0045.001.2512.501.2517.501.251.251.2518:0093.751.251.2510.0052.501.251.251.25E(zc)67.502.5010.004.1732.929.177.088.3313:00221.252.507.501.258.7511.251.2561.2514:0016.255.002.5022.505.0038.751.2530.0015:0043.751.252.501.251.251.251.2517.50E(zc)93.752.684.178.335.0017.081.2536.2574.2.2出租车服务满意度Y以及车辆分布数量x1基于苍穹智能出行平台的大数据,同样选取数据出租车分布量—x,作为计算满意度Y的数据来源。已知x与z相关数据,x相关数据见表3,z相关数据见表1。1表3:所截取各样本地区9.7日不同时间段x的大小及其平均值E(x)时间西溪湿地附西湖火车东站汽车南站武林广场黄龙体育馆德胜社区舟山东路附段近附近附近附近附近附近附近近(下城区)7:00404.001.00813.00527.00216.001.00260.00322.008:00355.001.00792.00200.00261.001.00353.00403.009:001.001.00839.00206.00208.001.00135.00168.00E(x)253.331.00814.67311.00228.331.00249.33297.6716:00835.001.00595.00441.00261.00369.00496.00449.0017:001014.001.001014.00111.00562.00145.00234.00273.0018:00813.001.00772.00283.00196.001.00270.00492.00E(x)887.331.00793.67278.33339