项目名称城市大规模时空数据的可视化研究-以出租车载客记录为例项目负责人(签名)_________________________所在学校(盖章)___________________________研究类别”含义:基础研究:指为获得关于现象和可观察事实的基本原理及新知识而进行的实验性和理论性工作,它不以任何专门或特定的应用或使用为目的。应用研究:指为获得新知识而进行的创造性的研究,它主要是针对某一特定的实际目的或目标。试验发展:指利用从科学研究和实际经验中所获得的现有知识、生产新材料、新产品、新装置、新流程和新方法,或对现有的材料、产品、装置、流程、方法进行本质性的改进而进行的系统性工作。推广应用、科技服务:指与研究与发展活动相关并有助于科学技术知识的产生、传播和应用的活动。研究项目项目名称城市大规模时空数据的可视化研究-以出租车载客记录为例研究类别21.基础研究2.应用研究3.试验发展4.推广应用5.科技服务依托的一级学科计算机科学技术成果形式论文+报告起止时间2014年4月到2016年5月经费申请总额2万元其他经费及其来源项目负责人姓名职称工作单位电子邮箱项除目负组责主人要外成五员名姓名职称学位专业工作单位承担任务本人签名项目负责人近三年来承担的研究项目项目名称项目来源起止年月排名进展高校学生微博使用行为大数据分析研究宁波市教育规划项目2014.4-2015.41立项慈溪市物流公共信息平台建设研究慈溪市社会科学项目2013.6-2014.61中期智慧物流关键技术及优化研究校高级别预研项目2012.10-2015.101中期基于学习成果展示的先学后教课堂教学模式研究校教学改革项目2013.12-2015.121进行宁波市质量监督局江北分局网站改版及维护宁波市质量技术监督局2013.12-2014.123进行RFID环境下网络攻击的防御方法宁波新汇信息科技有限公司2013.7-2014.64中期项目负责人为第一署名人的代表性成果成果名称成果来源获得时间排名等级extension-basedclusteringmethod:anapproachtosupportadaptabledesignoftheproductMSEC论文2007.101EIExtensionadaptivemethod:AnApproachtosupporttheconfigurableLayoutdesignicmlc论文2010.71EIOptimizationinlogisticsdistributionbasedonextensioncodedparticleswarmalgorithmIccsnt论文2012.21EIModifiedParticleSwarmAlgorithmforVehicleRoutingOptimizationofSmartLogisticsIcmic论文2014.31EI基于agent的紧急状态救援行为模型仿真工业安全与环保2014.31核心期刊1.本项目研究意义及国内外同类研究工作现状(附主要参考文献及出处):项目的研究意义城市运行和管理中累计的大规模数据,其样本内嵌于连续空间,在时间和空间上存在着很强的自相关性。项目以宁波出租车GPS数据为研究对象,结合交通地图,通过数据挖掘和可视化技术对交通小区划分、人们出行的OD时空分布显示,拥堵路段时段分析等研究内容进行了有效研究。力求揭示出租车时空数据中的内涵价值和演化规律,为城市交通管理决策提供重要的数据价值和参考意义。国内外同类研究工作现状近年来,国内外众多学者应用时空数据挖掘和可视化的方法,对出租车数据的使用进行了深入的研究。NivanFerreira(2013)教授带领他的研究组,开发了一个出租车OD数据分析系统TaxiVis,系统,能够对纽约地区的三年的出租车数据进行流畅的探索式分析,并且查询操作完全图形化,简单直接。①N.Andrienko等人对可移动数据的挖掘和可视化方法、工具和实验进行了全面梳理,指出了对于大规模时空数据利用的分析流程和发展趋势。②C.Peng等人从人类集体流动模式的角度出发,结合所在城市地区出租车行驶数据,对面向人群进行了时空显示和分析。③郭雪婷等(2013)以深圳市某一地区的出租车GPS实测数据为例,运用边界矩形法识别道路,划分拥堵标准,并根据各道路的拥堵隶属度确定其拥堵级别以及拥堵的时间段,建立了道路拥堵判别模型。④蔡毅(2013)从南京市出租车GPS海量数据中,提取部分数据对南京市市域进行交通小区的划分,利用相应的数据挖掘软件结合聚类分析方式对其进行分析,最终将分类数据进行了可视化。⑤程志华(2013)就乌鲁木齐市出租车GPS数据进行研究,调查分析乌鲁木齐市道路交通运行基本状况,探讨出租车GPS数据挖挖掘应用方法的同时,为乌鲁木齐市交通规划、建设和管理提供参考。⑥以上学者主要针对出租车时空数据的使用领域和分析方法进行了较全面的研究,除此之外,还有不少学者专门针对城市出租车移动数据应用的理论框架、预测管理、高性能时空挖掘算法等方面的进行了研究分,也有学者以符号学,图形学为基础来研究出租车时空数据的表示和聚集,研究层面相对较为广泛。[1]NivanFerreira,JorgePoco,HuyT.Vo,JulianaFreire,andClaudioT.Silva,VisualExplorationofBigSpatio-TemporalUrbanData:AStudyofNewYorkCityTaxiTrips[J],IEEETrans.VisualComputingGraph,2013,19(12):2149-2158[2]M.Veloso,S.Phithakkitnukoon,C.Bento,P.Olivier,andN.Fonseca.Exploratorystudyofurbanflowusingtaxitraces.InFirstWorkshoponPervasiveUrbanApplications(PURBA),2011.[3]C.Peng,X.Jin,K.-C.Wong,M.Shi,andP.Li`o.Collectivehumanmobilitypatternfromtaxitripsinurbanarea[J].PloSone,2012,7(4):481-487[4]郭雪婷,秦艳丽,雷震.基于出租车GPS数据的城市道路拥堵判别[J].交通信息与安全,2013,31(5):140-143[5]蔡毅.基于出租车GPS数据的南京市交通小区的划分[J].科技创新导报,2013,(23):218[6]程志华.基于出租车GPS数据的道路交通运行分析———以乌鲁木齐市为例[J].科技论坛,2013,(35):53-54[7]N.AndrienkoandG.Andrienko.Visualanalyticsofmovement:Anoverviewofmethods,toolsandprocedures[J].InformationVisualization,2013,12(1):3–24[8]I.Boyandin,E.Bertini,P.Bak,andD.Lalanne.Flowstrates:Anapproachforvisualexplorationoftemporalorigin-destinationdata[J].ComputerGraphicsForum,2011,30(3):971–980,[9]W.Zhang,S.Li,andG.Pan.Miningthesemanticsoforigin-destinationflowsusingtaxitraces[J].InProceedingsofUbiComp,ACM,2012.943–949.[10]RosswogJ,GhoseK.Efficientlydetectingclustersofmobileobjectsinthepresenceofdensenoise[C].Procofthe2010ACMSymponAppliedComputing,NewYork:ACM,2010:1095-11022.主要研究内容、目标、方案和进度及拟解决的关键问题:主要研究内容第一部分:数据采集(1)原始数据主要保存出租车上装配的GPS终端所采集的数据,这些数据包括序号,车牌号码,GPS时间,经度,纬度,车辆状态(空车、重车),车辆速度,车辆方向(8个方向),车费,距离信息。(2)对采集的原始数据过滤、抽样,入库。第二部分:出租车OD数据分析(1)根据PGS数据结合宁波市交通地图,计算分析不同区域上下客流量随时间的变化情况和发展趋势。(2)研究交通枢纽地区的交通流。选取特定区域出发和到达的客流量以形成对比分析。(3)根据小区划分和出租车GPS数据,给出载客出租车的OD时空分布,以计算某一时段地段出租车节点分布情况。(4)在基本载座人员数量确定的假设条件下,对人们出行的OD时空分布进行数据推断和有效预测。第三部分:交通小区划分和道路拥堵分析(1)根据车载数量和人们出行分布显示,应用特定k-means等聚类算法划分交通小区,匹配分析现有出租车投放机制。(2)根据出租车载客后的行驶数据,设定拥堵的标准情况,筛选出拥堵的路段时段以及拥堵的路口时段。第四部分:OD系统可视化开发(1)设计实现支持查询分析的出租车OD系统,以时间、地点和对象属性为查询条件,突出系统的数据渲染和筛选分布图。(2)针对大数据容量的快速查询,计划采用基于一个轻量级数据库的实时交互访问可视化界面。目标项目计划建立一个基于出租车时空数据挖掘下的可视化分析系统模型。结合宁波交通地图,能够有效实现出租车OD数据分析,交通小区划分和道路拥堵分析,为城市交通规划和决策提供数据支持和参考分析。方案(1)数据采集:由项目合作企业成员获得出租车PGS数据,依据数据抽样,设定数据区间,本项目计划使用2013年宁波7-11月之间的有效数据。(2)OD数据分析:设定交通枢纽要点为火车站和机场两个实例,对比分析交通流,按时段统计不同区域上下客流量随时间的变化;运用SPSS中的聚类方法对交通小区时空分布情况进行有效划分;运用拥堵指标法、矩阵边界法等方式对拥堵情况进行有效识别和统计。(3)OD信息系统开发:基于C/S模式,采用轻量级数据库为后台,开发支持大数据交互式访问的系统访问。采用支持时间、地点和对象属性为筛选条件下完全图形化可视化呈现。进度(1)2014年4月课题资料收集、数据采集、前期准备工作;(2)2014年5月——2014年7月出租车OD数据分析、交通流量、枢纽数据分析;(3)2014年8月——2014年12月出租车OD数据分析、车辆时空分布、人们出行时空预测分析;(4)2015年1月——2015年9月交通小区划分,道路拥堵分析;(5)2015年10月——2015年12月OD系统开发,完成数据有效集成分析(6)2016年1月——2016年5月课题研究总结、研究报告、论文撰写;拟解决的关键问题项目拟解决的关键问题主要表现为以出租车PGS数据为依据,应用可视化的方式来呈现数据内在的关联、分析、趋势和规律。其目的是使用户能够交互地浏览数据和挖掘过程,还可以对训练后得到的结果模型进行直观的呈现。项目计划基于一个轻量级的数据库之上,实现一个高效的显示策略。能够有效开展车租车行驶轨迹下的时空数据分析和区域时空分布展示,以达到为地区交通规划和决策作为有效数据支持。3.与本项目有关的工作条件(包括研究工作基础、实验条件等)研究工作基础一是出租车PGS数据,课题使用与相关企业合作研究的方式获取数据资料,目前共计有获取1000个出租车用户,30万条PGS信息。考虑到相关数据样本的连续性问题,获取的数据不能覆盖完整的用户社会网络。因此课题计划从中选取了600个车租车的轨迹数据进行实验。二是数据挖掘和课时化工具。主要使用的工具包括Gephi,netlogo,SPSS,java,sqlite等。所有软件均已经到位。相关科研条件(1)我校是一所普通