TRANSPORTRESEARCHVol.2No.1收稿日期:2015-12-02基金项目:北京市科技计划项目(Z141100004014021)作者简介:李祖芬(1994—),女,江西宜春人,硕士研究生,研究方向为交通运输规划与管理。E-mail:11271003@bjtu.edu.cn。基于手机信令定位数据的居民出行时空分布特征提取方法李祖芬1,于雷1,2,高永3,吴亦政4,龚大鹏1,宋国华1(1.北京交通大学城市交通复杂系统理论与技术教育部重点实验室,北京100044;2.德克萨斯南方大学理工技术学院,美国休斯顿77004;3.北京交通发展研究中心,北京100161;4.加利福尼亚大学戴维斯分校土木与环境工程系,美国戴维斯95618)摘要:为了得到可靠的居民出行时空分布特征,并为城市交通规划提供准确的出行现状数据,基于手机信令定位数据设计了提取居民出行时空分布特征的方法。通过对重复冗余的手机数据进行处理、运用地理信息系统将手机数据映射至所研究的交通区域、划分交通小区、定义出行识别、建立OD矩阵及绘制出行期望线等出行数据挖掘,得到了居民的出行时空分布特征。为了验证设计方法的可行性,以北京市的手机信令定位数据为例,提取出北京市居民的出行时空分布特征,并将所得的结果与北京市第4次综合交通调查的数据进行对比得出:两者的出行时间分布特征平均偏差为0.78%,早晚高峰进出城方向比例的偏差为0.1,全市的出行发生量与吸引量的平均偏差均小于3%。关键词:手机信令定位数据;时空分布;居民出行;OD矩阵;期望线中图分类号:U491.1文献标识码:A文章编号:2095-9931(2016)01-0051-07ExtractionMethodofTemporalandSpatialCharacteristicsofResidents′TripsBasedonCellularSignalingDataLIZu-fen1,YULei1,2,GAOYong3,WUYi-zheng4,GONGDa-peng1,SONGGuo-hua1(1.MOEKeyLaboratoryforUrbanTransportationComplexSystemsTheoryandTechnology,BeijingJiaotongUniversity,Beijing100044,China;2.SchoolofScienceandTechnology,TexasSouthernUniversity,Houston77004,USA;3.BeijingTransportationResearchCenter,Beijing100161,China;4.DepartmentofCivilandEnvironmentalEngineering,UniversityofCalifornia,Davis,Davis95618,USA)Abstract:Inordertoextractvalidtemporalandspatialcharacteristicsofresidents′tripsandprovidedataforurbantrafficplanning,amethodbasedoncellularsignalingdatawasproposed.Byprocessingre⁃dundantdata,mappingcellularsignalingdataontrafficanalysiszonesthroughusingGeographyInforma⁃tionSystem,definingthetrafficanalysiszones,definingtripidentification,establishingODmatrixandexpectedlines,thetemporalandspatialcharacteristicsofresidents′tripswereextracted.Inordertoveri⁃fythefeasibilityoftheproposedmethod,thecellularsignalingdataofBeijingwasusedasacasestudytoextractthetemporalandspatialcharacteristicsofresidents′trips.Theextractedresultswerecom⁃交通运输研究TRANSPORTRESEARCH第2卷第1期|2016年2月DOI::10.16503/j.cnki.2095-9931.2016.01.00851交通运输研究第2卷第1期|Feb.2016paredwiththoseofthe4thComprehensiveTransportationSurveyinBeijing.Theconclusionisdrawnthattheaveragedeviationofthetemporalcharacteristicsofresidents′tripswas0.78%,thedeviationoftheratesoftripsforenteringintotheurbanandleavingoutoftheurbanduringmorningpeakandeve⁃ningpeakis0.1,theaveragedeviationoftripgenerationandattractionislessthan3%.Keywords:cellularsignalingdata;temporalandspatialdistribution;resident′strip;ODmatrix;ex⁃pectedline0引言居民的出行时空分布特征主要包括居民的出行时间分布、出行流量及方向,其能够反映居民的交通需求在时间、空间上的分布,不仅能为城市的交通规划提供出行现状数据信息,也能为解决交通拥堵、提高道路通行效率等提供数据支持。其中,有效、实时的交通信息的获取是交通规划及决策的基础。而传统的交通信息采集方法(人工调查法和固定式交通信息采集技术)具有调查及维护成本高、传感器损坏率高、实时性较差及采集的交通数据精度较低等缺点[1]。随着手机终端的普及,采用手机定位等新技术采集交通信息逐渐受到重视。2015年中国手机用户已达到13.06亿,庞大的手机用户群为交通数据的采集提供了大量的数据源。另外,手机定位的交通信息采集技术还具有成本低、覆盖范围广等优点[2]。因此,手机数据可作为现有的交通数据采集技术的重要补充,其为居民出行时空分布特征的提取提供了很好的技术支持。目前国内外已有一些针对手机定位数据的相关研究。SchlaichJ.等[2]提出了利用手机定位数据获取出行轨迹。张健钦等[3]、赖见辉等[4]等提出了利用手机定位数据的出行路径识别方法。毛晓汶[5]对手机信令数据特征进行了分析,并以重庆为例得到出行OD分布、出行目的地分布和出行时间分布等出行特征,不过其研究虽然定义了手机信令定位数据中的重复冗余数据,却未详细阐述处理的方法。冉斌[6]根据手机信令定位数据和手机话单定位数据获取了出行时耗、出行距离等出行特征,但未详细阐述提取的方法。CaceresN.等[7]利用仿真系统模拟现实环境的手机网络,并采用单一路段利用位置区更新的数据来仿真获取交通出行OD和相应道路的流量数据。GurY.J.等[8]根据手机定位数据获取个人出行信息,并基于这些信息进行交通规划。TettamantiT.等[9]运用手机定位数据预测居民的出行路径选择。从上述研究现状可以看出,国内外根据手机定位数据获取交通出行特征的研究还较少,并且在已有的研究中缺乏对获取交通出行特征方法的描述。因此,本文提出基于手机信令定位数据的出行时空分布特征提取方法,并运用所提出的方法对手机信令定位数据进行挖掘,以得到可靠的居民出行时空分布特征,可为城市的交通规划提供准确的出行现状数据。1手机信令定位数据的应用原理1.1手机信令定位数据获取的原理本文采用的手机定位法是基于小区的定位方法。基于小区的定位方法是一种起源于蜂窝小区定位技术的简单手机定位方法,基于手机用户所在的基站小区ID来确定位置信息。实现的原理是:GSM具有“蜂窝”的网络结构[10],手机用户如果进行通信业务就需要在所处的基站小区进行位置注册,通过提取注册的基站小区的ID号[11]就可以将用户定位到该基站小区信号覆盖的区域。相对其他的精确定位技术(如GPS),该定位方法在样本量、覆盖范围以及实施成本和周期上更具有优势。基站小区覆盖范围半径在市区大约为100~500m,郊区大约为400~1000m。该范围一般小于交通小区的覆盖范围,因此满足交通规划的应用要求。当正在通话的手机用户从基站小区移动到另一个基站小区时,将发生位置区切换。为了保证用户通信的质量和连续性,基站平台将移动台从某一通话信道切换到另一通话信道的过程,即为基站小区切换[12]。1.2手机信令定位数据库设计手机信令定位数据主要包括IMSI,TimeStamp,Longitude,Latitude和EventID等字段。其中,IMSI52TRANSPORTRESEARCHVol.2No.1为手机用户的唯一标识码,能唯一地标识用户;TimeStamp表示手机信令的发生时间;Longitude和Latitude共同描述手机用户的位置,分别为用户的经度和纬度;EventID表示事件类型,其字段含义如表1所示。表1EventID字段及触发方式类型触发方式类型主动方式被动方式EventID02457事件类型主叫被叫短信位置区切换定时扫描按照触发手机定位信息的方式对定位数据进行如下区分:主动方式(主叫、被叫,短信、位置区切换)和被动方式(定时扫描)。其划分依据为该信令产生过程是否受到手机用户主观行为的影响[13]。由于主叫、被叫、短信和位置区切换属于手机用户的主观行为,而定时扫描与手机用户本身的行为无关,是GSM通信系统定时更新手机用户的位置信息。因此,定时扫描属于被动方式触发的定位信息。2提取出行时空分布特征数据的方法为了提取居民的出行时空分布特征,本文首先对手机信令定位数据进行预处理,然后对所研究的交通区域进行小区划分,在此基础上提取居民的出行时空分布特征,并将所得的结果进行扩样,得到北京市总体人群的出行时空分布特征。2.1数据的预处理2.1.1重复冗余数据的处理本文中的重复冗余数据是指由主动方式触发所产生的冗余数据。主动方式触发所产生的冗余数据指的是手机用户在不进行位置切换的前提下,因频繁通话或短信向GSM通信网络发送的位置信息[5]。对于这些数据,本文的处理方法是将主动方式触发下的数据全部删除,只保留被动方式触发下的数据。由于被动方式触发的周期约为55min,因此相比主动方式触发机制,被动方式触发具有获取数据完整且稳定的优点,且触发的周期能够满足居民出行时空分布特征分析的精度要求。因此在后续的研究中,本文主要对被动方式触发的手机用户数据进行分析处理。2.1.2手机信令定位数据映射至交通区域手机信令定位数据虽然显示了数据点的位置信息,但无法直观地表示手机用户在交通区域的运动情况。因此本文运用地理信息系统将手机信令定位数据映射至所研究的交通区域,根据手机信令定位数据和区域空间位置的关系确定每个数据点在区域中的具体位置,便于计算和分析手机用户的交通出行。2.2交通小区的划分本文为了直观地反映出行时间和空间分布特征,综合考虑交通区域内每个子区域手机用户数和面积这两个因素对交通小区进行划分。本文没有严格按照交通规划中小区划分的规则进行小区划分,因为按照划分规则进行的小区划分所得到的交通小区范围较小[14]。当基站分布数量较多时,切换干扰多,将难以保证手机信令定位数据位置信息的准确性,导致获取的出行信息误差较大。当划分的交通小区范围较大时,由于基站识别范围远远小于交通小区的范围,切换干扰大大降低,获取的手机信令定位数据准确度较高,误差较小。2.3手机信令定位数据的出行时空分布特征提取2.3.1出行时间