轨迹数据分类轨迹数据是对移动对象的运动过程采样得到的数据,通常包含采样位置、时间、运动速度等属性信息。将采样点按照一定时间尺度排序便形成了移动对象的轨迹[1]。根据采样方式和驱动因素的不同,将轨迹数据分为以下3类:①基于时间采样的轨迹数据,即按等时间间隔对移动对象进行采样形成的轨迹;②基于位置采样的轨迹数据,即移动对象位置发生变化即被记录而形成的轨迹;③基于事件触发的轨迹数据,即移动对象触发传感器事件后而被记录下来形成的轨迹[2]。基于时间采样的轨迹数据基于时间采样的轨迹数据基于时间采样的轨迹是等时间间隔记录移动对象的信息,或扫描全局通过反演移动对象位置而获得的数据,前者如车载GPS数据、动物迁徙数据,后者如飓风数据、涡旋数据等。基于时间采样的轨迹可用以下模型表达,即以等长的时间间隔记录移动个体的位置[3]。Tr代表一条时空轨迹,St代表起始时间,T代表时间记录间隔,序列中(nX,nY,St+(n-1)*T)代表在St+(n-1)*T时刻,轨迹对象在二维时空的位置为(nX,nY)。基于时间采样的轨迹数据具有数据量大、覆盖范围广的特点。但未考虑数据的代表性,会造成数据冗余、数据遗漏,如车载GPS在车辆状态没有发生变化时仍然收集数据,传输过程中往往出现传感器信号丢失以致数据遗漏,且轨迹数据依赖局限于交通路网[2]。绝大多数的轨迹研究都立足于此,他们从大量轨迹数据中提取出行模式和交通状况。他们或将访问地点按频率排序可以用来提取个体用户的出行模式[4],或从集体轨迹信息入手,推测城市活动的热点规律模式。Wu(2013)等认为在轨迹数据中寻找的热点的动态模式可以用来揭示历史事件和预测未来活动热点,这也许对交通和公共安全很有价值。将活动热点按时序排列,整理成库。可以显示了城市热点在时空上是如何形成,消失等过程。还探索了地区工作日与休息日的模式区别,并建立数据库用来预测将来地区模式[5]。基于位置采样的轨迹数据。基于位置采样的轨迹是当采样对象位置发生变化时记录其位置、时间、属性信息而获得的数据,如居民出行调查、人口迁徙统计数据等。基于位置变化采样的轨迹可由移动对象位置变化的节点序列表示[3],模型表达如式(2),即以离散位置变化节点记录移动个体的轨迹信息。其中nX≠1nX,nY≠1nY,且1T≠nT;Tr代表时空轨迹,该序列中的(nX,nY,nT)代表在时刻nT,轨迹对象在二维空间的位置为(nX,nY)。基于位置采样的轨迹数据以移动对象的位置变化为关注重点,具有属性信息丰富、轨迹位置变化详细等特点。但这类数据收集主要依靠人工操作,缺乏自动采集装置,导致数据整理过程耗时耗力、调查范围有限、更新周期长、空间位置需要二次匹配等一系列问题[2]。这类轨迹数据最为典型的就是OD流。OD(Origin—Destination)流指轨迹中起点到终点的流动性特征,其中0表示出行起点,D表示出行终点。OD流从统计的角度反映移动对象的活动和群体轨迹的动态特征。利用OD流可以发现上车点和下车点密度的空间分布,从而可以识别出城市某些特定位置(如火车站、飞机场等)[6]。当然也可以对人口迁移进行分析,对他们的主要来源地与主要迁移地进行统计分析与可视化显示,可以得到人口迁移的规律,发现暗含其中的社区结构[7]。Zhang等(2012)对出租车数据进行OD流聚类分析,找出聚类中心,添加起始点语义信息,发现OD流的语义,如车站一车站、商场一车站等[8]。基于事件触发采样的轨迹数据基于事件触发采样的轨迹是移动对象触发传感器事件后,移动对象的位置、时间及其他属性信息被记录下来的数据,如手机通话,手机连接wifi热点,公交卡、银行卡等智能卡刷卡,用户签到等事件。若移动对象未触发传感器事件,其移动轨迹则不能被记录。虽然移动对象的时空轨迹是连续的,但只有移动对象触发传感器事件发生时,位置、时间信息才有记录,因此此类时空轨迹可以由一组离散的时空记录点序列表示,如式(3)所示:其中1T≠nT,(nX,nY)与(1nX,1nY)有可能相等,Tr代表时空轨迹,该序列中的(nX,nY,nT)代表在时刻nT,轨迹对象在二维空间的位置为(nX,nY)。基于事件触发采样的轨迹数据具有数据量大、覆盖范围广、更新周期短、采样对象具有代表性等特点。但此类轨迹数据记录的位置不一定是移动对象的真实位置,导致轨迹数据的空间分辨率不高。如手机通话事件的位置是用基站服务范围(以基站为标识点的Voronoi多边形)近似表示,位置精度取决于基站的密集程度,且只有传感器事件被触发时才记录移动对象的相关信息,无法勾勒移动对象详尽的轨迹信息,只是人类行为活动中的快照[2]。位置签到数据是利用待遇GPS的智能终端记录某一时刻所处位置而产生的具有空间性,实践性和社会化的属性信息的数据,他记录生活轨迹,反映人的日常生活行为,是一种重要的众源地理数据。[9]Hu等(2014)在文章中提出了利用位置签到数据探索城市热点与商圈研究。为及时、准确探测城市热点和客观高效分析商圈,提出一种基于社交网络众源位置签到数据的城市热点探测与商圈挖掘方法。位置签到数据是具有空间坐标和用户属性的离散GIS点对象,首先对离散签到数据进行格网化处理,将大数据量、离散签到位置点转化成具有空间连续性与邻接性并能够更好地反映签到事件集聚密度的格网数据。其次,运用探索性空间数据分析(exploratoryspatialdataanalysis,ESDA)度量签到数据的空间相关性,量算其空间结构和全局分布模式,以确定热点探测和商圈聚类的最佳模式。再次,采用聚类分析识别出具有统计显著性的热点、冷点和空间异常值位置。最后,通过度量聚类分析结果的地理空间分布,得到具有统计显著性的聚类地理要素的空间特征::包括商圈范围、中心变化趋势和方向发展趋势。[1]Li,X.,Han,J.,Kim,S.,&Gonzalez,H.(2007).Roam:rule-andmotif-basedanomalydetectioninmassivemovingobjectdatasets..ProceedingsofSiamInternationalConferenceonDataMining.[2]李婷,裴韬,袁烨城,宋辞,王维一,&杨格格.(2014).人类活动轨迹的分类、模式和应用研究综述.地理科学进展,33,7.[3]NanniM.2002.Clusteringmethodsforspatio—temporaldata.Pisa,Italy:UniversityofPisa.[4]Alvares,L.O.,Fernandes,J.A.,Macedo,D.,Bogorny,V.,Moelans,B.,&Kuijpers,B.,etal.(2007).Amodelforenrichingtrajectorieswithsemanticgeographicalinformation.in‘ACM-GIS’,ACM.[5]Lu,R.W.S.Y.(2014).Detectionofdynamicactivitypatternsatacollectivelevelfromlarge-volumetrajectorydata.InternationalJournalofGeographicalInformationScience,volume28,5,946-963.[6]VelosoM,PhiyhakkitinukoonS,BentoC.(2011).Urbanmobilitystudyusingtaxitraces.2011.Intemationalworkshopontrajectorydataminingandanalysis.Beijing,China:September18,2011.[7]Guo,D.(2009).Flowmappingandmultivariatevisualizationoflargespatialinteractiondata.Visualization&ComputerGraphicsIEEETransactionson,15,6,1041-1048.[8Zhang,W,Li,S,Pan,G(2012)MiningtheSemanticsofOrigin-DestinationFlowsUsingTaxiTraces.InProceedingsofthe2012ACMConferenceonUbiquitousComputingPp.943–949.[9]胡庆武,王明,&李清泉.(2014).利用位置签到数据探索城市热点与商圈.测绘学报,3.