1/15世界铁路大数据研究与应用现状0引言随着信息采集、存储、分析技术的日益成熟,大数据已逐渐成为推动行业进步与社会发展的源动力,成为国家基础性战略资源。计算社区联盟曾发表白皮书《大数据计算:在商务、科学和社会领域创建革命性突破》,并提出“大数据真正重要的是新用途和新见解,而非数据本身”。我国铁路转企改革加速稳步推进,铁路正处于关键的转型期。盘活数据资产、深挖数据价值、发现新知识、提升新能力,有助于推进铁路转型升级、创造新的利润增长点。中国铁路总公司高度重视数据资源的开发利用,强调铁路应依托既有数据资源优势,统筹开展大数据专项应用,加强数据分析,提高铁路信息化应用水平。大数据的概念是铁路行业多年来一直关注的问题,过去10年间,自动化检测技术的普及使这一概念进一步成为主流,大数据技术在铁路运输领域得到了越来越普遍的应用。国外大数据在铁路行业的应用实践为我国铁路大数据的发展提供参考,围绕铁路资产管理、检修管理、运营管理等方面,对欧洲、美国和日本的铁路大数据研究与应用现状进行研究。1欧洲数据的收集和分析方式在过去10年发生了较大改变,大数据技术提供了更加复杂的数据收集、分析和可视化工具,并减少了报告系统中的人工干预。欧洲铁路公司对大数据在铁路行业的应用潜力做了详细调查研究,调查结论为大数据技术在铁路安全管理中的应用潜力是值得研究的,但同时指出,影响大数据发挥作用的最大制约因素是数据的缺乏和可用性[1-2]。1.1德国在大数据迅速发展的背景下,大数据技术已经在德国铁路股份公司(DB)的分析与预测、决策支撑及自动化应用方面取得了一定进展。DB通过规划建设统一的数据中心平台,实现了对经营状况、设备故障分析等精确分析功能在内的数据综合应用平台,并开展了4个方面的数据分析工作:设备故障对运输效率影2/15响情况分析、关键设备故障分析及优先级识别、设备状态可视化展示、检修成本优化分析。DB统一数据平台主要功能见图1。根据DB统计,开展以上4方面的数据分析工作后,在经营管理方面的提升有:(1)对机车故障的预测时间提前6h;(2)机车核心部件故障率预测的精准度由之前的15%提升到86%;(3)通过燃油使用量的数据分析,优化个别司机开车习惯。在节约成本方面的提升有:(1)优化燃油使用,将燃油使用效率提升1.5%;(2)通过设备故障预测,将机车维修走向状态修,节约检修人工成本。德国VTGAG公司与瑞士Nexiot公司共同研发了基于远程信息处理技术的车辆智能定位装置VTGConnector[3]。该装置不仅能精确定位货车,还能为货主提供基于大数据的一系列增值服务,比其他国家的货车追踪技术又有了新进步。数字化货车的基础性功能包括:追踪货车当前位置;了解来自货车的各种实时信息;精确监视货车状态并预测到达时间和可能的延误;收到多种类型的即时信息提醒;获得根据货车运用数据自动归集绘制的若干分析图表。VTGAG公司的这些服务功能是模块化的,在基础功能之外,还可通过另外收费的形式,为用户添加所需的其他个性化功能,包括使用传感器确定货车装填量、精确测量货车质量等。1.2瑞士2010年,瑞士联邦铁路(SBB)曾推出“SwissTAMP”项目,其目标是创建一个主动维护的中心工具。SwissTAMP集成了SBBIT网络中的20多个子系统,收集并存储所有轨道分析所需要的数据。SwissTAMP的轨迹分析功能可汇集一系列测量和诊断数据,产生综合的状态属性并计算距离下次维护的剩余时间,维修计划功能可将轨道分析的输出结果与生命周期成本因素关联起来,并制定最佳的建议措施、财务估算和可行的替代方案。瑞士国家重点科研计划(NFP)大数据专项于2017年正式启动,该专项内容包括大数据信息技术板块(大数据分析基础性研究、大数据基础设施构架、数据库和计算中心)和大数据应用板块(对大数据在交通、灾害等领域的应用展开基础性研究)。1.3瑞典3/15瑞典铁路运用大量数据进行基础设施管理,这些数据来源于数百个不同的数据源。对于铁路资产管理,大量的信息需要获取和分析以评估整体状况、维护、资金支出和铁路轨道检测。需搜集的信息包括轨道可用性、轨道使用时间、轨道状态、历史工作记录、工作详细记录等。轨道状态检测主要包括连续的和断点式的自动检测车的检测、日常巡查的人工检测和服务故障记录[4-5]。瑞典铁路大数据管理系统主要模块见图2。图1DB统一数据平台主要功能4/15图2瑞典铁路大数据管理系统主要模块1.4英国英国铁路安全和标准化委员会(RailSafetyandStandardsBoard,RSSB)在2012年提出的《铁路技术战略2012》(TheRailTechnicalStrategy,RTS)指导下,提出铁路大数据整体框架。通过采集基础设施、车辆、现场工作人员、乘客、环境等数据,汇集于数据中心搭建铁路大数据平台,形成铁路数据分析和信息增值服务,达到支持预测、决策支持、控制、规划和实时信息服务等能力,实现自动列车、实时乘客信息服务、智能资产维护,提高铁路安全性、改善人力管理的效率。为提高运输安全性,哈德斯菲尔德大学铁路系统的大数据风险分析(BDRA)项目正在研究如何有效组合并利用铁路的多源大数据,以便更好地了解英国铁路系统和所处环境[6]。BDRA在风险评估的精确性上有较大提升,因为它是对所有风险相关数据进行统计分析,而不是从有限的抽样数据中评估风险概率,因此减少了对依赖于假设和简化的风险评估模型的使用。迄今为止,BDRA已经对信号数据和事故报告进行了分析,分析结果用于评估存在风险的列车数量。初步的研究结果表明,BDRA可服务于英国铁路安全和风险管理,但在下一步研究中,5/15需要采用新的风险分析技术、语义技术、交互式可视化技术来执行数据分析和专用的计算机系统[7]。1.5意大利意大利铁路公司Trenitalia近年来利用大数据开展机车车辆数字化的预测性维护,利用动态检修管理系统(DynamicManagementMaintenanceSystem,DMMS)把物联网、分析技术和内存计算技术结合起来。DMMS的主要功能包括列车设备状况实施监控、故障发生短期诊断、维护工作动态规划、部件剩余使用寿命预测等。DMMS使得整个检修工作全面数字化,通过对列车上几百个传感器采集的大量数据进行分析、计算,预测出即将发生故障的部件,从而采取相应措施。这种检修方法能够把机车车辆检修成本降低达8%[8-9]。1.6法国2011年以来,法国公共数据开放得到了稳步发展,无论从参与公共数据开放的机构数目、已开放的数据集总量,还是从根据开放数据开发的应用项目来看,法国已成为全球公共数据开放领域领先的国家之一。法国国家铁路公司(SNCF)以创新的合作伙伴网络为旅客日常生活提供新服务为宗旨,面向开发者推出了数据开放。在检修管理应用方面,SNCF最近与美国IBM公司签订协议,利用该公司的IBMWatson物联网平台、大数据云计算技术以及自主开发的专用工业传感器,对列车以及铁路基础设施进行远程监控并为预测性维护创造条件。当前,巴黎通勤列车装备2000个传感器,每月可传输70000个数据点的信息,使得法国铁路公司的技术人员可在同一时间对200列列车的状态进行远程监测,以便及时发现潜在问题,包括诸如空调设备和车门等故障问题,省去了列车段的人工检查,也能防止服务中断以及更昂贵的维修工作[10-11]。2美国铁路大数据的应用包括采集数据、分析数据、智慧决策等过程,其热点问题皆有美国铁路行业的应用案例[12]。美国联邦铁路管理局(FRA)很重视铁路大数据的应用,2002年以来启动了涉及大型数据库、图像处理、神经网络、机器学习等多个项目[13](见表1)。表1FRA开展的大数据相关项目6/15序号项目名称项目年份1基于轨道几何数据的作用力估算20022动态模拟的神经网络20073接头夹板检测系统20094虚拟车辆20105轨道几何异常自动校订20106机器视觉学习20137混凝土轨枕的机器视觉20148基于风险的调度优先20149基于天气建模的轨道温度预测201610被动非接触高速轨道检测201611基于仿真的断轨脱轨风险分析201712由数据驱动和缺陷退化建模的轨道养护维修方案优化201713现有变化检测软件在铁路环境的应用2017从混搭型智能数据平台、基础设施运维管理、客户服务、风险分析等方面,介绍美国铁路大数据的研究与应用成果。2.1混搭型智能数据平台虽然在大数据的背景下可以获取大量行业相关数据,然而支离破碎、未受保护、无法访问、质量低下的不良数据只会带来糟糕的业务结果。出于这方面考虑,7/15互联网和数据服务公司提出了智能数据平台的概念,旨在让数据实现自我组织,保证数据安全可靠,Informatica在2014年发布了新型的智能数据平台。在通用智能数据平台基础上,一些公司针对铁路行业特点开发了定制化的数据平台,Railinc公司自2015年开始从传统的数据仓库向大数据方向转变。近年来针对于铁路行业开发的混搭型智能数据平台(见图3)包括元数据自助管理、ELT抽象层、Wandisco支持的数据存储和备份等层面。该混搭型智能数据平台在机器学习和数据分析部分,运用Spark进行流数据分析,利用SAS进行历史数据分析。利用智能数据平台,一方面可以提高铁路行业产值,如进行预测性维护、ETA预测、设备故障分析的模型优化等;另一方面可以优化铁路运营管理,如车队管理模拟、系统异常探测、商业决策制定等[14]。图3Railinc混搭型智能数据平台2.2基础设施运维管理美国铁路比较关注运用大数据技术优化基础设施状态管理和养护维修计划,通过对桥梁、道岔、钢轨磨损、轨道几何等数据的分析和状态预测,有效防范事故发生,从而保障铁路行车安全。2.2.1铁路资产管理8/152011年美国货运铁路启动了“资产健康战略计划”(AssetHealthStrategicInitiative,AHSI),AHSI对各铁路公司分别收集和存储的大量数据进行分析,并由此解决行业内最关键的铁路设备管理与维护问题。AHSI建立在以往关于监控铁路车辆健康情况的EHMS计划之上,组件跟踪程序可在全国225308km铁路网范围内轻松地跟踪并监测6种类型的车辆组件。在AHSI开发前,铁路公司主要依靠轨旁设备监测组件的磨损迹象,然而列车往往在多铁路公司的范围内运行,而监测数据却不共享,铁路公司仅能够掌握车辆在自己轨道上运行的状况,由此会延误对潜在问题的诊断和维护。AHSI正在汇集这些铁路数据库,允许全国范围内的铁路公司和车辆拥有企业共享信息并制定更好的车辆维修、保养和运行决策,以提高铁路安全性。尽管AHSI仍在运用初期,但在2015年使用大数据识别运行状况不佳的车辆,已经避免了1000多次服务中断[15]。Ensco公司开发了基于GIS的铁路钢轨状态监测系统,用于进行资产管理、判断钢轨状态、智能制定维修决策等。该系统输入的数据来源多样,包括轨道检测车(TMV)、轮轨间监测器(V/TIMonitors)、移动定称(IMWS)、相关文件等。其中,轨道检测车获取的数据输入虚拟轨道行走器软件(VTW),该软件通过对检测数据的分析,允许使用者标记钢轨缺陷,并可自动给出缺陷部位的里程和坐标,减轻工务人员定位钢轨缺陷的工作量。钢轨状态监测系统(RTCM,见图4)有3个主要模块:第1个是数字化钢轨记录(DTN),主要用于生成管理报告;第2个是钢轨检查工具(TrackIT),帮助使用者准确地了解钢轨资产的位置和状况;第3个是维修自动推荐,可使管理人员在办公室内对应该养护维修的区域一目了然,方便人力物力的调度管理。钢轨状态监测系统同时接入GIS和SAP系统,可共享地理位置信息和派遣工单[16]。2.2.2预测性维护美国Strukton公司开发了预测性维护和故障诊断系统POSS,其目标是在早期阶段识别资产的衰退,帮助分析师将注意力集中在衰退资产上,优化维修间隔,以减少维修成本和故障,其基于数据的维修管理流程见图5。9/15图4钢轨状态监测系统(RTCM)图5Strukton基于数据的维修管理流程(POSS)1