智慧地铁:基于大数据与人工智能的新型地铁系统
2018-11-16陈德旺章明亮
陈德旺 章明亮 沈 镛
1.福州大学数学与计算机科学学院,福建福州 350116;2.智慧地铁福建省高校重点实验室,福建福州 350116;3.福州大学图书馆,福建福州 350116
2006~2015年的10年间,中国城镇化率由44.34%提升至56.10%,城镇人口达7.7亿人[1]。城镇人口的增加,随之而来的就是大城市的交通拥堵问题[2],原有的基础建设无法满足当前的交通需求。特别是在“北上广深”这样人口数量达千万级的特大城市,如何提高城市的通勤效率成为了摆在城市发展面前的一个重要议题。目前主要采用的方式就是修建地下铁路设施,解决传统公共交通运量不足的问题,同时缓解交通压力[3]。到2017年1月,北京地铁共开通19条线,全长574km,345个站点,日最大客流量1052万人;上海地铁共开通14条线,全长617km,366个站点,日最大客流量1186.7万人;广州地铁共开通10条线,全长308.7km,167个站点,日最大客流量908.3万人。面对如此大的客流量,地铁运行的安全性及效率值得我们去深入研究,尤其是系统联动和智能化水平还有很大的提升空间。因为小的故障导致地铁系统大范围暂停使用的案例时有发生。
现有地铁系统包括列车自动控制系统(ATC)、供电系统(SCADA)、自动售检票系统(AFC)、监控系统等多个子系统。在现有地铁系统中,数据分散于各个子系统,难以实现联动,系统整体运行效率有待提高[4]。现有地铁系统自动化程度还可以,比如,自动驾驶系统ATO、自动防护系统ATP等。但是,地铁系统的智能化程度不高,大量采集的数据利用效率不高。地铁系统还不够聪明,尚且做不到从数据中学习以不断提高运行安全性和效率,也难以做到各子系统实时高效智能联动。因此,引入大数据和人工智能技术将有利于解决地铁系统大量数据得不到有效利用和智能化程度不高的两大关键问题。
大数据的典型特征包括数据体量大、数据种类多、要求运算速度快以及价值密度低的特征[5-6]。地铁各子系统在运营中制造出大量的、种类繁多的数据,传统的数据存储和处理方式将无法应对如此数量和种类的数据[7],而这些数据对于地铁运营
安全及运行效率是极其有价值的,由此应用大数据技术就显得尤为重要。谷歌的Google文件系统GFS[8]、分布式数据存储系统BigTable[9]、MapReduce[10],以及开源项目Hadoop[11]、Spark[12]等,都为大数据的处理和分析提供了很好的技术支持。
基于大数据的支持,人工智能技术的应用将从中挖掘出更多有价值的信息,如传统的机器学习方法K-means[13]、SVM[14]、贝叶斯网络[15]等,以及深度学习算法受限波尔兹曼机(RBN)[16]、Deep Belief Networks(DBN)[17]、卷积神经网络(CNN)[18]等都可以从大量的数据中学习、总结规律,使得地铁系统更加智能化,能够从历史运行数据中进行自我学习,自我改进,变得越来越聪明,越来越安全,越来越高效。
综上所述,我们认为大数据与人工智能技术在地铁系统的深度应用,将导致现有的地铁系统向智慧地铁系统的方向发展。本文提出了智慧地铁的概念,指出了智慧系统的研究方向、关键技术及其应用。
1 智慧地铁的定义与主要研究方向
智慧地铁是地铁、大数据与人工智能技术的三元交叉领域,如图1所示。智慧地铁既是地铁的一个新的研究方向,也是人工智能和大数据技术的一个应用领域。
图1 智慧地铁
智慧地铁包括三个研究步骤:首先,对地铁运行过程中产生的客流数据、视频监控数据、列车运行关键部件的监测数据进行采集;其次,构建大数据平台,对各种类型的地铁数据进行清洗、合并、共享等,形成地铁大数据平台;最后,通过人工智能技术对地铁大数据进行智能分析、挖掘和学习等。
智慧地铁的可研究问题很多,但是主要来说,主要分为4个研究方向,如图2所示。这4个研究方向分别为:地铁大数据平台(方向1),地铁运行智能监测技术(方向2)、地铁运行智能调度技术(方向3)和智慧地铁软件开发(方向4)。其中,地铁大数据平台是基础,提供数据给方向2和方向3,采用的核心技术为大数据技术,包括数据的清洗、合并与共享等。方向2专注于地铁运行的安全,采用的核心技术为人工智能(AI)技术。根据地铁运行的大量监测数据,及时检测出异常并报警。方向3专注于地铁运行的效率,采用的核心技术也是AI技术。通过分析地铁客流和视频等数据,智能优化列车运行时刻表,使得地铁出行的需求得到满足。方向2和方向3研究成果,提供给方向4进行开发,形成智慧地铁软件,采用的核心技术是软件工程技术。总之,这4个研究方向相互支撑,形成了一个有机的整体,共同构成智慧地铁的核心技术。通过智慧地铁的研究能够服务于地铁的安全运行和高效运行,提高乘客的使用满意度,降低地铁系统的运营和维护成本,具有重要的意义。
图2 智慧地铁的四个研究方向
2 智慧地铁的基础:地铁大数据平台
地铁大数据平台是智慧地铁的基础,为其他研究提供数据支撑。搭建地铁大数据平台分为以下3个步骤, 首先,接入地铁运行运营中所产生的车载传感器数据、车站及列车内的视频监控数据、AFC刷卡数据等。然后,采用Hadoop、Spark等框架对原先分布在不同系统中的数据进行融合,使大数据能更好的发挥其价值。最后,平台能够通过服务接口的形式,为大数据的智能分析和应用等提供数据支持。地铁大数据平台结构如图3所示。
图3 地铁大数据平台
3 智慧地铁的关键技术
智慧地铁的核心技术为AI技术,研究的核心问题是如何利用AI技术提高地铁运行的安全性和效率,可以分为地铁运行智能监测技术和地铁运行智能调度技术。
3.1 地铁运行智能监测技术
地铁运行的数据有很多种,由于篇幅有限,不能一一详细讨论。本文以视频数据和关键部件传感器数据为例,来说明智能监测技术可研究的具体内容。
(1)研究基于计算机视觉的地铁视频数据的异常检测,对视频监控中出现的突发扰动、乘客大面积拥堵等容易发生事故(及事故)的情况通过机器学习算法进行自动检测,并及时反馈给地铁运营安保人员,使其能在事情初发阶段赶到现场,及时处理,避免事故带来更大的损害。
(2)研究基于多传感器融合的列车运行关键部件的故障检测算法,依托于大数据平台所收集的列车运行数据,通过故障检测算法对列车故障类型、故障位置等进行判断,能在一定程度上减少人工现场检测排查的工作量,降低地铁运行日常维护成本。
总之,随着数据量的增大、算法研究的推进,基于AI的故障检测算法的准确率也将得到进一步提升。
3.2 地铁运行智能调度技术
提高地铁系统的运行效率,使得地铁客流需求与列车运行时刻表最佳匹配,是地铁调度的核心问题之一。传统的运行时刻表主要根据客流数据制定,忽略了视频提供的客流拥挤数据。传统的时刻表主要依靠经验设定,没有利用AI提供的智能优化技术,难以做到需求与供给的最佳匹配。本文认为实现地铁运行智能调度,关键在于以下2个算法的研究。
(1)研究地铁客流时空模式挖掘算法。通过大数据平台的数据接口,对乘客的日常出行刷卡数据进行分析,挖掘客流分布在时间和空间上的规律。通过时空模式的挖掘,可进一步对站点客流预测算法进行研究,预测不同时间各站点的客流量。
(2)研究列车运行时刻表优化算法。基于刷卡、视频等数据及时空模式挖掘的工作,对时刻表优化算法进行研究,力求在乘客满意度和地铁运营成本之间达到双赢。
地铁客流的变化有一定的规律,也存在一定的随机性和不确定性,尤其有时还有突发事件,真正做到实时最优匹配是非常困难的,还需要研究很长的时间。
3.3 智慧地铁软件开发
在方向2和方向3的理论研究的基础上,还要注意成果的开发、转化与应用。所以智慧地铁还需要一个应用研究方向,可以称之为智慧地铁系统开发。我们认为,智慧地铁的开发应该以软件开发为主,类似于软件定义的地铁,所以方向4为智慧地铁软件开发。该方向所使用的核心技术为软件工程。
有关智慧地铁的软件开发,包括很多种类型的软件。基于智慧地铁关键技术的研究成果,基于软件工程技术开发适用于智慧地铁的各类软件,以实现AI技术的研究成果。由于篇幅有限,本文认为首先应重点开发以下3个软件:(1)开发地铁视频智能监测软件,能对视频中异常情况进行报警,并输出视频监控区域的拥挤度。(2)开发地铁运行关键部件智能监测软件,对转向架和受电弓等列车运行关键部件的工作状态进行智能分析,实时输出异常报警信息,以避免安全事故的发生。(3)开发地铁运行智能调度软件,该软件能根据客流和视频数据,对列车运行时刻表进行智能优化,以提高地铁的运行效率和乘客满意度。
在地铁大数据平台上,应用AI核心技术,可以研究出很多算法,以提高地铁运行的效率和安全性。通过软件工程等软件开发技术,可以分阶段分布实施,开发出很多具有自学习功能的软件,为智慧地铁的产业化打下基础。
4 结语
针对现有地铁系统的运行的大量数据利用率不高、各子系统之间联动水平较低、系统智能化水平不高等问题,本文提出了智慧地铁的概念,指出智慧地铁是大数据、人工智能和地铁的三元交叉领域。本文指出了大数据、人工智能和软件工程是实现智慧地铁的三大技术,其中,大数据技术是基础,人工智能技术是核心,软件工程技术是应用。
本文还提出了智慧地铁研究的4个方向及其相互关系,尤其是提高地铁运行安全性和效率的两大关键技术:地铁运行智能监测技术以及智能调度技术,并讨论了实现这些关键技术的难点和算法。
总之,我们认为大数据、人工智能等技术的发展,导致现有地铁系统必然朝着智慧地铁的方向发展。智慧地铁是地铁的一个新的研究领域,也是人工智能的一个新的应用方向,存在很多的研究内容和关键技术。在本文的基础上,还有很多需要研究的内容,比如各种AI算法的适用性、相关性和包容性,以及智慧地铁软件开发的阶段性、兼容性和扩展性等。