自学习算法在列车自动驾驶系统的应用
2022-10-27薛文静张东海
薛文静,张东海
(1.浙江省交通投资集团有限公司,杭州 310020;2.浙江杭海城际铁路有限公司,杭州 310000)
1 自动驾驶系统既有算法面临新挑战
截止2021年底,国内大陆地区共有50个城市开通城市轨道交通运营线路283条,运营线路总长度 9 206.8 km。其中地铁运营线路 7 209.7 km,占比78.3%;其他制式城轨交通运营线路1 997.1 km,占比21.7%,当年新增运营线路长度1 237.1 km。近年来,随着交通强国与智慧交通建设工作的试点与推进,轨道交通信号控制行业掀起了面向“智慧化”的全新科技创新浪潮。特别是2019年9月国务院印发的《交通强国建设纲要》以及2020年3月中国城市轨道交通协会发布的《中国城市轨道交通智慧城轨发展纲要》,都为自动驾驶系统在智能检测、监测和智能运维等前沿关键技术指明新的发展方向,提出更高的标准和要求。
自动驾驶系统作为城轨信号控制系统的重要子系统,代替人工实现列车的自动运行、精确停车、车门控制、自动折返等功能,对列控系统的“智慧化”起着至关重要的作用。尤其是对自主化全自动运行系统(FAO)全自动驾驶与互联互通制式的信号控制系统在轨道交通线路中的推广和应用意义重大。因此当前自动驾驶系统的核心控制算法在关键场景中(比如智能识别列车动力学性能实现精确停车、智能识别线路特征实现舒适运营、智能控制能耗实现节能运营、智能预测时分实现运行计划动态调整等),将面临新的挑战。
1.1 关键技术与指标
自动驾驶系统的“智慧化”关键技术主要包括站台精确停车、舒适运行、时分预测与控制和节能运行等。
站台精确停车功能是自动驾驶系统最具有挑战性的部分。根据《城市轨道交通 CBTC 信号系统-ATO子系统规范》[1],站台停车误差指标为:精度范围±0.3 m内的概率大于等于99.99%;精度范围±0.5 m内的概率大于等于99.999 8%。混合制动不可控是影响自动驾驶停准率指标的最重要问题,而不同的机械制动与不同的电制动机构之间的动力学特征相差很大,尤其是磁悬浮、低底板、吊轨、单轨等车型相对于地铁、城际与轻轨列车各车型有很大差别。
舒适运行主要指自动驾驶系统控制列车运行的全过程中乘客感受到的舒适程度。通常使用列车冲击率来衡量,冲击率为列车加速度的变化率。根据《城市轨道交通 CBTC 信号系统-ATO子系统规范》规定,列车冲击率应小于等于0.75 m/s3。
时分预测与控制主要指自动驾驶系统控制列车运行的全过程中,根据自动列车监控系统(ATS)运营计划,结合临时限速、线路数据等信息预测运行时分,制定符合运行计划要求的控制目标,并准确控制列车实现计划以及达到既定平均旅行速度的功能。具体指标是实际时刻与计划时刻之间的偏差量,包括列车的运行时间、站台停车时间、折返时间,也包括平均旅行速度,前后车的运行间隔等。
节能运行主要指自动驾驶系统控制列车从加速启动至停车的全线实际运行过程中消耗的能量,以及再生的反馈回电网能量等等。
1.2 既有算法的现状
近年来随着轨道交通的飞速发展,自动驾驶系统的核心控制算法先后经历了两个大的发展阶段。一是以比例-积分-微分(Proportion Integration Differentiation,PID)控制器为基础的改进型经典控制算法阶段;二是以专家或训练过的神经网络为指导的模糊控制以及遗传算法等专家算法阶段。
1) 改进型经典控制算法
PID算法是一种经典的控制算法,通过有效的比例(Proportion)、积分I(Integration)、微分(Integration)参数设定,能够使系统达到良好的响应速度和控制误差。由于列车运行过程中信号采集和传输均存在误差,微分控制易放大误差,可以根据具体情况单独使用比例控制或者比例积分控制。为了对列车运行过程自适应,研究人员提出了改进的PID算法:文献[2]设计出一种基于模糊自适应的PID控制器,用于解决控制系统非线性多目标,运行环境变化大且复杂的问题。文献[3]使用位置式PID算法,以决定牵引和制动命令的执行时间点,可以减少列车牵引和制动时间以实现节能,保证列车提速平稳以提高列车的舒适度和稳定性。
2) 专家监督自适应算法
由于复杂的列车控制系统难以用单一的控制模式解决,研究学者开始着眼于使用模糊理论、神经网络、遗传算法及专家系统进行车辆控制[4]。例如,文献[5]使用基于Pareto最优解的带精英策略的非支配排序遗传算法来解决自动驾驶的安全性、舒适性、停车精确性、节能性及准时性的多目标优化问题。文献[6]使用基于粒子群的全局列车自动运行(ATO)控制策略来改善控制工况切换频繁以及能耗较大等问题。各类算法特定对比如表1所示。
表1 列车自动驾驶算法的特点对比Tab.1 Comparison of Characteristics of Automatic Train Operation Algorithms
1.3 既有算法的问题与不足
既有的自动驾驶算法的策略主要为根据线路数据、列车自动防护(ATP)系统限速、列车自动监控(ATS)运行计划等因素计算合理的目标速度,然后通过列车速度与设定目标速度相比,结合列车加速度等状态对停车误差、舒适度、运行时间等目标进行控制。
列车属于典型大惯性大滞后非线性复杂控制对象。既有的自动驾驶核心算法,在研究列车的鲁棒适应性上取得了一定的进展,具备静态的规则或模式,对一定的参数波动具备一定的自适应能力。但规则或模式往往相对固定,对于磁悬浮、低底板、吊轨单轨等车型难以适应,即便是对于地铁、城际与轻轨列车各典型车型,在长达15年的全生命周期运营过程中,发生的大于一定量级的性能变化难以适应。尤其是随着设备老化,同批次的不同列车间在级位切换延时和牵引制动力上,变化趋势不统一或者差异度过大时,既有的自动驾驶核心算法难以自动适配,往往需要耗费大量的运营维护成本进行人工调整。
在电制动与机械制动转换的关键控制过程中,既有算法对不同混合制动机构的组合(电制动与空气制定、电制动与液压制动等)兼容适应性还有待加强。既有的算法虽然有一定的配置度,但不具备普遍的智能化适配调整能力,往往需要借助人力对算法结构及算法参数进行改变,需要耗费大量人力物力成本。
既有的自动驾驶核心算法的动态“智慧化”故障预测能力不足。既有的自动驾驶核心算法,对同一时期列车参数的离散型特征的量化评估不到位,不能有的放矢的基于延时离散性过大、牵引制动力离散性过大等量化评估指标实现故障预测并指导列车牵引制动系统的维护时机。
既有的自动驾驶核心算法对于线路中的某些特征场景的动态适应性不足,容易出现频繁的异常级位切换,造成舒适度与能耗问题,例如密集道岔对列车存在明显阻力的区域与坡道或者弯道叠加、大弯道与大坡度叠加区域等。
既有的自动驾驶核心算法对于综合平衡站台精确停车、舒适运行、时分预测与控制、节能运行等多种目标的“智慧化”寻优能力有待加强。随着列车动力学性能的变化,各类运营指标都会不同程度的受到影响,既有的自动驾驶核心算法难以从实时运行表现出发,“智慧化”的在各种运行指标之间综合平衡寻优。
2 自学习算法在列车自动驾驶系统中的应用
随着地铁及高速铁路的发展,线路长度增长及列车密度增加,自动驾驶系统的应用场景也越来越复杂。主要体现在:各个车厂的每辆列车之间性能也存在差异;随列车运行时间延长车辆性能往往会逐渐离散化;系统需兼容地铁、轻轨、磁悬浮、吊轨、独轨等各种不同场景下的各类不同车型;系统需适配国内外不同电制动与机械制动厂商组合等等。
2.1 解决列车参数变化及漂移
不同厂家列车的牵引、制动、延时性能不同,相同厂家的列车之间性能参数也存在差异。一般情况下作为算法的应用条件,信号设备要求列车之间性能参数的变化率在10%以内。随着列车运营时间增长、元器件老化等原因,车辆参数会发生不可逆的漂移,性能参数随车辆载客状况、天气的变化而变化。
在列车运行中,不稳定的运行参数、调度命令等各种干扰,不仅具有很大随机性,而且其中一些干扰甚至会持续相当长的时间[7]。自学习算法可以针对列车参数的漂移进行动态识别,逐步调整其参数、结构,控制学习率,使得调整过程总体收敛到一个稳定的模态中,从而动态适应列车参数的变化。
2.2 解决混合制动不可控问题
对于国内目前运行的列车,一般采用电制动与机械制动组成的混合制动机构,表现为高速运行时,列车以电制动为主要制动方式;低速运行时,电制动会逐渐减弱,制动系统通过增加机械制动来补偿制动力。
制动系统的性能优劣主要取决于电制动的性能和与机械制动的配合。然而转换过程中,电制动与空气制动往往不能完全衔接,导致制动力在转换速度附近出现极大的性能偏差,甚至呈现“不可控”的状态,容易造成频繁的级位跳变,进而使得能耗增加,加速刹制动磨损等问题。
自学习算法若能够识别混合制动的制动系统契合度,在“智能化”模式下,尝试不同的控制过程,动态适配特定车辆混合制动规律,得出最优解控制策略与控制参数。
2.3 解决线路数据不精确问题
信号系统在进行控车时,需要根据线路数据来制定目标速度。在线路数据设计的过程中,为防止列车超速等危害安全的情况发生,往往按照偏安全的方式提供坡度和弯道等数据的保守值。比如坡度、弯道数据在现实中应为连续变化的,但在设计过程中将相邻坡度合并成同一坡度值的坡度段。线路数据的不精确,加之列车作为一个多质点实体,在变坡或变弯时过程和规律都具有一定的不确定性。
自学习算法天然具备适应不确定性的特点,能够智能辨识、评估并记忆特定线路位置的特征,比如记忆相同列车在同一站台、同一区间运营之间,运行状况的差异性。文献[8]利用这一特点,对已有运行数据分析计算,搭建站台坡度及相应补偿值的数据库,随后在停车过程中,在数据库中查找与此站台坡度匹配的补偿值来完成对列车制动特性的自我学习和适应。
2.4 解决多目标平衡问题
智慧列控对自动驾驶系统提出了更高的要求,在保证停车准确率与运行效率的基础上,还要重点关注舒适度、节能等指标。控制中存在多目标相互制约的特点,舒适度与目标速度的跟随性互相矛盾,节能与运行时间也相互矛盾。针对行驶速度、节能、停车误差等单目标,已经出现大量的研究成果[9-11],也有一些专家学者对多目标全局控制展开了研究[12-13]。自学习算法能够根据当时当下特定列车自身的性能特征,更多维度地平衡多目标,进行综合决策寻优。
2.5 解决人工调试问题
人工调整算法结构与参数的过程,往往需要多名运营维护人员,针对列车各站数据反复寻优适配,才能达到一定程度的优化调整效果。随着线路增多,后续的运营维护压力会越来越大。自学习算法能够实现无监督的自动寻优,做到在没有人工参与的情况下动态适配当前列车,实现各项运营指标间的最优效果。
3 结语
综上所述,自学习算法作为自动驾驶系统的前沿关键技,能够进一步提升轨道交通信号控制系统的智能检测监测和智能运维水平,尤其是在站台精确停车、舒适运行、时分预测与控制、节能运行等各个方面全面提升自动驾驶系统的“智慧化”程度。自学习算法及其核心技术的应用有利于轨道交通行业,面向智慧交通、绿色运营实现跨越式发展,为交通强国的建设提供技术助力。