APP下载

推动4C装置图像智能识别技术持续发展的思考

2020-12-17盛良张克永张文轩杨志鹏

中国铁路 2020年10期
关键词:接触网样本装置

盛良, 张克永, 张文轩, 杨志鹏

(1.中国国家铁路集团有限公司铁路基础设施检测中心,北京 100081;2.中国国家铁路集团有限公司工电部,北京 100844;3.中国铁道科学研究院集团有限公司基础设施检测研究所,北京 100081)

接触网是由接触悬挂、支持装置、定位装置、支柱与基础等主要部分组成,包含吊弦、定位线夹、终端锚固线夹、中心锚结装置等众多零部件的复杂大型结构体[1-2]。由于长期处于风、雨、雪、雾、高低温、强光照、沙尘、盐污等复杂外部环境中,并经受列车受电弓高频振动和大载流电气作用,其结构中各零部件的安全可靠运行,对电气化铁路运营秩序和安全运输发挥着重要保障作用。

接触网状态检测监测装置(简称4C装置)是电气化铁路供电安全检测监测系统(简称6C系统)的重要组成部分,4C装置通过对支持装置、定位装置、接触悬挂及附加悬挂等区域进行高精度定位与高清成像,实现对接触网零部件外观状态的快速采集,并通过图像智能识别算法实现对零部件完整性、移位、裂损、松脱、异物等缺陷状态的自动识别预警,有效保障了接触网系统的安全运行。其中,4C装置图像智能识别是其发挥安全保障功能和提高检测劳效的关键影响因素[3-4]。

文献[5]梳理了6C系统的发展历程和应用实践,并提出4C装置及其他各型装置的发展不足。文献[6-7]梳理总结了深度学习的技术优势,以及在计算机视觉中的应用前景。文献[8]采用图像处理和模式识别等方法,对大量接触网零部件缺陷图像的智能识别作了探索性研究。文献[9-10]探索运用深度学习技术开展图像智能识别,并在铁道塞钉智能识别中取得良好运用效果。基于深度学习4C装置图像智能识别的技术特点,在分析我国电气化铁路接触网的特征和优势基础上,研究提出一条可推动4C装置图像智能识别技术持续发展的工作路线。

1 发展现状

2014年起,随着高铁接触网检测车(含4C装置)的分批次集中采购装配和全路范围内广泛装备配属,4C装置已基本实现对高速和普速铁路全覆盖检测,全路接触网零部件结构状态检测工作实现了革命性转变,接触网养护维修效率得到极大提高,弓网系统运行安全性、可靠性显著加强。截至2019年底,全国各型4C装置总计116套。

2018年以来,在中国国家铁路集团有限公司(简称国铁集团)的统筹指导下,由中国铁道科学研究院集团有限公司(简称铁科院集团公司)和设备供应商等相关技术力量组成的工作组,经过连续2轮软件系统优化升级,4C装置图像智能识别的项目数量和质量均有一定提升。识别项点数量增加至38个,识别检出率提高到26.57%。

尽管如此,4C装置图像称4C图像智能识别效果距离现场需求仍有较大距离。一方面,现有智能识别项点数量仍然较少,尚不能有效覆盖主要接触网类部件,仍需要依赖人工进行缺陷识别分析;另一方面,现有识别算法适应能力较差,不能有效适应多种形式接触网零部件结构,一定程度上影响了4C装置功能的全面发挥。

2 关键要素分析

2.1 技术路线

随着计算机技术的发展,计算能力极大提高,计算成本大幅下降,使基于机器学习的图像智能识别技术路线发生了重大转变。基于深度学习的智能识别技术路线,具有算法模型通用、扩展性强、技术成熟等特点,并且其通过数据驱动方式实现模型参数优化方式,能够与不断产生的检测数据结合,实现算法模型的循环迭代,形成自生长态势,已成为目前甚至今后较长时期内图像智能识别领域的主要技术路线,也是4C智能识别的主要技术路线[6-9]。

基于深度学习的智能识别技术,其实现效果的好坏主要由算法模型和样本数据决定。一方面,算法模型具有通用、扩展性强、技术成熟等特点,但其技术的提升依赖行业发展,更新换代周期相对较长;而用于算法模型参数优化训练的样本数据,由于数据规模可以通过科学分类、广泛汇集和持续积累等方式实现快速成倍增长,故其发展不依赖某项技术的发展,并且随着使用自然增长,发展成本低。另一方面,算法模型参数的构建与优化训练专业性强,应主要依靠科研或社会专业技术力量;而样本数据的增长专业性相对弱,在铁路行业内部的日常检测工作中即可实现。综合以上分析,从铁路行业内部可开展工作的角度出发,样本数据的持续扩大是推动智能识别技术进步的关键。

2.2 铁路接触网特点

我国高速铁路接触网具有结构形式多样,并且高铁线路由多个铁路局集团公司、站段分别运管的特点。一方面,由于接触网结构形式、零部件类型等差异较大,使全路集中研发一套适应所有结构形式接触网的智能识别算法十分艰难。另一方面,由于每个站段或铁路局集团公司通常运管多条接触网结构形式不同的线路,并且每种结构形式的接触网里程长度仅为各条线路的1个区段,使得以各铁路局集团公司分散开展研发适应各自管内所有线路的智能识别算法工作所需样本数据规模不足、资金和研发力量分散。也就是说,倘若样本数据充分,通过集中资金和研发力量,针对不同结构形式接触网甚至分线路分别研发智能识别算法,将具有更高的经济性。

我国高速铁路的优势之一是路网规模庞大。一方面,我国幅员辽阔,单线里程超过1 000 km的高铁线路占比较大,使针对特定线路研发独立智能识别算法的工作具有样本数据规模的保障。另一方面,我国路网线路众多,多条线路采用同种形式接触网的情况较多,这意味着该种形式接触网的样本数据规模将进一步成倍扩大,使针对不同形式接触网分别研发独立的智能识别算法的工作具有更高的可行性。但发挥路网规模优势的前提是消除不同铁路局集团公司及站段间样本数据之间的属性差异,即全路4C图像缺陷样本数据实现统一编码规则。

2.3 现状分析

当前,4C装置图像数据分析工作仍主要依靠人工,并且已经获得了大量有价值的缺陷图像样本数据。但由于各铁路局集团公司及站段间对于接触网结构状态的缺陷定义和归档标准不统一,造成相当多的缺陷图像样本数据限制在铁路局集团公司甚至站段机构的小范围内,无法形成全路大数据图库,影响全路规模优势的发挥,是当前4C装置智能识别技术发展缓慢的重要原因。同时,由于全路尚未建成分类科学、数据规模足够的4C图像缺陷样本数据库,使得按照不同类型或线路接触网开发特定智能识别算法的主要成本集中在图像缺陷样本数据的整理,而非算法优化和模型参数训练,这是目前4C装置智能识别技术坚持使用一套算法的主要原因,也是社会技术力量长期难以有效被引进的关键因素。

3 工作路线的建立

3.1 构建并发挥路网规模优势

我国高速铁路接触网的结构形式多样,路网规模庞大,拥有世界其他国家和地区无法比拟的优势。如何将该优势与相关技术发展结合,并转变为装备技术、数据运用等可全面提升的有形资产,形成其他国家或地区无法超越的技术制高点,是6C系统各项工作必须思考和回答的问题。基于深度学习的4C装置智能识别技术,可通过样本数据规模的扩大驱动智能识别模型参数不断优化,使智能识别效果持续提高,具有发挥我国路网规模优势的条件。

可根据接触网结构形式分类(甚至分线)制定全路统一的接触网结构状态描述标准,消除各铁路局集团公司及站段之间的4C图像缺陷样本属性差异,进一步根据统一标准要求,将全路各铁路局集团公司、站段已经产生和即将产生的4C图像缺陷样本数据规范统一,利用6C系统数据中心进行全路归集并形成大数据库,建立起我国4C图像缺陷样本数据的路网规模优势。之后,通过将智能识别算法模型的训练优化工作,集中上移至全路4C图像大数据库,发挥我国4C图像缺陷样本数据的路网规模优势。

3.2 建立技术发展生态

充分发挥高速铁路基础设施检测监测体系三级检测机构职能作用,构建由国铁集团(检测中心)、铁路局集团公司及站段和社会技术力量组成的技术发展生态,建立并发挥我国路网规模优势,盘活研发技术力量格局,形成4C装置智能识别技术的健康、可持续发展态势(见图1)。

图1 4C装置图像智能识别技术发展路线示意图

国铁集团(检测中心)是实现全路统一,发挥路网规模优势的中心。中心负责将各铁路局集团公司及站段的4C图像缺陷样本数据通过6C系统数据中心归集入库,并根据技术需求分别设立训练图库和评定图库,用于社会技术力量研发智能识别算法的优化训练和对训练后的算法模块进行评定比选,最后经综合比对,将效果和经济性较好的智能识别算法模块向全路高铁接触网检测车和高铁综合巡检车(含4C装置)发布运用。同时,中心负责根据数据规模的增加和智能识别的需求变化,集中资金、分阶段、分类型或线路,组织社会技术力量开展智能识别算法研发和优化工作。可通过公开竞赛形式,主动引入社会优势技术力量开展高速铁路接触网4C智能识别算法研发工作,充分发挥社会技术力量。

铁路局集团公司及站段是4C图像缺陷样本数据产生的源头,也是智能识别算法模块运用的终端,是智能识别工作的服务主体。路局及站段负责将4C图像数据按照统一编码规则进行编码和归档,同时将国铁集团(检测中心)发布的智能识别算法模块进行更新和运用。

社会技术力量(包括4C装置的设备供应商),是智能识别算法的技术输入力量。由于在该发展生态中,4C装置主要作为智能识别算法模块的搭载平台,智能识别工作的技术力量将不再局限为4C装置的设备供应商,可引入社会优秀技术力量,盘活智能识别研发力量格局,促进智能识别技术快速发展。同时,由于样本数据已按照统一编码规则实现编码和分类,各社会技术力量的工作将主要集中在算法优化和模型参数训练上,并且模型参数训练工作将主要集中在国铁集团(检测中心)的全路4C图像库开展,省去了缺陷样本数据的整理环节,节约了技术力量投入,较大程度降低了智能识别算法研发成本。

4 路线实施关键

4.1 制定统一编码规则

4C图像缺陷样本数据是在高速铁路基础设施检测监测体系的三级检测机构间流通的2个要素(样本数据和算法模块,如图1所示)之一,其实现流通的前提也是路网规模优势发挥的前提,是实现数据的统一编码。4C装置的主要功能是实现接触网结构状态检测,故其图像数据编码规则实为接触网结构状态描述的编码规则。

该项工作可根据4C装置检测项目要求,按照接触网结构特点,分类制定全路统一的接触网结构状态描述编码规则。现阶段,可由检测中心牵头,组织包括设备供应商、铁路局集团公司、站段和科研院所在内的力量,在充分考虑基于深度学习的智能识别技术路线需要的前提下,并于总结现阶段各铁路局集团公司、站段及设备供应商已经制定的相关编码规范的基础上,按照逐步深入细化的实施路线,分类梳理全路接触网的结构特点,根据接触网各结构及部件的重要程度,有重点、有层次的细化并分类制定接触网的结构状态编码规则。同时,考虑到4C装置投运以来已经产生了大量有价值的图像缺陷样本数据,在完成此项工作基础上,需尽快规范已有样本数据并实施全路归集,避免数据资产流失。此外,为保证编码规则的科学性,可通过设立科研项目,从简统化接触网编码规则的研究制定入手,逐步深化完善编码规则。

4.2 统一算法模块接口标准

根据上述技术发展生态,高铁接触网检测车和高铁综合巡检车(4C装置)的软件系统将成为智能识别算法模块的运用平台,并且主要集中在软件系统上。算法模块是在高速铁路基础设施检测监测体系的三级检测机构间流通的要素之一,但其流通的前提是算法模块与软件系统之间接口实现统一。由于算法模块将按照接触网结构类型或不同线路独立研发,各台4C装置将可能安装多个独立算法模块,为此需要优化软件系统的算法模块调用机制,使智能识别算法模块的发布实施和运用更加灵活高效;同时,考虑到推进实施的初期,智能识别功能不能完全取代人工分析,并且人工分析工作也是智能分析结果的确认和重要补充,应通过按照统一编码规则,优化软件系统人工分析功能,实现4C图像的接触网结构状态的快速自动化编码。

4.3 优化成像质量评价方法

4C装置的高清图像是实现接触网结构状态检测的原始数据,拍摄角度、图像清晰度等方面不仅影响缺陷图像样本质量(且可能进一步影响算法模型参数优化训练),也会影响智能识别算法模块的部署运用效果,是智能识别工作的源头和基础。应细化研究4C装置成像质量评价项目和方法,最后通过6C评定的方式保障图像数据的源头质量。

5 结论

(1)当前4C装置图像智能识别由于识别项点数量较少、算法适应能力较差等原因,仍大量依赖人工进行缺陷识别分析,一定程度上影响其功能的全面发挥。

(2)基于深度学习的智能识别技术路线的关键在于数据驱动,而我国路网具有规模庞大的绝对优势,由于各铁路局集团公司间数据编码标准不统一,造成大量缺陷图像样本数据限制在铁路局集团公司机构内,无法形成全路规模优势,这是当前4C装置智能识别技术发展缓慢的重要原因。

(3)以建立全路4C图像大数据库为基础,构建由国铁集团(检测中心)、铁路局集团公司及站段和社会技术力量组成的技术发展生态,不仅实现我国路网规模优势的建立和发挥,同时进一步盘活研发技术力量格局,形成4C装置图像智能识别技术持续发展态势。

(4)明确了工作路线的3个关键点:制定统一的缺陷图像编码规则、统一并优化算法模块接口标准和进一步完善成像质量评价项目和方法。

猜你喜欢

接触网样本装置
教你辨认枪口装置
BIM技术在电气化铁路接触网中的应用研究
为开通打下基础!这条国际铁路完成接触网平推验收
倒开水辅助装置
用样本估计总体复习点拨
中老铁路两国同步架设电气化接触网第一线
基于接触网下部材料厂型螺栓的改进研究
规划·样本
轰趴装置指南
随机微分方程的样本Lyapunov二次型估计