图像智能识别技术在高速铁路基础设施检测中的应用

2019-11-20严鹏廖峪陈伟庚刘晓江杨长卫

中国铁路 2019年11期

严鹏，廖峪，陈伟庚，刘晓江，杨长卫

（1.西南交通大学，四川成都 610031；2.中国铁路广州局集团有限公司深圳工程建设指挥部，广东深圳 518000；3.中国中铁二局第四工程有限公司，四川成都 610306）

1 概述

我国高速铁路正在快速发展，预计到2020 年将达到3.0 万km[1]。然而，随着高铁运营里程的逐渐增大，基础设施病害问题已成为威胁运营安全的焦点，如何准确、及时发现病害则是迫切需要解决的难题[2-5]。近年来，随着人工智能和大数据分析技术的快速发展，人脸、指纹、虹膜等智能识别理论与技术已渐趋成熟，在机场与车站安检、网络支付、上班考勤等方面得到广泛应用，解决了传统技术难以突破的关键技术难题[6-7]。

基础理论的发展有助于科学技术的进步，现阶段人脸识别技术的核心是图像识别算法。基于图像识别算法，以接触网悬挂状态及缺陷为对象，阐述图像识别技术在高速铁路基础设施状态检测方面的应用。

2 整体技术框架

针对接触网悬挂状态及缺陷的智能检测工作大致可划分为大数据处理、智能验损两大部分，具体架构见图1。大数据处理部分主要是针对海量的缺陷照片，进行高效、安全的存储和特征分析管理，采用Hadoop架构来实现计算机集群对海量数据分布式计算。在智能检测方面，主要采用基于图像识别和百层神经网络的人工智能技术；通过自主研发的NBK-INTARI 神经网络技术开展图片增强、边缘检测、特征提取及缺陷特征等工作，将分析结果与数据库关联，进而对实测存在缺陷的图片进行快速识别。

图1 接触网悬挂状态及缺陷智能检测工作架构

3 人工神经网路的基本原理

人工神经网络是目前在人工智能领域应用最为广泛的数学分析模型。其中，前向BP 神经网络则是应用最多的神经网络方式，具有自学习、自适应、非线性映射及容错率高等优点，能够解决传统方法无法解决的具体问题。BP 神经网络大致可划分为输入层、隐含层及输出层，其基本原理[8-10]如下：

为输出层向。

在输入层，输入节点仅将输入信息通过激活函数f（u）的作用传播到隐藏层节点上，研究选择的激活函数为sigmoid，则其表达式为：

设w是输入层-隐藏层、隐藏层-输出层间权值，其向量为隐藏层节点的输出以O表示：

输出层节点的输出以P表示：

输出误差δ为：

式中：T为输出节点的目标值。对于隐藏层节点有：

式中：δi为隐藏层节点i的误差项；ai为隐藏层节点i的输出值；wki是节点i到下一层节点k的连接权值；δk是节点i到下一层节点k的误差项。更新每个链接上的权值为：

式中：wji节点i到节点j的权重；η为学习速率常数；δj是节点j的误差项；xji是节点i传递给节点j的输入。

4 关键技术

4.1 缺陷数据库

丰富、完善的缺陷数据库是开展智能验损的基础，课题组针对接触网悬挂状态及缺陷，与铁路局集团公司开展具体工作，收集、整理了针对腕臂底座、套管双耳、定位线夹、长定位立柱等57 个部件共178 种典型缺陷，并成功实现了识别，部分缺陷识别照片见图2。

图2 部分缺陷识别照片

4.2 弱光环境下的图像识别

根据现场调研结果发现，接触网悬挂状态检测工作大部分在夜晚开展，难以有效保证部分构件的清晰度。因此，针对弱光环境下开展图像增强，将部件的细节进行增强，突出重点关注部分，适当减弱周围环境，为后续提高图像识别的准确率做准备。课题组采用频域增强方法，通过将图像空间域转换到特定的变换域内，并且在此变换域中完成变换后的系数操作与处理，然后再将其逆变换到图像空间域[11-15]。

假设图像空间域ƒ（x，y）变换后的频域函数为F（x，y），传递函数为H（u，v），从空间域到变换域的函数过程表述为：

逆变换的函数过程为：

式中：ƒ（u，v）为在频域内系数处理之后的图像频谱；g（x，y）为图像增强处理后的输出图像。在实际操作中，可根据具体的需求而设置不同的传递函数H（u，v）。

选取现场实测图片（见图3），经过增强后（见图4）可知，增强后接触网部件的图像更突出，边缘更清晰，目标图像与背景分界明显。

图3 原始图像

图4 增强后图像

4.3 细部构件的精准识别

接触网悬挂系统存在大量的细部构件，如何能够精准识别接触网系统的缺陷至关重要。研究采用百余层的神经网络算法和特征金字塔模型，自主研发了重复区域融合算法，充分考虑接触网零部件特征，对部件进行快速锁定（见图5）。在此基础上，将神经网络传统的前向传播方式升级为反向传播，通过调整网络输出与原始值间的误差来训练与改变权值，进而提高识别准确性。大量现场实测结果表明，现阶段只能通过对接触网同一部件来自不同角度的7 张图片实现构件的精准识别，准确率在90%以上。

图5 精准定位与缺陷识别

4.4 缺陷智能识别效率

准确性和时效性是人工智能技术的两大核心指标。在整个识别过程中，将第1 次识别结果投入到下一次训练样本中，以快速扩大输入层样本的数量，制定适合接触网缺陷识别的学习策略，加快学习模型的收敛速度，减少学习时间。研究对比分析了常数型、AdaDec 和AdaMix 3 种学习策略对深度学习模型收敛性的影响。假定工况信息如下：训练样本集为8 000 幅接触网原始图像，测试样本为1 500 幅接触网原始图像，迭代次数最大值为35。重构误差分析见图6。

由图6 可知，随着迭代次数的增加，常数型、AdaDec 和AdaMix 的重构误差逐渐降低，最后趋于稳定。

图6 重构误差分析

5 工程应用

为了系统说明图像识别技术在高速铁路基础设施检测中的优势，以1 000 km 的铁路线路为例，假定每隔20 m 设立1 根供电杆，高速综合检测车针对每根供电杆拍摄20 张图片，累计100 万张图片。课题组前期对此进行了大量调研和访谈，基本掌握缺陷识别现状：需25 个图像分析员连续工作60 d，平均每分钟识别2～3 张图片（识别速度为20～30 s/张），难以对病害达到及时发现、及时处理的要求；识别的稳定性较差，识别人员工作疲劳易造成缺陷识别的遗漏，影响识别质量。

针对同样的工作量，课题组采取人工智能识别，运算速度大幅度提升，识别速度为0.25 s/张， 3 d 完成计算。通过人工智能方式，单张识别速度提升近100 倍，总体识别速度提升500 倍。