基于5G的编组站咽喉区异常检测系统
2022-08-08柴金川宗孝鹏
钟 昊,柴金川,宗孝鹏
(1. 佳讯飞鸿智能科技研究院 人工智能应用技术研究所,北京 100044;2. 中国铁道科学研究院集团有限公司 国家铁道试验中心,北京 100015)
铁路编组站咽喉区的行车和调车作业尤为繁忙,且工务、电务和供电等专业在咽喉区施工作业也较为频繁,会出现异物落入道岔后导致基本轨与尖轨无法密贴、施工作业结束后工器具遗留在现场、转辙机在检修完成后箱盖未闭合或未完全固定等安全隐患,严重地威胁着行车安全。
目前,咽喉区安全检测主要依靠人工巡检,但因人工巡检周期长,难以及时发现异常情况。保障咽喉区安全是提高铁路编组站通过能力的前提和基础,亟需采用新技术及时发现和消除安全隐患。
近年来,随着人工智能技术的快速发展,基于智能视觉的铁路巡检技术已成为研究热点,接触网异常识别系统[1]、钢轨表面缺陷检测系统[2]、机房智能巡检机器人系统[3]、轨旁设备异常检测系统[4]、货车故障动态图像检测系统[5]等智能检测系统在铁路各专业得到应用,极大地提升了铁路巡检作业效率,增强了铁路安全保障能力。
《国铁集团关于加快推进5G技术铁路应用发展的实施意见》指出,加快推进第5代移动通信技术(5G) 应用,是推进新时代铁路高质量发展、实现交通强国、铁路先行的重要领域和重要基础,有利于提升铁路服务品质和效率效益。
为此,研究开发基于5G的编组站咽喉区异常检测系统(简称:咽喉区异常检测系统),借助5G网络大带宽、低时延、泛在连接的优势,利用监控摄像头对咽喉区关键点位定期巡检,采用智能视觉技术,自动识别咽喉区异常情况并告警,推动铁路业务模式创新,提升编组站咽喉区安全保障能力。
1 系统构成与功能
1.1 系统构成
编组站咽喉区异常检测系统,如图1所示。
图1 编组站咽喉区异常检测系统构成
(1)图像采集子系统:在编组站咽喉区关键部位安装监控摄像头,巡回采集各个关键点的监控视频;目前利用运营商5G网络(今后可利用铁路5G-R专网),将视频监控数据发送给视频分析子系统,实现咽喉区视频监控数据的接入、汇聚和集中管理。
(2)视频分析子系统:完成视频图像智能分析,主要包括视频监控平台、视频分析服务器及数据存储模块等;其中,视频监控平台实现摄像头的统一接入与管理,通过标准协议,对前端摄像头云台进行控制;视频分析服务器对采集的视频数据进行智能分析,判断是否存在异常情况,生成告警信息并发送给服务管理子系统。
视频分析子系统软件采用基于组件的多级流水线视频处理技术[6],实现视频采集、解码、预处理、合流、推理、告警、分流、渲染、编码、输出的流水线,多路视频可以在流水线上并行处理,如图2所示。
图2 视频分析子系统流水线
(3)服务管理子系统:提供系统服务管理功能,包括接口管理、配置管理、任务管理及状态监测模块;其中,接口管理模块定义了与既有的工电供生产管控系统(简称:生产管控系统)的HTTP数据传输接口,可将告警信息、关联的异常图像以及系统自身运行状态上报给生产管控系统,并从生产管控系统接收系统管理指令;配置管理模块可对分析服务进行配置,如接入摄像头的地址、数据存储路径等;任务管理模块提供巡检周期、摄像头预置位等参数设置功能,完成巡检任务调度;状态监测模块实时采集和记录硬件及服务的运行状态信息,如CPU温度、磁盘剩余、GPU占用百分比等。
生产管控系统接收到告警信息后,推送到车站值班室监控终端以及值班人员手持终端,指导异常处理工作,避免引发安全事故。同时,车站值班人员可在生产管控系统的监控终端上,通过与服务管理子系统的数据接口,执行状态监测、配置管理及任务管理等操作,实现对咽喉区异常检测系统的监测与控制。
1.2 系统功能
咽喉区异常检测系统通过摄像头采集咽喉区视频数据,智能识别咽喉区异常情况,并将告警信息上传给生产管控系统。
(1)定时巡检:系统按照预定的时间间隔,定时控制摄像头对准预置位,采集咽喉区各个关键点的视频数据。
(2)道岔异物入侵检测:道岔基本轨与尖轨之间存在较大缝隙,当异物(如列车通过时崩落的石块)落入缝隙时,会导致基本轨与尖轨无法密贴,如图3(a)所示;系统通过视频智能分析,自动识别基本轨与尖轨密贴区域出现的异物。
(3)工器具遗留检测:工务、电务和供电3个专业咽喉区施工作业较为频繁,使用的工器具种类繁多,容易出现工器具遗留现象,如图3(b)所示;通过视频智能分析,自动识别轨道内的工器具遗留异常。
(4)转辙机箱盖状态检测:转辙机在检修完成后,箱盖(尤其是外箱盖)未闭合或者未完全固定,容易危害行车安全,如图3(c)所示;通过视频智能分析,自动识别转辙机箱盖外观异常,箱盖是否完好和正常闭合。
图3 安全隐患示意
(5)异常告警:识别出异常情况后,立即将告警信息上传到生产管控系统,由生产管控系统将告警信息及异常图像推送至车站值班室监控终端和值班人员手持终端,指导相关人员及时到现场进行处理。
(6)运行状态监测:对异常检测服务运行状态及设备服务器资源进行监测,查看服务运行是否正常,以及服务器的CPU、图形处理器(GPU,Graphic Processing Unit)、网络、磁盘等硬件信息。
(7)服务管理:对系统数据接口、配置参数及任务进行管理,实现与既有的生产管控系统对接,提供摄像头分析任务管理及相关参数设置。
2 系统工作流程
基于机器学习的异常检测主要方法:(1)无监督学习方法,即利用手工设计特征[7]、特征表示[8]、模板匹配[9]和浅层机器学习等方法,实现单个缺陷或故障的检测;(2)监督学习方法,即利用标注好的故障图像(包括类别、矩形框、像素等)对神经网络进行训练,利用训练好的神经网络模型来识别[10]。
在实际应用场景中,咽喉区异常检测面临着异常样本数量极少,以及异常类别不固定、无法提前预知遗留物类别的难题。因此,咽喉区异常检测采用无监督学习方法进行异常检测。
咽喉区异常检测系统的工作流程如图4所示。
图4 系统工作流程
(1) 系统开始工作时,读取摄像头的巡检参数(巡检周期、预置位等),检查各个摄像头是否有到达设定巡检周期的巡检任务;
(2) 当某个摄像头进入设定的巡检周期时,系统控制该摄像头云台移动到第一个预置位,采集咽喉区指定位置的监控视频数据,并通过5G公网连接,将视频数据传输给视频分析子系统;
(3) 视频分析服务器对每一帧图像数据进行异常检测,结合滑动窗口方法,判断连续时间段内是否存在异常;
(4) 检测到异常时,向生产管控系统推送告警信息,提醒车站值班人员及时进行处理;
(5) 系统控制该摄像头云台移动到下一个预置位进行检测,直至该摄像头的所有预置位检测完毕,结束该摄像头的检测;
(6) 检查下一个摄像头,重复上述(2)~(5)步骤,直至所有的摄像头检测完毕。
3 异常检测算法
3.1 知识蒸馏
知识蒸馏是一种模型压缩方法[11],是一种基于“教师—学生思想”的训练方式,即将一个训练好的教师模型中所包含的知识蒸馏提取到学生模型中,如图5所示。由于其简单有效,已经在工业界被广泛应用。
图5 知识蒸馏过程
将知识蒸馏方法应用于异常检测的基本思路是:在正常样本上,对于预先训练好的教师模型和随机初始化的学生模型进行知识蒸馏,使得学生模型的输出去逼近教师模型的输出,完成在正常样本上的知识学习。因此,在正常样本上,由学生模型预测得到的特征(embedding)与教师模型十分相似;当输入异常样本时,由于学生模型并未见过异常,学生模型预测得到的特征与教师模型相差较大,于是判断输入图像为异常。
3.2 基于特征匹配的异常检测算法
师生特征金字塔匹配(STPM,Student-Teacher Feature Pyramid Matching)算法[12],是一个基于知识蒸馏的异常检测框架,如图6所示。
图6 师生特征金字塔匹配网络结构
使用大规模数据集的预训练模型作为教师模型,训练阶段将教师经验提炼到具有相同结构的学生模型。采用特征金字塔结构,将多尺度大小的特征图进行融合,可以提高小目标的检测性能。
在训练阶段,使用正常数据,即无异常的图片进行训练,学生模型学习到正常数据集的分布。在测试阶段,当输入为正常数据时,学生模型与教师模型的特征分布相近,特征图差异较小,异常值得分较低,归类为正常数据;当输入为异常数据时,由于学生模型没有学习过异常数据的分布情况,与教师模型的特征图差异较大,异常值得分较高,归类为异常结果。
在异常检测算法验证阶段,使用异常图像进行测试,如图7(a)所示,图片中存在工器具遗留异常,对应的人工标注的工器具位置如图7(b)所示;使用训练阶段得到的异物检测算法模型,对输入图像进行检测,检测结果如图7(c)所示。
图7 异常检测算法检测效果
3.3 检测结果异常判定方法
为了消除由干扰因素造成的误报,采用滑动窗口算法确定最终结果[13]。滑动窗口算法的参数包括滑动窗口长度L、滑动步长S及滑动阈值百分比;滑动阈值百分比的含义为,在长度为L滑动窗口中,异常结果次数超过阈值比例后,判定该时刻结果为异常。
如图8所示,设置滑动窗口长度L为3,滑动步长S为2,即选取3个连续时刻的检测结果进行最终判断。对于连续时间段内的检测结果序列,N表示此时刻未检测到异常,Y表示此时刻检测出异常。
图8 滑动窗口示意
在T=0时刻,滑动窗口内3次检测结果均为N,则判断T=0时刻没有异常;在T=1时刻,滑动窗口内有1次检测结果为Y,而其余2次结果为N,1次检测结果为Y可能由误检造成,因而判断T=1时刻没有异常;在T=2时刻,滑动窗口内有2次检测结果为Y,1次检测结果为N,则判断T=2时刻出现了异常。
3.4 算法特点
与传统异常检测算法相比,采用无监督学习算法无需采集负样本(即异常情况的图像),通过对正样本数据进行自动特征提取,即可识别除正常情况之外的异常,提高异常识别的检出率。在正常样本数据足够多样的情况下,该算法可以有效适应光线及天气等环境变化情况。同时,可通过多个场景图像的混合训练,提高模型泛化能力。
传统异常检测算法需手动设计特征提取方法,对形状轮廓、色彩空间等特征进行异常分析。本文提出的异常检测算法,通过神经网络自动提取图像特征,特征提取更为多样,有利于提高异常检测的准确率。
4 测试验证及应用中发现的主要问题
4.1 测试环境与样本数据获取
在怀化西编组站进行系统部署及测试,该编组站具备中国移动5G公网覆盖,项目使用的频段范围为2515 MHz~2615 MHz,频率带宽共100 MHz。
在咽喉区内道岔的基本轨、尖轨、密贴区和转辙机等关键点安装超高清4K球机摄像头,支持30倍光学变焦,通过5G公网接入视频分析子系统。
由于摄像头采集的图像会受光线变化影响,同一位置的图像在不同时刻、不同天气条件下也存在差异。为保证检测模型的鲁棒性,设置3个摄像头采集15个预置位的图像数据,每隔5 min采集一组无异常的图像,连续采集7天,从而获取到不同时间段、不同光线条件、不同天气的样本数据,用于模型训练。
4.2 测试结果
对摄像头预置位进行异常模拟测试,分别在道岔密贴区放置石块,在轨道内放置工具,打开转辙机的箱盖。部分预置位的检测结果如图9所示,左侧为输入图片,右侧为检测结果图,以热力图表示异常的分值,红色矩形框表示异常区域。
图9 异常检测结果示例
当图像中存在工器具、转辙机箱盖未闭合等异常时,均可由该系统正确地检测出来。
4.3 应用中发现的主要问题
在系统应用过程中发现:(1)视频传输过程中偶尔会出现丢帧花屏现象(如图10所示),异常检测算法会将其识别为异常,从而产生误报;(2)摄像头夜间采用红外补光,输出灰度图像,大大降低了异常识别的准确度。
图10 花屏产生误报
5 结束语
本文针对编组站咽喉区存在的道岔异物入侵、工器具遗留等安全风险,研究开发了基于5G的编组站咽喉区异常检测系统。借助现有的运营商5G网络,实现了咽喉区视频监控数据的采集;运用知识蒸馏技术,采用无监督学习算法框架,实现咽喉区非确定性异常识别和定位功能。异常检测算法具有通用性和泛化能力,可适应不同道岔场景,不受光线、阴影、环境变化影响,具有精度高、泛化能力强、鲁棒性好的特点,在现场测试验证过程中取得较为满意的效果。
后续将针对现有问题,重点研究解决花屏现象的识别和预防问题,降低误报率;同时,通过物理补光和优化异常检测算法,提高系统在夜间的异常识别能力。