铁路GPR检测数据智能管理分析系统的研究与设计
2019-07-03程远水
杜 翠,刘 杰,程远水
(中国铁道科学研究院集团有限公司 铁道建筑研究所, 北京 100081)
21世纪以来,铁路建设正从信息化、数字化走向智能化。隧道、路基等铁路基础设施的智能诊断,是智能建造技术的重要组成,为工程质量验收提供重要的技术支撑[1-2]。
探地雷达(GPR,Ground Penetrating Radar)无损检测技术是高速铁路路基、隧道衬砌质量检测的主要手段[3-6]。但在实际应用中,地质雷达数据处理还面临两个典型问题:(1)数据处理周期长,检测结果时效性差;(2)人工解释雷达图像及多解性引起的误判。因此,针对探地雷达数据处理存在的问题,对检测数据快速处理的关键技术进行攻关,实现路基、隧道等铁路基础设施的智能诊断,对推动铁路智能制造技术的发展具有重要的现实意义。
通过研究和开发铁路GPR检测数据智能管理分析系统,可为铁路路基、隧道检测工程提供项目管理、数据管理、快速处理、辅助解释和统计分析服务,提升目前的数据管理和数据处理解释的自动化、智能化水平,为路基、隧道等铁路基础设施的智能诊断提供重要的技术支撑。
1 系统需求分析
1.1 GPR数据处理流程
GPR数据处理是一个复杂的过程[7],不同的探测介质采用的处理流程会有一定的差异,典型的GPR数据处理流程,如图1所示。外业进行数据采集后,内业需根据现场打标记录、桥隧涵设备表等信息,进行里程校正、试处理、信号处理、图像解释、统计分析以及检测报告编制等一系列工作。
GPR检测采集的数据量非常庞大。路基普查约5 GB/100 km,隧道约1.2 GB/ km,与具体的测线数量和采集参数有关。
图 1 典型的GPR数据处理流程
1.2 GPR数据处理需求
目前,数据处理通常采用的是雷达设备厂商提供的配套软件。根据目前软件存在的问题,总结铁路GPR检测数据智能管理分析系统的需求,主要包括4个方面。
(1)建立数据管理机制和管理平台
数据通过拷贝等形式流转,硬盘存储,效率低风险大,不利于查找和再利用,也给软件部分自动化功能的实现带来难度。
(2)增加目前软件缺失的功能
目前,软件欠缺里程校正、数据统计、报告辅助生成等功能,且开发商通常不提供定制版本,也不提供二次开发接口,无法对目前软件进行改进。
(3)良好的人机交互
由于软件设计理念不同,软件都是针对一个文件进行精细处理。如果用于大批量文件的应用场景,则存在大量的重复性操作,影响工作效率。
(4)增加辅助解释功能
通过人工进行图像解释,存在效率低、标准不一的问题,使得图像解释这一步骤占用了大量的时间,且存在多次反复,增加了数据统计和编制报告的工作量。
2 系统设计
2.1 总体架构
铁路GPR检测数据智能管理分析系统基于B/S模式,采用分层架构,如图2所示。表现层展现用户界面,负责视觉和用户交互;业务逻辑层实现软件各类算法;公共组件层为业务逻辑层的各个模块提供公共服务;数据访问层用于同数据库进行交互,对数据的添加、删除、修改、显示等,为业务逻辑层或表现层提供数据服务;数据层采用Oracle和HDFS组合的方案。
图 2 系统架构
2.2 功能设计
根据GPR数据处理流程及系统需求分析,系统功能分为5个模块,分别为项目管理、数据管理、数据处理、图像解释、统计分析。
2.2.1 项目管理
以基础设施检测项目为核心,对项目相关的静态、动态数据进行信息化管理。静态数据包括基础设施的设计资料、 施工资料等,动态数据包括GPR原始数据、处理后数据、典型图像、异常信息等。
此外,为保证数据处理的客观性,该模块还设计了任务分配功能,项目管理员将项目涉及的GPR文件匿名分配至处理人员,并可查看数据处理进度。
2.2.2 数据管理
实现雷达原始文件上传、采集记录上传、数据下载等功能。因各类基础设施检测涉及到多种雷达品牌和型号,其文件格式各不相同。在此模块下,原始文件上传后,在服务器后台自动完成文件解析过程,将雷达文件转换为统一格式存储,文件头中的属性信息存入关系型数据库。
2.2.3 数据处理
实现雷达数据处理的功能,包含里程校正、信号处理和工作流处理3部分。里程校正功能利用采集时的打标记录,通过回归计算的方式对累积误差进行校正。信号处理功能实现了常用的雷达信号处理算法,如背景去噪、增益、滤波等,用于去除干扰信号,提高信噪比。工作流处理功能利用并行计算技术,实现多文件的批量处理,提高处理效率。
2.2.4 图像解释
实现GPR图像解释的功能,包括AI识别、数据成像、交互解释3部分。AI识别功能实现对GPR图像中各类异常的自动识别;交互解释功能用于人工解释以及复核AI识别结果是否存在错判、漏判等,这里也实现了层位追踪功能,可以浏览雷达剖面图像,修正AI识别层位结果,绘制衬砌层位、道床层位线等。
2.2.5 统计分析
实现GPR解释结果的统计分析功能,包括自动统计、图表展示、辅助报告3部分。根据项目需求,实现各类异常的数量、分布、等级等参数的自动统计,以丰富的图表形式实现结果的可视化,根据指定的格式生成报告,节约数据处理人员的工作量。
3 关键技术
3.1 并行工作流处理技术
目前,雷达软件通常缺失或只有简易的批处理功能,交互方式较为复杂,批处理步骤的计算效率很低。如果从算法并行化角度出发,则实现难度和成本较高[7]。为满足海量的数据处理需求,本研究提出了基于Hadoop大数据技术的并行工作流处理技术。并行工作流处理流程,如图3所示。
图 3 并行工作流处理流程
(1)根据GPR检测数据的特点,选取单个雷达文件进行试处理,设计相适应的标准工作流,包含若干滤波、增益等信号处理算法,采用C++编程实现。
(2)通过自定义Hadoop作业,发起一个处理作业将同时处理多个雷达数据文件,Hadoop MapReduce框架根据需要处理的文件个数,创建相应个数的map作业。一个map作业从分布式文件系统(HDFS)中读取数据文件,并将文件流传递给标准工作流的C++数据计算函数进行处理,在处理完成后,接收处理的结果数据,保存在HDFS中。多个map作业并行的处理多个数据文件,使原本的串行处理过程改造为并行的处理过程,提高了处理效率。由于雷达数据间并无关联性,无需将处理结果进行合并,所以Hadoop作业可设置为单map作业,忽略reduce过程。
为了更好地配合Hadoop MapReduce并行作业的运行,雷达数据文件将事先导入到Hadoop分布式文件系统中(HDFS),使Hadoop集群中的每个节点均可访问到需要处理的雷达数据文件。处理后的结果也将保存在HDFS中。
3.2 GPR图像智能识别方法
目前,GPR图像解释工作是通过数据处理人员进行人工判读,数据处理人员的技术水平和经验对解释结果有很大的影响。由于GPR图像的各类识别目标的特征均差异很大,判别依据并不十分明确,且判别特征非常抽象,使得提取具有表征性的特征建立特征向量的难度非常大[8-11]。而深度神经网络技术将特征提取和分类集成到一起,自动提取图像特征,可克服传统机器学习方法对特征工程的依赖,更适用于GPR图像的识别。因此,为了提高GPR图像解释的准确度和效率,本研究采用深度神经网络技术对GPR图像进行智能识别。基本流程包括如下3个主要步骤,如图4所示。
(1)建立GPR图像样本库,进行训练后建立识别模型。
(2)将GPR文件进行图像分割后,通过调用识别接口,对GPR图像进行智能识别,获取的结果为每个识别目标的类别和图像坐标。
(3)对步骤(2)获取的结果,通过拼接、去重、定位、统计等手段进行智能修正,最终的识别结果为整个文件的识别目标类型、数量和实际坐标(里程和深度)。
图 4 GPR图像智能识别方法
4 系统测试应用
为了测试系统各个功能的实际应用效果,开发完成后利用高铁隧道衬砌检测车采集的数据进行系统测试。并行计算硬件配置为CPU:Intel 至强4核处理器;内存:16 G;硬盘:200 G;网络:千兆网。智能识别采用的显卡为英伟达TITAN Xp显卡。
在5节点集群环境下,并行计算测试应用效果,如表1所示。现有软件无批处理功能,单个文件处理时长约90 s。引入该系统后,50个雷达文件处理时长约90 s,处理效率提升效果十分显著。
表 1 并行计算测试效果
利用拱顶数据建立训练样本集,利用拱腰数据建立测试样本集,对钢筋和钢拱架两类识别目标进行了训练和识别测试,取得了良好的效果,识别结果分别见图5和图6所示。在智能识别的基础上,技术人员再进行检查和修正,比全人工判读节省大量的时间和精力。
图 5 钢筋识别结果
图6 钢拱架识别结果
5 结束语
隧道、路基等铁路基础设施的智能诊断,为工程质量验收提供重要的技术支撑。为提升铁路GPR检测数据的处理效率和智能化水平,满足新建线路海量检测数据快速处理的迫切需求,本文研究设计了铁路GPR检测数据智能管理分析系统,通过基于Hadoop大数据框架的并行工作流技术实现批量文件的快速处理,采用深度神经网络技术实现GPR图像的辅助解释,并设计了项目管理、统计分析等模块减轻处理人员的工作量,可显著提升GPR检测数据处理的自动化、智能化水平。