基于CNN 的光纤振动传感信号特征提取和识别
2023-11-20孙磊峰张姝慧时二伟
孙磊峰,张姝慧,时二伟
(国家管网西部管道兰州输气分公司,甘肃 兰州)
引言
分布式光纤振动传感系统对油气管道沿线的振动信号进行采集分析,能够作为油气管道安全监测的重要手段。油气管道的敷设环境复杂多样,在途径公路以及人员活动频繁的区段,光纤振动传感系统极易受到强噪声背景、多源干扰及未知地埋条件的影响,系统对目标事件检测识别的准确率成为制约其规模及应用的最大技术瓶颈。
油气管道光纤振动信号分析,通常采用的方法为设计时域和频域特征计算方式,再利用计算的特征数值进行模式识别[1-2],然而对于不同区域的光纤振动信号采用固定的人工设计特征计算方式,缺乏一定的灵活性。本文对油气管道周边常见的威胁信号和非威胁信号进行了分析,并对基于机器学习模型的多维信号检测识别算法进行了探究。
1 振源分析
在油气管道周边存在的各类挖掘动土施工都可能对油气管道造成破坏,威胁油气管道的安全。而常见的干扰源主要有:公路、铁路、农耕机械作业,分析收集到的各种振动信号样本库,对单个探测单元接收的一维信号进行时域和频域的分析比对,可以看出,其主要可以包含的振动模式有“冲击”模式和“机械振动”模式。“冲击”模式指时域信号具有明显的规律性,“机械振动”模式指时域信号振动幅值相对其邻近点区域较大但不具有规律性;而从频域观察,“冲击”模式和“机械振动”模式均具有高频成分明显提升的特点。不同类别的振动信号,其模式构成可做如下概括,见表1。
通过对数据库的分析比对发现,挖掘机作业、破路机作业与火车经过、重型车辆行驶、工厂作业、农耕机械作业、农田灌溉机械等信号均包含“冲击”模式和“机械振动”模式;人工挖掘与放牧动物群经过等信号主要包含“冲击”模式;挖沟机作业、破路机作业、盾构机作业主要包含“机械振动”模式。对管道和其伴行光纤真正具有威胁性的几种作业行为,主要为多种机械作业行为,其振动信号所包含的模式成分并不一致,而几种干扰信号却含有与挖掘作业信号相似的激励成分。因此,如果仅仅依靠对单个监测单元信号提取固定的人工设计的特征参数,是很难对干扰振动进行有效区分的,所以,需要利用时间和空间上的信号分布做出更为严密的模型进行分析判断,再结合深度学习算法,提高监测系统的识别和报警效果。
2 模型测试
依据分布式光纤振动传感系统的每个探测单元各自的一维信号提取的人工设计特征,当管道周边出现新的振动源或者地理环境发生变化时,可能需要进行特征提取方式的再次设计,对于区分管道周边出现的各种威胁性和非威胁性的振动源,缺乏一定的灵活性,需要进一步结合深度学习算法,对振动信号进行类型识别。从时间维度而言,应从传统人为经验的特征提取方式到深度学习网络特征提取方式进行探究。从时频、时空等多维度信息而言,可从基于机器学习模型的多维信号检测识别算法进行探究。
卷积神经网络CNN 广泛应用于图像处理领域,而分布式光纤振动传感系统的每个探测单元采集的振动信号,实质上为1D 信号。目前研究中,对1D 信号如语音、振动信号进行处理分析时,主要有三种思路[3-5]:一是将1D 信号通过某种变换转化为图像,如将原始光纤振动信号进行短时傅里叶变换得到时频图,再利用CNN 对时频图进行学习和分类;二是利用1D-CNN 处理振动信号,直接输入1D 数据,基于1D-CNN 神经网络,对一维的光纤振动数据进行特征的提取和类型的识别;三是结合CNN 与BiLSTM 网络,先用1D-CNN提取时间序列的信号特征,再利用BiLSTM 网络实现信号分类。
本文基于从多个现场应用项目长期运行收集和整理得到的信号样本数据库,对以上三种CNN 应用思路进行探究,并从识别准确性和计算性能等方面进行了比较。
2.1 基于CNN 的振动信号时频图特征提取和识别
时频分析计算步骤:
(1) 对于单个光纤监测单元的振动探测信号,以长度为256 的窗函数,重叠数据点数200,按时间顺序进行滑动截取;
(2) 对于每次窗口中截取得到的数据序列,依次进行快速傅里叶变换(fft),并记录本次计算得到的频谱数据序列;
(3) 将窗口滑动过程中每次计算得到的频谱数据序列,进行拼接,得到时频分析矩阵,时频分析矩阵的横轴为频率,纵轴为时间。
经过以上计算步骤,将振动信号时频图作为原始的输入图片,输入到LeNet-5 卷积神经网络,采用LeNet-5 卷积神经网络进行信号区块的模式识别。
2.2 基于1D-CNN 的振动信号特征提取与识别
CNN 可以很好地识别出数据中的简单模式,然后使用这些简单模式在更深的层中生成更复杂的模式。本文采用的1D CNN 模型描述如下:
输入数据:原始数据采样率400 Hz,每条样本记录时长为20 s,数据经过解调预处理后,每条数据样本中包含有8 000 个采样点,得到一个8 000×1 的矩阵。
第一个1D CNN 层:卷积核大小设置为400,滤波器数量设置为80。输出矩阵7 601×80。
第二个1D CNN 层:卷积核大小设置为400,滤波器数量设置为80。输出矩阵7 202×80。
第一个池化层:池化层大小设置为5,步幅stride设置为1。输出矩阵1 440×80。计算区域中的最大值作为池化后的值,即最大池化层。
第三个1D CNN 层:卷积核大小设置为720,滤波器数量设置为60。输出矩阵721×60。
第四个1D CNN 层:卷积核大小设置为720,滤波器数量设置为60。输出矩阵2×60。
第二个池化层:池化层大小设置为2,步幅stride设置为1。输出矩阵1×60。计算区域中的平均值作为池化后的值,即平均池化层。
Dropout 层:比率设置为0.6,输出矩阵1×60。
Softmax 层:将长度为60 的向量降为长度为12 的向量,因为此时有12 种事件类别需要进行识别。
2.3 基于CNN-BiLSTM 的时空信号特征提取与识别
结合CNN 与BiLSTM 的网络,提出了一种基于CNN-BiLSTM 的分布式光纤振动传感时空信号特征提取与识别方法。CNN 网络从一维时序光纤振动信号中自动提取和生成模式特征,BiLSTM 网络结合时序振动模式特征的空间分布信息,对分布式光纤振动传感系统采集的激励振动信号进行类型识别。
CNN 与BiLSTM 网络结合的分布式光纤振动信号特征提取和模式识别的方式,在有效利用了分布式光纤振动信号空间维度信息的同时,能够自适应的提取到光纤振动信号的模式特征,避免了人工设计固定特征计算方式复杂度高、灵活性低的问题,对于处在不同的土质、湿度、埋深等地理环境的光纤振动信号,都能够进行有效的特征提取以及类型识别,在工程应用中,能够有效的降低在工程部署实施阶段的系统配置复杂度,并能够在长期运行阶段,根据新出现的各种外界激励,加入系统的训练样本数据库,进行持续的自适应优化,确保油气管道安全监测系统的监测效果,具有明显的技术优势。
2.4 分析比较
基于从多个现场应用项目长期运行收集和整理得到的信号样本数据库,使用十折交叉验证方法,对上述三种算法模型进行测试,其分类准确性统计如图1 所示。基于CNN 的振动信号时频图特征提取和识别准确率约为91.1%,基于1D-CNN 的振动信号特征提取与识别准确率约为95.5%,基于CNN-BiLSTM 的时空信号特征提取与识别准确率约为95.6%。三种模型的识别准确率均>90%,1D-CNN 和CNN-BiLSTM 的识别准确率相近,均高于CNN-时频图方法。
图1 三种模型十折交叉验证正确率统计
不同模型识别单个振动信号样本的平均计算耗时如图2 所示。基于CNN 的振动信号时频图特征提取和识别平均计算耗时约0.010 2 s,计算数据为每个振动信号样本中具有最大幅值的探测单元数据;基于1D-CNN 的振动信号特征提取与识别平均计算耗时约0.005 6 s,计算数据为每个振动信号样本中具有最大幅值的探测单元数据;基于CNN-BiLSTM 的时空信号特征提取与识别平均计算耗时约0.006 3 s,计算数据为每个振动信号样本中幅值超过全体数据中值的探测单元数据。其中,CNN-时频图方法计算耗时最长,CNN-BiLSTM 比1D-CNN 模型的运行时间略长,但三者均满足实时监测的要求。
图2 三种模型计算耗时统计
3 结论
本文对油气管道周边常见的威胁信号和非威胁信号进行了分析,并对基于机器学习模型的多维信号检测识别算法进行了探究。由于管线周边出现的信号源复杂多样,仅依靠对单个监测单元信号提取人工设计的特征参数很难对具有威胁性的振动源进行有效区分,利用深度学习算法模型,自动提取振动信号特征,对振动信号的时间和空间特征分布进行更为灵活和严密的分析,避免人工设计的固定特征对不同的环境自适应差的问题,进一步提升信号特征信息提取的全面性、有效性。并基于从多个现场应用项目长期运行收集和整理得到的信号样本数据库,对CNN-时频图方法、1D-CNN 和CNN-BiLSTM 等三种CNN 应用思路进行了探究,并从识别准确性和计算性能等方面进行了比较。经过测试结果的统计分析,三种模型的识别准确率均>90%,1D-CNN 和CNN-BiLSTM 的识别准确率相近,均高于CNN-时频图方法。在计算耗时方面,CNN-时频图方法计算耗时最长,CNN-BiLSTM比1D-CNN 模型的运行时间略长,但三者均满足实时监测的要求。