一种分布式光纤传感系统的信号识别方法
2018-11-14吴红艳
帅 师,王 翦,吴红艳,贾 波,艾 鑫
(1.复旦大学 材料科学系,上海 200433; 2.上海复旦智能监控成套设备有限公司,上海 201906)
随着光纤技术的发展,光纤传感系统在通信、医疗、航空、军事、能源和安防等方面得到了高度的重视和广泛的应用[1-5].光纤传感系统是集光学技术、电学技术、信号处理技术于一体的综合性系统,可用于测量应力、温度、声音等多种物理量,具有抗电磁干扰、耐腐蚀、灵敏度高、结构简单、安全可靠等优点,能够应用于一些传统传感器无法使用的环境,比如核磁共振室、长距离野外管道以及海洋等极端环境[6-8].
分布式光纤传感技术是光纤传感技术中的一个重要分支,该技术利用光纤的一维空间特性对环境中的物理量进行测量,光纤既作传感元件,又作传输介质.目前,常用的分布式光纤传感技术有光时域反射技术(Optical Time Domain Reflection, OTDR)、光纤双光束干涉技术和准分布式光纤布拉格光栅复用技术[9-11],其中OTDR技术存在盲区且仪器体积较大,布拉格光栅复用结构比较复杂,而光纤双光束干涉法构造简单、精度高[12-14],故本文采用这种方法.
将该系统布设在所需环境中,可以对各种入侵信号进行监测和报警.目前,入侵信号定位技术已很成熟,以往的算法通常是将采集到的信号直接进行定位[5].在实际应用中,系统因其极高的灵敏度可能对入侵信号和非入侵信号均进行定位计算和报警,既浪费系统内存,又因误报对使用单位造成困扰.因此,对光纤传感系统所采集的信号预先进行模式识别,准确区分入侵信号与非入侵信号是一个亟待解决的问题.目前,关于分布式光纤传感系统模式识别的研究较少,常见的方法是提取出时域或频域信号中的某一特征参量,如强度、方差、短时平均能量、短时过电平率等,然后利用统计学方法进行分类[7,15-18].这些方法的实现步骤较为复杂,识别准确率较低,容易受到外界干扰,在复杂环境中的可靠性较低.
本文将语音信号模式识别中常用的Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)特征提取法应用于分布式光纤传感系统的信号特征提取,并用支撑向量机(Support Vector Machine, SVM)分类器进行模式识别.对实际应用中的敲击、剪切等入侵信号和吹风(用电风扇模拟)、下雨(用浇水模拟)等非入侵信号进行了分析,达到了良好的识别效果,实现了较高的识别率.该技术可以有效屏蔽风雨的干扰,提高系统的运行效率,具有很强的实用价值.
1 分布式光纤传感系统
本文所使用的分布式光纤传感系统的结构如图1所示.本系统是MZ干涉仪与Sagnac干涉仪的混合结构,如图1所示,其中: SLD为超辐射发光二极管光源;C 1为3×3耦合器;TD为延迟线圈;C 2为2×2耦合器;FRM为法拉第旋转镜;PIN 1、PIN 2为两个光电探测器;DAQ为数据采集卡,采集到的数据最终输入计算机进行处理.
图1 分布式光纤传感器结构图Fig.1 Schematic diagram of the distributed optical fiber sensor
光源发出的光经过3×3耦合器C 1后分为两路: 一路经延迟线圈进入2×2耦合器C 2;另一路直接进入2×2耦合器C 2,从2×2耦合器C 2出来的光经扰动点后在法拉第旋转镜处返回,经过2×2耦合器C 2后又分为两路,所以最终有4种路径的光信号汇集到光电探测器: 路径1(1-5-7-8-9-10-9-8-6-4);路径2(1-4-6-8-9-10-9-8-7-5);路径3(1-5-7-8-9-10-9-8-7-5);路径4(1-4-6-8-9-10-9-8-6-4).
由于只有光程差小于光源相干长度的两束光才能发生干涉,所以本系统中只有路径1与路径2两束光可以互相干涉.当有外界扰动时,两束光产生相位变化,由于这两束光到达扰动点的时间不同,因此形成相位差,进而在3×3耦合器C 1处发生干涉,干涉信号由光电探测器转换,经采集卡输入计算机进行解调.
根据光弹效应,光传播过程中相位的变化与外界扰动信号成正比[19-20].假设t时刻在距反射镜L位置处有频率为ω的正弦扰动信号,其引起光纤中传输的光的相位变化为φ0sinω(t),光束经路径1回到3×3耦合器C 1处的相位变化可以表示为:
Δφ1(t)=φ0sinω(t)+φ0sin[ω(t+τL)],
(1)
其中:ω为外界扰动频率;τL=2neffL/c;neff为光纤有效折射率;c为真空中光速.同理,光束经路径2回到3×3耦合器C 1处的相位变化可以表示为:
Δφ2(t)=φ0sin[ω(t+τD)]+φ0sin[ω(t+τD+τL)],
(2)
其中τD为光束经过延迟线圈的时间.所以,发生干涉的两束光的相位差可以表示为:
Δφ(t)=Δφ2(t)-Δφ1(t).
(3)
光电探测器PIN 1和PIN 2探测到的两束光信号的光功率可以表示为:
(4)
根据文献[21]介绍的相位还原方法,将光电探测器探测到的信号经光电转换输入计算机进行解调,即可还原出扰动引起的光相位变化φ0sinω(t).
2 MFCC特征提取
MFCC模拟了人耳的听觉特性,人耳对不同频率的声音有不同的感知,人耳听到的频率与实际频率存在这样的映射关系[22]:
(5)
其中:fMel为Mel频率;f为实际频率.根据式(5)可以作出如图2所示的曲线图,可以发现,在1kHz以下Mel频率和实际频率近似为线性关系,在1kHz以上近似为对数关系.
在分布式光纤传感系统中,外界扰动信号本质上是由振动引发的音频信号[23],这种传感信号与语音都具有长时非平稳、短时平稳、不连续等性质[24],所以可以将用于语音信号特征提取的MFCC方法用于光纤传感系统的信号.MFCC的计算流程如图3所示.
图2 Mel频率与实际频率的关系图Fig.2 Graphical relationship between Mel frequency and real frequency
图3 MFCC参数计算流程示意图Fig.3 Block diagram of MFCC extraction algorithm
首先,对经过解调后的信号进行分帧和加窗处理,因为外界扰动信号具有短时(10~30ms)平稳的特性,所以需要把一段长信号划分为每段长度为10~30ms的短信号,并对分割后的信号加汉明窗;然后,对时域信号进行快速傅里叶变换(Fast Fourier Transform, FFT)转化到频域,将得到的线性频谱通过Mel频率滤波器组后得到Mel频谱S(k),其中Mel频率滤波器组是一组梳状滤波器,每个滤波器的中心频率在Mel尺度上是等间距的,前一滤波器的中心频率是后一滤波器的起始频率,滤波器个数由信号截止频率决定;最后,将Mel频谱取对数,并进行离散余弦变换(Discrete Cosine Transform, DCT)变化,得到Mel倒谱:
(6)
文献[25]的研究表明,声音信号的大部分信息都保留在低频部分,因此,我们只取C(1)到C(12)这12维MFCC参数.
3 SVM模型
20世纪90年代,Vapnik等基于统计理论中的结构风险最小化原理提出了SVM模型,该方法建立一个分类超平面作为决策平面,使得两类数据之间的隔离边缘最大化[26-27].SVM适应能力强、分辨准确率高,相较于决策树算法、贝叶斯算法、遗传算法、关联规则分类等分类算法,它在解决小样本、非线性及高维模式识别中有许多特有的优势,在模式识别领域有重要应用[28].光纤传感系统需要长时间布设在野外,样本库的训练通常在前期完成,因此“小样本训练、高识别率”的SVM算法非常适合于该系统.
3.1 SVM二分类原理
当两类信号线性可分时,可以用线性SVM找到空间中的最优平面划分两类数据.在分布式光纤传感系统中,由于噪声的存在,采集到的信号是线性不可分的,此时需要将线性不可分的样本映射到高维空间,使其线性可分,映射后空间的最优分界面为:
(7)
(8)
(9)
(10)
将式(10)代入式(9)可将目标函数化简为:
(11)
相应的分类决策函数为:
(12)
(13)
3.2 SVM多分类原理
本文需要区分多种类型的扰动信号,本质上是一个多分类问题.SVM常用于二分类问题,但是它也适用于多分类情况,假设输入数据共有k类样本,现有的算法主要有以下几种[29]:
(1) “一对多”判决法
依次用一个二分类SVM分类器(以下简称分类器)将一类样本从剩余样本中区分出来,对于k类样本共需要k个分类器;
(2) “一对一”判决法
在任意两类样本间都设计一个分类器,对于k类样本共需要k(k-1)/2个分类器.当未知样本输入时,每个分类器都对其进行识别,给出一个类别判断,最后“得票最多”的类别即为最后的识别结果;
(3) 层次判决法
层次分类法是一个倒立的二叉树结构,首先将输入样本划分为2个子类,再将各子类再次划分成次级子类,如此循环下去,直到得到一个单独的类别为止.层次判决法可以有不同的二叉树结构,在使用时需要合理选择分类结构.
研究[30]表明,“一对一”判决法SVM分类器具有良好的分类效果,我们实验中也选择了这种方法.
4 实 验
图4 实验算法示意图Fig.4 Block diagram of the experiment
搭建如图4所示的光路系统,将传感光缆(即图1中8~10段)布设在围栏上,系统所用光纤为标准单模光纤,光源为波长为1310nm的激光光源,数据采集卡使用NIDAQPCI-6122,采样率为200kHz,信号处理部分由LabVIEW 2015和MATLAB R2015b共同完成,算法示意图由图4所示.
对布设在围栏上的光缆实施动作,采集敲击、剪切、吹风、下雨(其中吹风以电风扇模拟、下雨以浇水模拟)4类信号各100个、共400个信号,每个信号长度为0.5s,即100k点.为了提高数据的可靠性,每种信号均由4位实施者完成.为了提高运算速度与准确率,我们对每个数据进行降采样处理,降采样因子为10,信号点数由100k点下降为10k点.典型的原始信号时域图和频域图如图5所示,
图5 原始信号时域图与频域图Fig.5 Original signals and relevant frequency spectra
可以看到每种信号的频带都集中在1kHz以下,剪切信号的主频带在100Hz和250Hz附近,敲击信号的主频带在80Hz和200Hz附近,吹风信号频谱和下雨信号频谱的幅值均很小,50Hz左右的低频信号为环境噪声,所以这两类信号的主频带分别在400Hz处和250Hz处.4类信号有明显的频谱特征,由此可以推断基于频谱变换的MFCC特征提取方法是有效的.
接下来,为了进一步提取出有用信号,排除无效环境噪声的影响,对信号进行端点检测,通过短时平均能量方法识别信号发生起跳点,从起跳点开始截取3k点,至此这3k点包含的就是有效扰动信号.经过这些处理后,按图3流程提取每个信号的MFCC参数,这4类信号的MFCC参数如图6所示.
图6 4类信号的MFCC特征参数Fig.6 Four kinds of original signals’ MFCC
表1 识别结果
注: 1)为平均值.
最后,构建SVM模型,选定合适的模型参数,从4类信号中随机选择20个样本作为训练集送入SVM分类器进行训练.训练结束后,将剩余的每类80个样本作为测试集输入分类器进行识别,识别结果如表1所示.
从识别结果可以看出,MFCC和SVM模型相结合的模式识别方法具有良好的识别效果,对敲击、剪切两类入侵信号的识别率分别为97.50%和95.00%,对吹风、下雨两类非入侵信号的识别率均为100.00%,对4类信号的综合识别率为98.13%.人为入侵信号具有一定随机性,不同的实施者所制造的扰动信号在强度、持续时间等方面都有差别,而自然环境声音等非入侵信号相对稳定,此即实验中非入侵信号识别率略高于入侵信号的原因.光纤传感系统通常布设在野外环境,受到环境噪声的影响很大,本文提出的模式识别技术能够准确区分入侵信号与非入侵信号,识别结束后,系统仅需对入侵信号进行定位和报警,节省了系统内存空间,提高了系统运行效率.将该系统布设于某中学周界,将光纤绑在铁艺围栏上用于传感和信号传输,系统连续运行一个月,风雨天气实现零误报.
5 结 论
本文基于分布式光纤传感系统所采集到信号的特点,借鉴传统的语音信号检测方法,提出了一种用MFCC方法提取特征参数、用SVM模型进行识别的分布式光纤传感系统信号模式识别方法,能够准确区分入侵信号与非入侵信号.实验中仅选取每类信号中20个样本作为训练集,而80个样本作为测试集,分类结果验证了SVM算法在小样本训练集上的优异性能.本文提出的分类算法计算流程简单,识别准确率高,受环境影响小,具有很强的实用性.实验系统运行稳定,性能良好,能够推广到实际应用中,先利用本算法对光纤传感系统采集到的信号进行模式预判,排除风雨等非入侵信号的干扰,仅对入侵信号进行定位和报警,很大程度上降低了误报率,能够提升分布式光纤传感器的工作性能.