APP下载

智能化声音信号检测铁轨异常

2022-05-16张华钟陈安东

黑龙江交通科技 2022年3期
关键词:参量梅尔铁轨

王 磊,张华钟,陈安东

(江苏省铁路集团有限公司,江苏 南京 210018)

1 前 言

传统的铁道松动的检测手段主要是通过经验丰富的铁道工人通过敲打铁轨,通过铁轨回音来识别铁轨是否发生松动[1-2]。这种方式对工人的技术要求较高,并且识别的成功率不稳定,容易出现漏判,误判的情况。为了提高识别的准确率,降低人为因素的影响,同时针对目前铁道安全检测系统尚待升级,政府和百姓愈发重视交通安全性的现状,我们提出了结合计算机人工智能算法的思路,构建全自动化的智能识别系统。

2 算法介绍

2.1 梅尔频率倒谱系数

梅尔频率倒谱系数(MFCC)在1980年由Davis和Mermelstein所提出,是一种在语音识别中广泛使用的特征。MFCC是梅尔频率倒谱的系数,来自于音讯片段的倒频谱[3]。倒谱和梅尔频率倒谱的差异主要是梅尔频率倒谱的频带划分是等距划分的,它比用于正常的对数倒频谱中的线性间隔的频带更能近似人类的听觉系统。通过这样的表示手段,可以在多个领域中使声音信号有更好的表示[4]。

MFCC特征提取主要分为以下几个步骤。

(1)将声音信号分解为多框。(2)将声音信号高通滤波。(3)通过FFT将信号变换至频域。(4)将频谱通过梅尔滤波器,得到梅尔刻度。(5)在每个梅尔刻度上提取对数值。(6)对结果进行IDFT变换,变换到倒频谱域。(7)MFCC就是这个倒频谱图的幅度。

2.2 概率线性判别分析

概率线性判别分析(PLDA)最早由Prince等人提出,PLDA与LDA相比,PLDA也是将数据投影到低维空间中,从而最大化类间距离。PLDA具备LDA不具备的优势,它能同时考虑到数据和噪声来建模,实现比LDA更佳的实验效果[5]。

2.3 主成分分析

主成分分析是从原始样本数据里的多个参量提取出几个贡献率较高的主成分,每个主成分都可以最大程度体现样本数据的最主要特征,相互独立,在保留样本数据主要特征的同时,最大限度的减少数据量[6-7]。PCA将原始数据中大量的参量通过分析最后获取几个贡献率最大的主成分,降低建模难度,同时选出更为精简更能突出数据特征的数据。但是,在实际案例样本的研究中,为了完成多元统计分析中的数据特征提取,需要记录众多影响结果的主成分。因为每个参量都从不同的角度上反映了数据的特征,如需要反映一个人的总体情况,可以从身高,外貌,品质的不同角度来体现一个人的特征;而且参量与参量之间可能存在着一定的联系,例如学生的学习成绩和家庭关系的和睦程度是有着一定的联系的,因而原始统计数据反映的信息存在重复点。当然,目前已经有一些方法可以较好的规避重复性带来的数据冗余以及其对提取主成分的影响。

PCA是从数个主成分来体现出样本整体特征,将我们原始数据中许多相关性很高的参量转化成彼此相互独立或不相关的主成分。通常是选出少数几个,能体现数据的主要特征的几个主成分,用来代表原始数据的主要特征并完成数据降维[8]。

(1)数据采集

本实验通过专业的声波仪每隔10 m采集一次铁棒敲击铁轨的声音,并通过铁道专业人士检查铁轨是否出现松动。未松动标签设置为0,松动标签设置为1;一共采集了200例未松动铁轨的声音信号,183例松动铁轨的声音信号。

(2)结果分析

数据处理如图1所示,我们首先将200例未松动铁轨的声音信号和183例松动铁轨的声音信号按照7:3划分为训练集和测试集。训练集:160例未松动铁轨的声音信号和150例松动铁轨的声音信号;测试集:40例未松动铁轨的声音信号和33例松动铁轨的声音信号。然后分别提取训练集和测试集的MFCC特征,将提取出的特征作为PLDA模型的输入构建识别模型,最终结果显示针对测试集中未松动铁轨识别准确率100%,松动铁轨识别准确率为98.5%,表现出了MFCC-PLDA模型有着极好的识别效果。PCA-PLDA模型对测试集中未松动铁轨识别准确率90%,松动铁轨识别准确率为95%。该模型的分类效果相对比MFCC-PLDA模型效果要差,主要原因可能与MFCC更适合提取声音相关的特征,而主成分分析法相对语音重要特征提取的能力较MFCC要弱一些[9]。此外我们还将MFCC-PLDA识别模型的结果与有经验的铁路工人根据经验来判别的结果进行了对比,工人根据经验针对测试集中未松动铁轨识别准确率90%,松动铁轨识别准确率为96.67%;工人识别结果明显低于MFCC-PLDA模型结果,与PCA-PLDA模型的结果相当,再次表明了未来通过人工智能算法可以比人工更好解决该问题。

图1 MFCC-PLDA数据分析模型

3 总 结

本研究基于铁轨松动这一研究点,通过MFCC算法进行语音特征提取,然后使用PLDA分类器构建一种全新的自动化识别方法来替代传统的人工识别手段,此外我们还与PCA-PLDA模型进行了对比,最终模型的识别结果显示模式识别算法可以有效地提高了自动化识别的精确率和工作效率,为未来构建智能化的铁道安全监控系统奠定了基础。

猜你喜欢

参量梅尔铁轨
含参量瑕积分的相关性质
基于含时分步积分算法反演单体MgO:APLN多光参量振荡能量场*
梅尔维尔鲸
铁轨之间:一战停战百年鉴
“熊”视眈眈
光参量振荡原理综述
自然条件下猪只运动参量提取算法
铁轨接口处为什么有缝
一米菜园
梦想是眼睛,第一个攀上珠峰的盲人探险家