APP下载

基于NLMS自适应滤波的实时声音信号检测识别

2014-03-14无锡市计量测试中心

上海计量测试 2014年4期
关键词:傅里叶门限滤波

周 政 / 无锡市计量测试中心

基于NLMS自适应滤波的实时声音信号检测识别

周 政 / 无锡市计量测试中心

在特定区域环境中,提出了一种基于NLMS自适应滤波的实时声音信号检测识别方法。该方法NLMS对滤波后的误差信号进行双门限检测,并以通过检测的疑似信号所持续的时间,作为其是否为目标信号的评判指标。通过对待处理声音文件的测试,该方法可以有效地去除非期望信号,保留目标信号,从而实现对目标信号的准确检测。

声音信号;NLMS滤波;特征分析;检测识别

0 引言

环境声音的检测与识别是一个非常活跃的研究对象[1],应用在许多领域当中,且其研究涉及人工智能、模式识别、数字信号处理、发声机理和听觉机理等多个学科。然而,由于背景噪声的存在,必然降低了检测阶段和分类阶段的性能,导致错误率的提升和识别率的下降。因此在实际的声音应用中,设计一个合适的检测方法,显得尤为的重要。

目前,对于环境声音事件来说,其面临着较多的困难:各种不同环境下出现的声音复杂多样,频带较宽,多种声音叠加、反射,声音长度差异大,动态范围广,发声声源种类多样等。传统的声音识别算法的识别效率低、稳定性差,很难达到要求。为此本文以厨房环境声音为例,提出了一种基于NLMS自适应滤波的声音检测方法,用于识别目标声音(油爆裂声)的起始位置,防止误识别的发生。

1 时频加窗短时傅里叶变换

短时傅里叶变换(STFT)[2]是和傅里叶变换相关的一种数学变换,用以确定时变信号其局部区域正弦波的频率与相位。由于声音信号在短时间内是局部平稳的,所以可对某一帧语音进行傅里叶变换,即短时傅里叶变换,定义式如下:

式中,ω(n-m)为窗函数序列,针对不同的窗函数序列,可以得到不同傅里叶变换结果。

由式(1)可知:短时傅里叶变换有两个变量n和ω,所以它是时间n和频率ω的时频函数。当n固定不变时,它仅是频率ω的函数,即是序列:x(n)的标准傅里叶变换。

选择汉明窗作为其时频局部化的窗函数[3],计算出各个不同时刻的功率谱。窗函数一旦确定了以后,其形状就不再发生改变,短时傅里叶变换的分辨率也就确定了。

选取一段厨房环境声音进行测试,观察各种不同声音的能量谱,为进一步的分类、识别做准备,其原始声音的时域幅值及能量谱的对照图如图1所示。

其中图1(a)为信号在时域内幅度的变化情况;图1(b)为短时能量谱,深色为高能量,浅色为低能量。此音频起始部为一段说话声音,第5 s处附近有金属撞击噪声,第12 s处目标信号音(油爆裂声)开始出现。从能量谱图中看出,目标声音是宽谱的,能量主要集中在1 500 ~ 4 500 Hz,且持续为高能量,利用这一特性有利于后续信号的辨识。而如何实现去除非目标信号干扰,正确识别12 s处的目标信号是本文后续工作的重点。

2 NLMS自适应滤波

2.1 NLMS自适应滤波基本原理

最小均方(LMS)误差自适应滤波器[4]是将输入信号x(t)通过系数可调的加权滤波器后,与期望的参考信号d(t)比较,得到误差信号e(t)。采用特定的滤波算法调节滤波器权系数w(t),最终使误差信号的均方差E[e2(t)]达到最小值,滤波器的输出更接近期望参考信号,达到最优滤波。由LMS可以推出滤波器权系数的递推公式为

归一化LMS(NLMS)算法[5-7]是一种变步长的LMS算法,比LMS算法具有更快的收敛速度。它在滤波的初始阶段,步长较大,收敛速度较快;当算法收敛后,减小步长μ,以保证较高的收敛精度。由NLMS可推出滤波权系数递推公式为

式中,γ是为了避免xT(t)x(t)过小而设定的参数,通常情况下的取值范围为 0≤γ≤1。

图1 幅值及能量谱分析图

2.2 原始信号的预处理

由自适应滤波的基本原理可知,NLMS自适应滤波器的实现需要已知输入信号的期望信号作为参考信号。但环境声音去噪处理中,很难预先已知目标声音谱信息来构建参考信号,因此常规的自适应滤波器很难满足要求。由于目标信号并非白噪声,而是由液体的振动产生,有一定的振动规律。因此本文采用一种以自身原始信号作为滤波的期望信号,使其既为原始信号也为期望信号的方法,进行自适应滤波。滤波后的误差时域图如图2所示。

从图2中可以看出,在误差时域中,目标信号之前的干扰信号被削弱,而目标信号却得以加强,起到了抑制干扰、突出目标特征的作用。滤波后以误差信号的时域幅值代替原始信号的时域幅值进行下一步的特征分析。

图2 误差信号时域图

3 端点检测

端点检测的目的就是在复杂的应用环境下的信号流中分辨出干扰信号和目标信号,并确定目标信号的开始及结束。主要通过短时能量及瞬时过零率对目标信号进行检测,当出现的信号满足目标信号的各项特征,则其被认为是目标信号,即目标信号的开始端。

3.1 检测识别基本流程

检测识别目标信号时,同时对滤波后的信号进行短时能量及瞬时平均过零率的判别。当被检测信号均超过两者的门限后,才被认定为疑似信号。对于疑似信号,将继续进行时间门限的判别,只有其超过能量及过零率门限的时间均大于已设定的时间门限,才被认为是目标信号(图3)。

图3 基本流程图

3.2 短时能量门限

首先用短时能量进行判别,并设定一个高门限,当信号能量超过此门限后,进行下一步持续时间门限判断。检测时,要对声音信号进行加窗分帧处理,如果窗的长度过大,在提高检测速度的同时导致识别率的下降;如果窗的长度过短,在提高检测识别率的同时增加了检测的时间。因此,采用动态窗长短时能量端点检测方法,在检测到疑似目标信号时使用大窗长,出现疑似目标信号后,改用小窗长。将短时能量[8-10]定义为

式中:En— 第n帧的短时能量;

Frame— 帧长;

x(i) — 第n帧下第i个采样点的值

根据式(4)对滤波后的信号做短时能量分析,结果如图4所示。

图4 短时能量图

图4(a)为信号在时域内幅度的变化情况,第5 s处附近有误导噪声,第12 s处目标信号音(油爆裂声)开始出现,这两处波形呈现明显的尖锐增大。图4(b)为能量随时间推移的变化情况,虽采用帧数计数,但其时间进度与图4(a)的时间进度完全对应。

根据图4考虑设置过渡段的时间门限,算法在检验到有疑似目标信号时开始计时,若信号短时能量值没能在设定的时间门限范围内持续,则认为其为无效信号;若超过时间门限,则认为信号有效。利用这一能量特性可以实现对信号的辨识,辨识的精确度高于传统的幅度辨识。但仅凭这个特征判断目标信号还不可靠,还需要对疑似信号作进一步的识别与确认。

3.3 瞬时平均过零率门限

过零是指信号波形穿越时间轴或零值线,对于离散时间信号而言,就是相邻的取样值符号改变。平均过零率即为单位时间(或单位样本)内过零的次数[11-12]。计算一个声音信号帧内单位时间越过零线的平均次数,可以得出其瞬时平均过零率或瞬时平均过零数。当信号瞬时平均过零率超过此门限后,进行下一步持续时间门限判断。瞬时平均过零率的计算方法可表示为

式中:n— 窗口函数变量;

m— 声音信号变量;

N— 窗口长度

根据式(5)~(7)对滤波后的信号做瞬时平均过零率分析,结果如图5所示。

图5 瞬时过零率

图5(a)为信号在时域内幅度的变化情况,第5 s处附近有误导噪声,第12 s处目标信号音(油爆裂声)开始出现,这两处波形呈现明显的尖锐增大。图5(b)为信号的瞬时过零率统计,虽采用帧数计数,但其时间进度与图5(a)的时间进度完全对应。

同样设置时间门限与过零率门限,通过短时能量判别的信号,可进一步进行过零率判别。若信号没能在设定的时间门限范围内持续,则认为其为无效信号;若超过时间门限,则认为信号有效。

4 结语

本文提出一种在室内环境中识别目标声音起始端的方法。利用NLMS自适应滤波,以自身信号作为滤波期望信号,并根据声音信号的特性,以滤波后的误差信号e代替原始信号,进行后续多重门限的识别检测。该方法在特定的环境中,对语言声音、尖锐碰撞声和一些不明的短暂噪声都具有很好的滤波效果,而多重门限的识别,保证了检出目标声音的准确性。在以后的研究中,还可以加入目标声音匹配识别,但其高精度是以高计算量为代价,并对硬件的实现,提出了更高的要求。

[1] 王浩安, 李应. 噪声环境下基于能量检测的生态声音识别[J]. 计算机工程, 2013, 39(2):174-177.

[2] 张学敏. 基于短时傅里叶变换的敏感语音提取[J]. 微型机与应用, 2009, (24): 78-81.

[3] 张玉恒, 吴启晖, 王金龙. 基于时频加窗短时傅里叶变换的LFM干扰抑制[J]. 电子与信息学报, 2007, 29(6): 1361-1364.

[4] 陈丛, 卢启鹏, 彭忠琦. 基于NLMS自适应滤波的近红外光谱去噪处理方法研究[J]. 光学学报, 2012, 32(5): 286-291.

[5] 万政伟, 惠晓威, 朱婷. 基于NLMS算法的自适应滤波器的研究与应用[J]. 计算机系统应用, 2010 (4): 46-48.

[6] 倪锦根, 李锋. 变步长NLMS自适应滤波算法研究[J]. 计算机应用与软件, 2009, 26(1): 248-250.

[7] 张银行, 杨辉媛, 宋志国. 基于归一化LMS算法的自适应滤波器设计[J]. 吉首大学学报 (自然科学版), 2012, 33(2).

[8] 吕卫强, 黄荔. 基于短时能量加过零率的实时语音端点检测方法[J]. 兵工自动化, 2009, 28(9): 69-70.

[9] 李景川, 董慧颖. 一种改进的基于短时能量的端点检测算法[J]. 沈阳理工大学学报, 2008, 27(3): 37-39.

[10] 张仁志, 崔慧娟. 基于短时能量的语音端点检测算法研究[J]. 电声技术, 2006 (7): 52-54.

[11] 刘波霞, 陈建峰. 基于特征分析的环境声音事件识别算法[J]. 计算机工程, 2011, 37(22):267-269+273.

[12] 蔡萍. 一种结合短时过零率的快速语音端点检测算法[J]. 厦门理工学院学报, 2013, 21(2): 48-51.

Realtime voice signal detection and recognition study based on NLMS adaptive fi lter

Zhou Zheng
(Wuxi Measurement Testing Center)

In a particular region environment, proposes a real-time voice signal detection and recognition method based on NLMS adaptive fi lter. The method of double threshold detection of the error signal after NLMS fi ltering, and through the suspected signal detection for extended periods of time, as if it is the evaluation index of the target signal. By treating the sound file processing test, the method can effectively remove the nonexpected signal, preserve the target signal, in order to achieve accurate detection of target signal.

sound signal; NLMS fi lter;feature analysis;detection and recognition

猜你喜欢

傅里叶门限滤波
基于规则的HEV逻辑门限控制策略
随机失效门限下指数退化轨道模型的分析与应用
基于Neyman-Pearson准则的自适应门限干扰抑制算法*
双线性傅里叶乘子算子的量化加权估计
基于小波降噪的稀疏傅里叶变换时延估计
基于傅里叶变换的快速TAMVDR算法
生产性服务业集聚与工业集聚的非线性效应——基于门限回归模型的分析
RTS平滑滤波在事后姿态确定中的应用
基于线性正则变换的 LMS 自适应滤波
快速离散傅里叶变换算法研究与FPGA实现