APP下载

频谱相似评价改进语音信号增强

2020-10-21罗春梅

机械设计与制造 2020年10期
关键词:背景噪声环境噪声频谱

罗春梅

(辽东学院机械电子工程学院,辽宁 丹东 118000)

1 引言

实际环境中干扰噪声的存在影响了语音信号的质量,也从也容易影响到人与人之间正常的语音交流。随着海经济效益的提高,在大型船舶海上航行环境下工作和生产变得越来越频繁,而船舶环境下语音通讯与交流必不可少,但船舶航行过程中各种设备产生的巨大噪声,严重干扰了通讯端语音信号,使得有用的语音不能被正常接收,影响了船舶工作者的正常交流,因此,削除语音信号通讯端工作环境中船舶的噪声干扰,增强语音信号,对语音交流的准确性和舒适性有重要意义,而要在船舶噪声持续存在的环境中,实现语音信号增强,首先需要将含有语音的信号段从复杂多变而又长久持续的船舶背景噪声中正确的检测分离出来,进而通过谱减法等方法进一步实现语音增强。

由于噪声的持续存在,首先从源信号中将含有语音的信号片段(后续简记为语音段)与不含语音仅含有环境噪声的信号片段(后续简记为噪声段)正确分割,然后通过谱减法等方法仅对语音段进行增强,是持续强噪声环境下确保语音信号有效增强同时保证算法效率的关键,针对此,学者相继提出了以短时谱能量[1]、短时分形维维数[2]、过零率[3]、多重回归[4]及修正谱估计[5]等为特征的算法,对含噪信号的语音段和噪声段进行检测分割,但这些方法用于以船舶为背景噪声的环境时遇到了困难[6]。船舶背景噪声和语音信号的这种特征复杂多变使得已有的检测方法因类内特征离散度大而失效,因此需要探索新的语音段和噪声段的检测分离方法以适应船舶背景噪声特征,通过提高语音段的检测精度,为后续谱减法的有效使用作准备。

样本熵是由Richman 提出的用于衡量序列复杂性的一种改进方法[7]。由于语音信号与船舶背景噪声信号的产生机理不同,语音信号是由肺部气流经声道震荡产生,而船舶产生的背景噪声则与其结构、材质和发动机转动等相关,因而两种信号时间序列的新信息产生程序各不相同[8],而复杂性则描述了出现新信息量的程度,为此,在分析信号短时频谱相似评价基础上,根据信号中新信息量的差异,通过提出基于信号归一化样本熵特征的语音段检测方法,实现了语音段与噪声段的精确检测和分段,以用于基于谱减法的语音段信号增强。实测数据实验验证表明,算法取得了较好的检测结果,有利于语音信号的增强。

2 信号特征分析

船舶辐射的背景噪声与话音信号本身都为复杂多变的信号,现有方法提取的特征大都表现出较强的类内离散及类间重叠[6],为此根据信号生成机理提出基于信号频谱相似评价的含噪语音中语音段检测方法,信号样本的频谱相似评价分析如下。

船舶作为一种工作环境有其本身的特殊性,船舶背景噪声主要由船舶发动机、发电机等各种设备的运行产生[5],对于实际的工作环境,船舶自身的大小、材料、发动机类型等会成为其噪声特性的决定性因素[9],这说明当在一个较短时间内分析其噪声特点时,由于船舶自身运动状态及发动机状态等通常会保持一个较稳定的状态,因而对噪声进行频谱等各种特征分析时,频谱在分析时间段内会有较好稳定性,如图1 所示。图中频谱进行了平滑处理,可以看出,其相邻帧的频谱分布表现出较大的相似性,即具有短时稳定性。

图1 船舶背景噪声帧间频谱相似特性Fig.1 Spectral Similarity of Noise Between Adjacent Frames

语音信号由肺部气流经声道震荡产生[10],其有意义的最小单元为音素组成的单词。音素为声腔可发出的最小发声单位,每个音素的产生方法和声道部位各不相同,因而其对应的频谱波形也各不相同。一段语音信号中会选择各种不同单词来表达内容,而每个单词又由多个不同的音素组成,因而在一段语音发声时,需要通过各种不同的音素发声引起气流、声门和声道的不断变化,从而表现出即使在一个较短时间内,其相邻时间帧信号的频谱分布等特征由于音素频谱波形的存在而表现出较大的差异,如图2所示。图中所示为纯净语音信号信号经分帧处理后相邻帧信号的频谱分布特性,其频谱计算方法与图1 相同,且都进行平滑处理。

综上所述,由于不同的发声机理,语音信号与船舶背景噪声信号的短时频谱相似性出现了较大的不同,对于背景噪声信号,其短时帧间频谱分布相似性较大,说明其短时序列中的新信息量较少,而语音信号帧间频谱差异较大,说明短时内序列的新信息量会较多,因而通过反映信号复杂度的样本熵来描述这种新信息量差异,可以实现两种信号的判别。

图2 语音信号帧间频谱分布特性Fig.2 Spectrum Character of Speech Signal Between Adjacent Frames

3 基于样本熵的语音信号检测

3.1 样本熵的物理意义

样本熵的定义为数据向量由m 维增加至m+1 维时继续保持其相似性的条件概率,可以表示为[10]:

式中:N—信号长度;r—相似容限;Bm(r)和Bm+1(r)的定义,如式(7)所示。

序列较复杂而使其新息产生概率较大,则其样本熵值就会偏大[11]。样本熵通过序列统计来衡量序列复杂性,表征数据的前后变化,较短的数据长度即可完成估计。

3.2 计算频谱分布趋势

实测信号受噪声污染会其短时频谱中存在不确定的瞬时突变,影响频谱的相似评价鲁棒性[12],为此,算法在进行相似评价之前先对频谱进行曲线拟合平滑,计算频谱曲线的变化趋势。用N个邻接的滤波器进行滤波,再作平方积分和归一化处理,并计算分贝值,得到频谱的每帧估计值f(w)。

式中:f(w)′—位置标准化后的频谱值。于是有f(w)′>0,然后进一步得到归一化的频谱值为[13]:

式中:f(w)″—归一化频谱值,可以反映曲线的趋势,且满足f(w)″≥0 和∑f(w)″=1,故可按概率密度函数处理。

3.3 提取样本熵特征

设每帧长度为N 的含船舶背景噪声的语音信号经过预处理后为x,其组成m 维向量为:

语音信号与背景噪声信号的样本熵在一定时间内的分布,可以看出由于语音信号的短时频谱分布不具有稳定的相似性,而船舶背景噪声具有较好的短时频谱相似性,两种信号的样本熵表现出明显的差异,通过设置合理的阈值,可以实现信号段的检测分割,如图3 所示。

图3 语音段及噪声段样本熵差异Fig.3 Difference of Sample Entropy Between Speech and Noise

4 基于样本熵的信号段判别

对于采样率为11025Hz 的输入信号,基于样本熵的信号判别算法的实现步骤为:

(1)信号分帧。对信号预加重和汉明窗分帧,每帧512 个数据点,帧移点数为256。实验中,m=2,容许值r=0.2。

(2)对信号段进行初始判别。根据式(8)计算样本熵,根据式(9)计算自适应阈值。

其中:λ1与 λ2i=1,2,…,N-m+1 的值通过试验确定,这里取值为λ1=4 和λ2=6,u,δ 为信号的均值与标准差。比较的SampEn值与Threl 的值:如果SampEn≤Threl,信号为语音信号;如果SampEn>Threl,信号为辐射噪声。从而实现对每一帧信号的初始判别。

(3)邻域平滑处理。根据同一种信号通道持续一定时间的规律,以当前信号帧及其前两帧信号作为当前帧类别判断的的邻域,对信号进行平滑处理。当邻域帧信号中有两帧以上的信号的类别为环境噪声信号,则当前帧信号最终类别判定为环境噪声;反之亦然。在平滑阶段以邻域帧信号的初始判别类型为判据。

5 算法实验验证

实验使用实测数据对提出的算法进行验证,其中不同类别的船舶工作环境噪声数据400min,不同的说话人和录制环境的各种语音数据共400min,数据采样率均调整为11025Hz。

将实测信号数据分成三组以验证算法对船舶背景噪声语音信号段检测的准确性,第一组全部使用不时间和不同工况船舶背景噪声,主要验证在长时间持续的背景噪声中无语音信号时算法的效果;第二组实验将语音信号数据与背景噪声数据各取相同时间长度连接成一个实验数据进行实验,其中语音数据与噪声数据使用不同的数据文件,主要验证算法对于语音段的起始位置检测是否准确;第三组实验中语音信号与背景噪声信号随机出现,且每种信号的时长从1s 到30s 随机选择,验证算法对语音信号段的检测准确性。实验部分结果,如图4 所示。图中四个子图从下到上分别为(a)为时域幅值;(b)为计算得到的归一化样本熵分布,其中三条横线为进行平滑所需要的阈值;(c)为未进行平滑处理的初始判别结果,其中坐标纵轴中1 代表识别结果为环境噪声,2代表环境噪声待定,3 为语音信号待定,4 代表判定结果为语音;(d)为经平滑后的最终判断结果。从图中可以看出,三组实验中算法都取得了准确的判别结果。

图4 语音信号与环境噪声判别算法处理结果Fig.4 Results of the Discrimination of Speech and Radiated Noise

进一步通过式(10)来衡量算法判别的精度[15],即:

所有信号数据进行实验后得到的判断精度结果,可以看出,基于信号样本熵的语音信号与环境噪声信号判别算法的检测精度较好,如表1 所示。对实验结果分析后得出,语音信号的检测精度相对偏低,其主要原因是信号中的静音帧,其频谱特征与背景噪声相近,但其不影响后续语音增强。

表1 信号判别精度实验结果Tab.1 Signal Discrimination Accuracy Experiment Result

6 结论

通过分析语音信号与船舶工作环境噪声信号的不同产生机理,利用两种信号在时间序列中出现新信息量的差异,在比较信号相邻短时帧频谱相似性基础上,通过归一化样本熵实现信号的判别。文中仅使用样本熵一个特征,避免了多特征之间的相关性带来的不确定因素以及特征值的计算带来的计算量较大等不足,实测数据实验结果验证了算法的准确性。

猜你喜欢

背景噪声环境噪声频谱
窄带电力线通信信道背景噪声抑制方法
一种用于深空探测的Chirp变换频谱分析仪设计与实现
环境噪声智能检测终端设计
一种基于稀疏度估计的自适应压缩频谱感知算法
基于云服务的环境噪声智能监测系统研究
应用背景噪声成像研究祁连山地区地壳S波速度结构
南海某海域环境噪声与风速相关性研究*
铁路环境噪声测量中的问题分析
认知无线电频谱感知技术综述
海上单道地震勘探中船舶等背景噪声的影响分析及压制