APP下载

基于特定听觉特征的盲信号提取方法

2018-11-15王心怡

声学技术 2018年5期
关键词:峭度先验波形

王心怡



基于特定听觉特征的盲信号提取方法

王心怡

(昆明船舶设备研究试验中心,云南昆明 650051)

针对参考信号波形难以构造等情况,提出一种利用期望源信号听觉特征进行信号盲提取的方法,根据源信号的听觉特征先验知识,将提取信号与期望信号听觉特征向量的接近程度作为度量,使用非线性最小二乘法进行迭代计算分离向量,提取出与期望信号在听觉特征上最为接近的源信号。对这种方法进行了理论推导,并使用不同类型的信号进行了仿真。仿真结果表明,该方法具有良好的效果,且由于仅利用了信号的听觉特征,而不需要参考信号的具体波形,对于不同类型的信号,具有广泛的适应性,具有良好的应用价值。

盲源分离;盲源提取;听觉特征;非线性最小二乘

0 引言

近年来,盲源分离广泛应用于生物医学、无线通信、图像处理、阵列信号处理等领域[1-3]。在实际应用中,感兴趣的信号往往只是某一个或几个源信号,将特定的源信号提取出来,就称为盲提取。文献[4]提出了一种将特定频带信号提取出来的盲提取方法。文献[5]提出了首先将具有最大峭度的信号提取出来的盲提取算法。文献[6-7]提出了一种针对特定峭度信号的盲提取方法,它可以将峭度在某一范围内的源信号提取出来。另一类盲提取方法是参考独立分量分析(Independent Component Analysis-Reference, ICA-R)方法,将信号的先验知识以参考信号的形式加以利用,只提取出期望的源信号。在ICA-R中,通过引入一个接近性度量函数,将传统独立分量分析(Independent Component Analysis, ICA)问题转化为一个新的约束最优化问题,接近性度量函数常用的有分离输出信号与参考信号的均方误差,或分离输出信号与参考信号的瞬时相关性,使用这些接近性度量,通常需要根据源信号的波形构建参考信号,如源信号的符号函数或同频正弦信号等。

在很多情况下,从混合信号中提取特定的期望源信号存在很大的困难,主要原因有两个方面:一是难以找到一种合适的度量准则。例如,多个源信号的频谱有很大重叠,峭度也很接近,在提取期望的源信号时难以确定一个合适的峭度范围;二是难以根据期望的源信号构建参考信号,限制了ICA-R等方法的使用,例如很多时候只能得到源信号的某些统计特性,而没有源信号的波形样本,不具备源信号波形有关的先验知识,无法构建参考信号;并且有些源信号具有较强的时变性,已有源信号的波形先验知识与混合信号中的该源信号接近性很差,也无法准确估计出该源信号。

本文提出一种基于源信号听觉特征的盲提取方法,将提取信号与期望源信号听觉特征的接近程度作为度量准则,提取出与期望信号在听觉特征上最接近的源信号,这种方法不需要构建参考信号,也不需要源信号波形的先验知识,对源信号的频带、峭度等也没有限制,只要源信号的听觉特征是稳定的,就能够以较好的效果提取出期望的源信号。

1 信号的听觉特征

信号的听觉特征是保证正确提取源信号的重要因素。听觉特征有很多种,用于信号盲提取的听觉特征应具有以下特点:(1) 具有很高的区分能力,能够充分体现不同的源信号之间的差异,而对同一个源信号在状态变化时保持相对稳定;(2) 特征参数在受到环境噪声影响和信道变化时能够保持稳健;(3) 易于计算等。

对于声学信号,可以使用的特征包括线谱、线性预测系数(Linear Prediction Coefficient, LPC)、Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficient, MFCC)等。根据研究,使用MFCC作为特征参数,在不同环境下可以保持较好的稳定性[8-10],对于不同的源信号具有较好的区分能力,并且对于同一个源信号,MFCC在信号的基频、相位等参数发生较大变化时仍保持稳定,因此,本文采用MFCC作为信号的听觉特征。

MFCC模拟人耳的听觉机理,人耳在嘈杂的环境中,以及各种变异情况下仍能正常地分辨出各种语音,具有很高的识别正确率,其关键因素之一就是耳蜗的作用。耳蜗实质上相当于一个滤波器组,其滤波作用是在对数频率尺度上进行的,在1 000 Hz以下为线性尺度,而1 000 Hz以上为对数尺度,这就使得人耳对低频信号比对高频信号更敏感,因此可以根据这个特性,构造一组类似耳蜗的滤波器来模仿人耳对声音的特征提取方式。

MFCC参数的计算过程是将信号通过临界频带滤波器组,然后转换到倒谱域,流程如图1所示。

其中,为Mel滤波器组的滤波器个数。

图1 MFCC参数提取流程

Fig.1 Flow chart of MFCC parameter extraction

2 基于听觉特征的盲提取

设有个源信号,观测到的维混合信号为源信号的瞬时线性混合,即

其中,为维源信号,为×维混合矩阵,为维观测信号,本文讨论=的情况。

3 仿真验证

仿真使用3个源信号,分别是频率为500 Hz的方波信号、谐波成分为150、350、550、750、950、1 150、1 350 Hz的多频正弦信号和粉红噪声信号,3个源信号的波形如图2所示,仿真信号采样率为10 kHz,横坐标为采样点数,纵坐标为波形幅度。将3个源信号:方波、多频正弦信号和粉红噪声信号按照混合矩阵:

进行加权得到的3通道混合信号,其波形图如图3所示。

图2 源信号

Fig.2 Source signals: 1. square wave signal, 2. multi-frequency sinusoidal signal, 3. pink noise signal

图3 图2中源信号的混合信号

使用本文方法对源信号2进行提取,听觉特征MFCC先验值是采用与源信号2相同的谐波能量比构造的多频正弦信号,取多个采样时段计算,再求平均值。这个统计的先验MFCC向量与任意一段符合该谐波能量比的信号都具有较强的相似性。

真实源信号和使用本文方法提取出的信号如图4所示,提取的源信号与真实源信号的相关系数为0.979 9。

图4 提取出的期望源信号

图5是提取信号的听觉特征MFCC向量与先验特征的比较。由图5可以看出,提取信号在听觉特征上与先验值很相似,计算出的相关系数为0.923 6。

图5 提取出的源信号的听觉特征

对峭度相近的信号进行仿真,3个源信号分别为两种不同乐器的独奏音乐信号及汽车引擎声音信号,如图6所示,源信号的归一化峭度值分别为-0.343、-0.146、-0.346。将源信号按照混合矩阵

进行加权得到混合信号,混合信号波形如图7所示。

使用本文方法提取其中一个音乐信号。使用音色相同的乐器的其他音乐片段信号进行听觉特征MFCC的计算,对多段信号样本分别计算MFCC,并取平均值。

提取出的幅度归一化音乐信号如图8所示,该乐器的先验MFCC、提取信号的MFCC如图9所示,由图9可以看出,本文方法提取出的源信号与该乐器在听觉特征上更为接近。

根据仿真结果可以看出,提取信号与真实源信号的相似程度较高,听觉特征接近期望的源信号,当混合的源信号数目较多、无法获取当前混合的源信号波形参考信息时,本文方法能够较好地提取期望的源信号。

图6 源信号

图8 提取出的音乐信号

图9 提取出的音乐信号的听觉特征

4 结论

本文提出一种以期望信号听觉特征作为参考的盲提取方法,使用非线性最小二乘法求解分离向量,提取出特定的源信号。在无法得到参考信号具体波形的情况下,能够有效地实现信号提取。仿真结果表明,本文方法对不同类型的信号都有较好的稳健性,不受峭度等特性的影响。本文方法具有较为广泛的适应性和良好的应用价值。

[1] COMON P. Independent component analysis, a new concept[J]. Signal Processing, 1994(36): 287-314.

[2] CICHOCKI A, AMARI S. Adaptive blind signal and image processing[M]. New York, USA: Wiley, 2002.

[3] 陈晋央, 吴瑛. 基于独立分量分析的波束空间波达方向估计算法[J]. 声学技术, 2012, 31(2): 227-231.

CHEN Jinyang, WU Ying. Beam-space direction of arrival (DOA) algorithm based on independent component analysis[J]. Technical Acoustics, 2012, 31(2): 227-231.

[4] CICHOCKI A, THAWONMAS R, AMARI S. Sequential blind signal extraction in order specified by stochastics properties[J]. Electronics Letters (S0013-5194), 1997, 33(1): 64-65.

[5] CICHOCKI A, RUTKOWSKI T, SIWEK K. Blind signal extraction of signals with specified frequency band [C]//Proceedings of the 2002 12th IEEE Workshop on Neural Networks for Signal Processing, Switzerland. USA: IEEE, 2002: 515-524.

[6] 季策, 王艳茹, 王晓宇. 一种基于标准峭度的新型复数盲分离算法[J]. 东北大学学报(自然科学版), 2015, 36(5): 614-617.

JI Ce, WANG Yanru, WANG Xiaoyu. A new complex blind source separation algorithm based on standard kurtosis[J]. Journal of Northeastern University(Natural Science), 2015, 36(5): 614-617.

[7] 陈寿齐, 沈越泓, 马明, 等. 基于峭度的稳健特定信号盲提取[J]. 系统仿真学报, 2008, 11(22): 6093-6096.

CHEN Shouqi, SHEN Yuehong, MA Ming, et al. Robust extraction of specific signal based on kurtosis[J]. Journal of System Simulation, 2008, 11(22): 6093-6096.

[8] 刘若伦, 张家琦. 乘法模型下西洋乐器音色特征[J]. 声学技术, 2009, 28(3): 269-275.

LIU Ruolun, ZHANG Jiaqi. Timbre features of western instrument under multiplication model[J]. Technical Acoustics, 2009, 28(3): 269-275.

[9] 石超雄, 李钢虎, 何会会, 等. 基于提升小波变换的MFCC在目标识别中的应用[J]. 声学技术, 2014, 33(4): 372-375.

SHI Chaoxiong, LI Ganghu, HE Huihui, et al. Application of the lifting wavelet transform based MFCC in target identification[J]. Technical Acoustics, 2014, 33(4): 372-375.

[10] 朱知萌, 郭育, 王冠, 等. 水下蛙人呼吸声Mel倒谱特征的实验研究[J]. 声学技术, 2017, 36(3): 286-292.

ZHU Zhimeng, GUO Yu, WANG Guan, et al. Experimental research on Mel cepstrum feature of the underwater diver breathing-signal[J]. Technical Acoustics, 2017, 36(3): 286-292.

Blind signal extraction based on specific auditory feature

WANG Xin-yi

(Kunming Shipbuilding Equipment Research and Test Center, Kunming 650051, Yunnan, China)

In the case that the reference signal waveform is difficult to provide, a blind extraction method based on auditory feature is proposed in this paper. According to the known auditory feature, the accessibility of auditory features between expected signal and extracted signal is treated as a measure, the nonlinear least square algorithm is used to calculate the separation vector in order to extract the source signal that is closest to the expected signal in auditory feature. The theory of the method is described in this paper, and the simulation is also performed with different kinds of signals. The simulation result shows the effectiveness of the method, which needs no waveform but only the auditory feature of reference signal. And, the method is adaptive to different kinds of signals and has a good performance in practical applications.

blind source separation; blind source extraction; auditory feature; nonlinear least square

TB566

A

1000-3630(2018)-05-0496-05

10.16300/j.cnki.1000-3630.2018.05.015

2017-06-15;

2017-08-20

王心怡(1983-), 男, 内蒙古锡林浩特人, 硕士, 高级工程师,研究方向为声学信号处理。

王心怡, E-mail: wxy345135@163.com

猜你喜欢

峭度先验波形
基于MCKD和峭度的液压泵故障特征提取
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
基于无噪图像块先验的MRI低秩分解去噪算法研究
基于LFM波形的灵巧干扰效能分析
用于SAR与通信一体化系统的滤波器组多载波波形
谱峭度在轴承故障振动信号共振频带优选中的应用
基于自适应块组割先验的噪声图像超分辨率重建
基于鲁棒性小波包峭度图的滚动轴承故障诊断*
基于ARM的任意波形电源设计
双丝双正弦电流脉冲波形控制