基于EMD的ICA语音增强
2015-03-23李云飞全海燕肖春梅
李云飞, 全海燕, 肖春梅
(昆明理工大学 信息工程与自动化学院, 昆明 650093)
基于EMD的ICA语音增强
李云飞, 全海燕*, 肖春梅
(昆明理工大学 信息工程与自动化学院, 昆明 650093)
传统ICA方法是将所有源信号都从混合信号中都提取出来,而参考独立分量分析(ICA-R)通过将一些先验信息引入到ICA学习算法中,从混合信号中仅提取期望源信号.本文为了从混合语音信号中提取出期望的语音信号,采取的是基于经验模态分解(EMD)方法来获取功率谱包络作为参考信号,继而把参考信号运用到ICA-R算法中,达到语音增强的目的.计算机仿真和性能分析结果表明,此方法在有噪声干扰的情况下达到语音增强的目的.
盲源分离; 独立分量分析(ICA); 参考独立分量分析(ICA-R); 经验模式分解(EMD); 语音增强
独立分量分析(Independent component analysis,ICA)是一种重要的盲源分解方法,其目的是从多通道测量所得到的由若干独立信源线性组合成的观测信号中,将其中的独立成分分解开来[1-3].参考独立分量分析(ICA-R)是一种根据一些先验信息即参考信号,从诸多的源信号中提取我们感兴趣的源信号的方法,从而消除传统ICA输出顺序不确定性和显著减低运算,大大节省处理时间等优点.因此,提供或者构造一个合适的参考信号对期望信号的提取有着至关重要的影响[4-5].
由于语音的功率谱是不连续的(主要分布在300 Hz~4 KHz之间),而噪声的频谱范围在300 Hz~4 KHz之间),而噪声的频谱范围分布较宽,分布也比较均匀,与语音的功率谱有明显的区别.因此,我们可以利用语音信号功率谱来获得语音信号近似功率谱包络来作为参考信号,从线性混合噪声中提取目标语音信号.
经验模态分解(Empirical Mode Decomposition,EMD)是非线性、非平稳信号处理方法,通过多次移动过程把信号分解成一系列本征模函数(IMFs),可以通过部分IMFs来重构原信号,本文EMD被用作低通滤波器来获得语音信号功率谱包络,相比于传统的低通滤波器而言,EMD的方法分解的速度很快,而且EMD得到的包络更加细腻,能够追踪语音功率谱短暂急剧变化的边缘,这对于精确提出期望语音信号至关重要[6-7].因此本文中提出了基于EMD参考信号的选取,并把EMD提取的功率谱包络作为参考信号运用到ICA算法中,实现了语音信号增强的目的[8].
1 ICA-R算法
ICA-R的基本思路是将输出信号与参考信号的接近性度量引入到ICA算法中的差异函数中,从而得到一个约束最优化问题,再利用拉格朗日乘子算法找到约束优化问题的最大值,得到解混向量[5].设分离矩阵为W,使得M维输出矢量ym(k)满足:
y(k)=WTx(k)=WTAs(k).
(1)
设参考信号为r,那么r与ym(k)接近性度量函数ε(y,r)当且仅当输出信号是期望源信号的估计取到最小值,即应满足一下不等式:
(2)
因此存在一个阈值δ使得g(w)=ε(y,r)-δ≤0 当且仅当输出信号y(k)=WTx(k) 时成立,从而在约束独立分析的框架内,将输出信号与参考信号的接近性度量引入到ICA的差异函数中,可得出一单元ICA-R的约束最优化问题:
Max:j(y)≈ρ[E{G(y)}-E{G(v)}]2.
(3)
St:g(w)=ε(y,r)-δ≤0,
h(w)=E{y2}-1=0.
(4)
本文选用G(y)=log(cosh(y)/a),ε(y,r)为输出信号y和参考信号r的接近度量,本文选用均方误差函数ε(y,r)=E{(y-r)2}-δ作为输出信号和相应的参考信号之间的紧密性的量度.利用拉格朗日乘子算法找到上述约束优化问题的最大值,可以得到ICA-R算法如下:
(5)
(6)
(7)
其中,k是迭代下标,是学习速率,RXX是输入混合信号的协方差阵,最佳乘数μ和λ可以由以下迭代算法得到:
μk+1=max{0,μk+γg(wk)},
(8)
λk+1=λk+γh(wk).
(9)
其中,γ为标量惩罚因子.
2 基于EMD方法构建参考信号
2.1EMD分解算法
经验模态分解(EMD)是非线性,非平稳信号处理方法,是基于信号的局部变化特征,通过对非线性非平稳信号的分解获得一系列表征信号特征的时间尺度固有模态函数(intrinsic mode functions,IMFs)[6-7].EMD方法的存在基于以下3个假设:(1)数据中至少有两个极值点:一个最小值、一个最大值;(2)特征时间尺度由两个相邻极值点的时间间隔所决定;(3)如果数据没有极值点只有拐点,则通过一阶或多阶微分得到极值点.下面给出EMD的算法步骤如下:
1)求得信号x(t)有的所有极值点,确定数据序列的局部极大值集Xmax和局部极小值集Xmin.
2)在极值点间用3次样条函数进行插值,得到上下包络线emax(t)和emin(t),在上下包络之间是原始数据x(t).
3)计算均值线m(t)=[e(t)max+emin(t)]/2和求出原始数据x(t)的局部均值m(t),原始信号与局部极值的差值记为d(t)=x(t)-m(t).
4)检查d(t)的特性,如果不满足IMFs定义,则用d(t)代替x(t),重复以上步骤,直到满足停止准则.
5)如果d(t)满足IMFs的两个条件,则得到第一个IMFs,用参r(t)=x(t)-d(t)取代x(t),重复上面步骤,直到r(t)=x(t)-d(t)至多有两个极值点.
2.2 参考信号的构建
语音的功率谱是不连续的,而噪声的频谱分布较宽且较均匀,两者的功率谱有明显的区别,于是依据期望语音信号频谱特性来构建参考信号.下面对语音信号的功率谱包络进行EMD分解,并构建参考信号.
图1 语音信号波形
图2 语音信号的功率谱
图3 本征模态函数c1~c5
图4 本征模态函数c6~c10
图5 部分IMFs的合成语音功率谱
图1、2为语音信号波形及其功率谱,对图中的语音信号的功率谱进行EMD分解,得到各IMFs分量,如图3和4所示.依据EMD原理,我们分别选择、、求和得到合成信号,如图5所示.而对于基于EMD构造的参考信号不需要准确的近似功率谱,仅仅只要能够含有语音信号的能量分布信息即可,因此小数量的IMFs,足以包含此类信息[9-10].
3 ICA-R算法实现语音增强的实验
为了验证基于EMD构建参考信号方法的混叠语音增强效果,我们做了大量基于EMD的ICA-R语音增强的仿真实验,以其中一些例子进行介绍.期望增强的源语音信号s1及其功率谱,分别如图6(a)和6(b)所示.四路干扰噪声信号依此为:白噪声(a)、工厂机械噪声(b)、鸡尾酒会噪声(c)、纯语音噪声(d),分别如图7(a)~(d)所示.实验中对于基于EMD构造的参考信号的语音增强,我们选用c3~c8本征模态函数之和来近似功率谱,并以此参考信号,如图8所示.实验中用到的语音信号以及噪声信号均来源于Loizou语音实验室的语音库,每路信号的采样频率都为8 kHz,采样点为18 000个.
图6 目标语音信号s1及其功率谱
图7 四路噪声信号
图8 基于EMD构建的参考信号
随机二维混合矩阵A选取为[0,1]上的随机矩阵,源语音信号和四路干扰噪声分别经过矩阵A混合得到含噪声的观测信号及基于EMD参考信号输出语音信号分别如图9-图12所示.
从下如图9~图12可以直观的看到基于EMD的语音增强信号波形与源语音信号都大体相同,为了定量的评价算法分离性能,我们利用PESQ-MOS语音质量评估算法对得到的结果进行语音质量评估.源信号s1在四种加性噪声下ICA语言增强后的SNR和PESQ-MOS分值分别如下表1所示.
图9 语音与白噪声两路混合信号以及ICA-R恢复的语音信号
图10 语音与工厂机械噪声两路混合信号及ICA-R恢复的语音信号
图11 语音与鸡尾酒会噪声两路混合信号及ICA-R恢复的语音信号
图12 语音与纯语言噪声两路混合信号及ICA-R恢复语音信号
表1 SNR、PESQ-MOS性能指标结果
从表1中可以看出,在4种加性噪声下,得到的PESQ-MOS值还是比较高的.由于在听觉上和原语音并无多大的差异,该实验还是可行的.因此,基于EMD参考信号的选取及其在ICA-R中的应用是一种可行的语音增强方法.
4 总结
本文提出了基于EMD构建参考信号的ICA-R语音增强方法,选用小数量的IMFs求和可以得到原始语音信号近似功率谱,就可以构建合理的ICA-R参考信号,提取期望语音信号.计算机仿真和性能分析都表明,此方法在加性噪声干扰下可以取得比较好的语音增强效果.尽管实验的结果还是比较让人满意,但是还存在一些不足,比如说在和纯语音噪声混合后取得的效果就不是很理想,以及在没有加性噪声的情况下怎么增强语音信号等等,都值得进一步研究.
[1] Zhang Zhilin. Morphological constrained ICA for extracting weak temporally correlated signals [J]. Neurocomputing, 2008.71. 1669-1679.
[2] Hyvarinen A, Oja E. A Fast Fixed-point Algorithm for Independent Component Analysis [J]. Neural Computation, 1997, 9(7):1483-1492.
[3] 黄灿辉. 独立分量分析在盲信号分离中的应用研究[D].重庆:重庆大学, 2006.
[4] Lu Wei, Rajapakse J C. ICA with Reference[C]//Proc of the 3rd International Conference on ICA and Blind Source Separation. [S. l.]: Springer, 2001: 120-125.
[5] 郑永瑞. 参考独立分量分析算法及其应用研究[D]. 大连:大连理工大学, 2005.
[6] 罗飞雪. 基于EMD与ICA的GPS动态变形检测数据处理方法研究[D].长沙:中南大学,2011.
[7] 李宁宁. 基于EMD和ICA的感应电动机故障检测研究[D].天津:天津理工大学,2011.
[8] 林秋华, 郑永端, 殷福亮. 基于参考独立分量分析的语音增强方法[J].大连理工大学学报, 2005, 46(6):915-1000.
[9] 林秋华. 参考独立分量分析算法及其应用研究[D].大连:大连理工大学, 2005.
[10] Yongrui Zheng, Qiuhua Lin, Fuliang Yin, et al. Speech Enhancement Using ICA with EMD-based reference.[J]. Computer Science, 2006, 3889: 739-746.
Speech enhancement using ICA with EMD
LI Yunfei, QUAN Haiyan, XIAO Chunmei
(Institute of information engineering and automation,Kunming University of Science and Technology, Kunming 650093)
The traditional ICA that recovers all the source signals simultaneously, Independent component analysis with reference( ICA-R) can extract only some desired source signal from mixtures of all source signals by incorporating a prior information into the separation process. In this paper, in order to extract the desired speech signal from the mixed speech signals, is based on empirical mode decomposition (EMD) method to get the power spectrum envelope as a reference signal, and then apply the reference signal in the ICA-R algorithm, achieve the purpose of speech enhancement. Computer simulation and performance analysis results show that this method can achieve the purpose of speech enhancement when in a case with noise interference.
Blind source separation; Independent component analysis(ICA); ICA with reference(ICA-R); empirical mode decomposition(EMD); speech enhancement
2014-05-25.
国家自然科学基金项目(41364002),云南省自然科学基金项目(2009ZC048M).
1000-1190(2015)01-0042-05
TN911.25
A
*通讯联系人. E-mail: quanhaniyan@163.com.