基于EMD的语音功率谱分析
2012-07-13魏霖静
周 慧,魏霖静
(甘肃农业大学 信息科学技术学院,甘肃 兰州 730070)
语音信号的功率谱反映了单位频带内信号能量随频率的分布、变化情况,它在语音技术分析研究领域中发挥了重要的作用。长期以来对语音信号功率谱的研究都是基于语音信号的短时平稳和发音线性的假设,这些不能很好的体现语音信号的非线性、非平稳的特点。近年来,随着对语音信号处理要求的提高,人们提出了许多处理非平稳、非线性信号的方法。其中美国NASA的Huang N E博士于1998年提出的一种新的非平稳信号分析法[1]:经验模态分解法受到研究者的青睐。这种方法依据信号自身局部特征时间尺度从原信号中提取出若干个固有模态函数(IMF)和一个残余量,分解出的各个IMF分量突出了数据的局部特征,具有较强的自适应性,可更准确有效地把握原数据的内在特性。文中首先利用经验模态方法,分解出了语音的IMF分量,然后对它们的功率谱特征作了分析研究。
1 经验模态分解方法(EMD)
经验模态分解法[2-5]就是将输入信号分解成多个带有物理特性的固有模态函数(IMF)。它是基于一种简单的假设:任何复杂的信号都是由不同的简单固有模态函数组成,每一个模态可以是线性的、非线性和非平稳的,其局部极值点和过零点的数目相同,在相邻的两个零交叉点之间只有一个极值点,且任何两个模态之间是相互独立的,这样的任何一个信号就可以被分解为有限个固有模态函数之和,其中任何一个固有模态函数(IMF)都满足以下条件:
1)整个数据序列的极大极小值数目与过零点数目相等或最多相差1。
2)数据序列的任意一点由极大值所确定的包络与由极小值所确定的包络均值始终为零。
实信号进行EMD分解的步骤为:
1)找出分解信号x(t)上的所有极大值点和极小值点,分别拟合出信号x(t)的上下包络线,确保所有的点在两个包络线之间,计算上下包络线的平均值m1(t);
2) 定义h1(t)=x(t)-m1(t),如果h1(t)满足 IMF 定义的两个条件,则为第一个IMF分量,如果h1(t)不满足上述的条件,则将h1(t)作为上述过程中的x(t) 来进行筛选,直到k时刻,h1(t)变成了一个 IMF,于是有h1k(t)=h1(k-1)(t)-m1k。 然后,指定c1=h1k,c1即为第一个IMF分量。
3)c1可以通过这个公式r1=x(t)-c1从剩余的数据中分离出来,残余函数r1仍然包含了不同长周期成分的数据。它又被看成是新的数据,经过上述同样的筛选过程。
2 语音功率谱分析
2.1 语音信号预处理
考虑到声门脉冲形状和口唇辐射对音信号的频谱产生高频衰落的影响,在分解信号前先用一个简单的一阶FIR滤波器1-az-1对于分析的语音进行预加重,提升其高频部分,一般预加重的系数取a=0.95。预处理后的语音信号再按照EMD分解步骤分解出IMF分量。
2.2 选取参数模型估计功率谱
现有的估计功率谱方法主要是经典的非参数估计法和现代参数估计法。文中选用了现代参数估计法中AR模型的Burg算法来估计信号功率谱。
AR模型的Burg算法[6-7],是按照前向和后向线性预测器的预测均方误差和最小为准则,以Levinson-Durbin递推为约束的条件来进行谱估计的。它相对自相关算法而言,不需要加窗截取信号,且分辨率和稳定性较好。Burg算法估计功率谱公式为:
其中apk是利用Levinson递推关系求出的所有AR模型参数,为AR模型激励白噪声的方差。
3 实验结果
3.1 实例分析
取情感语音数据库中一女性发音人在愤怒情绪下发出的汉语元音[a]作为分析信号,EMD分解后的结果如图1所示。
图1 分解的IMF分量Fig.1 IMF components after EMD
从图1可以看出,每个IMF分量包含了不同的时间尺度,其中IMF1~IMF3分量的频率总体较高,包含了语音信号中的主要信息,剩余的IMF分量和残余量的频率较低,因此实验中对前3个IMF分量进行了功率谱的分析,信号功率谱分析过程中采用了AR模型的Burg算法,结果如图2~图5所示。
图2 IMF1分量的功率谱Fig.2 Power spectrum of IMF1
图3 IMF2分量的功率谱Fig.3 Power spectrum of IMF2
图4 IMF3分量的功率谱Fig.4 Power spectrum of IMF3
对比观察图2~图5可发现一般方法得到的是基于信号整体或者是不同时刻的功率谱,分辨率相对较低,而利用EMD方法的功率谱估计则体现了不同时间尺度分量的功率谱,它是从信号分解的角度研究了信号的功率谱特性,分辨率较高、曲线平滑、峰值特征明显。
图5 一般方法分析的功率谱Fig.5 Method power spectrum based on general method
3.2 特征统计
采用上述方法对同一人在4种不同情感状态下发出的汉语语音的元音[a]分别进行了实验,并将IMF1~IMF3分量中的峰值特征统计如表1所示。
表1 峰值特征统计表Tab.1 Peak feature statistics
分析表1发现不同情感的IMF峰值特征差异较大。4个不同情感状态的第一阶IMF峰值特征中,中性的第一峰值点功率最大,其次是厌恶和惊奇,生气的最小。而随着IMF阶数的增高,在生气和中性情感的IMF1~IMF3功率谱中,第一峰p值呈现出一种单调递减的趋势,这表明两者内在的IMF分量有一定的相似性,而对于惊奇和厌恶,p值总体为递减趋势,局部有转折,这两者有相似性。由此可见,基于EMD方法的功率谱分析,能更直观的显示出不同情感语音的数据特征和内在的IMF分量特性。
4 结束语
针对语音信号的非平稳、非线性的特点,文中提出了一种先基于经验模态分解方法(EMD)[8]分解信号,而后再利用现代参数模型法估计出功率谱的方法。与传统的功率谱方法相比,它有效地提高了分辨率,充分地体现了语音信号内在的特征,这对今后相关领域的研究提供了一种可行的方法。
[1]Huang N E,Long S R.The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[J].Pro.Roy.Soc.Lond.A,1998,454(12):903-905.
[2]Deléchelle E ,Lemoine J,Niang O.EmpiricalMode Decomposition:An Analytical Approach for Sifting Process[J].IEEE Signal Processing Letters,2005,12(11):764-767.
[3]钟佑明,秦树人.希尔伯特-黄变换的统一理论依据研究[J].振动与冲击,2006,25(3):40-44.
ZHONG You-ming,QIN Shu-ren.Research on the uniform theoretical basis for Hilbert-Huang transform(HHT)[J].Journal of Vibration and Shock,2006,25(3):40-44.
[4]张小蓟,张歆,孙进才.基于经验模态分解的目标特征提取与选择[J].西北工业大学学报,2006,24(4) :453-456
ZHANG Xiao-ji,ZHANG Xin,SUN Jin-cai.Improving feature extraction of ship-radiated target signals with Empirical Mode Decomposition (EMD) and Hilbert Spectrum[J].Journal of Northwestern Polytechnical University,2006,24(4):453-456.
[5]刘慧婷,倪志伟,李建洋.经验模态分解方法及其实现[J].计算机工程与应用,2006,32(11):44-47.
LIU Hui-ting,NI Zhi-wei,LI Jian-yang.Empirical Mode Decomposition method and its implementation[J].Computer Engineering and Applications,2006,32(11):44-47.
[6]罗丰,段沛沛,吴顺君.基于Burg算法的短序列谱估计研究[J].西安电子科技大学学报:自然科学版,2005,32(5):724-728.
LUO Feng,DUAN Pei-pei,WU Shun-jun.Research on short sequence power spectrum estimates based on the Burg algorithm[J].Journal Of Xidian University,2005,32 (5):724-728.
[7]姚文俊.自相关法和Burg法在AR模型功率谱估计中的仿真研究[J].计算机与数字工程,2007,33(10):32-35.
YAO Wen-jun.Research on AR model power spectrum estimation based on the algorithm and burg algorithm[J].Computer&Digital Engineering,2007,33(10):32-35.
[8]李赛,张勇,刘欣.基于经验模态分解法的短期负荷分层预测[J].陕西电力,2011(10):7-10.
LI Sai,ZHANG Yong,LIU Xin.A stratified short-term load forecasting method based on empirical mode decomposition[J].Shaanxi Electric Power,2011(10):7-10.