基于EMD和MFCC的舒张期心杂音的分类识别
2017-06-19李宏全郭兴明郑伊能
李宏全, 郭兴明, 郑伊能
(重庆大学 生物工程学院,重庆市医疗电子技术工程研究中心,重庆 400044)
基于EMD和MFCC的舒张期心杂音的分类识别
李宏全, 郭兴明, 郑伊能
(重庆大学 生物工程学院,重庆市医疗电子技术工程研究中心,重庆 400044)
心音信号是一种具有非线性和非平稳特性的振动信号,基于线性时变或时不变模型的特征提取方法势必会忽略信号的一些内在信息,为了更好的反映心音的本质特征,提出了一种经验模式分解(Empirical Mode Decomposition,EMD)结合Mel频率倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC)的舒张期心杂音的分类识别方法。心音信号经EMD分解得到有限个固有模态函数(Intrinsic Mode Function,IMF),利用互相关系数准则筛选出主IMF分量,分别提取主IMF分量的MFCC、MFCC的一阶差分系数和Delta值,以此作为隐马尔科夫模型的输入向量,实现对临床采集的正常心音和2类舒张期心杂音分类识别,实验结果表明,该方法能有效的识别心音。
舒张期心杂音;经验模式分解;Mel频率倒谱系数;隐马尔科夫模型
心音是人体重要的生理信号之一,由心肌收缩、心脏瓣膜启闭和血液撞击房室壁、大动脉壁等引起的振动所产生的声音。心杂音是指在正常心音与额外心音之外,在心脏收缩或舒张过程中由层流的血液转变为湍流或漩涡而冲击心壁、大血管壁、瓣膜、腱索等使之振动而在相应部位产生的异常声音。心杂音包含重要的病理信息,对于心血管疾病的诊断具有重要价值[1]。根据杂音在心动周期中发生的时间,可将心杂音分为收缩期杂音、舒张期杂音和连续性杂音。根据杂音的临床意义,可将心杂音分为病理性杂音和生理性杂音。通常情况下,收缩期杂音可以是病理性的,也可以为生理性的,而舒张期杂音为病理性杂音[1-2]。因此对舒张期心杂音信号进行识别分析对于心脏疾病的诊断具有重要的意义,同时也能避免生理性心杂音对识别结果的影响。
心音的分类识别一直是心音分析领域中的研究热点,旨在利用分类器根据不同心音中杂音的内在特征判定出不同的心音信号所属的心脏疾病类型。目前许多学者提出了多种心音的特征提取和分类方法[3-5],但这些方法大多数建立在心音信号线性时变或时不变模型的基础上。而心音心杂音为具有非线性和非平稳特性的振动信号,线性的分析方法势必会忽略信号内部一些重要的信息。
经验模式分解(Empirical Mode Decomposition,EMD)是一种有效的时频分析方法,能自适应地将任何信号按频率由高到低分解成多个固有模态函数(Intrinsic Mode Function,IMF),每个IMF分量包含原信号不同时间尺度的局部特征,对其分析可以更准确的反映原信号细节特征的相关信息。由于EMD分解是基于信号局部的时变特点,因此它非常适合处理非线性和非平稳信号[6]。故利用EMD对复杂的心音信号进行分解,再从分解得到的IMF分量中提取信号的特征信息更能反映心音的内在本质信息。Mel频率倒谱系数(Mel-frequency Cepstrum Coefficient,MFCC)基于人耳对不同频率的语音具有不同的感知能力而提出,具有较好的鲁棒性[7],广泛应用于语音信号处理并取得较好的识别效果,而心音和语音都是振动信号且具有相似的特点[8],因此可将其应用于心音特征提取。
本文采用EMD和MFCC相结合的心音特征提取方法,首先对心音进行EMD分解得到不同频段的IMF分量,利用互相关系数准则筛选出主IMF分量以去除虚假分量,计算主IMF分量的MFCC、MFCC的一阶差分系数和Delta值,实现心音信号特征向量的有效提取,然后将特征向量输入隐马尔科夫模型(Hidden Markov Model, HMM)分类器实现正常心音和2类舒张期心杂音的分类识别。利用临床采集到的病例数据进行测试,结果表明所提出的特征提取方法比单独使用MFCC特征能够获得更高的识别率,说明所提方法是有效的,从而为心音信号的分类识别提供一种新的思路。
1 基本理论和方法
1.1 EMD方法原理
EMD是由Huang等提出的一种适用于分析非线性、非平稳信号的时频分析方法,能将复杂信号分解成有限个IMF分量。每个IMF分量必须满足两个条件:①在整个时间序列数据集中极值点的个数和过零点的个数相等或至多相差一个;②极大值包络线和极小值包络线在任何一点的均值为零。其原理如下:对于一时间序列信号x(t),首先确定出信号所有的局部极大值和局部极小值,然后利用三次样条插值法对极值点进行处理得到极大值和极小值包络,并求出包络均值曲线m(t),用x(t)减去m(t)可得:
(1)
将h1(t)作为新的信号重复k次上述步骤得到h1k(t),此时标准差SD为:
(2)
若SD≤0.3,令h1k(t)=cc1(t)即为所求的第一个固有模态分量IMF1,则剩余分量r1(t)=x(t)-cc1(t),对r1(t)继续重复上述步骤直至rn(t)为一单调函数,则分解过程结束。则此时信号x(t)可表示为
(3)
EMD通过迭代的方法将IMF分量按照频率由高到低的顺序依次从原始信号中分离出来,它们充分体现了原始信号所包含的细节成分。
1.2 隐马尔科夫模型
HMM是一种在Markov链的基础上发展起来的动态时间序列统计模型,能够通过较少的样本训练出较为可靠的模型,按照模式匹配原理,寻找出与未知信号最为相似的模式作为识别结果[9],重在表达信号类别内的相似程度,广泛应用于模式匹配、统计学习和分类识别。
HMM是由两个随机过程组成,其中一个随机过程是描述每个状态与观察值之间的统计对应关系,它解决了用短时模型来描述短时平稳段信号的问题;另一个是用Markov链来描述状态的转移,它解决了每个短时平稳段是如何转变到下一个短时平稳段的问题,这是基本的随机过程[10]。一个HMM模型可以记为λ=(N,M,π,A,B)[11],其中N为模型的状态数;M为每个状态所对应的观察值的数目;π为初始状态概率矩阵;A为状态转移概率矩阵;B为观察值概率矩阵。对于连续型HMM,B是一组观察值概率函数,M是高斯混合分量个数。
HMM模型运用于实际应用时,有三个问题需要解决,即:①评估问题:给定观察值序列O和模型λ,计算产生观察值序列O的概率,常用的解决方法是前向-后向算法。在心音识别中,该问题可以描述为:给定一未知类型的心音信号和训练好的几类心音模型,计算该心音信号与哪类心音模型产生的概率最大,则认为该未知心音信号即是那一类心音;②解码问题:给定观察值序列O和模型λ,确定产生观察值序列O概率最大的路径,最常用的解决方法是Viterbi算法;③学习问题:根据给定观察值序列O的训练集来确定产生该训练集最大概率的模型λ,常用的解决方法是Baum-Welch算法。
由于心音信号为一维时变序列,且连续混合高斯密度函数HMM模型与离散型HMM模型相比,具有失真小、分类更明显的优点,因此本文选择左向右的连续混合高斯密度函数HMM模型。其中状态数为N=5,高斯混合数为M=4。
2 实验数据
由心脏瓣膜异常引起的舒张期心杂音包括二尖瓣狭窄(Mitral Stenosis,MS)、主动脉瓣关闭不全(Aortic Insufficiency,AI)、三尖瓣狭窄(Tricuspid Stenosis, TS)和肺动脉瓣关闭不全(Pulmonary Insufficiency, PI)。然而单纯性的三尖瓣狭窄是极其罕见的,常常合并主动脉和二尖瓣疾病[12]。肺动脉瓣关闭多由肺动脉扩张导致相对性关闭不全所致,常见于二尖瓣狭窄合并肺动脉高压。因此本文选择二尖瓣狭窄和主动脉关闭不全两类舒张期心杂音作为实验对象。
实验数据包含210例心音信号,其中60例二尖瓣狭窄、60例主动脉瓣关闭不全和90例正常心音(Normal Heart Sounds, NHS)。全部病理数据都是经临床医生确诊的单一性疾病,正常心音信号的测试者均无心血管疾病史。所有心音数据均采用重庆博精医学信息研究所研制的“运动心力监测仪”在重庆医科大学附属医院采集获得,其中采样频率为11 025 Hz,量化值为8 bit,文件采用wav格式保存。采集信号时,受试者均取端坐位,身体稍前倾,平稳呼吸,心音传感器置于受试者的心尖区,轻轻均匀用力按压使其紧贴心尖区皮肤。
3 心音特征参数提取及分析
3.1 预处理
心音是一种微弱的生理信号,在采集的过程中非常容易受人为或环境中噪声的干扰,从而影响特征参数提取的准确性,因此有必要对采集的心音信号进行消噪处理以突出其特征。对于心音信号去噪,小波变换是一种非常有效的方法[13],为此本文采用能量集中度高、时间局部性好的db6小波[14]、‘sqtwolog’阈值和5层分解的方法对采集的心音消噪,如图1所示,一例临床采集的主动脉瓣关闭不全心音信号去噪前后的效果对比,此方法能够较好的保留心音的主要成分。
图1 一例原始的主动脉关闭不全和消噪后的主动脉关闭不全
3.2 MFCC特征提取
人耳对不同频率f的语音具有不同的感知能力,Mel频率正是为了描述这种感知特性而提出,它与频率f成非线性关系。MFCC则利用Mel频率与f之间的关系,从Mel尺度频率域提取的一种倒谱系数,是语音相关识别研究中常用的特征参数[15]。其提取流程如下图2所示,具体过程为:
(1) 对经小波去噪后的心音信号s(n)预加重处理,以增强心音的高频成分,然后分帧、2加窗得到每帧心音的时域信号x(n),其中窗为哈明窗,帧长25 ms,帧移10 ms。
(2) 将时域信号x(n)经离散傅里叶变换得到线性频谱X(k)。转换公式为
(4)
式中,N为傅里叶变换的点数。
(3) 将线性频谱X(k)通过一组Mel尺度的三角形滤波器组(即Mel频率滤波器组)得到Mel频谱,并通过对数能量的处理得到对数频谱S(m)。
(5)
式中:M=24为滤波器组的个数;Hm(k)为每个滤波器的传递函数。
(4) 将S(m)经离散余弦变换变换到倒谱域,即可得到MFCC,计算公式为
(6)
图2 MFCC提取过程
由于滤波器的个数是24,则可得到24维的MFCC倒谱系数,有相关实验表明最前若干维以及最后若干维的MFCC系数对信号的区分性能最大[16],因此本文取前12维的MFCC系数。
3.3 MFCC的一阶差分系数特征提取
在提取MFCC以后即可计算其一阶差分系数,将其记为△MFCC,其计算公式为
(7)
式中:c(n)为一帧心音信号的MFCC特征参数序列;k为常数,通常取2。由式(7)可以看出△MFCC为信号帧MFCC特征参数前后四帧的线性组合。
3.4 Delta特征提取
对MFCC特征向量序列在时序方向上做一次傅里叶变换,便可得到对应于MFCC特征的Delta特征,Delta特征反映的是信号帧间的动态特性,也称作是二维系数或速度系数,其计算过程可简化为
(8)
式中:D(t)表示第t帧MFCC特征的Detla特征;Θ表示第t帧时序变化的信号帧的数量。
3.5 基于EMD和MFCC的特征提取
3.5.1 主IMF分量的选取
对一例经小波去噪后的主动脉瓣关闭不全的心音信号进行EMD分解,其分解结果见图3。
图3 一例主动脉瓣关闭不全的EMD分解图
从图3中看出主动脉瓣关闭不全的舒张期心杂音信号经EMD分解成了按照频率由高到低排列的11个IMF分量和1个残余分量,不同的IMF分量包含不同的时间尺度。由于不同的心音信号的频率范围有所差异,则不同的心音信号所分解出来的IMF个数也不同,而原始信号最主要的本质信息往往集中体现在某几个IMF分量上,加上虚假分量的存在,因此必须对IMF分量进行筛选。互相关函数是判断在频域内两个信号是否相关的一个指标,它可以用来确定目标信号有多大可能性来自于输入信号。故可采用互相关系数准则对IMF分量筛选,即计算每阶IMF分量与原消噪后的心音信号之间的互相关系数,选择系数较大的IMF分量作为主IMF分量。正常心音信号和2类舒张期心音信号的互相关系数平均值如表1所示,前4阶IMF分量的互相关系数均大于0.1,而其它高阶的IMF分量的互相关系数的均在0.01或更小的值,一般情况认为,互相关系数大于0.1即可认为两个信号之间具有较强的相关性,则前四阶IMF分量与原去噪后的心音信号具有较强的相关性,因此选择IMF1~IMF4作为主IMF分量。
表1 各IMF分量与原去噪后的心音信号的互相关系数
Tab.1 Mutual correlation coefficients between the IMF components and the original de-noised signals
心音类型各IMF分量与原去噪后心音信号之间的互相关系数IMF1IMF2IMF3IMF4IMF5≥IMF6NHS0.4790.7620.2880.1030.019<0.01AI0.4430.3710.2130.1110.012<0.01MS0.8010.5230.2990.1530.013<0.01
3.5.2 基于IMF和MFCC的特征提取
在确定了主IMF分量即IMF1~IMF4后,分别对每个IMF分量单独提取12维的特征参数MFCC、△MFCC及Delta值,经组合形成三个特征向量EMD+MFCC、EMD+MFCC+△MFCC及EMD +MFCC+Delta,分别简记为E+MFCC、E+M+△MFCC和E+M+Delta,他们的维数分别为48维、96维和96维,以此作为HMM识别模型的输入向量。图4显示了从三类心音信号的主IMF分量第一帧中提取48维的MFCC。
4 识别结果及分析
为了评价所提出算法的有效性,对采集的210例心音数据按训练样本与测试样本1∶2的比例进行实验,即70例心音信号用于训练HMM模型,余下的140例信号(正常心音信号60例,主动脉瓣关闭不全40例,二尖瓣狭窄40例)用于测试。程序运行平台为Windows 7 系统,CPU:Intel T6400 2.0 GHz,RAM:2 GB。采用状态数为5和高斯混合数为4的HMM识别模型作为分类器,其不同特征提取方法的识别结果如表2所示。
图4 主IMF分量中提取的第一帧48维的MFCC
表2 不同特征提取方法的识别结果
对表2纵向分析可知,特征参数MFCC的识别率最低仅为85.71%,而采用所提出的三种特征值提取方法所提取的特征参数的识别率均在90%及以上,均优于单独使用MFCC作为特征参数的识别率,说明复杂的心音信号经EMD分解后,再从分解得到的IMF分量中提取特征信息更能反映心音信号的本质特征。针对所提出的三种特征提取方法,E+MFCC 获得了最低的识别率,E+M+Delta获得了最高的识别率95.71%,因为MFCC仅反映了心音信号的静态特性,忽略心音信号的动态特性,而△MFCC能够反映心音信号的动态特性,将两者结合可更好的反映信号的特征信息,故特征参数E+M+△MFCC的识别率高于E+MFCC;MFCC、△MFCC均只考虑了帧内的关系,并未考虑到帧与帧之间的动态联系,参数Delta值能够反映信号帧间的时变特性,有助于提高识别率,因此特征参数E+M+Delta获得了最高的识别率。
表3 不同分类器的识别结果
针对分类方法,选择具有较优学习性能和较强分类能力的BT-SVM与本文的HMM进行对比,其中SVM的核函数选取RBF,决定其性能的两个参数惩罚因子和核参数的取值均为2,特征向量选取E+M+Delta,其识别结果如表3所示。结果表明HMM模型获得了比SVM更佳的识别性能,这与文献[11]的结论一样。虽然其训练时间要稍长于SVM,但也在合理范围之内。综上,HMM更适用于对本文所提取的特征参数进行分类识别。
5 结 论
心音是一种具有非线性和非平稳性的振动信号,针对基于线性时变或时不变模型的心音特征提取方法不能充分体现心音的内在的特征信息,提出了基于EMD和MFCC相结合的舒张期心杂音信号的分类识别方法。小波去噪后的原始心音信号经EMD分解成有限个IMF分量,这些IMF分量充分体现信号的局部特征信息,实现信号的特征信息的分离。然后提取主IMF分量的MFCC、△MFCC及Detla值,经特征组合形成E+MFCC、E+M+△MFCC和E+M+Delta三个特征向量,结合HMM分类器对临床采集到的210例心音信号进行试验分析,得到了比单独使用MFCC作为特征向量更高的识别率。同时将本文采用的HMM与SVM进行对比,其结果表明针对于本文所提出的特征参数,HMM比SVM具有更优的识别性能。因此,本文提出的三种特征值提取方法能够有效的对心音进行分类识别,为心音信号的分类识别提供了一种新的方法,对进一步实现心脏疾病的临床辅助诊断具有重要价值。
[1] 陈文彬,潘祥林,康熙雄,等. 诊断学[M]. 北京:人民卫生出版社,2008:137-147.
[2] GHAREHBAGHI A, BORGA M, SJÖBERG B J, et al. A novel method for discrimination between innocent and pathological heart murmurs[J]. Medical Engineering & Physics, 2015, 37(7): 674-682.
[4] BABAEI S, GERANMAYEH A. Heart sound reproduction based on neural network classification of cardiac valve disorders using wavelet transforms of PCG signals[J]. Computers in Biology and Medicine, 2009, 39(1): 8-15.
[5] ZHENG Y, GUO X, DING X. A novel hybrid energy fraction and entropy-based approach for systolic heart murmurs identification[J]. Expert Systems with Applications, 2015, 42(5):2710-2721.
[6] HUANG N E, SHEN Z, LONG S R, et al. The empirical mode decomposition and the Hilbert spectrum for nonlinear and non-stationary time series analysis[C]// Proceedings of the Royal Society of London A: Mathematical Physical and Engineering Sciences. The Royal Society, 1998, 454(1971): 903-995.
[7] 余建潮,张瑞林. 基于MFCC和LPCC的说话人识别[J]. 计算机工程与设计,2009, 30(5):1189-1191.
YU Jianchao, ZHANG Ruilin. Speaker recognition method using MFCC and LPCC features[J]. Computer Engineering and Design, 2009, 30(5):1189-1191.
[8] HUSSAIN S, KAMARULAFIZAM I, NOOR A M, et al. Classification of heart sound based on multipoint auscultation system[C]// IEEE. 2013 8th International Workshop on Systems, Signal Processing and their Applications (WoSSPA), 2013: 174-179.
[9] 柳新民,刘冠军,邱静. 基于HMM-SVM的故障诊断模型及应用[J]. 仪器仪表学报,2006, 27(1):45-48.
LIU Xinmin, LIU Guanjun, QIU Jing. Hybrid HMM and SVM approach for fault diagnosis[J]. Chinese Journal of Scientific Instrument, 2006, 27(1): 45-48.
[10] 赵力.语音信号处理[M]. 北京:机械工业出版社,2003:98-100.
[11] ZHAI G, CHEN J, LI C, et al. Pattern recognition approach to identify loose particle material based on modified MFCC and HMMs[J]. Neurocomputing, 2015, 155: 135-145.
[12] SAITO T, HORIMI H, HASEGAWA T, et al. Isolated tricuspid valve stenosis caused by infective endocarditis in an adult: report of a case[J]. Surgery Today, 1993, 23(12): 1081-1084.
[13] CHENG X F, ZHANG Z. Denoising method of heart sound signals based on self-construct heart sound wavelet[J]. AIP Advances, 2014, 4(8): 087108.
[14] 张国华,袁中凡,李彬彬. 心音信号特征提取小波包算法研究[J]. 振动与冲击,2008, 27(7):47-49.
ZHANG Guohua, YUAN Zhongfan, LI Binbin. Resear on wavelet packet algorithm for feature extraction of heart sound signal[J]. Journal of Vibration and Shock, 2008, 27(7):47-49.
[15] 张文英,郭兴明,翁渐. 改进的高斯混合模型在心音信号分类识别中应用[J]. 振动与冲击,2014, 33(6):29-34.
ZHANG Wenying, GUO Xingming, WEN Jian. Application of improved GMM in classification and recognition of heart sound[J]. Journal of Vbration and Sock, 2014, 33(6):29-34
[16] 蔡莲红,黄德智,蔡锐. 现代语音技术基础与应用[M]. 北京:清华大学出版社,2003:236-238.
Classification and recognition of diastolic heart murmurs based on EMD and MFCC
LI Hongquan, GUO Xingming, ZHENG Yineng
(Chongqing Engineering Research Center for Medical Electronic Technology, College of Bioengineering, Chongqing University, Chongqing 400044, China)
Heart sound is a kind of vibration signals with characteristics of nonlinearity and non-stationarity. So the feature extraction methods based on linear time-variant or time-invariant models are bound to ignore some important internal information of heart sound signals. To better reveal the essential features of heart sound signals, a new feature extraction method based on the empirical mode decomposition (EMD) and Mel-frequency cepstral coefficient (MFCC) was proposed to classify diastolic heart murmurs. Firstly, the heart sounds were decomposed into finite intrinsic mode functions (IMFs) with EMD. Then the main IMF components were selected with the mutual correlation coefficient criterion. The main IMF components’ MFCCs, MFCCs’ first-order difference coefficients and Delta values were extracted, respectively. Finally, those were taken as input vectors of a hidden Markov model (HMM) to classify and identify normal heart sounds (NHSs) and two kinds of diastolic heart murmurs acquired from clinic. The test results showed that the proposed method can be used to distinguish the three types of heart sound signals effectively.
diastolic heart murmurs; empirical mode decomposition (EMD); Mel-frequency cepstral coefficient (MFCC); hidden Markov model
国家自然科学基金(31570003)
2016-02-24 修改稿收到日期:2016-04-06
李宏全 男,硕士生,1989年生
郭兴明 男,教授,博士生导师,1964年生
R318.04
A
10.13465/j.cnki.jvs.2017.11.002