基于最小分类误差准则的呼吸音分类技术

2016-12-07徐文皓洪青阳吴谨准颜卫源

厦门大学学报（自然科学版） 2016年6期

关键词：概率建模分类

李琳,徐文皓,洪青阳*,童峰,吴谨准,颜卫源

(1.厦门大学信息科学与技术学院,福建厦门361005;2.厦门大学海洋与地球学院,福建厦门361102;3.厦门大学附属第一医院,福建厦门361003)

基于最小分类误差准则的呼吸音分类技术

李琳1,徐文皓1,洪青阳1*,童峰2,吴谨准3,颜卫源3

(1.厦门大学信息科学与技术学院,福建厦门361005;2.厦门大学海洋与地球学院,福建厦门361102;3.厦门大学附属第一医院,福建厦门361003)

从大量呼吸音样本中归纳综合出肺部病理特征的科学表示,实现自动化、定量化的呼吸音分类,是现代医疗信息化技术的重要研究内容之一.提出了一种基于最小分类误差(minimum classification error,MCE)准则的呼吸音分类方法,建立呼吸音类别的分类误差损失函数,采用广义概率下降法(generalized probabilistic decent,GPD)估计得到呼吸音的隐马尔科夫模型(hidden Markov model,HMM)参数,以增强不同类型呼吸音模型的区分能力.实验结果表明,与传统的最大似然(maximum likelihood,ML)法相比,基于MCE准则求解的HMM模型,具有更好的分类效果,提高了识别准确率,客观证明了基于MCE准则的呼吸音分类技术的有效性.

呼吸音分类;隐马尔可夫模型;最小分类误差;最大似然

呼吸音,又称为肺音,是由肺部气流湍动产生,宏观上分为正常呼吸音和异常呼吸音,前者包含肺泡呼吸音、支气管呼吸音和气管呼吸音;后者可分为异常肺泡呼吸音、异常支气管呼吸音、异常气管呼吸音、爆裂音、哮鸣音和鼾音等[1].传统诊断中,医生使用听诊器在胸腔听诊肺部信号,以分析肺部疾病情况.但受到医生客观生理(如听觉能力的好坏)和主观经验(如诊断能力的高低)的影响,传统听诊的诊断模式无法客观地发挥最大作用.另一方面,雾霾天气所带来的呼吸道疾病发病率高,增加了医疗压力.因此,对肺部疾病快速而准确诊断的需求日益增加.

电子听诊器等数据采集硬件平台的发展进一步促进了基于计算机信号处理的呼吸音信号分类与分析技术的发展.呼吸音分类通常采用“特征提取+分类模型”的系统框架[2],常用的呼吸音特征提取算法包括自回归系数[3-4]、希尔伯特-黄变换[5]、梅尔频率倒谱系数(Mel frequency cepstral coefficients,MFCC)[6]、基于小波变换技术的离散小波系数[7]和短时频谱法[8]等;而几种典型的分类方法,如矢量量化(vector quantization,VQ)技术[5]、k最近邻(k-nearest neighbor,k NN)法[9]、支持向量机(support vector machine,SVM)[10]、人工神经网络(artificial neural network,ANN)[3,7,10]、基于最大似然估计(maximum likelihood,ML)的高斯混合模型(gaussian mixture model,GMM)[11]和隐马尔科夫模型(hidden Markov model,HMM)等[12-14]也得到了一定的应用.

其中,VQ技术、k NN方法和SVM方法实现了粗略的呼吸音分类,但分类准确率不高.基于ANN采用各种改进方法,如增加隐藏层数、使用增量监督机制、采用径向基函数等呼吸音识别方法,可以取得较高的分类准确度,但在样本容量较小的情况下容易产生误分类.基于ML的GMM分类性能易受到GMM阶数和样本时长的影响.

参考语音识别的模式,将不同类型呼吸音的呼吸周期信号建模为类似语音音节单元的HMM,使用ML法对HMM进行参数估计,由于考虑了呼吸音信号的时序关系,可提高正常呼吸音和异常呼吸音的分类精度.但由于ML法需要通过训练使样本的似然度都达到最大,对训练数据的数量及分布要求较大,且在参数估计过程中强化同类数据类内特征,没有评估不同类之间的相互影响,无法体现不同类的差异性.

受语音识别和说话人确认技术中判别学习方法——最小分类误差(minimum classification error, MCE)法的启发[15-16],本研究希望优化正常呼吸音和异常呼吸音对应模型之间的相互区分性,为不同类的判别函数找出合适的参数集使得分类误差最小.首先,根据呼吸音的频率、时长、能量等特点,采用HMM对呼吸音信号进行时序建模;接着,构建MCE判别函数,对每个呼吸音类型(正常、异常)定义错误分类损失函数,以衡量被错误分类的可能性;最后,由错误分类损失函数最小化得到最佳的HMM参数.

本研究设计了一系列的实验内容,考虑呼吸音的人耳听觉感知性,采用MFCC作为呼吸音特征表示,再分别运用HMM-ML和HMM-MCE 2种呼吸音分类方法对呼吸音样本进行正常/异常的识别能力测试.实验结果验证了HMM-MCE算法在呼吸音识别中的可行性和有效性,并对2种方法中正确识别、错误识别的情况进行了对比分析,发现HMMMCE方法可以获得比HMM-ML方法更高的识别效果.

1 呼吸音数据

为了有效记录实验所需的呼吸音样本,自制了一套呼吸音采集设备,主要由双声道听诊头、音频处理芯片WM8978、微控制器S3C2440、液晶显示屏、耳机等部分组成.其中听诊头内部的麦克为主通道,主要采集被测者的呼吸音,以及夹杂其中的心音和外界干扰噪声,采集到的声音信息储存在音频文件的左声道部分;听诊头的外部后方处有另一个麦克作为副通道,主要采集外界干扰噪声,采集到的声音信息储存在音频文件的右声道部分.音频文件类型等参数事先通过微处理器写入设置,本实验设置音频文件类型为WAV文件,采样率为16 k Hz,采样精度为16 bits.

为了更好地模拟传统听诊模式,选取人体身上8个部位,对其进行编号,其中前胸:右上为1,左上为2;后背:右上为3,左上为4,此4个采集点为主要采集点.其余采集点序号5～8分别对应前胸的右下和左下及后背的右下和左下.由于采集到的呼吸音较少,故并未用于下述的3.1实验中.共采集到135位测试者共334条有效呼吸音,135个测试者全部采集了听诊点1,其中有58名测试者监听了4个部位.每个测试者至少采集25 s的呼吸音.

由于受到外界噪声和仪器自身引入的热噪声等干扰,为了提高录音质量,需要对其进行预处理,主要包括低通滤波和主动降噪(active noise canceling, ANC)处理[17]两部分.由于正常和异常呼吸音的频率范围基本低于2 k Hz,所以将双通道的音频样本通过一个上限频率为2 k Hz的低通滤波器,以滤除音频信号中的高频噪声和热噪声等干扰.之后采用基于最小均方的ANC技术,将左声道录制的有效呼吸音和环境噪声的混合音与右声道录制到的环境噪声相抑制,最终得到相对纯净的呼吸音.

2 呼吸音HMM建模

2.1特征提取

对每一个呼吸音时域样本采用hamming窗进行分帧,帧长为256个采样点,帧移为128点,预加重系数为0.97.对每帧数据提取24维MFCC特征向量O.

2.2HMM参数

呼吸音的HMM采用三元组参数λ={A,B,π}表示,A={aij}(i,j=1,…,N)表示状态转移概率; B={bjk}(j,k=1,…,N)表示观测概率,采用8个GMM表示;π表示初始分布矢量.N表示每个HMM的状态总数,对于每个呼吸音周期均采用N=6个状态表示:s1,s2,s3,s4,s5,s6.呼吸音的HMM建模如图1所示,图中O为观测值,t表示呼吸音样本的帧数.

图1　呼吸音的HMM建模Fig.1 The H MM of respiratory sound

用λ表征可观测O的概率P(O|λ),如下所示:

其中,si为当前状态,P(O,st=si|λ)为λ中处于第si个状态观测到呼吸音序列O的概率,st为t帧时对应的状态.αt(si)和βt(si)为t时刻在i状态的前向变量和后向变量.

2.3ML方法

根据正常呼吸音或异常呼吸音的HMM观测概率计算每个状态生成该观测值的概率,由概率最大化决定呼吸音样本所属的类型,即采用ML进行HMM模型λ的参数优化,如下所示:

其中^λ为观测呼吸音序列O的概率最大时参数λ的取值.

2.4MCE方法

MCE法是一种有监督的区分性训练算法,引入损失函数,将参数求解转换为使分类错误最小的最优化参数估计问题.

为加强对呼吸音类别的区分能力,需要构造呼吸音的损失函数,首先制定分类错误的度量di(O),

其中,gi(O;λ)是求取在λ参数下观测到呼吸音序列O的最大似然函数;i,j=1,…,M(M表示输入呼吸音类型数,设为2);η=0.999.之后将di(O)代入sigmoid函数φ(x)中进行归一化处理,得到归一化后的度量φi(O;λ),

最后,构造损失函数L(λ),

其中,P(O)为观测呼吸音序列出现的概率.之后采用广义概率下降算法(generalized probabilistic descent,GPD)反复迭代修正模型的转移概率A、观测概率B以及初始分布矢量π,使L(λ)损失值逐渐减小直至收敛.

3 实验结果及分析

为验证HMM-MCE方法对呼吸音进行分类的有效性,参照Matsunaga等[13-14]的策略重现了HMMML方法,对比2种方法在单一听诊点和多个听诊点情况下的识别性能.实验数据采用的是自制双通道电子听诊器采集的呼吸音数据,由临床医生通过听诊经验以及X光肺部拍片综合判断测试者对应的呼吸音是正常呼吸音还是异常呼吸音,具体数量见表1所示.

3.1单一听诊点呼吸音识别实验

实验1:训练数据为听诊点1中的19个异常呼吸音和49个正常呼吸音,测试数据为听诊点1中除训练数据之外的18个异常呼吸音和49个正常呼吸音.

表1　不同听诊点采集的呼吸音数量Tab.1 The numbers of respiratory sounds on different auscultation points

实验2:训练数据同实验1,测试数据为除听诊点1之外的其他听诊点的所有54个异常呼吸音和142个正常呼吸音.

均采用HMM-ML和HMM-MCE 2种识别方法对上述实验数据进行分类处理.实验结果由表2显示,来源相同听诊点的呼吸音,被正确识别的概率高于89%,而来源于不同听诊点的呼吸音被正确识别的概率均不高.可见,不同听诊点的呼吸音样本对呼吸音HMM建模具有不容忽视的影响,同时也发现相同的实验条件下,HMM-MCE方法能获得更好的识别效果.

表2　单个听诊点呼吸音分类实验对比Tab.2 The classification experiments of respiratory sounds on single auscultation point

3.2多听诊点呼吸音识别实验

为了减小呼吸音听诊点的不同对HMM建模的影响,在HMM训练阶段采用不同听诊点呼吸音混合训练的策略,所使用的实验数据如表3所示.

同时为了观察数据样本时长对识别效果的影响,分别导入每个呼吸音文件的前500帧(约2～3个呼吸周期)、前1 000帧(约4～5个呼吸周期)、前1 500帧(约7～8个呼吸周期)、前2 000帧(约9～10个呼吸周期)和全部帧数(约2 500帧,10～12个呼吸周期)进行了5组实验.均采用HMM-ML和HMM-MCE 2种识别方法进行分类实验,实验结果如图2所示.

表3　多个听诊点呼吸音实验数据Tab.3 The experimental data of respiratory sounds on many auscultation point

图2　混合听诊点实验在不同样本时长情况下的性能对比Fig.2 The performance comparison of different length samples in mixed auscultation points′experiment

由图2可知,当呼吸音样本时长仅为2～3个呼吸周期时,2种分类策略的正确识别率均超过91%,其中,HMM-MCE方法取得更好的分类性能;当样本时长不少于8个呼吸周期时,随着样本数据的增加,2种分类方法的正确识别率均提高,但HMM-MCE方法的分类性能提升幅度大,且一直表现出比HMM-ML方法更优秀的类别区分能力.

上述5组实验中对每种类型(正常/异常)正确识别的统计情况如图3所示.当帧数目相同时,与HMM-ML方法相比,HMM-MCE方法在大多数情况下对正常肺音和异常肺音正确识别的准确性更高.当帧数目为500帧时,受到样本时长过短的影响, HMM-ML方法和HMM-MCE方法均出现过拟合的情况.当帧数目大于1 000帧之后.随着样本数据量的增加,HMM-MCE具有更强的区分效果.

4 结论

考虑到呼吸音的时序特点及不同类型呼吸音之间的差异性,本研究基于MCE准则对异常呼吸音和正常呼吸音进行HMM建模,提高了对呼吸音类别的区分.实验结果表明,无论在单听诊点呼吸音识别还是混合听诊点呼吸音识别的实验中,本研究所提出的HMM-MCE分类方法的识别性能均优于HMM-ML方法,同时由于MCE算法对正常呼吸音HMM和异常呼吸音HMM的训练使不同类型的模型差距拉大,加强了模型的区分性,使得MCE算法对正常呼吸音和异常呼吸音的正确分类能力明显高于ML算法.本研究工作为异常呼吸音类型的细分类研究进行了可行性研究的技术铺垫.

图3　不同实验条件下正确识别类型的统计Fig.3 The statistics of correct identification in different experimental conditions

[1] 王文渊,闫平凡.肺音研究综述[J].北京生物医学工程, 1992,11(2):106-112.

[2] 郑明杰,宋余庆,刘毅.基于机器学习的肺音分类技术的研究进展[J].计算机科学,2015,42(12):8-12,31.

[3] CHEN M Y,CHOU C H.Applying cybernetic technology to diagnose human pulmonary sounds[J].Journal of Medicine System,2014,38(6):1-10.

[4] HADJILEONETIADIS L J,PANAS S M.Autoregressive modeling of lung sounds using higher-order statistics:estimation of source and transmission[C]∥1997 IEEE Signal Processing Workshop on Higher-Order Statistics. Los Alamitos:IEEE Computer Society,1997:4-8.

[5] HOMS-CORBERA A,FIZ J A,MORERA J,et al.Timefrequency detection and analysis of wheeze during forced exhalation[J].IEEE Transactionson Biomedical Engineering,2004,51:182-186.

[6] BAHOURA M,PELLETIER C.New parameters for respiratory sound classification[C]∥Electrical and Computer Engineering,2003.IEEE CCECE 2003.Canada:IEEE,2003:1457-1460.

[7] KANDASWAMY A,SATHISH KUMAR C,RAMANATHAN R P,et al.Neural classification of lung sounds using wavelet coefficients[J].Computers in Biology and Medicine,2004,34(6):523-537.

[8] JIN F,KRISHNAN S,SATTAR F.Adventitious sounds identification and extraction using temporal-spectral dominance-based features[J].IEEE Transactions on Biomedical Engineering,2011,58(11):3078-3087.

[9] DOKUR Z.Respiratory sound classification by using an incremental supervised neural network[J].Pattern Analysis and Applications,2009,12(4):309-319.

[10] ABBASI S,DERAKHSHANFAR R,ABBASI A,et al. Classification of normal and abnormal lung sounds using neural network and support vector machines[C]∥Proceedings of the 21st Iranian Conference on Electrical Engineering.Iran:IEEE,2013:14-16.

[11] MAYORGA P,DRUZGALSKI C,MORELOS R L,et al.Acoustics based assessment of respiratory diseases using GMM classification[C]∥2010 Annual International Conference of the IEEE Engineering in Medicine and Biology.Buenos Aires:IEEE,2010:6312-6316.

[12] MATSUNAGA S,YAMAUCHI K,YAMASHITA M, et al.Classification between normal and abnormal repiratory sounds based on maximum likelihood approach[C]∥2009 IEEE International Conference on Acoustics, Speech and Signal Processing.Taiwan:IEEE,2009: 517-520.

[13] MATSUTAKE S,YAMASHITA M,MATSUNAGA S. Discrimination between healthy subjects and patients using lung sounds from multiple auscultation points[C]∥2013 IEEE International Conference on Acoustics, Speech and Signal Processing.Vancouver:IEEE,2013: 1296-1300.

[14] YAMASHITA M,HIMESHIMA M,MATSUNAGA S. Robust classification between normal and abnormal lung sounds using adventitious-sound and heart-sounds models[C]∥2014 IEEE International Conference on A-coustics,Speech and Signal Processing(ICASSP).Florence:IEEE,2014:4418-4422.

[15] KITAOKA M,HASHIMOTO T,OCHIAI T,et al. Speech pattern classification using large geometric margin minimum classification error training[C]∥TENCON 2015-2015 IEEE Region 10 Conference. Macau:IEEE,2015:1-6.

[16] JUANG B H,HOU W,LEE C H.Minimum classification error rate methods for speech recognition [J].Speech and Audio Processing,1997,5(3):257-265.

[17] WU F Y,TONG F.Non-uniform norm constraint LMS algorithm forsparse system identification[J].Communications Letters,2013,17(2):385-388.

Respiratory Sound Classification Approach Based on Minimum Classification Error

LI Lin1,XU Wenhao1,HONG Qingyang1*,TONG Feng2,WU Jinzhun3,YAN Weiyuan3

(1.School of Information Science and Engineering,Xiamen University,Xiamen 361005,China; 2.College of Ocean&Earth Sciences,Xiamen University,Xiamen 361102,China; 3.The First Affiliated Hospital of Xiamen University,Xiamen 361003,China)

Unlike the traditional auscultation,automatic respiratory sound classification technology summarizes the scientific descriptions of pathological features from a large number of respiratory sound samples.And it serves as an automatic and quantitative auscultation tool to diagnose abnormalities and disorders in the lung.A classification procedure based on minimum classification error (MCE)approach using hidden Markov models(HMM)is proposed in this paper.The parameters of H MM are estimated by loss functions between different models of normal sounds and abnormal sounds,which aim to distinguished healthy subjects and patients. The experiment results show that the proposed HMM-MCE approach obtains higher classfication accuracy in comparison with the traditional HMM-ML method.

respiratory sound classification;hidden Markov model;minimum classification error;maximum likelihood

TN 912

0438-0479(2016)06-0901-05

10.6043/j.issn.0438-0479.201602021

2016-02-19 录用日期:2016-04-27

国家自然科学基金(61105026,11274259)

qyhong@xmu.edu.cn

李琳,徐文皓,洪青阳,等.基于最小分类误差准则的呼吸音分类技术[J].厦门大学学报(自然科学版),2016,55(6): 901-905.

LI L,XU W H,HONG Q Y,et al.Respiratory sound classification approach based on minimum classification error[J]. Journal of Xiamen University(Natural Science),2016,55(6):901-905.(in Chinese)