基于FCM聚类算法的呼吸音分类识别研究
2015-06-15易鹏飞等
易鹏飞等
摘 要: 为了分类识别不同部位的呼吸音,提出一种基于呼吸气持续时间相对值参数,以及呼吸气间歇时间相对值参数提取的呼吸音分析方法。该方法包括呼吸音预处理、包络提取、基于FCM聚类算法的自适应阈值线的选取、特征值提取为主的4个部分。对50例3种不同呼吸音进行分类实验,分类准确率为94%,从而验证了该方法的有效性。在此基础上,对该方法在同一种呼吸音病理和健康研究方面做出了展望。
关键词: 呼吸音; 呼吸音分类; Morlet小波; FCM聚类算法
中图分类号: TN911?34 文献标识码: A 文章编号: 1004?373X(2015)12?0016?04
呼吸音俗称肺音,它能够反映音源特征,并且能够反映肺部组织、气管及胸壁等传播媒介的声学特性,通过对呼吸音的检测可以有效准确地诊断呼吸系统疾病。对呼吸音信号的准确分析以及分类,可对呼吸疾病诊断起到重要的辅助作用[1?2]。呼吸音信号主要分为气管呼吸音、支气管呼吸音、支气管肺泡呼吸音、肺泡呼吸音不同生理部位所产生的呼吸音的时域波形以及不同变换后的波形都有差异,采用提取包络能对不同生理部位的呼吸信号进行描述,对其进行分类。
1 数据采集
本文所用到的呼吸音数据采集采用美国BIOPAC公司生产的MP150型16导生理信号记录气管呼吸音、支气管呼吸音、支气管肺泡呼吸音、肺泡呼吸音4个部位的呼吸音数据。采样频率为20 kHz,呼吸音的周期为12~20次/min,采样时间为30 s,为了保证采集数据的稳定性,截取其中的第3~5周期中的一个周期数据保存,保存格式为.txt或者.mat。呼吸音采集系统如图1所示。
2 方法的实现
2.1 预处理和包络提取
在获取呼吸音包络前,原始呼吸音信号需要进行预处理。首先,对采集的呼吸音信号进行下采样,采样频率从20 kHz下采样到2 kHz;接着,用十阶巴特沃斯滤波器进行滤波保证呼吸音带宽在100~1 000 Hz之间,再通过小波收缩阈值降噪法来有效去除呼吸音中的白噪声;最后采用Morlet小波来提取呼吸音包络。在包络提取法中,用Morlet小波针对呼吸音包络提取比Hilbert变换法提取的包络信号更光滑,能有效地降低使用Hilbert变换法所带来的不够光滑,毛刺太多(随机干扰成分)等问题,因此,本论文采用Morlet小波方法来提取包络[3?4]。
2.3 呼吸信号的包络
图2为肺泡呼吸音,其音调相对较低,吸气时音响较强,音调相对较高,时相较长;呼气时音响较弱,音调相对较低,时相较短[6]。图3为胸膜摩擦音,其是随着呼吸便可出现脏胸膜和壁胸膜间的摩擦声,一般在吸气末与呼气开始时较为明显。正常人胸膜表面光滑,胸膜腔内只有微量液体存在,因此呼吸时胸膜脏层和壁层之间相互滑动并无音响发生。胸膜摩擦音为病理呼吸音的一种[6]。如图4所示,支气管呼吸音是呼吸时气流在声门、气管形成湍流所产生的声音,吸气时主动运动,吸气时声门增宽,气流通过快;呼气是被动运动,声门变窄,气流通过慢,因而呼气时相比吸气时相长,音调较高,音响较强[6]。
图5为支气管呼吸音伴大湿啰音,其是由于通过呼吸道内的分泌物如渗出液、血液、浓液等,形成的水泡破裂所产生的声音,变化在吸气早起,音调响亮[6]。
2.4 特征参数提取
呼吸音的特征参数,本文使用FCM聚类算法对呼吸音包络信号进行自适应选取阈值线,图6以一例肺泡呼吸音作为参考,然后提取呼吸音特征参数,呼气相和吸气相的持续时间(T1,T2),呼气间隙时间和吸气间歇时间(D1,D2),呼气相和吸气相的峰值(P1,P2),最后可以通过呼吸音参数的特点来判断吸气相和呼气相。
2.4.1 FCM聚类算法
FCM聚类算法也称模糊C均值聚类[7],是由Bezkek于1981年提出的,它是目前广泛采用的一种聚类算法。FCM把n个向量[Xi]([i]=1,2,…,n)分为c个模糊组,并求出每个组的聚类中心,使其非相似性指标的价值函数达到最小,并且它能给出每个样本的隶属度来确定隶属于某个小组的程度。而FCM的模糊划分,使数据以(0,1)间的隶属度来确定其属于各个组的程度,同时归一化规定后,一个数据隶属度总和为1,即:
[i=1cpij=1, ?j=1,2,…,n] (5)
FCM的目标函数为:
[Km(P,c1,…,cc)=i=1cj=1n(pij)m(dij)2] (6)
式中:[pij]介于(0,1)间;[ci]为模糊组L的聚类中心;[dij=ci-Xj]为L个聚类中心与第j个数据点间的欧几里得距离;[m∈[1,∞)]为加权指数。构建目标函数式(7),可求得式(6)达到最小值的必要条件:
[J(U,c1,…cc,λ1,…,λn)=J(U,c1,…,cc)+j=1nλj(i=1cpij-1) =i=1cj=1n(pij)m(dij)2+j=1nλj(i=1cpij-1)] (7)
式中:[λj],j=1,2,…,n是式(7)的n个约束式的拉格朗日乘子。对所有输入参数求导,使式(6)达到最小的必要条件:
[ci=j=1n(pij)mxjj=1n(pij)m] (8)
[uij=1k=1c(dijdkj)2(m-1)] (9)
2.4.2 阈值线选取
阈值线的选定会确定几组呼吸音周期的特征参数,采用FCM聚类算法可得到聚类中心参数[[C1(p)],[C2(p)]],[[C3(p)],[C4(p)]]通过得到的参数分析阈值时得到的特征参数比较稳定,图7中当阈值选取30%~40%时比较稳定,在选取40%作为阈值线时,得到的参数值为0.918,1.035,2.352,3.388。
2.5 呼吸音区域定位
阈值线选取后根据呼吸规律,平静呼吸时呼气时间T1是要长于吸气时间T2,通过呼吸相和吸气相(TI,T2)的对比判定,确定吸气相和呼气相,同时确定呼气间歇时间D1和吸气间歇时间D2,通过归一化后得到的(T1,T2),(D1,D2)为1.035 s,0.918 s,2.352 s,3.388 s。
3 实验与验证
本文采用50例3种不同类的呼吸音进行分析,以[T1T2,D1D2]作为区分呼吸音类型参数,如表1~表6所示。
图8使用表4~表6所示的数据作为参数,可以清楚表明不同的呼吸音的特征值,使其有不同的分布区域,以达到识别分类的目的。在50例数据中共有47例数据得到准确的分类识别。
4 结 语
本文从时域的角度研究了一种呼吸音分类识别的分析方法,目的是分类识别不同部位的呼吸音,以及为研究在同一部位病理呼吸音和正常呼吸音的识别研究做基础。该方法基于临床实验采集数据库分析得出结论,对于实际应用和普遍性还需根据情况对算法做进一步的研究。
参考文献
[1] SOVIJ?RVI A R A,MALMBER L P. Characteristics of breath sounds and adventitious respiratory sounds [J]. Eur Respir Rev, 2000, 10(77): 591?596.
[2] KANDASWAMY A, KUMAR C S, RAMANATHAN R P, et al. Neural classification of lung sounds using wavelet coefficients [J]. Computers in Biology and Medicine, 2004, 34(6): 523?537.
[3] 李圣君,刘毅.肺音特征提取的小波包变换方法[J].计算机科学,2005(z1):162?164.
[4] 何岭松,李巍华.用Morlet小波进行包络检波分析[J].振动工程学报,2002,15(1):119?122.
[5] 孙延奎.小波分析及其应用[M].北京:机械工业出版社,2005.
[6] 陈文彬,潘祥林.诊断学[M].北京:人民卫生出版社,2008
[7] 孙晓霞,刘晓霞,谢倩茹.模糊C?均值(FCM)聚类算法的实现[J].计算机应用与软件,2008,25(3):48?50.