基于改进K均值聚类生成匹配模板的心搏分类方法
2018-04-09陈永波徐静波王云峰张海英
陈永波, 徐静波, 王云峰, 张海英
(1.中国科学院大学 微电子学院,北京 101047;2.中国科学院 微电子研究所 新一代通信射频芯片技术实验室北京市重点实验室,北京 100029)
0 引 言
作为心血管疾病诊断中一种重要的方法,动态心电图(electrocardiogram,ECG)具有无创伤、操作简单、出图快等特点,在临床上得到了广泛应用,并成为心脏病临床检查中的一种常规手段[1]。动态心电图能够在长时间(24 h以上)连续记录多达10万次以上的心跳(70次心跳/min),若采用逐个心搏检测的方式,工作量巨大、易产生误判[2]。
为了提高分析效率和分类方法的普适性,本文提出了一种改进的K均值聚类生成可变宽心电模板,并匹配心搏的方法。选取心搏的QRS波群(即正常心电图中幅度最大的波群)特征值为聚类特征向量,使用经过波形反混淆(DEMIX)纠错的K均值聚类生成可变宽心搏模板,建立心搏模板库,使用心搏模板库对心电信号进行匹配分类。最终实验结果显示,本文方法显著提高了心搏分类算法的准确性和分类效率,为动态心电检测的临床应用提供了参考。
1 基本原理
1.1 心电标准数据库介绍与分类标准
MIT-BIT是研究心电节拍分类算法公认的权威心电数据库,共48组两导联心电数据,心电诊断专家对每组数据文件中的每一个心搏都做出了分析结果,主要包括心率(心搏的R波位置)、心搏的类型以及信号质量等[3]。
本文参照美国医疗促进协会(Association for the Advancement of Medical Instrumentation,AAMI)制定的ANSI/AAMI EC57 2012[4]心搏分类标准,将心搏分为5类:N(正常或者束支传导阻滞节拍)、S(室上性异常节拍)、V(心室异常节拍)、F(融合节拍)、U(未识别节拍)。ANSI分类标准与MIT-BIT心电数据库注释的心电节拍类型是2种不同的分类方法,所以需要进行心搏类型转换。本文参照文献[3,4],将MIT-BIT标注的心搏类型转化为ANSI标准,其对应关系如表1所示。
表1 MIT-BIT心搏注释映射
1.2 心电信号预处理和QRS波群特征提取
心电信号为典型强噪声非平稳、非线性的微弱信号,主要频段集中于0.05~100 Hz,采集过程中容易受到3种噪声干扰:50 Hz工频干扰、肌电噪声和基线漂移。为滤除噪声干扰,本文使用文献[5]中提出的巴特沃斯数字滤波器进行滤波处理,其转移方程式如下
(1)
(2)
心搏节拍的R波峰位置常作为定位心搏的重要依据,且检测算法成熟。采用文献[6]中提出的方法对滤波后的心电信号进行R波峰值点的检测,并由心搏的R波峰值点为基准中心点,参照文献[6,7]选取心搏的RR间期、QRS波群时限、QRS波群绝对面积、QRS波群极性、R峰值作为描述QRS波群的特征向量。
1.3 K均值聚类
K均值聚类算法是聚类算法中常用算法之一,其基本思想是不断迭代分类结果与聚类中心点向量,直至划分的结果不再变化或迭代次数达到上限,即划分簇中的样本与样本均值的误差平方和达到最优,聚类时使用误差平方和准则函数E定义为
(3)
式中xi为属于簇的样本;ci为簇Ci的平均值。E越大说明簇内样本相似度越低,E越小说明簇内样本相似度越高,为提升计算效率,本文选取心搏的特征向量为作为聚类样本。常规K均值算法存在以下缺点:1)聚类结果容易受到聚类起始质心选择问题的干扰;2)分析方向单一,容易出现局部最优解,造成孤立点等问题[8]。本文根据聚类后同类种群心搏波形具有相似性特点,引入DEMIX用于改善K均值聚类存在的问题。
1.4 波形反混淆纠错
心电信号发生的机理相似,属于同种类型的心搏波形在形态上具有很大的相似性,而不同种类的心搏波形之间有较明显差异[9]。本文利用同种类型心搏波形相似性的特点,采用波形反混淆技术将属于某个分类的心搏波形全部叠加,然后利用叠加权值去除错误分类。
记经K均值聚类后属于第i类(i=N,S,V,F,U)的心搏类型的心搏总数为Ni,将该分类下所有心搏波形以R波峰值为基准中心点,前后取0.6倍RR间期,上下取1.1倍R波峰值进行区域波形叠加,计算区域{x(u,v)|-0.6RR≤u≤0.6RR,-1.1Rv≤v≤1.1Rv}内每个采样点的叠加权值F(u,v)为
(4)
图1为Ni取1,154,1847,3 024 时同类型心搏的叠加效果。从图中可以看出,Ni越大,同类波形叠加区域越清晰可见,利用该特点进行分类结果的纠错。
图1 不同数量i类型心搏叠加显示
1.5 改进的K均值聚类方法
本文根据同一类型心搏信号波形具有相似性特点、通过将K均值聚类与波形反混淆相结合,设计了一种改进的K均值聚类方法,能够保留较好的聚类结果,在增强了算法全局收敛性的同时加快算法后期收敛速度,提高算法的收敛效率。具体步骤如下:
1)对需要进行聚类的心电数据预处理,提取QRS波群特征值;
2)设定初始聚类中心、种群数和迭代上限;
3)K均值聚类生成聚类结果;
4)对聚类结果进行波形反混淆纠错,将每个种群纠错结果中的xⅢ(i)型心搏特征向量的平均值作为聚类中心点,将xⅠ(i)型心搏和xⅡ(i)型心搏作为新的聚类输入,返回步骤(3)迭代计算,至迭代上限或者聚类结果不再纠错为止。
1.6 可变宽心搏模板生成
图2 可变宽心搏模板
1.7 心博模板匹配原理
本文采用可变宽心搏模板进行心搏匹配,可以消除RR间期差别和心搏细微变异给模板匹配带来的影响,以增强心搏模板的普适性。与待测心搏匹配时,首先将待检心搏R峰值点与模板基线的R峰值点对齐,若待检心搏落于该模板可变宽区域内,则判定该心搏与该模板匹配。若待检心搏有部分落于匹配模板之外,则选取模板基线与待测心搏进行相关系数计算,其相关函数为
(5)
式中D(X)为心搏信号的方差
D(X)=E{|X-E(X)|2}
(6)
cov(X,T)为待测心搏X和心搏模板基线T的协方差
cov(T,X)=E{[T-E(T)][X-E(X)]}
(7)
当相关系数r越接近于1说明待测心搏与模板基线越相似,r越小说明两者形态差异性越大。选取经验阈值Thread=0.9,当待检心搏与模板的相关系数大于该值时,认为匹配成功;若低于该阈值,使用二分查找方式在模板库中选取匹配模板再次进行匹配,直至模板库中无可匹配的模板时,取最大相关系数的模板类型作为该心搏的分类。
2 实验过程与结果
本文使用VC 6.0作为算法实现的软件平台,使用MIT-BIT心率失常数据库、ANMA/ANSI分类标准作为算法准确性验证。MIT-BIT数据库中第102,104号数据中含有起搏信号,将其剔除后从余下的46组病例中随机选取24组数据作为实验数据,取12组心电数据混合后构造心电模板,然后使用生成的心电模板对剩余的12组数据的心搏进行分类。
考虑到最终将心搏分类结果为5类,所以,本文在生成心电模板时,设定初始心搏模板数为5~12。根据结果表明,心搏模板个数设为8时,使用生成的心电模板进行分类得到准确性和灵敏度最高,最终得到心搏分类的混合矩阵如表2。
表2 种群数为8时分类结果
按照ANMA/ANSI标准选取灵敏度Sen、真阳性率Ppr和总精确度Acc作为评价指标,将本文与文献[10,11]提出方法的分类结果比较如表3。
从表3可以看出:本文方法能够提高心电数据分类准确性,比较文献[11]方法S类心搏分类有明显的提高,并且可变宽心搏模板能够适应心变异性带来的差异,适用性得到了改善。
表3 分类准确率对比 %
3 结束语
本文通过使用K均值聚类和DEMIX纠错相结合的方式生成可变宽心搏模板,然后使用模板库进行心电波形匹配的方法,改进了K均值聚类时易陷入局部极值问题和初始质点选取敏感的缺点,使用可变宽区域模板匹配的方法一定程度上解决了心变异性带来的模板匹配问题。通过对MIT-BIT心电数据库的实验表明:本文方法提高了心搏分类的准确率,使其能够适用于远程医疗中长时间的心电监护数据的辅助诊断和分析。
参考文献:
[1] 李 倩,刘志贵,彭贵力,等.心电监测技术及其在远程医疗中的应用[J].传感器与微系统,2008,27(1):1-7.
[2] 卢喜列,卢亦伟.12导同步动态心电图学[M].北京:化学工业出版社,2007.
[3] Song X,Deng Q.On the format of MIT-BIH arrhythmia database[J].Chinese Journal of Medical Physics,2004,21(4):230-232.
[4] Association for the Advancement of Medical Instrumentation.ANSI/AAMI EC57:2012,Testing and reporting performance results of cardiac rhythm and ST segment measurement algorithms[S].Arlington:Association for the Advancement of Medical Instrumentation,2012:1-22.
[5] Shens A M.The discrete wavelet transform:Wedding the a trous and Mallat algorithms[J].IEEE Transactions on Signal Proces-sing,1992,50(10):2464-2482.
[6] 俞文斌,谢志军.基于穿戴式心电信号检测系统设计[J].传感器与微系统,2015,34(9):64-68.
[7] Moreas J C T B,Seixa M O,Vilani F N,et al.A real time QRS complex classification method using Mahalanobis distance[J].Comput Cardiol,2002,29:201-204.
[8] 安计勇,高贵阁,史志强,等.一种改进的K均值文本算法[J].传感器与微系统,2015,34(5):130-133.
[9] 杨 波,张 跃.基于多模板匹配的室性早搏辨别方法[J].计算机工程,2010,36(16):291-293.
[10] Osowski S,Hoai L T,Markiewic Z T.Support vector machine based expert system forreliable heart beat recognition[J].IEEE Transactionson Biomedical Engineering,2004,51(4):582-580.
[11] Kiranyaz S,Ince T,Pulkkine N J,et al.Personalized long-term ECG classification:A systematic approach[J].Expert Systems with Applications,2011,38(4):3220-3226.