基于小波熵的早期房颤心电信号检测算法
2018-11-28刘鹏宇
摘要:房颤是全球最为常见的心律失常,由此导致的并发症不断威胁着人类健康。心电图是临床上行之有效的研究手段。选取PhysioNet2017心电数据库,使用PAN- TOMPKINS方法对数据预处理,接着离散小波分解方法获取小波熵,最后使用正则化逻辑回归算法进行分类。经50组实验验证,方法平均准确率为92.98%、灵敏性为93.33%,特异性为92.63%,能够快速检测房颤。
关键词:RR间期;小波熵;递归定量分析;房颤
一、引言
房颤是一种很常見的快速心律失常疾病,也是心脏疾病中难于攻克的难关之一。全球房颤总患病率为0.4%,成人患病率在0.5%~0.95%之间,在75岁以上人群可达10%[1]。短时、偶尔发作的房颤本身并不会危及生命,但是快速持续的房颤会导致心力衰竭等严重后果[2]。不仅如此,房颤病人的住院率和费用都很高,耗费了巨大的医疗资源和治疗费用[3]。
研究房颤检测算法,把握治疗的最佳时期,减少房颤的发病率和死亡率。心电图是诊断心脏电活动的常用诊断工具,现有的研究房颤方法主要是根据房颤时心电图的两大特征展开:(1)P波消失,出现一系列无规则的F波;(2)RR间期绝对不等。由于P波与F波属于微弱波,容易受噪音和基线漂移影响[4],基于P波消失的检测房颤算法,如[5], [6],并没有展现很好的性能。近些年,学者提出了基于RR间期检测房颤的方法。RR间期伴随着人体生理状态的变化而变化,能够用于快速房颤检测。Park制作庞加莱图并计算簇的数量、平均步进增量、对角线周围点的离散度作为三个特征,输入支持向量机算法检测房颤[7]。万慧华等制作序列直方图,将其输入神经网络进行房颤检测[8]。Zhou提出基于符号动力学和香农熵的方法检测房颤[9]。但目前这些方法需要长时数据确定房颤发作,无法判定时长小于一分钟的房颤。为了解决这一问题,本文提出基于小波熵的房颤检测方法,从量化信息的角度入手,能够用于检测短时房颤。首先利用心电图提取RR间期时间序列,接着利用小波变换分析和香农熵计算小波熵,最后将正则化逻辑回归引入房颤检测算法中,进行房颤的检测。正则化逻辑回归的优点是能够很好的解决机器学习算法中过度拟合的问题。方法流程图如图1所示。
二、材料和方法
2.1数据库及数据预处理
为验证算法性能,论文使用Computing in Cardiology Challenge 2017竞赛提供的数据库,是目前有关房颤短时单导联心电图的最新数据。数据库包含时长跨度为9秒至60秒的心电图,采样频率为300赫兹。提取心电信号RR间期时间序列,选择PAN- TOMPKINS算法实现该目标[10],其设计的数字带通滤波器能够减少由于心电信号中存在的各种干扰而引起的错误检测,。使用标准的24小时的MIT/BIH心律失常数据库验证,该算法正确检测QRS波群的概率为99.3%,可靠性高。
2.2小波熵
小波变换继承和发展了短时傅立叶变换局部化的思想,同时又克服了窗口大小不随频率变化等缺点,是进行信号时频分析和处理的理想工具。
小波变换需要利用一个小波的平移和伸缩来展现信号的特征,所使用的小波称之为小波母函数Ψ(t),将Ψ(t)进行伸缩和平移,可得到函数ψa,b(t):
本文中,信号s(t)是按照300赫兹的频率进行采样,因而使用离散小波变换。信号将表示为一系列不同尺度j和不同平移k的小波母函数的线性组合,每一项称之为小波系数,其表示为:
小波系数提供了信号全部的信息和不同尺度下局部能量的直观估计,且可用于计算每一尺度上信号的能量。基于此,尺度j有关的相对能量表达式为:
N表示分解层数,Pj表示小波系数的长度,相对能量总和等于1,其相对能量分布可视为一个时间尺度密度,能够表示不同尺度下,时间域上频率的分布状态。求得相对小波能量,进而能够计算尺度j上的多尺度小波熵WE,表达式为:
每一尺度的熵值反映了其概率分布的有序程度,能够被看作是衡量信号有序度或者无序的方法。如果是一个完全无序过程生成的紊乱信号,在不同的尺度上都存在小波系数,此时该信号的小波熵值近似于1。
本文所提出的方法,利用尺度为2的离散小波变换分析求解心电信号RR间期时间序列的小波熵。Rafiee对Haar、Daubechies、Coiflet、 Biorthogonal、Reverse Biorthogonal 和Symlet6种不同的小波母函数进行测试,使用6阶Daubechies小波母函数能够得到最优值[11],因此本作选择它作为离散小波分解分析的小波母函数。
2.3正则化逻辑回归
在机器学习算法中,当使用小规模、多特征量的训练样本时,模型容易出现过拟合的现象,即训练得到的分类预测模型适用于训练样本,均方误差小、准确率高,在测试集上效果不好。而正则化方法能够在一定程度上抑制过拟合,加强模型的泛化能力。
三、结果与讨论
共选取了1000条心电信号进行分析,其中房颤信号和正常窦性心律信号各500条,紧接着获得RR间期时间序列。离散小波分解方法中,db6作为小波母函数,分解2层后计算小波熵。接着带入正则化逻辑回归算法中进行训练,训练集与测试集的信号按照比例为7:3随机抽取,完成分类预测。在测试集中,算法的准确率为92.98%、灵敏性为93.33%,特异性为92.63%,结果如表1所示。
测试集小波熵的箱线图分析如图2所示,房颤组和窦性心律组的小波熵分布区别明显,房颤的小波熵明显比窦性心律的小波熵大,说明可以表征房颤与窦性心律信号内在动态差异性变化规律。这表明在房颤发生过程中,病理引起的电活动兴奋性导致不同尺度上的小波系数的有序程度发生转化。通过量化RR间期时间序列,从而能够识别房颤和窦性心律,相比于依靠P波或F波的检测算法,不需要考虑心电图中噪音的干扰,并且该算法在短时房颤片段中有很高的检测准确率。
参考文献
[1]G. Pagana et al., “Time–frequency analysis of the endocavitarian signal in paroxysmal atrial fibrillation,” IEEE Trans. Biomed. Eng., vol. 59, no. 10, pp. 2838–2844, 2012.
[2]M. Bohnen et al., “Quality of life with atrial fibrillation: do the spouses suffer as much as the patients?,” Pacing Clin. Electrophysiol., vol. 34, no. 7, pp. 804–809, 2011.
[3]A. Ringborg et al., “Costs of atrial fibrillation in five European countries: results from the Euro Heart Survey on atrial fibrillation,” Europace, vol. 10, no. 4, pp. 403–411, 2008.
[4]N. Larburu, T. Lopetegi, and I. Romero, “Comparative study of algorithms for atrial fibrillation detection,” in Computing in Cardiology, 2011, 2011, pp. 265–268.
[5]A. Petr?nas, L. S?rnmo, A. Luko?evi?ius, and V. Marozas, “Detection of occult paroxysmal atrial fibrillation,”Med. Biol. Eng. Comput., vol. 53, no. 4, pp. 287–297, 2015.
[6]戴呼合 and 姜守達, “基于 ICA 和小波变换的房颤 F 波提取算法,” 仪器仪表学报, vol. 32, no. 8, pp. 1716–1723, 2011.
[7]J. Park, S. Lee, and M. Jeon, “Atrial fibrillation detection by heart rate variability in Poincare plot,” Biomed. Eng. Online, vol. 8, no. 1, p. 38, 2009.
[8]刘明, 万慧华, 龚硕然, and 韩小岑, “基于 RR 间期差的深神经网络房颤检测,” 激光杂志, vol. 36, no. 1, pp. 90–93, 2015.
作者简介:刘鹏宇,1994.04,男,回族,辽宁省沈阳市,硕士研究生,研究方向为工业工程,从事医疗数据分析方向的研究。