基于多指标融合的动态心电质量评估
2018-08-09朱超刘文彦王璐徐礼胜张书琪周树然张良钰
朱超,刘文彦,王璐,徐礼胜,张书琪,周树然,张良钰
东北大学 a.中荷生物医学与信息工程学院;b.计算机科学与工程学院,辽宁 沈阳 110169
引言
心血管疾病占非传染性疾病死亡总数的46%,是该类型疾病死亡的主要原因[1]。心血管疾病是世界范围具有普遍性的疾病,死亡人数仍在攀升,相关的诊治与预防关乎全人类的身体健康。而心电(Electrocardiogram,ECG)信号被广泛应用于心血管疾病的相关研究中,基于心电信号的提取和分析对于疾病的诊断和治疗有着极其重要的作用[2]。1901年,荷兰医生与生理学家Einthoven发表了第一篇介绍记录高保真人体心电图的弦线电流计论文,标志着心电图学的诞生[3]。直到现在,医学界仍广泛使用心电图作为心脏相关疾病诊断与治疗的辅助手段。但对于一些相关的突发性疾病的病兆捕获需要采取长时间连续观察,动态心电采集可以实现日常行为下长时间的心电信号采集,克服了常规静态采集在时间与空间上的局限性,并且,对心脏生理的持续监测有利于心血管疾病的早期发现。美国物理学Holter博士将无线电广播发射技术应用于心电图遥测研究[4],于1957年发明了动态心电图[5]。这种基于动态心电图的监护系统可以利用随身携带的采集盒持续监测长达24 h甚至更长时间的心电数据,美国心脏协会将这种可以长时间记录动态心电图的系统命名为Holter系统[6]。Holter技术的投入使用,不但解决了常规采集技术的局限问题,还满足了日益上升的社区与家庭医疗需求,动态心电的研究也逐渐发展起来。而动态心电信号质量的好坏,直接影响着动态心电信号的应用及后续研究的判断,因此,提高动态心电信号质量评估的可靠性和精确度极为重要。
总结现有研究,心电质量评估技术研究按方法的不同,可以分为基于单一指标的评估、基于多指标的评估以及其他评估方法:
(1)基于单一指标的评估方法。早期的心电质量评估技术大多基于单一指标,如通过对心电信号的相邻QRS波形面积的比较,以累积直方图的形式实现对心电信号的质量评估。随着后期信号处理的研究与发展,方法更加多元化,且各有优势,但由于没有有机地结合起来,因而单一指标的评估方法逐步被后续方法取代。
(2)基于多指标的评估方法。该方法基于已有的评估指标或者在此基础上稍加改进的新指标,对心电信号进行综合评价。评价方法大致上有单步处理与多步处理两大类。单步处理指的是一次性、同时对指标进行处理。例如,LI等[7]对12导联分别提取现有的6个质量指标,再对标准数据库中的数据基于机器学习方法将信号按质量好坏分类。另外,李桥等[8]依据时域波形、统计学以及算法匹配,提出多种质量评估指数,并按照阈值的方法进行融合,得到用于综合评估的指标。多步处理则是分步骤对信号质量进行评估,各步骤有独立的评估标准,并且评估结果会影响到下一步。例如,Chudacek等[9]对多导联信号进行基于5种参数的评估,对每个导联信号中的信号段,如果被任何一个参数评估为差,则被判定为“不可接受”的信号,继续下一段信号的评估,否则进行其他参数的评估。
(3)其他评估方法。其他评估方法则视实际问题而定。其中,具有代表性的是噪声分类评估方法,这种方法与上述基于多指标的多步评估方法有一定的相似,也是基于分步骤完成。例如Johannesen[10]首先对信号噪声分类并设定“可遗弃”信号的阈值,对分类按一定的顺序进行预处理。在每一步中,先判断是否为“可遗弃”信号,对剩下的信号进行去噪,接着对下一个分类进行去噪处理,以此类推,最后汇总得到质量结果。
心电质量评估技术依据研究对象的不同,可以分成两大类:静态心电信号质量评估与动态心电信号质量评估。其中,动态心电信号质量评估又可以分为实时短时分析与离线长时分析。静态心电信号主要含有4种基本噪声:呼吸或动作引起的基线漂移、设备采集中引入的工频干扰、肌肉收缩引起的肌电干扰以及因素复杂的随机噪声。相关研究已经很成熟,并且,在前面对评估技术中不同方法的描述中,大部分都能很好地应用于静态心电信号的采集。然而,动态心电信号中噪声种类更复杂,例如,运动伪迹的引入对动态心电信号的研究引入更大的挑战。尽管PhysioNet通过2011年的Computing in Cardiology挑战赛,吸收了许多优秀的动态心电质量评估方法,但是实验数据与测试数据均来自于类似短程心电信息监测系统,评估质量的标准是对一组短时间12导联数据同时评分,不适用于长时间离线评估。因此,动态心电信号本身的复杂性以及监测过程中可能存在的多种干扰使得特征提取与分析的准确性难以保证,进而影响后续判断,使得动态心电的应用受到局限,动态信号质量的评估技术仍存在需要研究与改进的地方。本文旨在提出一种能将动态心电信号按质量好坏进行区分的评估方法,以期提高分析的效率和精确度。
1 数据采集
采集对象为22~25岁的5名健康男性、5名健康女性,遵循自愿参与原则,采集对象均为在校研究生且都知情。采集过程分为基本动作与特殊动作,基本动作包括静坐、静卧、站立、弯腰、行走以及上下楼梯等,特殊动作包括慢跑、骑单车以及打乒乓球等。本文采集时基本动作定为静坐3 min和行走3 min,特殊动作定为慢跑4 min,每组数据长度为10 min,共采集10组数据。实验设计包含了这些动作之间的衔接动作,例如从静坐到站立过程中的起立动作,从行走到慢跑之间的加速动作,这些动作基本上概括了日常生活中必不可少的行为,尽可能地反映真实情况,为日常行为下动态心电信号的分析提供必备基础。
采集设备为ST-1212型号心电工作站(理邦精密仪器股份有限公司,深圳),可以实时显示心电图并导出原始的心电信号数据做离线分析,见图1。采样频率为500 Hz,采用Mason-Likar导联方式采集[11],见图2。
图1 动态心电采集设备图
图2 导联放置及设备穿戴方式
2 指标提取
2.1 外层指标的提取
外层指标一般是检错指标,例如,电极片脱落、导联线接错等,导致心电波形失真或者完全消失。对于外层的不可用信号,因为失去了有效信息,一般无法还原,因而直接忽略;可用信号,表示信号质量并没有完全被噪声或者干扰湮没,可以对内层进行质量好与坏的区分,好的信号可以直接解读,坏的信号可以通过相关处理获取有用信息。
本文仅针对电极片脱落进行指标提取。电极脱落对应的心电信号特征可以描述为一阶导数持续为0的信号段[12],PR段和ST段分别属于PR间期和QT间期的一部分,并且在正常生理情况下,PR段和ST段是呈等电位(也称作等位线),PR间期持续时间在0.12~1.20 s,而QT间期持续时间在0.30~0.44 s[13]。国内研究人员对30例正常人的心电图进行研究,提出PR间期和ST段的指标分别是(200.6±20.8)和(6.7±22.0)ms[14]。由于正常心电信号中存在的等电位对电极脱落的判断造成不可避免的干扰,因此,为了能准确检出故障并避免丢失有用信息,需要设定阈值时间,大于这个时间的信号值一阶导数持续为0,则判断为电极脱落发生。初步设定电极脱落阈值时间为0.22 s。
图3 电极脱落实验数据
标准心电波形图中[15],P波反映左右心房的除极化过程,波形的宽度在0.08~0.11 s,幅度不超过0.25 mV。PR间期指的是心房除极开始至心室除极的时间。QRS波群反映左右心室除极化的过程,对正常成人而言,其范围为0.06~0.10 s。QT间期表示心室肌除极和复极过程所需总时间,其长短与心率密切相关:心率越快,QT间期越短,反之则越长。U波是继T波后出现的宽而低的波,波幅多在0.05 mV以下,波宽约0.20 s,发生机制尚不明确。
采集一组手动撕去电极贴片的实验数据,绘制实验结果,见图3,图中波形保持水平的三段是需要被“排查”的电极脱落处,在相应数据处标为红色。
其中,图3是检测后部分被检测数据的截取图。被标记的数据表示被检出的电极脱落发生处,可以发现脱落处被完整标记出来。而脱落处两端处信号有幅值振荡剧烈甚至达到饱和,这是由于手动撕取以及重新贴回动作中会存在不可避免的延时,由于与实际现象有一定偏差,本文暂不作研究。图3则是数据整体检测情况,与设想结果一致,电极片脱落处都较好地被检出。
为了验证该方法的可行性,重新采集一组含有电极片脱落数据,并对该数据进行测试。绘制实验结果,见图4。
图4 增加电极脱落发生次数后的检测结果
可见,在每一处电极片发生脱落处都能准确检测出,则信号s第k点处电极脱落指标为:
其中,电极未发生脱落,表示可用信号,结果为1,发生脱落,表示不可用信号,结果为0。
2.2 内层指标的提取
从单一指标的合理性、复杂性以及指标间的互补性与一致性关系提出选取原则,从时域分析、频域两个角度分析选取指标[16]。
2.2.1 基于时域分析的指标
信号的波动可以拆分为波动的轮廓与波动的细节,波动轮廓可以用基线漂移情况来衡量,而波动细节则可以用接近一个(或多个)心动周期中波形上下幅值差来获得相对幅值变化。结合现有理论与方法,提出基线漂移程度指标与幅值变化程度指标,分别用实际采集的数据对波动轮廓和波动细节进行验证。
基于小波变换的基线漂移程度指标获取方法是,运用小波变换法分解动态心电信号,通过重构得到表征信号基线漂移情况的重构信号,再对重构信号进行加窗处理,从而获取用于评价基线漂移情况的指标[17-19]。算法如下:
对信号bs进行加窗处理,第i个窗内基线漂移指标bSQI:
bs表征信号s基线波动情况,α为静止状态下心电信号基线值标准。选取实验中有明显基线漂移成分的3组数据为例,加窗长度与窗移长度均为1 s,见图5。从3组数据图中可以看到,信号没有明显基线漂移干扰时,指标值维持在一个稳定的水平,若其中出现了孤立点,这些孤立点对应的信号段中都有轻微的基线漂移干扰;在基线漂移剧烈处,指标值大于这个稳定水平且出现严重偏移。整体来看,基线漂移程度指标能够很好地表征信号中基线漂移情况,信号段中基线漂移程度越严重,则对应的基线漂移指标值越大。
幅值变化程度指标的上包络与下包络可以描述为信号波动区间的上限值与下限值,由上下包络差求得的指标可以用于衡量信号波形中幅值的相对变化,从波动细节上来评估信号的质量。本文采用加窗后信号段的极大值与极小值来粗略估计包络差指标,算法如下:对原始信号s行加窗处理,求得窗内信号幅值最大值Max(si)与最小值Min(si),对波形幅值的变化区间进行限定,第i个窗内幅值变化指标aSQI为:
图5 三组实验数据原信号、基线漂移指标值分布与幅值变化程度指标值分布
选取实验出现幅值波动剧烈的3组数据为例,加窗长度与窗移长度均为1 s,结果见图5。从3组数据图中可以看到,信号波形中幅值波动不明显时,指标值保持为一个较低的稳定水平,一些孤立点出现在幅值发生突变的地方;在幅值波动剧烈的信号段,指标值通常高于稳定水平。整体来看,幅值变化程度指标能够很好地表征信号中幅值波动的情况,当幅值的波动范围增大时,则对应的幅值变化指标随之增大。
2.2.2 基于频域分析的指标
功率谱估计是频域分析方法中具有代表性的方法之一,功率谱反映的是信号的功率P在频域中随频率ω的分布情况,利用频段的差异区分心电信号中不同频率成分。动态心电信号中噪声成分复杂,提取不同噪声的含量作为相关指标的方法难以实现,而整个心动周期信号宽度大致为0~(58±19)Hz[20],用整体减去QRS波形所在频段的成分,可以从频域角度粗略估计噪声成分。本文从算法简易性出发,选取基于快速傅里叶变换的方法进行功率谱估计,计算如下:
对原始信号s行加窗处理,为了避免基线漂移的干扰,选取有效频段为5~35 Hz,并计算功率谱密度值。将整体成分减去有效频段成分,得到第i个窗内频率成分指标fSQI(i):
由于数据包含的噪声类型不确定,因而对整体含噪水平进行评估,任意选取一组数据为例,为了方便比较,将指标值进行归一化,见图6。
图6 实验数据与频率成分指标值分布
3 指标融合
本文采用分步及多指标融合的方法对动态心电信号进行融合[21]。指标的融合分两层进行,外层与内层之间,使用乘法合成法,由于电极片脱落指标并未对信号进行加窗处理,暂不考虑对乘法合成法进行加权;内层指标采用基于信息熵加权的加法合成法[22-23]。
3.1 内层归一化算法
其中,Max(y)和Min(y)用于设定进行无量纲化后数值波动的范围,取+1和-1,得到归一化后第i个窗内的指标nbSQI(i)、naSQI(i)以及nfSQI(i)。
3.2 求熵权
熵权属于信息量权,由于数据量较大且大部分非整数,按某数据点在数据区间所对应的概率值计算其概率。例如,数据值区间[a,b]对应的概率为Pa,b,若x∈[a,b],则x的概率为:
N与Na,b分别代表数据个数与落入[a,b]区间中数据的个数。设第i个指标Ii有n个元素,对指标按照下式求得信息熵为:
Norm()即第(1)步中的归一化处理结果,P()表示求概率,1/log(N)用于转换度量单位。
权重系数除了需要满足收敛性,还需要体现出在整体中的比重情况。对m个指标,ωi是第i个指标的熵值HIi所对应的权重系数,通常可以采用下式求得熵权:
按 照 式 (6)、(7)、(8)求 得nbSQI(i)、naSQI(i)以 及nfSQI(i)对应的熵权值为ωb(i)、ωa(i)以及ωf(i)。
3.3 多指标融合
采用加法合成法,得到内层融合指标:
由于日常行为下长时间采集的动态心电信号的研究有限,缺乏金标准,现今的研究主要基于阈值来判定质量好坏,本文采用基于区间估计的方法进行阈值设定。区间估计是参数估计的一种,它依据既定概率值构建包含待估计参数在内的区间,这个概率值又称之为置信水平,而区间则称之为置信区间[24]。粗略估计,当样本数量变大时,这个区间会更窄,得到的估计值更接近真值,能有效应用于长时间的信号采集之中,解决了经验阈值因为数据量大时会引入更多变动而导致准确性下降的问题。本文假设稳定水平即均值μ,那么对待估计参数μ,初步选取α=0.05求的置信区间[Tl,Tu]则区分信号好坏的阈值为Tu,得到内层指标:
其中,为了方便区分结果,好的质量打分为1,坏的质量打分为0.6。
对内层与外层之间采用乘法合成法,得到基于多指标融合的动态心电信号质量评估指标为[25-26]:
其中k为数据点数。
4 综合评估
以一个完整的心动周期波形为鉴别单位,鉴定要点是P、T波以及QRS波群是否完整,并以此为金标准。选用准确度(Accuracy),灵敏度(Sensitivity)进行心电质量综合评估[27]。定义如下:
真阳性(True Positive,TP)指金标准与评估方法一致评定质量为好的信号段中心动周期个数。假阳性(False Positive,FP)指金标准判断为差但却被算法评估为好的信号段中心动周期个数。真阴性(True Negative,TN)指金标准和评估方法均判断质量为差的信号段中心动周期个数。假阴性(False Negative,FN)指金标准判断为好但却被算法评估为差的信号段中心动周期个数。准确度越高,说明评估方法越接近真实情况;灵敏度越高,说明质量好的信号被检出得越精确。
5 结果与分析
5.1 可行性对比结果与分析
为了说明本文评估方法的可行性,选取一组数据,使用本文的评估方法与经验阈值法进行对比验证,见图7~8。
通过人工复核作为金标准进行核对,可见在图中A处,经验阈值法出现了漏检;在图中B处,经验阈值法检出结果与本文提出的区间估计法相比较为粗糙,在靠后的信号段中,将较好的信号划分到了质量差的信号中。并且,从方法的可延续性来讲,区间估计法融合时,只需直接添加合理的指标进行计算即可,而经验阈值法在添加指标时,还需调整单一指标和融合时的阈值,经过对比,得出本文提出的评估方法是可行的,评估结果更加精确。
5.2 准确度和灵敏度对比结果与分析
图7 经验阈值法的评估结果
图8 区间估计法的评估结果
本文仿照标准数据库的金标准确定方法,邀请了6名志愿者对10组数据进行评估。其中,3名有一定的心电图阅读经验,对另外3名做简单的读图方法指导与说明。每个评估人员对每组数据中的信号按心动周期逐一识读,并且独立完成评估工作。分别对两种评估方法求TP、TN、FP与FN值,最后求平均值以降低人为判断的干扰,对于争议大的结果,由共同协商来确定。分别计算得到两种质量评估方法结果,为了更清晰地对比,使用SPSS 19.0软件采用χ2检验的方法对两种评估的结果进行统计学分析比较,结果见表1。
表1 区间估计阈值法与经验阈值法的比较(周期数)
由表中数据可得,采用经验阈值法在准确度和灵敏度方面均有所下降。由差值可得,真阳性的变化比较明显,说明经验阈值法在评估过程中,对质量好的信号判断有误,会影响到最终的评定结果,不符合实际应用中的要求。相比之下,采用基于区间估计的阈值法进行指标融合能很好地适应于数据的变化,无需做出人为的调整即可获得较好的结果。在准确度和灵敏度方面,χ2检验所计算的P值均小于0.05,说明区间估计法与经验阈值法结果具有明显的差异,基于区间估计方法的准确性更好,并且在质量好的信号检出方面的能力较为突出。总之,区间估计法优于经验阈值法,前者更加准确。
6 结论
本文基于对现实问题的分析,提出了将动态心电信号按质量好坏区分的区间估计的评估方法。利用Holter系统采集长时间动态心电数据,通过对实际数据进行离线分析,从时域波形以及频域成分两个角度提取相应的指标,将加法合成法以及乘法合成法运用到指标融合之中,再利用区间估计原理得到评定信号好坏的阈值,不仅解决了经验阈值的局限性,而且降低了人为因素的影响,能够准确地获取质量好的信号,实现智能评估。最后,再从准确度和灵敏度两个方面,比较区间估计法与经验阈值法,结果表明区间估计法(准确度96.24%、灵敏度97.83%)明显优于经验阈值法(准确度92.39%、灵敏度95.16%),评估结果更加精确。