APP下载

基于卷积神经网络的心电信号质量分析

2020-03-11张海斌刘思璇

计算机工程与应用 2020年5期
关键词:电信号导联卷积

张海斌,刘 娟,刘思璇,程 宇

武汉大学 计算机学院,武汉430072

1 引言

心电图(ECG)是利用心电图机从体表记录心脏心动周期所产生的电活动变化图形的技术,记录的是电压随时间变化的曲线。随着社区医疗服务的发展,心电图的作用越见显著,可以及时帮助发现潜在的心脏疾病或先天性心脏病。目前,心电图已成为临床最常用的检查之一,主要用于记录人体正常心脏的电活动,帮助诊断心律失常、心肌缺血、心脏扩大、肥厚、心肌梗死及部位,判断药物或电解质情况对心脏的影响及判断人工心脏起搏状况等。临床检查上,心电图主要依靠心电图医师对ECG 信号的波形和节律等进行分析,分析结果易受医师的主观因素影响。另一方面,各类医疗和体检等机构每天均产生大量ECG 数据,但有经验的心电图医师资源却严重不足,制约了心电图的临床辅助诊断效果。因此,越来越多的研究机构致力于心电图信号的自动判读方法的研究。

心电信号的采集经常受到各种类型的噪声的污染,包括基线漂移、电干扰、肌肉颤动干扰和运动伪信号[1]。噪声污染影响采集到的心电图信号的质量。心电信号的质量好坏,决定着波形特征和节律特征检测的难易程度,因而直接决定着最终诊断的准确性。质量极差的心电图几乎无法获得其波形或节律等有效信息,即使是经验丰富的医生也很难对其进行正确判读,不适用于临床应用。因此,在利用计算机方法对心电信号进行自动判读之前,有必要对其质量进行评估,及时剔除临床不可接受的心电信号。自PhysioNet/CinC Chanllenge 2011(PICC)以来,越来越多的学者开始对此进行研究[2]。现有的心电信号质量评估方法大体可分为两类:基于规则或启发式的评估方法和基于机器学习的评估方法。

在规则或启发式的研究方法中,文献[3]基于心率特异性信号小波分解系数得到的能量熵来评估是否可以从门诊病人的单导联心电图中获得可靠的心率,在标记好的数据集上的灵敏度和特异性分别为94%和98%,但该方法对P 波、T 波等波形受噪声干扰的数据检测结果不佳。Maan等人提出了一种基于导联相关性和Kors矩阵的心电质量评价方法,在PICC 数据库对该方法进行评价,正确率为92.2%[4]。Johannesen和Galeotti制定规则丢弃无信号变化、大振幅偏移的心电图记录,通过高通滤波器和三次样条函数检测基线漂移、电力线和伪影来进行质量评估,该方法在PICC 测试集上的准确率为90%[5]。Zhang Yatao 等 人 使 用Lempel-Ziv complexity来评估心电信号的质量,实验结果表明LZ 值对噪声信号比较敏感,尤其是高频噪声信号[6]。Naseri 等人则提出了基于能量凹陷指数(energy-concavity index)和心电信号相关性测量来对心电信号进行分析[7]。文献[8]提出了一种基于简单启发式融合和模糊综合评判的心电图质量评价方法。该方法通过提取波形基本特征,结合柯西分布、矩形分布和梯形分布建立了模糊向量。选择有界算子和加权隶属度函数进行评价和分类。在PICC 测试数据集上的准确率、敏感度和特异度分别为0.946、0.903和0.93。

在机器学习方法中,文献[9]采用结构相似性对两个心电图的图像进行比较,通过聚类方法选择具有代表性的心电图图像作为模板,再通过线性判别分类器进行质量评估,该方法在UCSF 数据库上的准确率为0.931,在PICC 数据集上的准确率为0.825。Behar 等人通过7个信号质量指数(pSQI、baseSQI、sSQI、kSQI、bSQI、rSQI和pcaSQI)共72个特征来设计分类器,并在PICC、MITBIHA、MICMIC II数据集上进行测试,利用高斯核函数的SVM分类器,对于窦性心律正常的心电图,分类准确率达到99%,对于心律失常的心电图,分类准确率达到95%[10-12]。同样,Clifford 等人也通过6 个信号质量指数(iSQI、bSQI、fSQI、sSQI、kSQI和pSQI)作为特征来设计多分类器(NB、SVM、MLP 等)进行质量评估,在PICC 测试集上取得了92.6%的准确率[13]。在文献[14]中,Kuzilek 提出了三级算法来评估ECG 信号。第一步提出简单规则对心电图做一个简单分类,基于阈值,给心电图一个分数。第二步计算特征,这些特征被给予SVM 用于计算得分。最后,组合第一步和第二步的分数来确定心电图信号质量。该方法在PICC数据库上进行测试,训练集和测试集得分分别为0.999和0.836。

但已有的研究,无论是规则化还是机器学习的方法,都存在一定的局限性:第一,噪声环境下计算各种特征尤其是形态学特征,仍然是一项具有挑战性的任务。第二,临床环境下,心电专家很难提出一套合适的规则来对心电图质量的好坏进行判定,阈值参数的设定也非常困难。

深度学习(Deep Learning,DL)是机器学习研究中一个新的领域,其动机在于建立、模拟人脑进行分析学习。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示,在计算机视觉[15]、图像处理[16]、语音识别[17]、自然语言处理[18]等领域已经取得了很好的成果。

卷积神经网络(Convolutional Neural Network,CNN)在计算机视觉、图像处理等方面都取得了不错的成绩。在心电疾病多分类领域也有研究[19-20]。本文基于卷积神经网络对心电信号的质量进行评估,用经过标记的“质量可接受”和“质量不可接受”的原始心电图数据进行卷积神经网络训练,通过网络模型自己寻找分类特征,最终学习得到心电信号质量评估模型。

很多心电图信号中部分片段质量不可接受,而部分片段的质量可接受。如果质量可接受的部分信息足够多,则该心电图也能用于临床。与其他方法直接对心电图整体的质量进行评估的策略不同,本文基于片段对心电图进行质量评估,可以得到更精细的评估结果。

2 模型与方法

2.1 模型框架

临床上在对心电图进行诊断分析时,更多的是将心电信号当作图像来分析。卷积神经网络是一种深度前馈人工神经网络,已成功地应用于图像识别方向。典型的卷积神经网络主要由输入层、卷积层、池化层、内积层和输出层组成。本文将心电图质量评估问题看成是将心电信号分为临床可接受和临床不可接受的两分类问题,并使用文献[21]中的3 层卷积神经网络来构建分类模型,模型示意图如图1所示。

2.2 输入层

输入层:输入层加载模型的输入并产生用于馈送给卷积层的输出。临床诊断下,心电图节律异常需要根据连续多个心动周期做出判断,单一或少数几个心动周期很难发现问题,因此本文模型输入的数据格式定义为1×1×3 000,即3 000 个采样点长度的一维数据,代表着一段时间长度的心电信号,这样,既保证了得到的质量可接受的数据片段能用于节律异常诊断,也能最大化地找到“质量可接受”数据。同时数据采样频率为500 Hz。

图1 CNN模型结构

目前,常见心电图主要是单导联、8 导联、12 导联等。并且不同来源的心电信号,其采样频率和采样长度也不同。当需要对采样频率不是500 Hz的多导联心电信号作为输入时,需要对每个导联进行降采样或过采样以调整采样频率为500 Hz。

2.3 卷积层

卷积层:卷积层将输入层输出的数据与一组可学习滤波器卷积,每个滤波器在输出图像中产生一个特征映射。给定一个输入信号序列xt,t=1,2,…,n 和滤波器wt,t=1,2,…,m。输入层的特征被一个卷积核进行卷积,再加上一个额外的偏置b,之后通过激活函数得到输出特征。第l 层的第i 个神经元的输入ali定义为:

2.4 池化层

池化层:池化层的输入是上一层卷积层的输出结果,它的目的主要是对输入的空间维度进行下采样,降低特征向量维度。常见的池化操作是取核区域内所有神经元的最大值(MAX)或者平均值(AVE)。对上一个卷积层输出的特征向量,将其划分为多个区域Rk,k=1,2,…,K ,每一个区域的大小即池化size的大小,有:

2.5 内积层和输出层

内积层:也称之为全连接层。经过之前的卷积层、池化层后,样本数据已经被映射到隐藏层的特征空间中,内积层就是将之前学习到的特征又映射到样本分类空间中。在这个模型中有两个内积层。其中,最后一个卷积层的输出通过SoftMax 激活函数输出属于每个类别的概率。

经模型训练过程,得到本模型采用的CNN 网络结构如表1。经过3个卷积池化操作和2个全连接层操作后,模型输出数据属于某一类别的概率值。通过概率值即可判断该数据属于二分类中的哪一类。

表1 本文采用的CNN网络结构

2.6 多导联长数据输出结果

由模型输入数据的条件可知,当对多导联心电图进行质量分析时,如果每个导联的长度大于3 000 个采样点的长度,最后通过模型判断,该心电图的每个导联都有多个输出结果,分别表示该导联各个小片段数据的信号质量分析结果。

3 实验

3.1 训练数据准备

PhysioNet/CinC Chanllenge 2011 挑战赛(PICC)期望参赛选手评估心电图信号质量,以获得质量可接受的心电图数据。本文从PICCset-a数据集上选取模型训练需要的数据。该数据集包含1 000份数据,是标准12导联心电信号,采样频率是500 Hz,采样时长10 s。每份数据均经过多名医生标记为“质量不可接受”(unacceptable)或者“质量可接受”(acceptable)。该数据集可以通过文献[22]进行下载获取。

考虑到模型输入层数据的要求和数据样本的数量,本文将set-a 数据集中每个导联的心电信号截取成6 s、3 000个采样点长度的训练样本数据。数据经处理和心电医生标记后得到4 878份数据用于模型训练,其中“质量可接受”数据2 719 份,“质量不可接受”数据2 159份。图2(a)是该数据集中被标记为“质量可接受”标签的数据,图2(b)~(d)是该数据集中被标记为“质量不可接受”标签的数据。

3.2 评价标准

PICC 2011 挑战赛数据的长度为5 000 个采样点,为满足模型输入的条件,先将数据分割成3 000 个采样点长度的片段。这里,每个导联的数据均被分割成2个小片段。再将每个片段作为模型的输入数据进行预测得到结果,最后将每个片段的结果进行综合分析得到该份数据的质量分析结果。

图2 PICC标记ECG信号

实验数据中,正类表示“质量不可接受”,负类表示“质量可接受”。用TP 表示正确预测的正类数,TN表示正确预测的负类数,FN 表示将正类预测为负类的数目,FP 表示将负类预测为正类的数目,对于正确率accuracy(Acc) ,敏感性sensitivity(Se) ,特异性specificity(Sp),有:

3.3 实验环境

本文使用Caffe框架,实验软件平台采用Windows10系统、Pycharm 和Anaconda 2,硬件环境是16 GB 内存,intel®Core™ i5-7200 CPU @ 3.40 GHz,主频3.41 GHz的Dell计算机。

3.4 PICCset-b数据集实验分析

本文采用随机梯度下降法来最小化损失函数,经模型调试,模型训练时batchsize 设为50,即每次输入的样本数为50;基础学习率为0.01;epoch为50,共进行50轮训练迭代。

对用PICCset-a 数据集训练好的模型采用独立的PICCset-b 数据集进行评估。PICCset-b 数据集共有500份标准的12 导联心电图信号,采样频率和与PICCset-a数据集格式一样。用PICCset-a数据集上训练好的模型和基于片段策略,在PICCset-b上测试,不仅可以在实际情况中设置不同的阈值给出每张心电图的质量评估结果,还能确定具体可用的数据片段。图3 是数据集NO.2794112心电图,各导联中每个小片段数据“质量不可接受”的概率评估结果(保留2 位小数,下同)为{(0.01,0.03),(0.03,0.06),(1.00,1.00),(0.04,0.08),(0.70,0.72),(0.67,0.58),(0,0),(0,0),(0,0),(0,0),(0,0),(0.01,0)}。III导联2个小片段评估为“质量不可接受”的概率都为1。但其他导联小片段数据质量不可接受的概率都非常小,因此该心电图全局会判定为质量可接受,同时给出局部评估结果,后续可以不对III导联的信号进行特征检测,避免因为噪声干扰造成特征提取不准的问题。图4 是NO.2969646 心电图,各导联每个小片段数据“质量不可接受”的概率评估结果为[(0.34,

0.50),(0.40,0.94),(0.22,0.97),(0.35,0.92),(0.44,1.00),(0.44,0.96),(0.29,1.00),(0.21,0.90),(0,0),(0.03,

0.59),(0.12,0.98),(0.25,0.99)]。2 个导联的前部分信号“质量不可接受”的概率都很小,后部分信号“质量不可接受”的概率很大,该心电图可以根据实际情况给出全局分析结果,特定情况下可以丢弃后部分“质量不可接受”信号,利用前半部分信号进行下一步的分析。

图3 NO.2794112 ECG信号

图4 NO.2969646 ECG信号

从实验分析也可以看出,采用小片段进行分析,给出全局分析结果的同时,也提供局部质量分析结果,能更准确地找出心电图信号“质量可接受”的片段,对后续的特征提取和自动判读更有价值。

3.5 与其他方法的比较

在set-b 测试集上进行全局质量评估,实验设定:80%以上的小片段检测为“质量不可接受”,则全局判定为“质量不可接受”,否则全局判定为“质量可接受”。与心电医生标记的结果比较,共472 份心电数据判定正确,正确率达到0.944,其中,敏感性Se 为0.964,特异性Sp 为0.924。

表2是本文方法和其他方法的对比结果,Xia等人[23]提出的正则矩阵(Matrix of Regularity)融合信号质量多项特征,准确率为0.929,由于质量不可接受数据不确定性较大,种类较多,该方法特征规则主要针对缺失信号、导联信号交叉和不规则节拍等质量不可接受信号,因此质量不可接受的识别率(Se)相对较低,而质量可接受的数据在这些特征规则的判定下识别率(Sp)较高。Clifford等人[12]提取6种信号质量指数(SQIs),通过实验对比发现5个特征组合的分类器准确率最高,运用在多层感知机(MLP)上的准确率为0.940,运用支持向量机(SVM)的方法,准确率为0.916,相比于MLP 对这些特征进行再学习不同,原特征在SVM方法中对“质量可接受”数据区分度不大,特异性Sp 有待提高。Kalkstein等人[24]则根据先验知识,针对该数据集制定相应规则,在set-b上的准确率为0.912。而本文方法在不需要显示手动提取信号质量特征,也不需要选取规则和阈值的情况下,准确率和敏感性均最高,相较于“质量可接受”的数据,模型对“质量不可接受”的预测能力更强,原因在样本标记时,质量可接受与否的界定存在主观因素,存在噪声干扰但临床还能接受的数据标记为正常,模型在学习时会将这类噪声当做“质量不可接受”类别的特征,误判为“质量不可接受”。针对该问题,后续研究会增加模型训练的样本数,保证数据和标签的差异性,使模型具有更强的泛化能力,更准确地学习到不同类别的特征。

表2 本文方法与其他方法的实验结果

4 结束语

临床环境下采集的心电信号往往由于含有大量的噪声使得心电特征提取和诊断变得异常困难,评估心电信号质量将有助于后续研究。卷积神经网络是一种深度前馈人工神经网络,已成功地应用于图像识别方向。本文使用一维卷积神经网络模型来对心电信号质量进行分析。模型通过3个卷积、池化层和2个全连接层,将输入的信号数据进行二分类概率输出。经过心电医生标记,PICC set-a 数据集上训练得到的模型,在set-b 数据集上测试,准确率为0.944,敏感性为0.964,特异性为0.924,相比其他方法,在不需要显示提取特征的情况下,分类效果得到一定的提升。

对心电图进行质量评估的主要目的是减少由于心电信号不可接受而造成的误报警。已有方法大多对心电图进行整体分析,一旦判定为质量不可接受,就不会对该心电图进行后续的特征检测或疾病分类。本文基于小片段数据分析,当质量不可接受数据比较少,质量可接受的数据足够多,该心电图也能用于临床研究。在心电图信号采集无法避免噪声干扰的情况下,可以最大限度地利用已有数据进行临床辅助诊断。

猜你喜欢

电信号导联卷积
回旋支闭塞引起孤立Ⅰ、aVL导联ST段抬高型心肌梗死2例并文献复习
基于联合聚类分析的单通道腹部心电信号的胎心率提取
基于3D-Winograd的快速卷积算法设计及FPGA实现
心电图预测急性下壁心肌梗死罪犯血管及预后的价值
12导联动态心电图与其他导联心电图的比较与应用
卷积神经网络的分析与设计
从滤波器理解卷积
基于Code Composer Studio3.3完成对心电信号的去噪
基于傅里叶域卷积表示的目标跟踪算法
基于随机森林的航天器电信号多分类识别方法