基于深度学习的心电图心律失常分类方法
2022-04-20张逸,周莉,陈杰
张 逸,周 莉,陈 杰
(1.中国科学院微电子研究所,北京 100029;2.中国科学院大学,北京 100049)
近些年来,全世界因心血管疾病导致的人类死亡人数不断增加。据世界卫生组织的统计显示,全世界平均每年因为心血管疾病而死亡的人数约为1 790 万人,占所有居民疾病死亡人数的30%以上,远高于其他疾病。对于心血管疾病发病的提前预防和诊断就显得愈发重要。心律失常是心血管疾病发病前的常见症状。心律失常是指心脏跳动频率或者节律出现异常的变化,一般是由心脏活动的起源或传导障碍导致。心电图(Electrocardiogram,ECG)具有成本低、使用方便、效率高和无创性等特点,是诊断心律失常最便捷的方法。目前最普遍的心律失常的诊断方法是依靠医生经验进行诊断,诊断结果比较依赖医生的诊断经验,面对大量的ECG 信号数据,医生可能会因为长时间的连续工作产生疲劳而出现漏诊、误诊的情况。ECG 心律失常自动分类技术能够提高ECG 心律失常分类的效率和准确率,避免因医生的诊断经验不足或疲劳等引起的漏诊、误诊,使医生能对心律失常及时地作出诊断和治疗,从而减少心血管疾病的发作,降低心血管疾病的死亡率。
1 ECG心律失常分类的研究内容
1.1 ECG信号提取与预处理
ECG 心律失常分类算法一般分为3 个步骤:ECG信号提取与预处理、ECG 信号特征提取和ECG 心律失常分类。
ECG 信号在采集时通常包含许多噪声,包括工频干扰、肌电干扰、基线漂移等,严重影响ECG 信号中正常波形的识别和ECG 信号特征提取[1]。因此需要对ECG 信号进行预处理滤除心电噪声。ECG 信号的滤波方法可分为传统滤波方法和现代滤波方法。传统滤波方法包括FIR 数字滤波器、IIR 数字滤波器等[2-3]。文献[4]提出了一种带有Kaiser 窗口的FIR 数字滤波器方法,用来去除ECG 信号中的干扰。现代滤波方法包括小波变换、自适应滤波算法、集合经验模态分解等。离散小波变换将ECG 信号分成不同频带,能很好地表示非平稳信号,和传统方法中的FIR数字滤波器相比,具有更好的效果[5]。文献[6]使用集合经验模态分解方法对ECG 信号进行降噪,与传统的降噪方法相比,它的降噪能力更强,降噪后的ECG信号质量更好。
1.2 ECG信号特征提取
ECG 信号的特征提取主要是对ECG 信号的特征参数的准确提取。提取有效的ECG 信号特征、提取出的特征是否能区分不同信号的类别是准确进行心律失常分类的关键。目前ECG 信号的特征提取方法有时域频域分析法、小波变换分析法、主成分分析法、独立成分分析法和线性判别分析法等[7-9]。
1.3 ECG心律失常分类
ECG 信号特征提取之后,就需要对心律失常进行分类。近些年来,心律失常自动分类的方法主要有传统的信号处理方法、传统机器学习的方法、人工神经网络方法等[10]。基于传统机器学习的心律失常自动分类过程步骤如下:首先根据医学知识,人为构建多种类型心拍的模式空间,再通过模式空间提取ECG 心拍的特征,最后利用分类器实现ECG 分类。近些年来基于机器学习的方法被大量地用于解决心律失常分类的问题,主要有线性分类器、支持向量机(Support Vector Machine,SVM)、K 近邻算法等。这些方法存在以下不足:泛化能力较弱、识别效果依赖于模式空间的人为构建,存在人为设计的局限性和复杂性;该类算法需要完成特征提取和分类两个独立任务,存在不同任务间数据重建的复杂性[11]。而基于人工神经网络的方法则不需要人工进行特征提取,输入数据在经过卷积层后能被自动提取特征。基于人工神经网络的方法在ECG 心律失常分类中取得了较好的分类效果。
2 研究方法
2.1 数据预处理
为了充分利用卷积神经网络(Convolutional Neural Networks,CNN)在解决图像分类问题上强大的特征提取能力和泛化能力,该文使用二维CNN 对ECG 心律失常进行分类。CNN 是一类包含卷积计算且具有深度结构的前馈神经网络,被广泛应用于图像识别和计算机视觉等领域。通过将MIT-BIH 数据库中的一维ECG 信号转化成适合于输入二维CNN模型的二维图像数据,不再需要人工对输入数据进行噪声过滤和特征提取。CNN 结构在处理ECG 心律失常分类任务时,可以使用原始ECG 图像样本作为网络的输入,不需要人工提取特征。卷积过程就是提取特征的过程,在训练数据的过程中可以自动提取ECG 图像的特征。将每个ECG 心拍的范围定义为以R 峰为基准点,取R 峰前100 个采样点和R 峰后140 个采样点作为一个心拍。根据心拍范围的定义,将一维连续的ECG 信号分成单独的ECG 心拍并绘制为分辨率为64×64 的二维图像。
图1 ECG一维信号转换为二维图像
2.2 神经网络结构设计
针对ECG 心律失常分类任务的相关要求,该研究设计了轻量化的二维CNN 结构,对ECG 图像进行高精度的分类。所设计的CNN 采用的卷积模式为MobileNets[12]中提出的深度可分离卷积。深度可分离卷积将传统卷积模式分成深度卷积(Depth-Wise convolution,DW)和逐点卷积(Poin-Wise convolution,PW)两步进行。深度可分离卷积与标准卷积的区别如下:标准卷积的卷积核是用在所有的输入通道上,而DW 卷积则是每个输入通道只用一个卷积核进行卷积。PW 卷积的运算和标准卷积运算相似,只是采用尺寸为1×1×M(M为上一层的通道数)的卷积核。将传统卷积模式分成DW 卷积和PW 卷积两步可以大大减少卷积核参数数量和卷积计算的复杂度。
基于MobileNetv2[13]中提出的倒残差模块思想,设计网络的基础模块block。每个基础模块block 中都包含深度可分离卷积和SoftPool[14]池化层,如图2所示。
图2 网络基础模块block
在每个模块内交替使用2 次1×1 的PW 卷积和1 次3×3 的DW 卷积,在DW 卷积后接SoftPool 池化层,可以减小特征图的大小从而减小网络的计算量,增大卷积的感受野。在前两次卷积之后执行BN 运算和ReLU 激活。BN 运算为批归一化操作,对激活函数的输入进行归一化,可以加快模型训练速度,提升模型的精度。ReLU 激活函数相比于其他的激活函数具有更小的计算量和可以避免梯度消失等问题。第三次卷积之后不进行非线性激活,保留线性输出。该研究提出的CNN 网络结构如图3 所示。
图3 CNN网络结构
该文提出的网络模型使用全局平均池化层(global average pooling)加Softmax 层替换全连接层作为网络的分类器。由于全连接层的参数量太大,使用全局平均池化层替代之后可以减少网络的参数量和计算量,还能避免全连接层带来的过拟合风险,提升网络的分类效果。
3 实 验
3.1 数据集生成
实验使用由美国麻省理工学院提供的研究心律失常的MIT-BIH 数据库来生成实验数据集。MITBIH 数据库中包含48 个双通道动态ECG 记录,每个记录长度为30 min,以每通道每秒360 采样点进行采样。多个心脏学专家对每份数据进行了标注,得到每份数据的参考注释。MIT-BIH 数据库中注释的主要心拍类型如表1 所示。
表1 MIT-BIH数据库主要心拍类型
根据美国医疗仪器促进协会(Association for the Advancement of Medical Instrumentation,AAMI)的标准,将ECG 心拍类型分为5 类,需要把MIT-BIH 数据库中注释的心拍类型转换为AAMI 的心拍类型。
表2 AAMI标准转换MIT-BIH心拍类型
经过ECG 输入数据预处理后,可以从MIT-BIH的数据库中生成96 577张ECG 图像,按照8∶2的比例将生成的ECG 图像数据集划分为训练集和测试集。
3.2 实验结果
使用生成的ECG 图像数据集对提出的CNN 网络进行训练和测试,测试结果如表3 和表4 所示。
表3 ECG测试集上的混淆矩阵
表4 ECG测试集上的测试结果比较
表3 给出了使用CNN 模型进行测试得到的混淆矩阵。混淆矩阵的列代表了各类别的预测值,行代表了各类别的真实值,能够表示各类别的真实值和预测值的分布情况。
为方便与其他方法进行分析比较,使用以下3个指标评估分类效果:准确率(Accuracy)、精确度(Precision)和召回率(Recall)。计算方式如下:
其中,TP表示某类别中正确检测为该类别的样本,FP表示某类别中错误检测为该类别的样本,TN表示某类别中正确检测为非该类别的样本,FN表示某类别中错误检测为非该类别的样本。
准确率能够表示正确的测试结果占全部测试结果的比例。精确度表示某类别中所有检测为该类别的结果中真阳性测试结果的比例。召回率则是表示某类别中正确鉴定为该类别的阳性检测结果占全部该类别结果的比例。通过以上3 个指标,能够准确评估提出的方法的分类效果。
表4 给出了该方法在测试集上的准确率、平均精确度和平均召回率,并与其他相关的ECG 自动分类方法进行比较。实验结果显示,该文提出的CNN模型在ECG 心律失常分类的准确率达到98.6%,与其他方法相比,该方法具有最高的准确率、平均精确度和平均召回率。
4 结论
该文提出了一种基于二维卷积神经网络模型的心律失常分类方法,将MIT-BIH 数据库中的ECG 信号转换为二维ECG 图像作为输入对CNN 网络进行训练和测试。实验表明,该方法在ECG 心律失常分类中达到了98.6%的分类准确率、98.5%的平均精确度和98.6%的平均召回率,实现了对ECG 心律失常的高精度自动分类。