基于深度置信网络的心电信号分类识别*
2022-04-07刘健徐伟钱炜
刘 健 徐 伟 钱 炜
(江苏科技大学电子信息工程学院 镇江 212003)
1 引言
心血管疾病严重威胁人类生命健康,其病死率超过其他疾病跃居第一,成为世界最重大的医学课题之一[1]。受不健康的生活方式影响,以及人口老龄化趋势不断提高,中国罹患心血管疾病的人数不断增加。加强心血管疾病防治工作,及时发现并有效治疗变得越来越重要。心电图是目前检测心脏疾病最有效的手段,反映了心脏各部位的生理状况。经过100 多年的发展,目前已累积了海量的ECG 信号数据。如何从大量的ECG 信号中有效学习到具有识别度的特征,提高ECG 信号分类的准确性,成为心电信号分类检测系统研究的重要课题。由于心电信号是微弱的生物信号,且受个体差异性影响,不同个体的同类信号也有明显差别,因此,通过人为识别很难正确区分信号。在此基础上,国内外学者研究了多种方法,通过提取心电信号中具有表征性的特征,对信号进行分类识别。这些方法主要有模糊推断法、统计法、线性分类法、神经网络法、支持向量机等[2~6]。但是这些方法需要人为设计特征提取器,不但要求设计者具备丰富的经验知识,而且会对方法有效性造成较大影响。
近年来,随着人工智能的火热发展,深度学习理论被应用于各类领域中。深度学习提供了自动学习深层特征的方法,避免了人为设计对分类效果的影响。目前,应用在心电信号分类识别中的深度学习方法有卷积神经网络(CNN)、自动降噪编码器(SDAEs)、CNN 与长短期记忆网络(LSTM)相结合等[7~10],对信号分类都取得了良好的成果。
本文用受限玻尔兹曼机[11](Restricted Boltzmann Machines,RBM)堆叠构成深度置信网络(Deep Belief Networks,DBN),利用RBM 的自动学习能力逐步提取信号的深层次特征,对四类心电信号进行分类识别。
2 深度置信网络的心电信号识别方法
2.1 深度置信网络原理
图1为DBN网络结构图。从图中可以看出,一个DBN 网络由多个RBM 堆叠而成,RBM 是DBN 网络模型中的基本组成单元。图中ω为RBM 层间的权值。RBM 训练时,通过逐层贪婪方法训练[12],获得每层RBM 的最优参数。最后用有监督的全局算法,从顶层开始微调整个DBN 网络的权值参数,使其收敛至全局最优。
图1 DBN网络结构图
DBN模型的具体训练步骤如下:
1)最底层的原始数据作为输入向量输入首层RBM,完成无监督训练;
2)首层RBM 训练后提取的特征向量,作为输入向量,训练下一层RBM;
3)重复步骤1)和2),直到每层RBM 都训练完成,获得顶层RBM的输出特征,此时得到每层RBM的局部最优参数;
4)利用全局算法(如误差反向传播算法),自上而下对每层RBM 进行有监督的微调,逐层调整RBM的权值参数,使其收敛至全局最优。
DBN 模型以RBM 为基本组成模块,解决了传统方法中的梯度弥散和陷入局部最优的问题。
图2 为RBM 结构图,v表示可见层,h 表示隐藏层,层间全连接,层内无连接。对于一个给定的状态(v,h),RBM的能量函数定义为
图2 RBM模型结构图
其中θ={Wij,bi,cj}代表RBM 模型中的参数,bi和cj为各层偏置,Wij表示层间的权值矩阵。(v,h)的联合概率分布为
这里Z(θ)是归一化因子。
当确定了可见层状态,则隐藏层中神经元的激活状态概率为
其中σ(x)=1/(1+e-x),为sigmod函数。
同理:
2.2 深度置信网络识别方法
基于深度置信网络的心电信号分类具体流程图如图3。
图3 实验流程图
需要分类的心电信号传输至深度置信网络,通过各层RBM 的训练寻找参数θ的最优值,并自动提取信号的深层次特征,将提取到的特征送入分类器中实现分类。为了提高分类效果,对整体网络进行权值微调,用微调后的网络实现最终分类。
2.2.1 网络预训练
RBM训练时,给定训练样本S={v1,v2,…,vns},ns为训练样本的数目,对数似然估计表示为
由函数lnx的严格单调性可知,最大化Lθ,S等价于最大化lnLθ,S:
采用梯度上升法[13],通过迭代的方式逐步逼近lnLθ,S的最大值,迭代公式为
其中η为学习率。从公式中可以看出,最重要的是是梯度的计算。其对各参数偏导为
为了保证算法的时效性,通常采用对比散度[14](Contrastive Divergence,CD)的快速学习算法训练RBM。训练后各参数梯度为
ε为学习率,·recon为一步重构后的模型分布。求出梯度后对各参数更新,调整参数θ。
参数更新准则为
公式中ξ为动量学习率。
为了确定合适参数,用模拟退火算法[15]对学习率和网络结构参数进行寻优,以隐藏层节点数、训练的学习率预测得到的误差作为目标函数对模型进行训练。
2.2.2 网络权值微调
DBN 网络中,RBM 只充当特征提取器,提取信号的深层次特征。在信号分类时,需要用分类器进行分类。本文选用Softmax 分类器,将RBM 提取的特征送至分类器中,结合类别标签,利用假设函数计算出特征属于每个类别的概率,完成分类任务[16]。其结构如图4所示。
图4 Softmax分类器结构图
为了提高网络分类性能,采用反向传播法自上而下对网络权值进行微调,最小化代价函数[17]:
函数1{y(i)=j} 的功能是:若表达式y(i)=j为真,则1{y(i)=j} 取1,否则取0。函数项为归一化概率,使各类概率和为1,λ>0。
3 实验结果分析
3.1 数据选取
本文采用MIT-BIH(Massachusetts Institute of Technology and Beth Israel Hospital Arrhythmia Database)数据库作为研究的心电信号数据来源。该数据库包含48 条双导联的心电信号记录,其中23 条记录可作为常规临床代表性数据,另外25 条记录包含了多种罕见的重要临床记录。本文则对其中的正常心拍、室性早搏、房性早搏和起搏心电信号进行分类,信号波形如图5 所示。选取其中具有代表性的22条记录构成数据集,一共30721个心拍样本。训练集共20480 个样本,测试集共10241 个样本。四类心拍样本分布如表1所示。
表1 心拍类型分布
图5 四类心电信号心电图
3.2 结果分析
对DBN 网络参数进行寻优时,退火模拟算法以预测相对误差为目标函数进行寻优。从图6 中可以看出,当迭代次数为13 时,误差由0.1085 下降到0.0824;当迭代次数为15时,误差下降到0.0337,此后误差不再变化。
图6 模拟退火算法参数寻优图
此时DBN初始化参数如表2。
表2 DBN初始化参数
DBN 训练时,逐层训练RBM,学习信号的深层次特征。
图7为DBN特征提取图,纵向从上到下为四类心电信号特征,横向1、2、3、4分别代表N、V、A、P四种信号。从图中可以看出,第一层RBM 提取的特征中,四类信号的特征有所区别,但不太明显。因为首层RBM提取的是信号的浅层特征。随着RBM层数的增加,所提取到的不同信号深层次特征区别越大,说明信号的深层次特征更具有代表性,能让分类效果更加明显。
图7 DBN特征提取图
本文用混淆矩阵对心电信号分类结果进行统计,使用敏感度(Sensitivity,Se)、正检测率(Positivie Predictivity,Pp)、特异性(Specificity,Sp)和整体精度(Overall Accuracy,OA)四个统计参数对心拍分类结果进行评价,定义如下:
这里TP 为真阳性,表示指定样本被正确分类的数目;TN 为真阴性,表示非指定样本被预测为非指定样本的数目;FP 为假阳性,表示非指定样本被预测为指定样本的数目;FN为假阴性,表示指定样本被预测为非指定样本的数目。
由混淆矩阵可以看出,5808 个正常节律心拍正确识别5764 个,1432 个室性早搏心拍正确识别1402个,658个房性早搏心拍正确识别641个,2343个起搏心拍正确识别2308 个,整体分类准确率为98.8%。
表4 为心拍分类统计结果,从敏感度、正检率、特异性三个不同的角度出发,都反映了算法对疾病的识别效果。三者的值越高代表分类准确率越高。由表4 可以看出,起搏心拍的敏感度、正检率和特异性都在99%以上,其他三种心拍的统计结果基本也都在98%以上,说明本文提出的方法具有较好的分类效果。
表4 心拍分类统计结果
权值微调阶段是为了提高网络的分类性能。为了说明权值微调的有效性,将网络微调前后的统计结果进行对比。
对比表3 和表5 可以看出,微调后各类信号样本的识别个数都有所增加,微调前整体分类准确率为97.8%,说明了权值微调对网络分类性能有所提高。
表3 分类结果混淆矩阵
表5 DBN权值微调前分类结果混淆矩阵
表6为微调前心拍分类统计结果。对比表4和表6,微调后各类信号的统计参数基本都有所提高。其中信号特异性变化不大,变化最大的是房性早搏的敏感度,提升了1.2%。对比结果进一步说明权值微调提高了网络的总体分类性能。
表6 权值微调前心拍分类统计结果
为了进一步体现本文方法的性能,将本文方法与传统的心电信号分类方法和基于深度学习的心电信号分类方法进行对比,对比结果如表7。
表7 心拍分类算法对比
由分类方法精度对比可知,对比其他几种分类方法,本文方法的整体精度最高。对比结果表明,深度置信网络应用在心电信号的分类问题中,有良好的分类效果。
4 结语
本文中构建了三层深度置信网络,选取MIT-BIH 数据库中4 种常见的心电信号共22 条记录号进行分类识别。利用深度置信网络的无监督的深层次特征自动学习能力,提取心电信号的深层次特征,对信号进行分类识别。在构建网络结构时对网络初始参数进行寻优,降低了随机设置参数对网络性能的影响,最终对4 类心电信号的识别准确率达到98.8%。对比常用的心电信号分类算法,深度置信网络的分类准确率更高,在未来的心电疾病诊断中会有较好的应用前景。