基于多分辨率残差网络的心肌梗死定位识别研究*
2020-01-03齐继蒋华张瑞卿沈阳佟彦妮沙宪政常世杰
齐继,蒋华,张瑞卿,沈阳,佟彦妮,沙宪政△,常世杰△
(1.中国医科大学生物医学工程系,沈阳 110122;2.中国医科大学附属第四医院医疗设备部,沈阳 110032;3.中国医科大学附属第一医院心血管内科,沈阳 110054)
1 引 言
心肌梗死按发生部位分为下壁、前壁、前间壁、广泛前壁、前侧壁、高侧壁和后壁七个位置,一般情况下,相较于其他单纯部位发生的心肌梗死,前壁心肌梗死的病变面积较大[1]。心肌梗死的定位诊断可以精确地判断冠状动脉的病变位置,有助于医生进行有针对性的介入治疗,也为临床观察病情和判断预后提供重要依据[2]。
十二导联心电图可以明确地表现出心肌梗死的多种病变部位,是一种能够准确诊断且成本低廉的无创检测方法。十二导联心电图的原理是通过连接于胸导联和肢体导联的电极,检测心脏传导系统在每个心动周期中动作电位的变化,从而形成电位随时间变化的心电波形图[2]。
心电图的准确判读需要医生具有扎实的专业基础和丰富的经验,但人工判读心电图易出现误判漏判的情况,且工作量较为繁重。为了解决上述问题,本研究设计一种心电图辅助诊断算法,它可以准确地对心电图自动分析并得出结果,从而减轻医生的负担,提高工作效率。
近年来,心电图辅助识别的研究相继出现,例如数字滤波和小波变换等技术,后来出现特征提取技术,以及近年来出现的深度学习的方法[3]。深度学习是机器学习的一种,传统的机器学习有输入层、隐藏层和输出层,深度学习有多个隐藏层。深度学习的主要框架有卷积神经网络(convolutional neural network, CNN)[4]、循环神经网络(recurrent neural networks,RNN)[5]、长短期记忆网络(long short-term memory Network,LSTM)[6]等, 残差网络(residual network,ResNet)是CNN的一种变体,它特有的短连接结构对于复杂数据有更好的分类效果[7]。ResNet在ILSVRC 2015图像识别比赛中获得第一名, ResNet在语义分割[8]、语音干扰检测[9]、交通车辆识别[10]等研究领域也有一定的应用。此外,研究者提出把多分辨率网络应用于神经网络中以增加网络宽度,提高识别准确率,多分辨率网络可应用于大规模场景分类[11]、动作识别[12]、生物识别[13]等研究。
对于在医学的心电识别领域,深度学习也有一些成功的实践,如Kiranyaz 等[14]基于CNN模型和多层感知机(MLP)模型,对心室异位节拍(VEB)和室上性异位节拍(SVEB)进行研究,得到了95%以上的识别准确率; Isin等[15]利用CNN对MIT-BIH数据进行三分类,得到92.4%的准确率;Rajpurkar等[16]利用ResNet模型对心律失常数据进行研究,得到80.9%的平均识别准确率。
目前,从公开发表的文献可知,尚未有利用深度学习技术进行心肌梗死定位的研究。本研究在ResNet的基础上提出改进的多分辨率残差网络,该网络能够应用于心肌梗死定位的自动识别,并可以辅助医生进行诊断,有一定的临床意义。
2 算法的设计
2.1 残差网络
残差网络(ResNet)是基于CNN在结构方面进行的优化,一个ResNet块由两个卷积层和一个跨层连接组成,见图1,算法如下:
yl=frelu[conv(i)]
(1)
yl+1=conv(yl)
(2)
o=frelu(i+yl+1)
(3)
其中,y为特定层的输出,frelu为激活函数,i为ResNet块的输入,conv为卷积算法,o为ResNet块的输出。
ResNet的主要特点是短连接技术,把输入引入卷积层之后的输出,从而实现跨层连接。ResNet独特的跨层连接结构可以解决网络很深时出现的训练退化问题和过拟合问题,ResNet可以使网络得到充分的训练,随着网络的加深,准确率显著升高,但是网络深度大于152层时,会进入平台期,准确率不会有明显提升[7]。
图1 残差网络模块
2.2 多分辨率网络
多分辨率网络是针对复杂图像识别任务提出来的,不同尺度空间的图像信息不同,普通的网络结构容易产生误判,多分辨率网络能够同时训练粗分辨率和细分辨率网络,见图2。
粗分辨率网络利用较大的接受域获取图像信息,细分辨率网络利用较小的接受域获取图像信息,两种网络经训练而得的数据特征信息,经整合后得到输出层的预测值。粗分辨率网络和细分辨率的网络结构通常由CNN构成。两个网络在图像区域中对应不同大小的感知域,识别图像的效果是互补的,从而提高图像识别准确率[13]。
图2多分辨率卷积神经网络
Fig.2Multi-resolution CNN
2.3 本研究设计的网络算法
当采用ResNet等经典的CNN网络训练心肌梗死数据时,训练之后的网络模型出现了收敛效果不佳,识别准确率低的问题。为解决这些问题,本研究设计的网络对ResNet网络做进一步优化,见图3、图4。优化后的网络是以9个卷积层为主体的31层网络,每个卷积层之后都伴随一个批量归一化(batch normalization,BN)层,BN层是一种用来求解协变位移的优化算法,即把每层网络中神经元的输入值限制为均值为0方差为1的正态分布,使得梯度变大,训练过程收敛快,使训练速度加快,从而减轻梯度消失问题[17]。
该网络的训练步骤如下:
(1)见图3,训练集数据进入第1个卷积层,经BN层后通过修正线性单元(recitified linear units,ReLU)函数进行激活,ReLU可以有效缓解随着网络结构加深而出现的梯度消失问题,并提高训练效率[18]。
(2)卷积后的局部特征数据经第3层最大池化(max pool)层的下采样运算后,进入ResNet网络结构,其余8个卷积层依次组成4个带有短连接的ResNet模块,每个ResNet模块有两个卷积层。max pool层的算法见式(4):
(4)
(3)第1组ResNet 模块中第一个卷积层经BN层归一化处理后,其输出沿着框架主体向下传输,同时连接至第3组ResNet 模块中第一个卷积层的输出端。
(4)第2组ResNet 模块中第一个卷积层经BN层归一化处理后,输出端沿着框架主体向下传输,同时连接至第4组 ResNet 模块中第一个卷积层的输出端。第2组ResNet 模块的输出经max pool层处理。
图3 改进的残差网络
(5)第4组的ResNet 模块经平均池化(average pool)层、全连接层后由ReLU函数激活,再利用dropout层,其作用是在每次训练的时候,网络会按照使用者设置的系数随机使相应个数的神经元不参与该次训练,进而减轻过拟合现象[19],最后经全连接层和softmax分类器得到输出。
本研究在改进ResNet网络的同时引入多分辨率网络,见图4,粗略分辨率网络和精细辨率通道中卷积核的大小分别为1×81和1×9,将上述图2所示的网络分别输入到这两个分辨率的通道中,经两个通道所训练的输出相加,得到最终的识别结果。
本研究将该网络结构称为多分辨率残差网络(Multi-resolution ResNet)。
图4 多分辨率残差网络
3 数据
本研究的数据由中国医科大学附属第一医院支持,研究使用的所有病例均由心电图工作站中存档的现有心电图记录中收集,电图工作站为数字心电图仪(Nihon Kohden)。心电图仪输出标准12导联心电图,采样率为12位/1 000 Hz(12导联同步采集),共模抑制比为120 dB,频率响应为0.05~160 Hz (-3 dB)。所有的患者都在检查室接受检查,与医生的办公室分开,心电图数据通过网络传输。心电图检查按照标准程序进行:患者仰卧位,肢体导联采用导电夹粘结,胸部导联采用一次性导电膏粘结。每个心电图数据的时间长度为2.5 s。
本研究从上述心电数据原始记录中选取包括前壁心肌梗死(AMI)、下壁心肌梗死(IWMI)、前间壁心肌梗死(ASMI)在内的共计3 549个数据以及6 250个正常心电数据(NORMAL),其中,每条记录所属患者的性别、年龄和种族都是随机选取的,本研究设计的训练集与测试集数据见表1。
表1 训练集与测试集的数据分布
4 结果
4.1 训练方法
利用较为经典的卷积神经网络LeNet、Vgg16、ResNet34与本研究提出的多分辨率残差网络进行对比。利用训练集数据对四种网络算法分别进行训练,测试集数据输入到训练完毕的模型中,得出识别结果。
本研究采用的开发平台是Windows 10操作系统, CNTK 2.0,编程语言是python 3.5.2。计算机配置:CPU为Intel Core i7-8700 3.3 GHz,显卡为NVIDIA GeForce GTX1080,内存大小为16 G。
本研究设计的多分辨率残差网络参数设置如下:
学习率为0.000025~0.0001,输入数据大小为12×1×1 400,输入层的节点数为16 800,隐藏层的节点数为32~256,迭代2 000次。
4.2 结果分析
从临床数据库选取如表1所示的训练集与测试集数据,分别基于LeNet34、Vgg16、ResNet34以及本研究设计的多分辨率残差网络进行训练,识别结果见表2,多分辨率残差网络的识别准确率为91.8%,均高于其他四种网络。
表2 多分辨率残差网络与经典卷及神经网络测试集识别准确率对比
为了分析数据在迭代过程中的收敛情况,上述四种网络的收敛曲线见图5。可见与经典的CNN网络相比,多分辨率残差网络的收敛曲线下降得更快,收敛过程更加平稳,收敛效果更好。
测试集的受试者工作特征(receiver operating characteristic,ROC)曲线见图6,横轴表示1-特异度,纵轴表示敏感度,AUC为曲线下面积,曲线越接近左上角,表示模型的准确性越高,对疾病的识别能力越强。
图5在训练集中多分辨率残差网络与经典卷积神经网络的收敛曲线对比
Fig.5Comparison of Multi-resolution ResNet and classic CNN′s convergent curve on train data
(a).LeNet;(b).VGG;(c).ResNet34;(d).Multi-resolution ResNet
图6 在训练集中多分辨率残差网络与经典卷积神经网络的受试者工作特征曲线对比
5 讨论
本研究基于经典的神经网络设计了多分辨率残差网络,并将其用于心肌梗死的定位识别。对临床数据库进行四分类,多分辨率残差网络的识别准确率高于经典的神经网络;与经典的神经网络相比,多分辨率残差网络的收敛效果更好,根据ROC曲线的分析,其诊断能力更强。
由实验可知,在心肌梗死定位识别领域,多分辨率残差网络可以应用于临床的心电图辅助诊断任务。在今后的研究中,将收集更多的数据,并对心肌梗死以外的心电数据进行深度神经网络训练,以期利用深度学习技术能够识别更多的心血管疾病,从而在临床心电数据自动诊断中实现更广泛的应用。