APP下载

基于卷积神经网络的阿尔茨海默氏病转化识别

2021-03-06丘致榕

科学技术创新 2021年4期
关键词:认知障碍残差切片

丘致榕

(福建师范大学,福建 福州350001)

阿尔兹海默病(AD)是一种记忆力衰退、大脑功能缓慢且逐渐变异引起的智力丧失表现的疾病,它给整个社会的经济带来巨大的负担。想对AD 患者进行彻底的治疗是不可能的。在AD的早期即轻度认知障碍(Mild Cognitive Impairment, MCI)时期进行及时干预是目前普遍认可的方法,轻度认知障碍(MCI)根据其不同临床结果可分类为稳定型(sMCI)和进展型(pMCI)。神经影像学可以作为阿尔茨海默病(AD) 及其前驱期轻度认知障碍(MCI)的潜在诊断工具,其中核磁共振成像(Magnetic Resonance Imaging,MRI)由于技术成熟,在机器学习领域被广泛利用。

1 数据与预处理

由于需要对sMCI 和pMCI 的患者进行长期跟踪回访,其核磁共振图像不易获取,因此本文收集了121 个sMCI 和159 个pMCI 的核磁共振图像。核磁共振图像需要经过一定的预处理才能输入到网络进行训练,预处理包括前联合- 后联合校正(AC-PC)、强度非均匀校正(N3)、去头骨、配准到标准模板和重采样成181*218*181 像素。本文使用了基于MATLAB 的SPM 12工具包进行对核磁共振图像做预处理,最后获得灰质、白质和去头骨三种核磁共振的三维图像。根据国内外的研究发现,白质图像在机器学习算法中表现出最好的分类效果。但由于使用三维卷积神经网络处理三维图像会产生大量的参数,需要消耗很高的算力。为了减轻计算压力,降低时间成本并且增大数据量,本文从三维图像抽取部分切片作为最终实验数据,抽取方式为:从俯视图第75 号切片开始间隔一张抽取,共抽取15 张切片。

2 卷积神经网络对图像的识别

2.1 AlexNet

虽然早期LeNet 在图像分类中取得了较好的成绩,但是受限于计算机性能的影响,该网络并没有引起很多的关注。直到2012 年,Alex 等人提出的AlexNet 网络在ImageNet 大赛上以远超第二名的成绩夺冠,卷积神经网络才重新被广泛的关注。AlexNet 是在LeNet 的基础上加深了网络的结构,并使用了一些新技术使得网络能学习到更丰富更高维的图像特征。具体来说,AlexNet 首次使用ReLU 作为网络的激活函数,成功解决了Sigmoid 在网络较深时的梯度弥散问题。虽然ReLU 激活函数在很久之前就被提出了,但是直到AlexNet 的出现才将其发扬光大。并且作者在训练AlexNet 时使用Dropout 随机忽略掉一部分神经元,以避免模型过拟合。Dropout 虽有单独的论文论述,但是AlexNet 将其实用化,通过实践证实了它的效果。可以说AlexNet是浅层神经网络和深度神经网络的分界线。

2.2 VGGNet

VGGNet 是Visual Geometry Group 提出的。该网络主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能。VGGNet 16 包含了16 个隐藏层(13 个卷积层和3 个全连接层),它具有以下的优点:(1)结构简洁,整个网络都使用了同样大小的卷积核尺寸(3x3)和最大池化尺寸(2x2);(2)几个小滤波器(3x3)卷积层的组合比一个大滤波器(5x5 或7x7)卷积层好;(3) 验证了通过不断加深网络结构可以提升性能。但VGGNet 使用了更多的参数并且耗费更多计算资源。

2.3 ResNet

残差网络(ResNet)要解决的是深度神经网络的“退化”问题。“退化”指的是给网络叠加更多的层后,性能却快速下降的情况。针对该问题有两种解决思路:一种是调整求解方法,比如更好的初始化、更好的梯度下降算法等;另一种是调整模型结构,让模型更易于优化——改变模型结构实际上是改变了误差面的形态。

ResNet 从后者入手,探求更好的模型结构。将堆叠的几层网络层称之为一个残差块。对于一个残差结构当输入为x 时其学习到的特征记为H(x),现在我们希望其可以学习到残差F(x)=H(x)-x,这样其实原始的学习特征是F(x)+x。之所以这样是因为残差学习相比原始特征直接学习更容易。当残差为0 时,此时堆积层仅仅做了恒等映射,至少网络性能不会下降,实际上残差不会为0,这也会使得堆积层在输入特征基础上学习到新的特征,从而拥有更好的性能。残差学习的结构有点类似与电路中的“短路”,所以是一种短路连接。

2.4 SE-ResNet

SE 模块是SENet 中的基本结构。与传统的CNN 不一样的是,该模块通过三个操作来重新标定前面得到的特征。

首先进行一个“压缩”操作,假设输入特征图的维度为H*W*C,其中H 是高度,W 是宽度,C 是通道数。“压缩”做的事情是把H*W*C 压缩为1*1*C,相当于把H*W 压缩成了一维,而实际中的网络一般是用全局平均池化操作来实现的。H*W 压缩成一维后,相当于这一维参数获得了之前H*W 全局的视野,感受区域更广。

其次是“激励”操作,得到“压缩”的1*1*C 的表示后,加入一个FC 全连接层,对每个通道的重要性进行预测,通过参数w来为每个特征通道生成权重,其中参数w 的学习是被用来表示特征通道间相关性的。

图1 AlexNet

图2 VGGNet

图3 ResNet 18

图4 SE-ResNet 18

最后是一个特征重标定的操作,将“激励”的输出的权重看做是经过特征选择后的每个特征通道的重要性,然后通过乘法逐通道加权到先前的特征上,完成在通道维度上的对原始特征的重标定。

本文使用的SE-ResNet 是将SE 模块嵌入到ResNet 模块中。对分支上的残差特征进行了特征重标定。这里我们使用全局平均池化作为“压缩”操作。紧接着两个全连接层去建模通道间的相关性,并输出和输入特征同样数目的权重。首先将特征维度降低到输入的1/16,然后经过ReLu 激活后再通过一个全连接层升回到原来的维度。这样做比直接用一个全连接层的好处在于:a.具有更多的非线性,可以更好地拟合通道间复杂的相关性;b.极大地减少了参数量和计算量。然后通过一个Sigmoid的门获得0~1 之间归一化的权重,最后通过特征重标定操作来将归一化后的权重加权到每个通道的特征上。

3 结果与讨论

本实验从灰质图像中间部位的30 个切片中间隔一张抽取15 张切片,共计得到4200 个切片,使用5 折交叉验证对Alexnet 8,VGG 16,resnet 18,se-resnet 18 进行测试。相关的参数设置为epoch=200,训练到180 轮后减少学习率,让网络达到最优;受显存限制batch_size 只能设置成8; 学习率1-180 轮设置成0.0001; adam 优化器使用默认参数。最终得到的结果如图所示,四个网络分别获得了82.1%、96.37%、72.55%和81.62%的准确率。

总之,中国对诊断及预防该病的科学研究报道甚少。本研究针对此问题提出4 种用于辅助诊断轻度认知障碍患者的卷积神经网络,这4 个卷积神经网络都能对患者大脑成像进行有效诊断,其中VGGNet 性能表现出最优秀的性能。

猜你喜欢

认知障碍残差切片
有氧运动与老年认知障碍
基于残差-注意力和LSTM的心律失常心拍分类方法研究
防跌倒,警惕认知障碍性疾病
基于双向GRU与残差拟合的车辆跟驰建模
关爱父母,关注老年认知障碍症
基于残差学习的自适应无人机目标跟踪算法
新局势下5G网络切片技术的强化思考
5G网络切片技术增强研究
慢性心力衰竭与认知障碍的相关性
基于深度卷积的残差三生网络研究与应用