卷积神经网络在轻度认知障碍中的影像学研究进展
2021-11-29李晓陵王敬贤李昂李孟曹丹娜王丰崔璇姚春丽蔡丽娜
李晓陵,王敬贤,李昂,李孟,曹丹娜,王丰*,崔璇,姚春丽,蔡丽娜
作者单位:1.黑龙江中医药大学附属第一医院,哈尔滨 150040;2.黑龙江中医药大学研究生院,哈尔滨 150040;3.哈尔滨医科大学公共卫生学院,哈尔滨 150081
轻度认知障碍(mild cognitive impairment,MCI)是阿尔茨海默病(Alzheimer's disease,AD)的早期表现,MCI常被误判为正常衰老,而其中三分之一的MCI患者在5年内可转变为AD[1-2]。AD是一种不可逆的进行性脑病,目前尚无有效治疗方法,造成了沉重的社会经济压力[3]。因此,对MCI患者进行早期筛查、及时干预、对症治疗,防止其转化为AD,具有重要的临床应用价值。
神经影像成像技术是临床诊断MCI的重要检查手段,磁共振成像(magnetic resonance imaging,MRI)和正电子发射断层扫描(positron emission tomography,PET)常用于鉴定与MCI相关的结构和分子生物标记物[4]。其中,MRI因非侵入、无电离、无辐射、价格适中等优点,具有较高的临床普及率,被认为是MCI研究中的首要影像诊断方法[5]。有研究显示海马、颞叶等脑区在认知功能下降前,就已经出现了结构或功能变化,这些改变是MCI诊断的特异性标志[6]。
随着人工智能(artificial intelligence,AI)在肺结节检出、胶质瘤分级和骨折诊断等影像判读领域的飞速发展,与影像技术相结合的大规模、高维度、多模态神经影像技术在认知研究方面日益成熟[7-9]。卷积神经网络(convolutional neural networks,CNN)是AI领域中一个迅速发展的深度学习(deep learning,DL)模型,也是影像学领域的最新技术之一,在图像识别与分类中大放异彩[10-11]。迄今为止,CNN及其众多衍生模型在神经影像识别领域均取得多项重大进展。基于以上情况,笔者以此为线索,探讨其在MCI领域的研究现状与未来发展方向。
1 CNN
1.1 CNN发展简述及基本结构
CNN概念起源于1962年Hubel等[12]提出的感受野,在此基础上Fukushima[13]于1980年提出的神经认知机可以看作CNN的雏形。此后,LeCun等[14]于1989年首次使用“卷积”一词对算法结构进行解释,直到1998年构建出LeNet-5模型,被公认为定义了CNN的基本结构。2012年AlexNet的成功奠定了CNN在深度学习领域的重要地位,同时也成为重点研究对象并逐渐演化出众多经典模型,如GoogLeNet、ResNet以及DenseNet等,广泛应用于图像处理和计算机视觉等领域。
传统机器学习算法对于图像处理需人工手动进行特征选择,深度学习的最大优势在于计算机算法本身即可确定最佳图像特征,进而回答针对图像的各种问题[15]。CNN是图像DL最常用的算法模型,其基本结构一般由输入层、卷积层、池化层、全连接层以及输出层5层组成[16]。在图像处理时,首先由输入层输入数据,其次经过卷积层与池化层交替操作提取图像特征,之后经全连接层把提取的特征组合归类,最后由输出层输出结果。
1.2 CNN在医学影像分析中的应用
自AlexNet问世来,应用深度学习进行数据分析成为脑科学关注的热点,CNN在目标识别与定位方面的优异表现使其成为计算机视觉领域最优秀的深度学习技术[17]。CNN结合其他深度学习方法用于医学图像分析,可以简化处理流程,提升影像诊断效率,在病变检测、图像分割及融合等方面成果显著。它对医学影像处理基本流程是图像预处理、图像分割、特征提取、特征选择、训练分类器及对测试集进行测试[18]。
在MCI脑影像诊断应用中,CNN的大部分医学影像数据来自阿尔茨海默病神经影像学倡议(Alzheimer's disease neuroimaging initiative,ADNI)数据库和影像研究开放获取系列[19]。SPM和ANT是分析处理脑影像的主要软件,获取影像数据后,对其进行预处理,如头动校正、配准、分割以及平滑处理等,然后送入输入层开始训练,最后进行试验并测评效果[20]。
2 CNN在MCI中的应用
目前CNN在MCI中的应用主要包括病变的检出、分类和预测三个方面。
2.1 病变检出
2017年我国学者吕鸿蒙等[21]对于模型对MRI图像针对性不强的问题做出改进,应用增强的AlexNet模型诊断MCI,结果证明该模型识别MCI的能力较初始模型更优。Noguchi等[22]对AlexNet持同样意见,其研究表明GoogLeNet可以用更少的训练数据来判断头部MRI序列类型。Qiu等[23]以MR图像为基础,联合简易精神量表和逻辑测试训练的深度学习模型在判断MCI患者组时实现了90.9%的总体准确性。
通过功能连接构建出的脑功能网络(brain functional network,BFN)被认为是有效诊断MCI的生物标志物,Kam等[24]提出了一种新颖的基于多BFN的CNN框架,使不同BFN的嵌入式功能可以在统一模型中全面支持彼此,以实现更准确的MCI诊断。在此基础上研制的CNN框架,可以同时学习静态BFN和动态BFN特征,验证了基于大脑功能连接的DL模型在MCI诊断中的有效性[25]。
曾安等[26]提出基于CNN和集成学习的多切片集成分类模型能更充分地利用MRI包含的有效信息,从而提高MCI诊断准确率。同年Liu等[27]结合DenseNet提出了一种多模型的CNN分类框架,对MCI诊断的准确率达到76.2%。Jiang等[28]和Kang等[29]使用结构MRI图像进行基于CNN的MCI诊断,准确率高达89.4%,在其后续研究中联合应用弥散张量成像(Diffusion Tensor Imaging,DTI)技术,多模态获取脑白质特征信息,进一步提高了疾病诊断精度。
Jie等[30]应用174名受试者功能MRI数据,建立新的加权相关核测量各脑区之间的相关性,研究证明该方法对MCI的诊断准确度达到84.6%。还有学者研究近红外脑功能成像数据训练CNN模型诊断MCI的可行性,也取得了良好进展[31]。
2.2 病变分类
MCI早期状态虽与正常衰老表现类似,但若进展为AD则会给个人和家庭造成沉重负担,磁共振技术为区分该疾病的不同阶段提供了有效手段。有学者通过构建新的CNN模型进行图像分类,使MCI和健康组分类取得了较高准确度[32-34]。Feng等[35]基于MRI的自动化深度学习模型使MCI/AD分类的准确率和敏感度分别达到89.4%和86.7%。
为使试验更有针对性,研究者们将MCI分为早期和晚期MCI(eMCI和lMCI),或渐进MCI(pMCI)和稳定MCI(sMCI)等不同亚型[36-37]。结构MRI能够详尽获取海马的形状和体积变化信息,有学者[38]从此入手,使用CNN对AD、MCI和健康组进行分类。使三组的准确度分别达到92.3%、85.6%、78.1%。Wee等[39]则结合皮层厚度数据,显示CN/AD与eMCI/AD的分类准确度分别为85.8%、79.2%,除CN/eMCI准确度较低外,其他各组间的分类准确度也都达到60.0%以上。Cui等[40-41]的研究不仅验证了上述方法的可行性,其提出的方法在sMCI,pMCI分类中也展示出不俗的分类能力。
Gorji等[36]通过提取脑脊液、灰质与白质的MRI特征,使对照组、eMCI组、lMCI组的组间分类准确率均达到93.0%以上,并且即使数据集较小,该结构也能表现出良好性能。基于级联CNN的多模式分类算法,可以在简化步骤的同时自动从通用多模态特征进行疾病分类,不仅揭示了AD和MCI等多种模式的脑MRI变化,还可检测其他脑部疾病,如精神分裂症、自闭症等[42-43]。
2.3 转换预测
自AlexNet问世并展现出巨大潜力后,许多经典的CNN模型得以创新发展,如ResNet、LeNet、DenseNet等。除了最初的LeNet因设计简单,应用较少外,其他模型均有用于MCI研究,并取得了良好效果[19]。
Lin等[44]研究设计了一种基于CNN的深度学习方法,可以利用海马MRI数据准确预测MCI-AD的转换,该方法在ADNI数据集中得到验证,达到了79.9%的精度。受AlexNet启发,将深度学习和机器学习相结合,设计出的决策支持模型可成功预测一年内从MCI到AD的转化概率[45]。CaffeNet是Alexnet的改进型,Wu等[46]联合应用CaffeNet与GoogleNet架构,不仅对MCI亚型分类表现出众,在预测转化风险方面,也取得良好成果,能够预测三年内不同亚型MCI/AD转化率。而Choi等[47]开发的基于MatConvNet的自动图像解释系统,可以使用PET数据准确预测MCI患者转化为AD的可能性,预测准确性优于传统的量化方法。对于eMCI转变为AD,lMCI转换为AD,Cui等[40]提出的方法也实现了较高的预测精度。近来,Lian等[48]提出的以注意力为导向处理全脑结构MRI信息方法,即使与几种最先进的MCI转换预测技术相比,也显示出优越的性能。
3 小结与展望
全球AD数量迅速增加,使得MCI阶段的辨别和干预非常关键。深度学习在图像识别领域表现优异。其中,CNN在医学影像的识别、分类等方面,具有无接触、高精度的特点。本文以CNN为轴,阐述了它在MCI诊断、分类、预测等多个领域中的应用现状。
但是由于参阅文献所用数据的来源、类型以及预处理方法等并不一致,所以对于各模型最终成果仅能大致参考,并未对各研究成果进行详细比较。而且CNN本身也存在着一定缺陷:首先它很难将不同格式的数据如影像和化验数据整合输入,还有参数标准化、成果可解释性等问题有待优化。
目前CNN在MCI方面的研究仍在不断深入,研究者们正在尝试探索最佳的生物标志物、多模态数据融合方式以及算法结构优化方向。随着越来越多的数据类型被获取,使用CNN进行研究将变得更有影响力。因此,将2D CNN扩展为3D CNN非常重要,尤其是当研究涉及认知功能的多模态神经图像时;此外,强化学习为脑科学提供了一套新的研究工具和一系列新颖假设,可以通过加强临床工作者与理论技术人员的交流,改进现行工作方式。如此,必将促使医学影像研究实现进一步飞跃。
作者利益冲突声明:全体作者均声明无利益冲突。