卷积神经网络和影像技术在精神分裂症中的研究进展
2023-01-10曹沛煜陈从新司琪雷家熙李玉婷隋毓秀
曹沛煜,陈从新,司琪,雷家熙,李玉婷,隋毓秀
精神分裂症(schizophrenia,SZ)是一组病因未明、临床表现多样的慢性重性精神病,其常见症状包括妄想、幻觉、言语表达异常、行为紊乱或异常紧张以及阴性症状[1]。全世界有超过2 000万人患有SZ,在中国,其终身患病率为0.6%,将近840万人,且这些数据仍在逐年增长,给患者及家庭带来了巨大的负担[2-3]。目前对SZ的诊断主要依赖临床访谈以及临床症状,通常以《国际疾病分类》第10版(ICD-10),美国《精神障碍诊断与统计手册》第5版(DSM-5)为诊断标准,辅以量表、影像技术等手段。根据DSM-5,当上述症状中的两种及以上持续1个月或更长时间,且至少包含前3项中的1项,在排除其他诊断后即可诊断为SZ[4]。
核磁共振(magnetic resonance imaging,MRI)作为一种非侵入性的医学影像技术,已被广泛应用于疾病的早期探测、诊断和治疗。已有研究发现与SZ有关的脑影像生物标志物,常见特征包括脑结构形态,如灰质体积和密度,在左外侧眶额叶、颞上回等区出现灰质变薄和密度降低[5-6];功能网络连接(FC),反映分离脑区之间的相互作用,在SZ患者中总体下降,如默认模式网络(default mode network,DMN)、听觉网络(auditory network,AN)、突显网络(SAN)等网络间连接存在显著缺陷[7-8]。研究者可借此发掘SZ患者脑部细微的结构和功能变化。
机器学习(machine learning,ML) 起源于人工智能,融合了计算统计和模式识别等学科,是一种基于数据学习的数据分析计算技术,常用于数据驱动的预测、描述和解释[9]。深度学习(deep learning,DL)是ML中新的研究方向,通过向算法框架中添加更多的层和单元实现更复杂的功能,它的特点在无需人工干预的自动化提取特征,获取比ML更加客观的结果[10]。卷积神经网络(convolutional neural network,CNN)作为DL的一个分支,能够从输入数据中逐层提取出抽象的特征。卷积层是CNN的核心处理层,由数个卷积单元组成,其作用是从上一层输出的特征图中挑选出特征,同时保持平移不变性,这样可以保留图片的局部信息。目前在医学领域,CNN已成功实现冠心病、阿尔兹海默症和COVID-19等疾病的诊断。当前已有一些综述总结了深度学习技术结合医学影像在精神医学领域的应用,展现了该技术广阔的应用前景,但对CNN与MRI结合应用于SZ尚未有系统的梳理和总结。本文就CNN应用于SZ的相关研究进行综述,并对该领域存在的一些问题进行分析与展望。
1 CNN在SZ机制探索中的应用
已有研究发现许多大脑区域变化与SZ有关,但目前为止,仍未有一致性的异常报告。传统研究使用的特征提取方法大部分基于手工或机器学习,随着深度学习技术的出现与应用,寻找SZ脑异常结构的工作变得更加高效与精准。
Oh等[11]在训练CNN识别SZ的实验中设计了专门的大脑分区方案,以探究影响CNN做出分类决策的脑区。他们将MRI的水平面分为8个区域,每次保留7个分区投入3D CNN参与分类训练,重复8次,若某一区被去除而分类效果出现显著下降,说明该区对分类的贡献最大。通过比对发现,右侧颞区、右颞顶叶和左额叶对分类贡献较大,而枕叶与右额叶对分类的贡献较小,结果与已有研究对应[12-13]。该实验以粗略的分区方案发掘出SZ存在的异常脑区,表明CNN可以在训练过程中自动识别包含异常特征的区域。同时也提示我们,如果在该实验基础上,选取精确的感兴趣区(region of interest,ROI),可以发现更具体、细微的脑结构异常变化以揭示SZ的病理机制。
Oh等[14]使用包含新型卷积过滤器的BrainNetCNN探索SZ影像与临床症状的关系。他们选取被试的fMRI和阳性与阴性症状量表(PANSS),提取出功能连接矩阵用于寻找可以识别SZ的节点和连接。他们发现的节点包括与默认模式网络相关的扣带回后部和角回,与AN和丘脑网络相关的颞上回和颞横回,这些区域与SZ的自我参照、幻听和认知功能障碍等息息相关[15-16]。在存在异常的功能连接中,他们发现SZ患者的前扣带回与额下回的连接强度与阳性或阴性症状呈正相关。已有研究认为前扣带回皮质参与认知的情感调控、冲突监测和执行控制,额下回参与注意控制和反应抑制,两者之间的异常连接可能导致功能失衡,继而引发SZ症状的发展[17-18]。
综上所述,结合影像数据和CNN用于SZ机制的探索存在很大的发展空间,SZ的精神病理学也可借此得以发展,对阳性症状和阴性症状的影像研究也可应用于病情严重程度判断等方向。既往基于影像学对SZ机制的研究不仅仅局限于结构和传导通路,尚包括功能连接和脑网络等应用方向。结合已有研究结果,未来这些新技术的结合可以更好地探索SZ的发病机制。
2 CNN在SZ诊断中的应用
到目前为止,绝大部分将CNN应用于SZ的研究都集中在诊断上,另有小部分研究致力于SZ的鉴别诊断上。这些研究在采用的数据集、输入的模态、算法的架构以及数据的处理都有很大的不同,以下部分将分别论述。
2.1 CNN对SZ诊断能力的提升
2.1.1 应用开端 Qiu等[19]使用被试的fMRI进行独立成分分析(independent component analysis,ICA),选取与SZ高级认知功能相关的DMN和听觉皮质(auditory cortex,AUD)作为ROI,对空间特征图切片以扩充数据量,以2D CNN模型作为分类框架,最终准确率分别为72.65%和78.34%。而Qureshi等[20]应用3D CNN来区分SZ和健康对照,作者选取了15个独立组分,包括DMN、AN、感觉运动网络等,将这些独立组分二次聚类后获得3D ICA,输入CNN中进行分类,最终准确率为98.09%,优于以往利用其他深度学习技术的分类结果。
上述研究表明,得益于大脑的三维解剖结构,3D CNN能捕获到二维网络无法捕获的特征。这一点在Wang等[21]的研究中亦可得到佐证,他们在3D CNN中嵌入的扩张卷积层有着更大尺寸的卷积核,可提取脑内远距离组织间的体素连接模式特征,从而实现更好的分类效果。所以在模型选择与参数设置之间也许存在一个平衡点,可以在分类中获得最佳的效果和性能,这一平衡点有待更多的研究探索发现。
2.1.2 数据扩增 深度学习的原理决定了其需要海量的数据进行训练,分类结果与输入的数据量成正相关。精神疾病的研究往往面临被试数据量不足的挑战,这会使CNN的学习结果出现过拟合的问题[22]。已有一些计算机领域的研究应用简单的扩增数据方式提升模型的性能,除此之外,整合多模态数据也是深度学习领域的常用方式。既往研究提示SZ患者存在广泛的灰质体积减少和白质传导通路异常[23-24],Hu等[25]整合被试的sMRI与dMRI数据并结合朴素3D CNN(naïve 3D CNN)以提高对SZ的诊断能力。他们将sMRI分割成灰质、白质和脑脊液,dMRI提取各向异性分数和平均扩散率,将这5种特征作为输入进行模型训练,结果获得81.02%的准确率。此外,他们发现了SZ可用于诊断的异常特征,包括脑岛、纹状体、丘脑的灰质体积,皮质和皮质下纤维的各向异性分数以及扩大的脑室,这些区域与已有的Meta分析结果相近[26]。该结果表明,利用CNN有潜质定位用于诊断SZ的关键性神经解剖学特征,同时亦有助于理解SZ的神经基础,探索发病机制。
以上方式提高了数据利用率,使CNN诊断SZ的能力得到进一步提升。此外仍有多种数据扩增方法尚未应用到本领域,相信随着这些方法的迁移应用,可以解决精神疾病研究领域被试数量不足的问题,提高深度学习的诊断效能。
2.2 CNN对SZ鉴别诊断的贡献 精神疾病存在多种谱系,谱系内存在高共病率和症状重叠,同时每种疾病自身又存在很大的异质性,这使得精神障碍的鉴别诊断成为临床工作的一大难点,借助深度学习技术对精神疾病进行鉴别诊断对临床帮助意义深远。Du等[27]使用一种CNN融合模型鉴别SZ与孤独症谱系障碍(ASD)。他们选取335例SZ和380例ASD患者的sMRI与fMRI,从中提取1个灰质体积矩阵、1个功能网络连接矩阵和7个脑网络功能域,包括皮质下、听觉、感觉运动、视觉、认知控制、默认模式和小脑网络。分别作为输入训练获得9个CNN模型,组合构建获得一个融合CNN模型,该模型在鉴别时获得平均准确率为87%。再将7个功能域分别输入该模型以比较分类能力,其中以皮质下网络和默认模式网络为输入时分别获得83%和82%的准确率,提示这些区域在两种疾病间的差异最大,具有鉴别意义。这些网络中的识别区域主要包括前扣带回皮质、尾状核、额下回、中央旁小叶和海马,这与已有的研究结果相一致[28]。该研究综合了多维度CNN和多模态影像数据,发现了SZ与ASD之间的差异性脑区,为二者的鉴别以及发病机制研究提供了很好的思路及方法。
综上,CNN应用于SZ的神经影像数据进行诊断与鉴别诊断的尝试已获得一定的成果,得益于计算机技术的飞速发展与更替,性能更强劲的CNN框架不断涌现,也将建立更完善的SZ诊断模型,并将模型应用到个体水平,实现SZ的自动化个体化精准化诊断与医疗。
3 CNN在SZ预后判断的应用
在精神疾病领域,深度学习技术用于预后判断的研究寥寥无几。Smucny等[29]使用深度神经网络(DNN)预测SZ临床改善者的状态。他们将被试fMRI与简明精神病量表(BPRS)相结合,以患者就诊时与随访1年后的量表评分为标签,提取双侧背外侧前额叶皮质(dorsolateral prefrontal cortex,DLPFC)和顶叶上回皮质(superior pariet al cortex,SPC)4个ROI为输入,结果分类为病情改善者的准确率为78.4%,未改善者的准确率为70.2%,对分类贡献最大的区域是左侧DLPFC。以往研究可以支持这一结论,主动认知控制过程中额顶叶激活较大的患者,在1年随访中更有可能表现出症状改善,而激活不良的患者治疗反应较差[30]。该研究表明,以DLPFC和SPC为代表的额顶叶有潜质成为用于判断SZ临床预后以及改善用药策略的生物标志物。而在现有基础上进一步使用多模态和多维度的数据以及将CNN作为分类工具可能会获得更好的分类效果。
Paul[31]在他的研究中使用3D CNN分类接受过经颅直流电刺激(tDCS)治疗的SZ患者,选取额顶叶网络中的左颞顶交界处(left temporoparietal junction,LTPJ)和右背外侧前额叶皮质(RDLPFC)作为输入,结果取得最佳准确率为77%。计算对分类有贡献的脑区,前3三个脑区为LTPJ中的左、右侧海马和左侧中央前回。这一结果在其他研究中也可得到印证,海马体积和形态学异常可以作为首发精神病患者临床预后的一个标志[32]。
要成为一种有效的诊断工具,DL分类准确率应达到至少80%,虽然以上研究结果仍有差距,但其反映了一个很有前景的开端。此外,上述研究利用影像数据判断SZ临床预后提供了很好的思路,将该研究中的临床评分替换为其他指标,可拓展不同的研究方向。现阶段CNN在SZ预后方向研究有限,但在已有基础上不难看出其前景无限,进一步探索可使我们接近更高水平的预测和更早期改善治疗的精准精神医学。
4 总结与展望
目前CNN应用于SZ研究存在的问题有两方面。一方面是训练CNN所需的数据量,用于训练模型的数据量越大,越能开发CNN的学习能力,提供尽可能多的训练数据至关重要;另一方面在于深度学习自身的问题,其提取特征以及诊断分类的过程和原理是不可见的,这使得模型诊断的结果不可解释,无法成为可信服的证据,严重阻碍了这项技术在临床的应用。对于第一个问题,如前文所述,已有学者进行了尝试;而后一个问题,也有不少专业研究人员提出例如可解释人工智能(XAI)等算法,该算法可以解释系统已经做的、正在做的和将要做的操作,帮助研究人员理解算法中的每一个步骤[33]。相信随着研究的深入,这些问题会迎刃而解。
深度学习的优势在于学习大量深度特征,这一特点在CNN上更为突出。目前SZ的研究模式多属于单中心研究,除影像数据外,尚有基于脑电图数据、遗传学、基因组学、代谢组学和蛋白组学等学科应用,但鲜有跨学科、整合学科的研究;且对于不同的研究领域,单一的深度学习算法无法充分利用数据。因此,模型框架的整合也成为必然趋势,基于自动编码器(AE)或循环神经网络(RNN)等“广义”的CNN层出不穷,卷积层不再是CNN的专属结构,可与其他算法模型搭建出新的模型框架。相信在未来,学科整合与模型整合会有广阔的应用前景,也将成为主流方向。
综上所述,将深度学习和精神分裂症的影像研究相结合是一个革新性的领域,可以获得更好的性能,在未来会拥有更广泛的应用,为精神分裂症乃至所有精神障碍的临床决策提供统一的解决方案,甚至彻底改变精神疾病的学科发展方向。