APP下载

人工智能算法在精神疾病中的应用简述

2020-09-05刘光迪李雨辰张伟章乐

工程 2020年4期
关键词:疾病诊断精神疾病决策树

刘光迪 , 李雨辰 , 张伟, 章乐

1. 引言

1990年和2010年全球疾病负担研究[1]发现,精神障碍和物质滥用是造成以伤残调整生命年(DALY)衡量的第四大疾病负担的主要原因[2,3],并且是导致全球范围内伤残的主要原因。

为了研究精神疾病的致病因素和发病机制[4],同时增加对大脑的干预能力和提高对精神疾病的临床治疗水平,各国开展了大量脑研究计划[5]。如美国2013年推出的推进创新神经技术脑研究计划(Brain Research through Advancing Innovative Neuroethology initiative)[4]、欧盟2013年推出的人类大脑计划(Human Brain Project, HBP)[4]、日本2014年启动的脑库网络(Brain Bank Network)项目[5]。我国也非常重视该领域的研究,并于2016年发布了“中国脑计划:脑科学与类脑研究”,该项目涵盖了大脑疾病的神经机制的基础研究和临床研究[6]。

尽管精神疾病是脑科学研究的一个重要领域,但是大多数精神病学专家仍然基于主观经验而不是通过病理生理学指标对该疾病进行诊断[7,8]。这可能会误诊及无法准确判断治疗路径。因此,我们迫切需要对重大精神疾病的病因和发病机制有一个清晰的认识,以便为主要的大脑疾病开发有效的治疗和干预措施。

近年来,基于人工智能(AI)的应用已被迅速用于精神病学研究和诊断[9–15]。例如,Jan等[16]提出了一种用于监测抑郁症的AI系统,该系统可以预测贝克忧郁量表II(BDI-II)中声音和视觉表达分数。另外,Wen等[17]基于多模态神经影像学提取了多种类型的灰-白质特征,并使用多核学习分类器为每个特征的核函数分配权重。

然而,目前尚无系统性的综述对AI在精神病学研究和诊断中的应用情况进行阐述。因此,我们将对该部分内容进行简要阐述,并对如何使用AI技术去探索精神疾病的生物标志物进行讨论。

2. 精神疾病诊断中与AI 相关的主要技术

AI技术[18,19]正被逐步应用于精神疾病诊断。大脑结构和功能是精神疾病最重要的生物学表型和关键的诊断标志物[20]。因此,使用AI技术可以获得用以表征不同精神疾病的详细信息,从而对这些疾病进行诊断[16]。

图1描述了精神疾病研究中用于大脑观察的三种主要技术:磁共振成像(MRI)、脑电图(EEG)和基于体势学的诊断[21]的技术。接下来,我们将讨论这些技术基于AI的相关应用。

2.1. 磁共振成像

MRI是用于研究行为和认知神经科学的主要技术,因为该技术可以探测明显的精神异常,而这些精神异常是计算机断层扫描(CT)技术所无法检测到的[22–25]。目前,脑成像常用的AI技术包括多任务/多模式学习、分类、核心和深度学习方法[26],这些方法有助于有效分析现有疾病数据、探索关键生物标志物和提高大脑疾病的临床治疗能力[24,25]。尽管许多与AI相关的技术已经被应用到MRI [26–28],但本节我们主要介绍被用于神经成像研究的卷积神经网络(CNN)[29]和深度神经网络(DNN)[30–32],以阐明精神疾病的神经相关性[30,33–36]。例如,Hosseini-Asl等[37]提出了一种新的自适应三维(3D)深度监督CNN,该网络可以自动提取和识别阿尔茨海默病的特征、捕捉由阿尔茨海默病引起的变化,以及利用这些网络对MRI图像进行分析和识别。此外,Koyamada等[38]使用DNN构建了一种主题传输解码器。该解码器是由人脑连接组计划(HCP)中的功能性MRI(fMRI)数据集所训练的,它具有比其他解码方法更高的解码精度。

目前,虽然MRI是一种重要的精神疾病诊断工具,但它仍存在几个主要的缺点。首先,MRI需要大量的计算机配置。其次,它需要大量数据来优化模型的关键参数。第三,它的成像过程耗时较长。因此,如何改进现有的基于AI的应用来解决这些问题是MRI未来的重要研究方向。

2.2. 脑电图

目前,EEG信号对于理解人类大脑如何处理信息和诊断精神疾病是非常重要的,我们可以通过检测和记录人类的EEG信号来完成神经系统疾病的诊断和治疗[39]。与CT和MRI相比,EEG具有更高的时间分辨率[40]。因此,尽管EEG的空间分辨率有限,但它仍然是一个有价值的研究和诊断工具,特别是当特定的研究需要毫秒级的时间分辨率时,如关于焦虑症、精神病和抑郁症的研究[41]。

图1. 精神疾病的主要观察技术。

在这里,我们重点描述了经典机器学习算法在EEG中的应用。由于EEG数据是用图形表示的,所以研究人员通常利用基于AI的模型来对其进行分析[42–45]。例如,Field和Diego [46]采用线性判别分析法处理EEG数据,并且在对正常患者和抑郁症患者进行分类时获得了67%的准确率。此外,Iosifescu等[47]采用支持向量机(SVM)对88名受试者额头上的8导联中点的静息状态EEG数据进行分类,分类准确率达70%。此外,Bisch等[48]采用逻辑回归(LR)对抑郁症的9导联EEG数据进行分类,分类准确率达83.3%。

尽管EGG可以简化数据采集过程,但其会造成信息丢失。更重要的是,EGG数据存在的大量未被挖掘的因素会导致分类决策出现大量噪声。因此,开发更适合EGG数据的机器学习模型是我们未来的主要研究方向。

2.3. 体势学

体势学数据(包括行为[49]、面部[50]等数据[48])对于研究精神疾病的发病机制、发展转化和辅助诊断非常重要。AI技术被广泛应用于分析这些数据,以帮助诊断和预测精神疾病。

近几年,与AI相关的应用已被用于基于体势学的数据诊断[50–52]。例如,Wang等[53]提出了一种为视频数据建立概率面部表情轮廓的计算方法,该方法可以自动量化精神疾病患者(如精神分裂症)和健康对照组之间情感表达的差异[16]。Zhu等[54]采用深度学习算法实现了抑郁症的自动诊断,他们通过将平均绝对误差降低30.3%,显著提高了抑郁症的预测性能。此外,Kaletsch等[55]研究了重度抑郁障碍(MDD)患者与健康对照组在身体运动方面的情绪表达差异,并证明MDD患者比健康对照组更消极。

另外,Dhamecha等[56]提出了一种用于识别或验证伪装后的人脸的人机性能算法[57]。该方法通过自动定位特征描述符来识别伪装后的人脸图像,并对这些信息进行处理以提高匹配精度。实验结果表明,该算法不仅能在性能上优于现有的商用算法,而且能在匹配时对伪装的人脸图像进行评价。

总的来说,随着AI和精密医学的发展,体势学数据的采集和分析将变得更容易、更方便,且成本更低。体势学数据有助于提高模型的预测准确性和减少误诊率,以及有助于精神病学专家诊断和治疗精神疾病。

3. 人工智能算法

3.1. 贝叶斯模型

在AI中,朴素贝叶斯分类器(naïve Bayes classifier)[58–60]是一种基于贝叶斯定理和特征条件无关假设的分类方法,它是分类算法的一种通用术语。

在近期研究中,贝叶斯模型经常被用来诊断精神疾病。例如,计算精神病学的Strüngmann论坛(Strüngmann Forum on Computational Psychiatry)[61–63]建议使用贝叶斯推理来研究潜在原因(遗传学和社会学现象[15,64])、潜在假设理论结构以及症状之间的关系[65]。此外,Grove等[66]采用贝叶斯模型比较法探讨了视觉整合与一般认知的关系。结果表明,贝叶斯模型不仅可以对疾病分类系统进行比较,并且能获取诊断组的一般心理病理信息。

3.2. 逻辑回归

在统计学中,逻辑斯谛模型[67,68]是应用最广泛的统计学模型,而且LR是一种重要的AI算法[68,69]。最近的研究经常使用LR模型来诊断精神疾病。例如,Hagen等[70]采用LR法评价了心理困扰与两种认知筛查工具之间的相关性。结果表明,基于绩效的评估可以减少心理困扰对认知筛查的影响。

此外,Barker等[71]采用多变量LR模型预测了30天内精神病患者再入院的情况。他们研究了一种更好的再入院预测方法,并找到了精神病患者再入院的重要预测因素。

Shen等[72]通过分类和回归树方法建立了一种风险分层模型以获得精神病共病的比值比(odds ratio, OR),并采用LR法计算了有无边缘型人格障碍的受试者之间的精神共病的OR。

总之,LR模型的预测准确性很高,并且其在临床上得到了广泛的应用。

3.3. 决策树

决策树[73]是一种类似于流程图的图表,该图表显示了一系列决策结果,包括随机事件结果和效用。决策树是监督分类学习中使用最广泛的算法之一。在AI算法中,决策树是一种预测模型,它代表了对象属性和对象值之间的一种映射关系。大多数现代决策树学习算法都采用基于纯度的启发式算法[74]。信息增益,即gain(D,X),定义如下[75,76]。

式中,D是一组训练集;X是某种属性;x是属性X的取值;Dx是D的子集,由X=x的实例组成;info(D)由下式定义。

式中,pi是根据训练实例的百分比进行估算的;m是类别数。

接下来,我们将详细讨论被用于精神疾病研究的两种决策树算法。

Carpenter等[77]使用决策树算法测试了学龄前儿童精神病评估(PAPA)项目是否可以被用于预测儿童是否可能患有广泛性焦虑障碍(GAD)或分离性焦虑障碍(SAD)。他们使用决策树识别了正处于焦虑症边缘的儿童,结果表明,该决策树对GAD和SAD的预测准确率均高达96%。

Scattler等[78]使用决策树分析了Spence儿童焦虑量表(SCAS)和SCAS-P强迫症-冲动性障碍子量表的数据,并结合儿童与家庭的临床和社区样本设计出两种诊断强迫症的筛查算法。结果表明,在不牺牲与全分量表相关的性质的前提下,该算法将诊断强迫症所需的SCAS-P项目数量减少了67%~83%。

3.4. 支持向量机

目前,SVM模型已被广泛应用于精神疾病的诊断。例如,为了描述用户的情况,Peng等[80]采用多核SVM模型,通过提取三种社交方法(用户微博正文、用户简介和用户行为)来定位可能患有抑郁症的潜在用户。此外,Al-Shargie等[81]提出了一种基于多类SVM的判别分析方法。结果表明,该方法可以判别不同的EEG应激水平,平均分类准确率达94.79%。

3.5. 深度学习

经典的机器学习方法,如贝叶斯模型和SVM,已经在精神病学和神经科学领域得到了广泛的应用[64–66]。目前,深度学习[82–84]是一个热门的机器学习研究方向,它在很大程度上超越了前面提到的AI模型[85–87]。

深度学习是指在多层神经网络上使用各种机器学习算法来解决图像或文本等各种数据的一组算法。结合低维特征,深度学习可以开发出更加抽象的高维属性类别或特征,从而发现数据的分布式特征。其中,权值更新可利用随机梯度下降法进行求解,公式如下:

式中,Δw(t)是t时刻权重;η是学习速率;C是损失函数。损失函数的选择与学习类型(如有监督学习、无监督学习、增强学习)和激活函数有关。

下面,我们详细讨论两个深度学习算法在精神疾病诊断中的应用。

通过在TensorFlow框架上使用DNN,Khan等[88]利用一种计算工具(综合精神疾病基因组评分,简称iMEGES)分析了个人基因组的全基因组/外显子组序列数据。基于深度学习框架,该工具为精神疾病创建了优先基因评分[89]。研究结果表明,当有大量训练数据集存在时,该工具的性能优于竞争方法。

此外,Heinsfeld等[39]对大型脑成像数据集采用了深度学习算法,并且仅根据患者的大脑激活模式就识别出了自闭症谱系障碍患者。研究结果表明,数据集的分类准确率达到70%,可见,深度学习算法对大数据集的分类效果优于其他方法。此外,研究结果显示了深度学习算法在临床数据集中的应用前景,并阐明了AI在精神疾病诊断中的应用前景。

尽管深度学习算法先进的性能在一些领域已得到验证,但由于其在学习和测试过程中缺乏透明度,所以该算法一直受到人们的密切关注[90–92]。例如,深度学习被称为“黑匣子”。相比较而言,LR等技术相对简单易懂。

为此,本文介绍了可解释DNN的最新研究成果。例如,在CNN可视化方面,Springenberg等[93]提出了一种可被用于从深度学习中获取特征的反卷积方法。此外,Kindermans等[94]提出了一种将输入图像中对CNN决策过程贡献最大的区域进行可视化的方法。而在利用传统机器学习模型解释神经网络的相关研究中,Zhang等[95]提出了一种解释预训练CNN卷积层特性的方法,并利用说明图揭示了隐藏在CNN中的知识层。总之,一个好的AI模型应该是可解释、可通用和适应性强的,并且应该从数据、规则和交互中进行学习。

4. 讨论

介于环境与多个易感基因之间的相互作用,未来精神疾病的诊断过程如下:首先,通过EEG研究引起蛋白质表达[98,99]等的微分子变异[96,97];其次,通过MRI检测大脑结构、特定神经环路以及大脑功能的改变;最后,当患者发生临床表型转换时,利用行为学数据鉴定行为变化[100]。结构、功能和行为方面的这些变化,不仅有助于精神疾病的早期诊断,而且有助于对诊断精神疾病的关键生物标志物进行探索。

然而,精神疾病的临床症状复杂多样。精神疾病的诊断又属于医学任务中的一种劳动密集型工作,因此,此项工作可由机器学习辅助进行。一般的医疗系统往往不能准确、快速地诊断精神疾病。临床检验技术和AI技术的不断发展,不仅可以大大降低诊断成本,而且可以实时获得辅助诊断结果。所以,AI技术可以协助医生做出更准确和更有效的诊断[101–103],从而提高神经精神疾病的临床诊断水平。

AI在这方面的典型应用是基于DNN的疾病诊断[104]。DNN可以通过基于相关疾病数据的深度学习模型来准确预测疾病或异常病变的风险。在文献中,虽然深度学习对精神疾病诊断的分析性能较好,但该模型也存在一些问题,如:①对计算机配置的要求较高;②对数据量的要求较高(只有在数据较多的情况下,实验性能才较好);③实验所消耗的时间较长。这些问题值得进一步研究和探讨。

总之,尽管AI在精神疾病诊断方面取得了很大的进展,但仍有许多问题需要解决[105]。首先,由于目前的研究主要是基于经典的浅层学习算法,而该算法在高维特征之间很难共享和使用信息。因此,深度学习是未来的一个研究方向。其次,发展利用无监督学习对未标注的精神疾病影像学数据进行自动标注是十分必要的。最后,由于目前基于AI的模型只能处理同源数据集,所以它的适用性不强。因此,迁移学习、多视角学习和集成学习[106]有望在将来被用于处理大量的精神疾病数据。

5. 结论

目前,MRI、EGG和体势学是诊断精神疾病的重要方法。随着AI技术在医学中的应用越来越广泛,传统的人工诊断方法正逐渐被淘汰,而MRI、EEG、体势学在计算机辅助诊断方法中的作用越来越重要。本文综述了AI技术在上述三个方面的应用,即①精神疾病诊断过程的简要介绍及对其中所产生的主要数据类型的分析;②AI技术在精神疾病诊断中的重要作用及其应用性能的介绍;③基于当前深度学习热点对疾病诊断方法的总结与分析。

致谢

本研究得到了国家重点研发计划慢性传染病专项(2016YFC1307201)、国家自然科学基金(61372138、81701328、81871061、81371484)、 国 家 重 点 研 发项目(2018ZX10201002、2016YFC1307200)、中国博士后基金 (2017M612972)、四川大学博士后基金 (2018SCU12042)、四川省科技厅科技计划项目(2018SZ0131)的资助。

Compliance with ethics guidelines

Guang-Di Liu, Yu-Chen Li, Wei Zhang, and Le Zhang declare that they have no conflict of interest or financial conflicts to disclose.

猜你喜欢

疾病诊断精神疾病决策树
轻型精神疾病的诊断与治疗
超高频超声在浅表器官疾病诊断中的应用
“无形”的病痛——关怀精神疾病人群
消化内镜在胃肠道疾病诊断和随访中的作用
一种针对不均衡数据集的SVM决策树算法
中国医保支付改革的探索与反思:以按疾病诊断组(DRGs)支付为案例
决策树和随机森林方法在管理决策中的应用
3 当我们失去健康:精神疾病
基于决策树的出租车乘客出行目的识别
CD10表达在滋养叶细胞疾病诊断中的临床意义