机器学习在抑郁症辅助诊断中的应用探究进展
2023-11-29华北理工大学临床医学院李博文李娟
华北理工大学临床医学院 李博文 李娟
近十年来,人工智能技术快速发展,在医疗领域的应用也逐渐深入。本文具体对机器学习在抑郁症的辅助诊断方面的相关研究进展进行综述,总结了机器学习在抑郁症辅助诊断领域的常用算法及一般研究流程,并对机器学习应用于抑郁症存在的优势与不足进行探讨,以期为后续研究提供借鉴。
通过运用以机器学习为代表的人工智能技术,进行抑郁症的辅助诊断,促进抑郁症的早发现和早治疗,具有十分重要的现实意义。本文就机器学习在抑郁症辅助诊断方面的相关研究进展进行综述,期望为机器学习在该领域的研究提供借鉴。
1 机器学习及流程简述
1.1 机器学习概述
美国计算机科学家约翰·麦卡锡提出了“人工智能”的概念,希望能够通过计算机对人类的智慧进行模拟。机器学习作为人工智能的重要研究应用领域之一,于20世纪50 年代初奠定基础,并不断发展,在20 世纪80 年代发展为独立的科学领域。现如今,随着计算机科学与技术的进步与发展,网络和移动的计算系统收集和传输大量数据的能力迅速增长,各种机器学习技术层出不穷,迎来井喷式发展。
机器学习作为一门专注于计算机如何从数据中学习的科学学科,位于计算机科学、统计学和各种其他学科的交叉点,通过数学推理和学习算法可以在海量的数据中挖掘有意义的规律,可以利用学习到的“经验”来改善计算机系统性能,更强调实际目标的具体应用[1]。目前,机器学习也逐渐被运用到抑郁症的辅助诊断中。
1.2 机器学习算法
随着社会的发展,数据体量的增长,对流程优化、资源分配有了更高的要求。机器学习算法能够快速进行数据处理,自动化做出一些决策,极大程度上减少了人力资源浪费以及人工干预的风险和错误,提高了效率和准确性,因此,越来越多的领域将研究与机器学习算法相结合,激发更多的创造力与可能性。
根据学习方法不同将机器学习算法分为传统方法(TA)和深度学习(DL)方法。深度学习与机器学习的关系如图1 所示。
图1 深度学习与机器学习的关系Fig.1 Relationship between deep learning and machine learning
传统学习算法可以从训练数据中学习并做出智能决策,因此加入大量的特征工程(FE)来处理原始数据集得到更结构化、更少噪音训练数据集是相当重要的,也是使用TA 方法进行研究的一大难点。这种方法的优点是最小计算负担与训练时间,且因为模型内部细节和工作知识完整,也被称为“白盒”,分析诊断结果有着高度的可解释性[2]。
深度学习算法由分层结构算法组成,可以模拟生物神经元工作,进行自动化特征提取,让机器能够像人一样具有分析学习能力。DL 由浅层和深层架构组成,这些结构复杂、多层、隐藏、相互连接,也被称为“黑箱”。优点是能够处理原始的、嘈杂的、非结构化的高位数据集,限制是在可解释性方面较差,计算负担沉重。传统机器学习与深度学习的比较如表1 所示。
表1 传统机器学习与深度学习的比较Tab.1 Comparison between traditional machine learning and deep learning
TA 使用的算法一般有:最小二乘支持向量机(LSSVM)、不同核支持向量机(SVM、CK-SVM)、基于判别分析的分类器(线性判别分析(LDA)和二次判别分析(QDA))、集成架构(Bagging、RusBoost(RB)、GentleBoost(GB)和随机森林(RF))、概率模型(朴素贝叶斯(NB)和逻辑回归(LR))、K-最近邻(KNN)及其变体,基于树的算法(决策树(DT)、J 48、复杂树),以及其他(高斯混合模型(GMM)、贝叶斯网络)。其中SVM 和KNN 是大多数研究中性能最高的分类器,在各种性能指标方面实现了优异的分类结果(约99%)。
DL 使用的算法一般有:卷积神经网络(CNN)、长短期记忆(LSTM)、CNN 和LSTM 的组合、自编码器(Autoencoder)、多层感知器(MLP)、人工神经网络(ANN)、径向基函数网络(RBFN)、ConvNet。CNN 是研究文章中使用最多的架构,许多研究将基于CNN 的时空特征与不同的特征提取方法相结合,很少有研究将深度神经网络用于抑郁症诊断。由于DL 的“黑盒”特性,迫切需要具有可解释性的处理问题的DL 方法模型。
机器学习常使用准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1 值、ROC 曲线、AUC 值等评价指标衡量抑郁症检测算法性能,对算法分类能力进行评估。
2 机器学习在抑郁症辅助诊断中的应用
2.1 基于脑影像数据的抑郁症辅助诊断
伴随研究的深入,越来越多的研究表明,脑结构、脑功能的异常可能与抑郁症的发生有关。随着医学影像技术的不断进步,目前有关抑郁症的脑影像研究主要分为三个方面,分别是脑结构、脑功能及脑代谢影像研究。
近年来,关于抑郁症患者的脑功能影像研究发展迅速,而机器学习同抑郁症患者的脑代谢和脑结构影像的研究相对较少。
脑功能影像研究则主要集中于额叶、颞叶、杏仁核、扣带回等处的功能障碍,作为对脑功能影像进行研究的最主要工具,功能性磁共振成像(fMRI)被广泛应用。并根据实验方案的不同,分为静息态fMRI 和任务态fMRI。
其中,在与静息态fMRI 结合方面,Zeng 等基于区域的静息状态功能连接,运用了支持向量机(线性核)模型对重度抑郁症进行识别,准确度达94.3%。从而表明与疾病相关的静息状态网络改变可能引发重度抑郁症中一部分情绪复杂性和认知障碍。此外,杏仁核、前扣带皮层、海马旁回和海马体在分类中表现出很高的判别力,可能在抑郁症的病理生理学中发挥重要作用。Dai 等使用多站点rs-fMRI 数据增加样本大小,并从使用SVMRFE-CV 选择的136 个重要特征训练的LinearSVM 模型中获得最好结果,揭示了FC 和NA 特征的组合使用对于MDD 和HC 的分类是有效的,可作为MDD 中改变脑功能连接网络的参考。
在与任务态fMRI 结合方面,Hahn 等运用单高斯过程分类,并集成高斯过程分类和决策树-支持向量机(线性核)进行比较,在3 项与抑郁症相关的功能性MRI 任务期间,整合与情绪和情感处理相关的数据,大大提高了分类的准确性,准确率达83%。Rosa 等运用高斯图模型与支持向量机模型,基于情绪面孔脑激活区进行分析[3]。结果显示,分类准确度可达85%,在抑郁症患者中,发现有稳定的纹状体、皮层及扣带回脑网络连接异常。
2.2 基于脑电和组学数据的抑郁症辅助诊断
2.2.1 脑电图(EEG)
脑电数据有着非侵入、成本低、效率高的优点,能够实时反馈患者的大脑活动,帮助医生更好地了解患者病情与治疗效果。将EEG 数据与合适的算法模型结合使用,是一种前景广泛、结果可靠的抑郁症辅助诊断方法。
已知最早使用EEG 数据辅助诊断抑郁症的研究始于1972 年,Stern 等使用EEG 数据来识别抑郁症患者与非抑郁症患者的差异。随着计算机技术的飞速发展,EEG数据辅助诊断抑郁症研究有了更多的算法模型。
Wu D 等使用了深度神经网络(DNN)对EEG 数据进行训练和测试,其中数据集包括64 名抑郁障碍患者和64 名健康受试者的EEG 数据。在训练阶段,使用了10 次10 折交叉验证的方法进行模型训练和参数调整。研究结果表明,使用深度学习方法对EEG 数据进行分析可以有效地预测抑郁症患者的症状严重程度,准确率高达85%。
Acharya 提出了一种使用深度卷积神经网络进行自动化EEG 筛查抑郁症的方法。该方法基于265 名患者的数据集,可以在高达96.30%的准确性和92.50%的敏感性下对抑郁症进行筛查。目前在该领域中,该研究的准确度已经达到非常高的水平。
以上足以见得算法与EEG 数据结合在辅助诊断抑郁症方面的优越性,值得注意的是,这些模型的准确率受到许多因素的影响,如实验数据、模型设计、超参数选择等。因此,在具体应用时需要根据实际情况进行选择和调整。
2.2.2 基于组学分析技术诊断相关生物标志物
目前,临床缺乏客观的生物标志物帮助辅助诊断抑郁症,进行治疗及预后评价。但仍然可以窥得基于组学分析技术在研究抑郁症的遗传因素、基础生物学机制、蛋白质标志物、代谢过程方面,为抑郁症的早期诊断、个体化治疗和药物研发等方面提供支持,具有巨大潜力。
2.3 基于行为数据的抑郁症辅助诊断
行为数据,如表情、声音和文本等,相对于脑电,MRI 等生理信号采集成本较低,数据易于获取,较其他数据更容易解释,模型准确率也较高。
目前,已有研究者引入卷积神经网络算法进行患者抑郁状态的检测。Zhu 等提出了一种基于深度卷积神经网络模型从视频数据中预测贝克抑郁量表II(BDI-II)值的方法,相比其他基于视觉的方法,该模型可以对患者的面部动力学特征进行很好的刻画,显著提高抑郁症的预测性能。Zhou 等在回归网络中引入了记忆注意力机制去深度判别抑郁表示,利用卷积神经网络算法,对面部特征的提取进一步优化,通过在基准数据集上对方法进行经验评估,结果表明其方法优于当下几种最先进的方法[4]。
近年来,通过患者的语音特征进行抑郁症的辅助诊断的研究越来越多,有研究发现,单调、迟钝、停顿、低沉和语言输出减少等特征与抑郁症患者的语言关联密切。也有研究以声音抖动和声门频谱斜率为特征,选取10 名高风险的近期自杀患者,10 名严重抑郁症患者和10名非抑郁症对照组建立模型,其准确率高达90%。
除此之外,社交媒体上发布的文本数据也可提供有关抑郁症的线索。刘豪等基于领域情感词典与字词特征融合,提出了一种进行中文抑郁症文本分类的方法,并应用于BERT 模型,准确率达到了97.59%。Yang 等通过抑郁症相关问题分类的支持向量机(SVM)框架和Doc2Vec 和文本卷积神经网络的框架,对受访者是否有抑郁倾向进行分类,建立了一个易于分析抑郁倾向的文本分类模型。
3 机器学习应用于抑郁症的优势、不足及展望
3.1 优势
利用人工智能强大的数据处理能力,用机器学习算法模型辅助医师完成诊疗,可以避免因认知偏差而导致的临床错误,提高诊断率,有助于为抑郁症患者提供更加有效的个性化治疗方案。
并且在心理咨询中,当人们面对人工智能咨询时,相较于人类咨询师,所产生的怀疑及顾虑更少,更易对人工智能坦诚相告,可避免患者因病耻感而不愿及时就医的问题,有助于促进抑郁症的早发现和早治疗。
3.2 不足
当下的研究所采用的样本数据多以小样本为主,缺乏大规模大样本的深入研究,机器学习模型预测的准确与否同所采用的数据质量密切相关,且算法模型的建立需要以标签数据为基础,同时还需要较多富有经验的专业医师进行大量的数据标注工作。
此外,将机器学习应用于抑郁症也对伦理道德问题提出了重大挑战,包括对于患者数据进行收集、共享的伦理问题以及患者数据隐私保护的问题等。
3.3 展望
近年来,抑郁症的全球发病率增长迅速,而我国目前精神卫生方面的医生数量难以满足日益增长的看病需求,对抑郁症患者进行及时的干预治疗存在着较大难度。若是能够利用以机器学习为代表的人工智能技术进行抑郁症的辅助诊断,则可以在一定程度上提高医生的诊断效率,节约我国的医疗资源,并缓解精神卫生方面的医疗资源稀缺情况。