机器学习在双相障碍的应用☆
2020-01-11周霓吕洞宾王凡马玮亮洪武
周霓吕洞宾 王凡马玮亮 洪武 △
双相障碍 (bipolar disorder,BD)在全球的患病率约为1%~2%,其特征是情绪不稳定,抑郁和躁狂交替发作[1]。目前对BD的诊断仍基于症状学。而在BD治疗中,通常方案要经历长时间反复调整,患者才能接受有效治疗。同时BD具有高复发率特点,随访研究发现45%患者会出现一次以上复发[2-4]。因此,BD的诊断与治疗由于具有较强主观性和个体差异,往往导致患者治疗效果不佳,病情迁延。机器学习作为大数据时代背景下的一门新兴学科,结合了多门学科的思想,凭借其对数据的分析和预测能力,为临床诊断、治疗方案选择及预后判断等提供了新方法、新思路。机器学习中心原则是通过从大型数据集中提取适用规律和模式来实现自动化归纳推理[5]。机器学习算法的目标就是建立一个适合数据的数学模型,一旦这个模型符合已知的数据,它就可以用来预测新数据的从属或预测未来走向[6]。目前已有许多类型的机器学习算法,包括支持向量机 (support vector machine,SVM)、随机森林和k-近邻算法等,具体问题的模型选择取决于数据特征和期望结果的类型[7-8]。这些算法的本质基本都是根据训练集的数据进行迭代改进,以构建用于自主预测的模型,不断提高性能[9]。机器学习可分为有监督学习和无监督学习两种类型[10]。在有监督学习中,用户向机器提供输入数据和预期结果(即标签),机器主要通过分类或回归方法学习数据特征到标签之间的规律[11]。而在无监督学习中,无标签的数据直接暴露在算法中,机器主要通过聚类和降维的方法组织数据集,以此发现和描述数据间的规律[12]。近年来,机器学习在精神科等医学领域的运用越来越广泛,为临床带来新机遇的同时也带来了许多挑战。本文将对近年来机器学习在BD中的应用进行综述。
1 辅助诊断与鉴别诊断双相障碍
根据《国际疾病与相关健康问题统计分类(ICD-11)》中BD诊断标准,症状学仍是BD诊断的主要依据,疾病诊断可能会受医师的主观想法影响。机器学习能够帮助医生寻找潜在的客观指标,从而协助诊断,减少诊断结果的主观性。
首先,在脑结构影像和功能影像学领域,由于影像学数据可直接提取矢量特征值,所以机器学习在BD诊断存在一定价值。研究表明BD患者大脑结构存在广泛改变,特别是涉及情绪处理和认知的大脑区域[1]。SQUARCINA等[1]使用半监督方法对41例BD患者和34名健康对照者大脑皮层58个目标区域进行磁共振成像扫描,识别出顶下小叶、距状旁回、额上回、下颞区等脑区是BD患者最易受累及的区域,以此建模的分类准确率约为75%。这提示识别出特定脑区损伤可以作为诊断BD的标志。MWANGI等[13]对16例确诊为BD的青少年和16名健康青少年进行弥散加权成像扫描,通过测量区域白质组织微结构,包括分数各向异性、轴向扩散率和径向扩散率来训练SVM算法,最终此算法判断BD准确率为78.12%。这些研究表明机器学习能够结合影像学区分BD患者和健康人群,为临床诊断系统提供了潜在的辅助方法。
另外,机器学习也能够通过影像学鉴别BD与重性抑郁障碍 (major depressive disorder,MDD)。 临床上 BD 与MDD皆有抑郁发作,两者难以区分,导致BD误诊率高,治疗效果差,预后不佳[14]。MATSUO等[15]使用基于体素形态学分析(voxel-based morphometry,VBM)和 SVM 算法对 596例MDD患者、158例BD患者和777名健康对照者的磁共振图像进行比较。分析结果显示,与MDD患者相比,BD患者双侧背外侧前额叶和前扣带回皮质的灰质体积明显减少[15]。这表明,机器学习能结合影像学识别神经解剖学特征来分类BD与MDD,并可能有助于识别神经影像学生物标记物,以便将来更好地区分这两种疾病。
其次,机器学习能根据问卷访谈明确BD的诊断和发作类型。BELIZARIO等[16]建立148例BD患者的队列,通过制定半结构化问卷和临床定式访谈收集其人口统计学和临床变量,采用随机森林的算法进行机器学习,将患者区分为抑郁相或躁狂相,其AUC为0.747。此研究表明,通过机器学习能够有效地区分BD类型,有助于治疗选择。
目前机器学习结合基因组学方法已应用到BD与精神分裂症鉴别的研究中。HESS等[17]通过全转录组基因meta分析和基因共表达网络分析,探究BD和精神分裂症患者外周血转录异常的特征。该研究发现相对于正常对照组,BD组有19个基因、60个基因集和4个基因模块表达差异显著。机器学习结果显示,区分BD患者和正常对照组的AUC为0.724,区分BD和精神分裂症患者的AUC为0.677[17]。这意味着,机器学习能基于基因表达谱区分BD和精神分裂症,在BD的鉴别中有巨大潜力。
除此以外,机器学习能够通过回顾患者文本数据为精神障碍诊断提供参考。HOU等[18]提出精神障碍辅助诊断模型,通过收集精神障碍患者及健康人群发布在公开社交网站推特(Twitter)的文本数据,用情绪分布相似度计算和随机梯度下降的方法分析文本情感特征,可以实时检测出高概率患有精神障碍的用户,并对情绪化倾向明显的用户及时发布心理健康预警。该模型能够实时有效地判断社交网络用户的心理健康状况,为及时有效的预防、诊断和随访提供了机会。
2 预测双相障碍发生发展
机器学习的最大特点是具有预测性,基于机器学习的技术越来越多地用于精神健康预测分析[19]。BRISA等[20]通过机器学习整合外周血中免疫和炎症生物标志物等数据来预测BD的诊断,模型灵敏度为80%,特异度为71%。此外,WISE等[21]使用SVM算法和VBM相结合,根据 47例MDD和BD患者的双侧前腹侧岛叶灰质体积预测患者的抑郁症状严重程度。这些研究表明机器学习能够预测BD的诊断及严重程度。
同时,机器学习还能够预测患者因疾病复发再入院的因素及可能性。EDGCOMB等[22]对2006年至2016年加州大学医疗保健系统内1250例BD共病其他疾病患者的电子医疗数据进行回顾性分析,使用决策树模型识别经30 d住院治疗的精神障碍患者再入院预测因素。结果显示,该模型对30 d再入院的预测准确率在88%以上,其预测因素包括人口统计学资料、疾病诊断、药物治疗方案和家庭支持性[22]。此外,SALEM等[23]纳入714例初步诊断为BD的成年患者,在入院后72 h内完成标准化边缘型人格问卷评估,用以建立机器学习模型,最终此模型预测BD住院患者30 d再入院的准确率为86%,并且具有明显边缘型人格障碍特征的BD患者更有可能出现抑郁症状,而不是躁狂症状,且住院时间可能更短。这些研究表明,机器学习能够为预测疾病的发展提供参考。
3 指导双相障碍精准治疗
在临床BD治疗中,由于个体差异,即使同种药物相同剂量,对于不同个体的疗效仍不一致,甚至在经一段时间治疗后仍需改变治疗剂量或方式,影响患者用药依从性,最终影响治疗效果[24-25]。而机器学习可以通过预测药物疗效来帮助BD患者制定治疗方案。目前已有一些研究表明机器学习可以基于药物基因组学及神经影像学等数据帮助BD患者建立个体化精准治疗,减少病情延误。
近年来基于基因组学的药物疗效研究表明,与机器学习结合能够使BD个体化治疗更准确。EUGENE等[26]根据基因表达综合数据库中使用中等剂量锂盐的研究数据,利用基因芯片和RNA序列算法包的线性模型以及决策树和随机森林机器学习算法进行差异基因表达分析,开发基于性别和基因表达的治疗前预测模型,该模型能够根据2个基因(RBPMS2和LILRA5)区分男性锂盐应答者,其敏感度为 96%,根据 3个基因(ABRACL,FHL3和 NBPF14)区分女性锂盐应答者,其敏感度为92%。这表明机器学习能通过分析BD患者基因组数据,为个体化治疗提供参考。
另外也有研究将机器学习与神经影像学相结合,同样能够实现BD个体化治疗。FLECK等[27]开发了基于级联遗传模糊树设计的语言机器学习系统,称为锂智能体(lithium intelligent agent,LITHIA), 该研究选定 20 例首发BD-Ⅰ型患者,在治疗前进行功能磁共振成像(functional magnetic resonance imaging,fMRI) 和磁共振波谱(magnetic resonance spectroscopy,MRS)扫描以及杨氏躁狂量表(Young mania rating scale,YMRS)评分,根据治疗后第 8 周相对于治疗前基线的YMRS评分减分率是否达到50%来分类对锂盐有无反应。患者经8周充分锂治疗后,使用基线YMRS总分、fMRI和MRS结果及性别对LITHIA进行4次训练。结果显示,LITHIA达到100%分类准确率,且能够预测经8周治疗后患者症状的减轻程度,训练准确率大于88%,验证准确率为80%[27]。这些研究表明,在今后BD治疗中,机器学习可以帮助临床医生更有效地优化个体治疗方案。
4 总结与展望
机器学习可能对BD的诊断及鉴别诊断具有潜在价值,还可以预测BD的诊断、病程变化以及治疗效果,具有应用于临床的指导优化诊治策略的前景。
然而,目前各研究中研究对象的诊断主要由临床医生根据一系列症状及体征主观判断得出,存在误诊可能,这将导致增加机器学习错误预测可能性。除此以外,目前机器学习研究的样本量普遍较小,预测准确率还有提高的空间。因此机器学习还有待深入研究,尚不能替代专业的医疗判断,在临床应用中仍应谨慎。机器学习应用于BD的研究尚待完善,但已有研究结果几乎都肯定了机器学习在BD诊治中的应用前景,机器学习在BD的广泛应用仍需要更多循证证据支持。