人工智能与炎症性肠病
2021-01-06李德春
陈 垒,李德春
陈垒,蚌埠医学院研究生院 安徽省蚌埠市 233030
李德春,徐州市中心医院放射科 江苏省徐州市 221009
0 引言
炎症性肠病(inflammatory bowel disease,IBD)是一种病因尚不十分清楚的慢性非特异性肠道炎症性疾病,包括溃疡性结肠炎(ulcerative colitis,UC)和克罗恩病(crohn’s disease,CD).近20余年来国内就诊人数呈快速上升趋势[1],根据2014年中国疾病预防控制中心数据统计:中国2005-2014年间IBD总病例约为35万,到2025年预计中国的IBD患者将达到150万例[2].UC最常发生于青壮年期,根据我国统计资料,发病高峰为20-49岁,男女性别差别不大[3],CD最常发生于青年期,发病高峰年龄为18-35岁,男性略多于女性[4],UC和CD发病率大致相等[5],其诊断相对困难,缺乏金标准[3],且两种疾病的临床表现非常相似,如粘液脓血便、腹痛和不同程度的全身症状,临床主要结合其临床表现、实验室检查、内镜检查、影像学检查和组织病理学检查进行综合分析,在排除感染性和其他非感染性结肠炎的基础上作出诊断[6].
AI是当下学术界和产业界的一个热点,AI是计算机科学的一个分支,是让计算机去行使通常情况下具备智能生命才可能行使的活动.广义的AI涵盖机器学习和机器人等.机器学习(machine learning,ML)是让计算机通过学习大数据,开发出一种算法,让计算机去完成对未知事件的预判,ML依据训练方式的不同分为监督性学习、非监督性学习和强化学习三种[7].伴随着AI的方兴未艾,医学影像与AI的结合被认为是最具发展前景的领域[8].在过去十年中,AI已被应用于多项临床研究,以改善胃肠疾病患者的医疗保健,准确检测息肉和早期癌症病变,促进炎症病变的分析,并预测药物的反应和临床结果[9].尤其在病理界,AI被认为掀起了新一代工业革命,诊断更快、更精准,节约医疗成本,使得医生将更多的时间用于疑难病例的分析[10].
由于IBD的诊疗目前存在困难,AI在基于大数据的基础上能够对IBD进行很好的应用,本文就AI目前在IBD中的应用及进展进行简要综述,旨在引起读者对AI在IBD中的应用研究产生兴趣.
1 AI模型在IBD中的应用
作为AI的一种主要形式,ML是一种应用程序,它通过采用几种方法(包括随机森林(random forests,RF)、支持向量机(support vector machine,SVM)、纵向回归(longitudinal regression,LR)等来执行模型的重复迭代,从而逐步提高特定任务的性能.ML已用于包括IBD患者在内的多项临床研究,以确定IBD的鉴别诊断,评估IBD,并预测用于治疗IBD的药物的反应和临床结果.统计建模的进步与获得和生成基因表达数据的容易性相结合,导致了多种方法来建立回归和分类模型,以帮助诊断、预后、疾病预测、患者分层和治疗选择[11].
对于分类来说,最常见的方法是使用基因子集来获得感兴趣的表型特征[12].HAN[13]在研究中提出了一种新的、可推广的基于个体化路径的分类方法,概率路径评分(probabilistic pathway score,PROPS),它使用高斯贝叶斯网络来创建反映路径活动的个性化特征,应用这些基于路径的特征来区分慢性疾病和溃疡性结肠炎,这种方法在区分UC和CD方面表现优异,并提供了关于驱动这些疾病的重要途径和潜在分子机制的生物学见解,结果显示PROPS在性能上优于现有的IBD分类器和替代方法,并且即使是已知由UC和CD共享的途径显示出不同的活性,这对于区分两者仍是有用的.由于基于完全监督学习(fully supervised learning,FSL)的分类器需要大量不同疾病严重程度的标记数据,获取此类数据非常耗时,需要大量专业知识,Mahapatra[14]提出了一种新的主动学习框架,并将其与半监督学习(semi-supervised learning,SSL)相结合,用于从腹部磁共振图像中分割克罗恩病组织,SSL方法使用几个标记样本,并利用来自许多未标记样本的信息来训练精确的分类器,得出了结合SSL和AI给出了一种分割方法,这种方法可以优化使用少量的标记样本和大量的未标记样本、需要较少的训练时间,其实验结果表明,与FSL方法相比,该方法具有更少的样本和更少的训练工作量,分割精度更高.最近一种新近开发的特征选择算法(doubly randomized preferece trial,DRPT)结合SVM分类器,根据结肠样本中32个基因的表达值生成一个模型来区分健康受试者和UC受试者,模型完美地检测出所有活动病例,在最终检测UC的模型表现出良好的性能[15].
2 AI结合内窥镜在IBD中的应用
AI现在是临床医学尤其是胃肠道(gastrointestinal,GI)内窥镜检查中的新趋势.人工智能有潜力在各个层面上改善胃肠道内窥镜检查的质量.它通过带来更高的准确性,一致性和更高的速度,使内窥镜检查过程更高效,更高质量,来弥补人类的错误和有限的能力.AI在胃肠道的所有部分的诊断和治疗性内窥镜检查中均显示了出色的结果.它有可能在所有级别上显著改善胃肠道内窥镜检查[9,16].内窥镜检查对评估IBD非常重要,一项研究集中在无线胶囊内镜(wireless capsule endoscope,WCE)在使用SVM或卷积神经网络(convolutional neural network,CNN)评估溃疡性结肠炎患者的肠道溃疡病变中的应用,并且这些算法模型的准确率都相对较高,从89.3%到93.8%不等[17].Charisis等[18]亦介绍了一种基于WCE图像处理技术的新特征提取技术,该技术可用于检测克罗恩病粘膜炎症产生的病变,更具体地说,开发了一种新颖的滤波过程,即混合自适应滤波(hybrid adaptive filtering,HAF),可以从WCE图像中高效提取与病变相关的结构/纹理特征.
此外,差分腔隙分析(differential lacunarity,DLac)被用于从HAF滤波图像中提取特征,即HAF-DLac方案,结合了SVM,可实现强大的病变识别性能,对于HAFDLac的训练和测试,研究使用了800幅图像数据库,该数据库是从13位接受WCE检查的患者中获得的,根据所描绘病变的严重程度,将异常病例分为轻度和重度.实验结果表明,在用于自动病变检测的WCE图像分析领域中,HAF-DLac方法分别高达93.8%(准确性),95.2%(灵敏度),92.4%(特异性)和92.6%(精度).Ozawa等[19]已经开发了一种用于IBD标准化内窥镜评估的AI系统,并取得了初步成功,他们应用CNN构建了计算机辅助诊断(computer aided diagnosis,CAD)系统,并使用来自UC患者的大量内窥镜图像数据集评估了其性能.这是一个有效区分正常粘膜(梅奥0)和“粘膜愈合状态”(梅奥0-1)的系统,在这项研究中,研究招募了952名溃疡性结肠炎患者和30322张结肠镜检查图像,并构建了卷积网络模型,在梅奥0-1和梅奥2-3之间的高极光值为0.94-0.99,基于CNN的CAD系统用于识别UC患者的内镜炎症严重性时,其性能十分强大,其在支持经验不足的内镜医师有着重要作用.
Hwang等[20]亦使用CNN算法用于自动检测各种小肠病变,可提高对小肠病变的诊断敏感性和分类能力.UC的内窥镜疾病活动评分在临床实践中很有用,Gottlieb等[21]收集了947份全长内窥镜录像,分别来自14个国家的249例患者,共拍摄了1950万幅图像,研究发现可以训练深度学习算法来预测UC严重程度,在此项研究中,他们的数据集是在多国临床试验中前瞻性收集的,使用了视频而非静态图像,并且机器学习算法的性能指标达到或超过了先前针对UC严重性评分发布的指标.Maeda等[22]开发并评估了一种CAD系统,使用内窥镜检查预测组织学炎症,回顾性获得187例内镜检查后获得活检样本的UC患者的数据,包括从盲肠,升结肠,横结肠,降结肠,乙状结肠和直肠的6个结直肠部位收集每位患者的内镜图像和活检样本,参照活检样本的组织学活性标记所有内镜图像,对于验证样本,从100位患者中收集了525个验证集(共525个独立段),并将其余87位患者的12900张内镜图像用于机器学习以构建CAD,主要结果指标是CAD预测持续性组织学炎症的诊断能力,结果表明CAD系统对溃疡性结肠炎患者准确率高达91.0%,可以完全自动识别与UC相关的持续性组织学炎症.Tong等[23]通过机器学习算法实现UC和CD之间的自动差异诊断,纳入2008-01/2018-11在北京协和医院进行结肠镜检查的5128例 UC患者,875例CD患者,采用RF和CNN方法通过机器学习的人工智能在帮助没有经验的内镜医师区分炎症性肠道疾病方面非常有前途.在对UC的内镜严重程度进行分级时,深度学习模型具有良好的性能,鉴于其可扩展性,可以改善结肠镜检查在UC研究和常规实践中的使用[24].最近一项前瞻性研究中验证了用于UC评估的深度神经网络(deep neural network or evaluation of UC,DNUC)算法的准确性,其识别出内镜缓解和组织学缓解的准确性分别为90.1%和92.9%,DNUC可以识别缓解期患者,而不需要粘膜活检收集和分析[25].
3 AI对IBD患者的预测和治疗评估
Ruffle等[26]对其在消化领域的应用作了一个综述分析,包括指导用药、预测疗效、胃肠镜下检测病灶等,结果显示其前景不可小觑.在对机器学习应用儿童炎症性肠病分类项研究中,对内窥镜和组织学数据进行了数学建模,以帮助对儿科患者的IBD诊断进行分类,所得到的模型显示了在区分慢性疾病和溃疡性结肠炎患者方面的高准确性,对未知数据具有高诊断准确性的模型诊断率达83.3%,并且还提供了这两种疾病亚型的复杂重叠的有效可视化[27].Waljee等[28]使用逻辑回归和RF构建了模型,该模型被认为有利于根据不同的住院风险对IBD患者进行分类,并对每个患者进行个性化药物治疗.LE等[29]应用AI在胶囊内窥镜检查过程中分析炎症性病变,确定患者的预后或预测其对治疗的反应.明确某些药物的预测因子和临床结果对于准确确定用于治疗IBD的有效药物非常重要,印度团队使用射频构建了一种算法,用于预测严重结肠炎患者的结肠切除术,准确率达77%[30].
基于机器学习的基因优先排序方法,以识别新型IBD风险基因近年来被提出,在从全基因组关联研究中收集已知的IBD基因,训练一个模型来识别IBD风险基因,然后对16390个基因的完整列表进行了评分和分类,IBD基因的预测得分显着高于非IBD基因的得分,这种方法通过利用来自表达数据和大量基因注释的信息成功地将IBD风险基因与非IBD基因区分开,同时能够检测出IBD的新型候选风险基因,这些发现可能有助于检测新的IBD风险基因,并增进对IBD发病机制的了解,同时也是一种对IBD基因方面的个性化评估[31].从宏基因组学数据中可靠地识别炎症生物标志物是开发无创、经济、快速的IBD早期诊断临床试验的一个有前途的方向,一种基于网络的生物标记发现(network-based biomarker discovery,NBBD)的综合方法集成了对潜在生物标记进行优先排序的网络分析方法和评估优先排序的生物标记的判别能力的机器学习技术,结果表明NBBD在可靠地识别IBD生物标志物方面特别有效[32].
早期预测反应可能有助于治疗团队以及患者及其家人为替代治疗选择做准备,Ghoshal等[33]在对AI预测急性重症溃疡性结肠炎的治疗结果中,采用单因素分析,多元线性主成分分析(principal component analysis,PCA)和非线性人工神经网络(nonlinear artificial neural network,ANN)方法,对12年间入院的263例急性重症UC患者的数据进行研究,结果显示使用线性和非线性建模技术可以预测UC患者的药物治疗反应.Waljee等[34]在优化硫代嘌呤治疗IBD患者中,利用实验室值和年龄来开发机器学习算法,以识别客观上可降低硫代嘌呤治疗的患者,机器学习算法能够通过算法预测的客观缓解识别出硫代嘌呤类IBD患者,该状态与明显的临床益处相关,包括减少类固醇处方,住院和手术.Wei等[35]在基于大样本的基础上,应用先进的机器学习技术可提高IBD的风险预测,该数据集包含来自15个欧洲国家/地区的大约17000个CD病例,大约13000个UC病例和大约22000个作为对照,鉴于这种大样本量和广泛的变化范围,采用了最新的机器学习技术来构建最佳的预测模型,最终预测模型在独立评估中得出CD和UC的曲线下面积(area under curve,AUC)分别为0.86和0.83,在当时,这是CD和UC所报告的最佳预测性能.后来,在基于机器学习的分析方法(例如梯度增强机器)可以非常高精度地预测CD患者的炎症严重程度(AUC=0.93)[36],对于UC患者,生物疗法是一种有前途的治疗选择,但是,相对较高的成本和潜在的毒性已经引发了人们的关注,停止和管理生物制剂的最适当标准引起人们激烈争论,为此,Popa等[37]建立一种ML模型,以预测接受抗肿瘤坏死因子药物治疗的UC患者一年的疾病活动,这是帮助临床医生做出治疗决策的有用工具,结果显示该分类器在预测一年内的疾病活动方面具有出色的性能,在测试组上的准确度为90%,AUC为0.92,在验证组上的准确度为100%,AUC为1,这种ML解决方案可能被证明是帮助临床医生决定增加剂量或改用其他生物制剂的有用工具.
同样,Hardalaç等[38]在评估硫唑嘌呤对IBD患者黏膜愈合的作用中将人工神经网络应用于IBD数据以预测粘膜缓解,取得了较好的结果.在生物疗法治疗炎症性肠病的治疗方法中,许多患者对生物单一疗法没有反应,如果能够确定可能的响应者可以减少成本和延误时间,Waljee等[39]预测中度至严重克罗恩病患者缓解的机器学习模型的开发和验证,在患有活动性克罗恩病的患者中,治疗第8周之前的人口统计学和实验室数据似乎可以迅速识别出对优特克单抗可能无反应的患者,而无需进行昂贵的药物水平监测,能够在一定程度上减轻患者的经济负担.
4 AI面临的问题和挑战
虽然AI在众多研究中取得辉煌的成绩,但也有部分研究情况并不十分乐观,陈肖[40]等构建结肠镜辅助诊断AI深度学习模型中,检测溃疡性结肠炎的特异度为67%,尚存在较大不足.有时,差异是影响模型准确性和有效性的主要混淆偏差,例如,东方和西方在基因型方面存在显著差异,特别是亚洲CD患者中核苷酸结合寡聚化结构域蛋白2(nucleotide oligomeric domain protein 2,NOD2)突变的罕见性[41].目前,IBD领域的大多数AI研究只有72%到96%的可变精度,基于AI系统的误诊或误分类是不可避免的[42].考虑到AI模型的一般特征以及在计算进度时的不可用性或透明性,对人工智能模型进行外部验证总是具有挑战性的.此外,当AI模型在临床实践中失败时,也相对难以确定它会有几个错误.因此,我们应该发展人工智能模型的可预判性,即当模型做出运算处理时,我们能够预测此模型运算结果的能力[43].
5 结论
炎症性肠病呈现逐渐增加趋势,由于没有诊断金标准,给临床工作带来挑战.AI在炎症性肠病中的已崭露头角,其在诊断、治疗中起到越来越重要的作用,如ML已用于包括IBD患者在内的多项临床研究,以确定IBD的鉴别诊断,评估IBD,应用PROPS方法显示PROPS在性能上优于现有的IBD分类器和替代方法,SSL用于从腹部磁共振图像中分割克罗恩病组织,该方法分割精度更高,运用SVM方法在无线胶囊内镜中评估UC患者的肠道溃疡病变中的应用,并且这些算法模型的准确率都相对较高,同时AI可以在IBD患者治疗过程中起到评估作用等.随着人工智能在医学领域的应用和发展,AI必将能为IBD患者在其诊断及治疗中做出贡献.但AI在炎症性肠病的诊疗中也有不足之处,这就需要大样本、合理的模型及方法对数据进行机器学习.不过,我们相信随着AI与医学影像的融合发展,能够为解决炎症性肠病添砖加瓦.同时,AI与医学的结合在炎症性肠病的应用也是步入信息化、大数据化的一种较有前景的发展前景又充满挑战的的行业,需要大家不懈的努力.