APP下载

人工智能在结肠镜检查中的应用

2021-11-29高旭东蔡云龙戎龙

现代消化及介入诊疗 2021年12期
关键词:结肠镜腺瘤息肉

高旭东,蔡云龙,戎龙

【提要】 本文主要对人工智能在结肠镜检查中的多种应用进行综述。在结肠镜检查中应用人工智能可以自动检测出大肠息肉,还可以判断出息肉的病理类型,识别早期肿瘤性病变。此外,人工智能可以应用于溃疡性结肠炎的结肠镜检查和结肠镜检查的质量控制,并对未来发展作出展望。

结直肠癌(colorectal cancer,CRC)至今仍然是癌症主要死亡原因之一[1]。近年来由于结直肠癌筛查的开展和大肠腺瘤性息肉的发现与切除,其发病率和死亡率随着时间的推移而下降[2]。腺瘤检出率(adenoma detection rate,ADR)是结肠镜检查质量的评价指标,较高的ADR与较低的检查间期CRC发病率和CRC死亡率的下降密切相关[3]。由于内镜医师专业水平的差异和医师的疲劳程度,ADR存在显著性差异(7%~53%)[4]。最近一项结肠镜检查的系统回顾和荟萃分析显示:大肠腺瘤的漏检率为25%,其中9%为高级别腺瘤,27%为无蒂锯齿状息肉[5]。同时息肉的病理诊断也是一个重要问题,内镜医师可以采用结肠镜检查预测息肉的病理类型,替代活检或切除组织的病理学评估,这种方法被称为“光学活检”,其准确性可达90%,但是由于内镜医师专业水平和内镜型号的不同,这种预测的准确性是很有限的[6-7]。计算机辅助诊断(computer-aided diagnosis,CAD)为上述问题的解决提供新的方法。目前CAD技术主要采用人工智能的深度学习法。

1 人工智能技术

人工智能技术(artificial intelligence,AI)是计算机科学的一个分支,包括机器人、语音识别、图像识别等内容。早期的CAD主要通过人工智能体系中的机器学习,其过程包括原始数据的特征提取、特征筛选、模型训练和模型验证。机器学习往往受到图像质量的影响,其效果具有很大的不稳定性。当前的CAD主要通过人工智能体系中的深度学习法,深度学习包括深度神经网络(DNN)、卷积神经网络(CNN)及循环神经网络(RNN)等。其中卷积神经网络在图像处理上具有显著优势,包括图像识别、目标检测和图像分割等,现已被广泛用于放射、超声、内镜等多种医学图像处理。

2 大肠息肉的自动检测

计算机辅助检测(computer-aided detection,CADe)是指在结肠镜检查期间实时在内镜监视器上提示息肉,以引起内镜医师的注意。在2003年,两个工程小组即开展了息肉自动检测的早期研究,他们对结肠镜白光图像进行息肉检测,提供了良好的准确度(>90%)[8-9]。此后各种研究不断开展,一个研究小组使用包含31个息肉的24个肠镜视频作为原始资料建立模型,对大肠息肉进行检测,诊断敏感性和特异性均大于70%[10]。但是这些早期研究是通过图像特征提取算法结合机器学习的方法对息肉进行诊断,其效果很大程度上取决于研究人员图像选取的质量,具有不稳定性。随着深度学习技术的出现,这种状况逐渐发生了改变。在2018年,Misawa等[11]开发了一种用于息肉检测的模型,其敏感性为90%,特异性为63%。随后Urban等[12]也开发了一个检测模型,可以在白光和窄带成像下使用,他们通过9个肠镜视频进行比较,AI组发现了45个息肉,比无AI组多发现9个,两组差异具有统计学意义。Wang等[13]研究了一个敏感性和特异性均大于90%的模型,他们使用大量数据对这一模型评估,对象包括1138例患者的27113张静态图像和111例患者的138个息肉视频,进一步证明模型的可靠性。

以往研究多是息肉检测的试验性研究和回顾性研究,近年来息肉检测的前瞻性研究不断开展。一项对CADe前瞻性研究的荟萃分析表明,通过系统检索Medline、Embase和Cochrane Central筛选,评估研究的合理性、证据确定性以及偏移的风险,共有5个随机对照试验符合条件。结论是AI检查的结肠息肉检出率(polyp detection rates,PDR)为45.4%,无AI组检查的PDR为30.6%;AI组的ADR为29.6%,无AI组的ADR为19.3%[14]。进一步观察发现,AI组的检查小腺瘤(≤5 mm)检出数量高于无AI组的平均数量,而对于较大腺瘤(>5 mm而≤10 mm)和大腺瘤(>10 mm)两组之间无显著差异,CRC的检出率两组也无显著差异,该研究认为CADe只是增加了小息肉和小腺瘤的检测率。而Gong等[15]开发的CADe模型,通过监控退镜速度和提示观察盲点,能够提高较大腺瘤和早期结直肠癌的检出率。最近Wang等[16]进行了一项有趣的双盲随机对照试验,使用了假AI输出假阳性结果。在这项研究中,AI组的ADR明显高于对照组即假AI组(34% vs.28%,P=0.03)。此外背对背研究对于CADe也是非常必要的,可以更好的评估腺瘤漏诊率。Wang等[17]使用他们开发的CADe开展了一项背靠背研究,AI组腺瘤漏诊率明显低于无AI组(14%vs40%,P<0.001)。

3 大肠息肉的分类检测

计算机辅助分类(computer-aided characterization,CADx)是指对检测到的息肉实时分析内镜或病理学分型。

3.1 白光内镜

白光内镜检查是最基本也是使用最广泛的检查方法,因此将CADx用于白光结肠镜检查是非常有意义的。Komeda等[18]报告了将CADx应用于33例白光结肠镜检查,区分腺瘤性病变和非腺瘤性病变,其诊断准确率仅为75.1%。临床中白光内镜获得的信息量远比色素内镜和放大内镜要少,即使是有经验的内镜医师有时也很难鉴别是否为腺瘤性病变,其准确度在现阶段几乎不可能达到很高水平。因此,CADx在白光结肠镜检查中的作用尚待进一步研究证实。

3.2 数字图像增强内镜

窄带成像(narrow-band imaging,NBI)或蓝激光成像是临床常用的数字图像增强技术,可以详细评估息肉的表面结构和血管形态。Tischendorf等[19]首先开展了CADx在NBI中的应用,诊断准确率为86.2%。Chen等[20]使用2157张图像进行AI训练,这些图像可以区分腺瘤性息肉和增生性息肉。他们比较了CADx和内镜医师在诊断小息肉(≤5 mm)方面的差异,以内镜活检病理作为标准,CADx的准确率为90.1%,而内镜检查初学者的准确率为80.3%~88.0%,说明CADx对内镜医师,特别是初学者,是非常有帮助的。Tamaki等[21]用CADx进行CRC浸润深度的诊断,他们根据息肉表面微血管在NBI和放大图像中的各种特征(例如血管的长度、宽度、形状、颜色等),利用AI分析了121个大肠癌,预测CRC黏膜下浸润或更深层浸润的准确率为82.8%。为了避免选择偏倚,尚需开展前瞻性随机对照试验客观评估CADx的准确性。

3.3 染色放大内镜

结晶紫染色联合放大内镜有助于内镜医师观察大肠息肉的表面细微结构,如腺管开口状态(pit-pattern),有助于对息肉病理学进行精确的预测诊断(敏感性97.8%,特异性91.4%)[22]。Takemura等[23]应用AI从结晶紫染色图像中提取不同类型息肉的腺管开口特征,诊断准确度达98.5%。但是这种检测需要结晶紫染色,而染色是由内镜检查人员进行的,很难获得质量一致的内镜图像。因此评估CADx在染色放大内镜的诊断准确率,至今尚无严谨的对照试验。

3.3 细胞学内镜

细胞学内镜(H290ECI;奥林巴斯)是一种新型的体内接触显微成像系统,它能在结肠镜检查时提供放大500倍或1000倍的实时细胞学图像。细胞学内镜能够提供聚焦固定的图像,有助于AI进行稳健的图像分析,因此细胞学内镜与CADx相结合是非常有前景的。日本一个研究小组对此进行了长期深入的研究。他们第一个研究模型是应用AI自动提取细胞核亚甲基蓝染色区域,然后对细胞核6种化合物进行定量分析,腺瘤性息肉的诊断准确率为89.2%[24]。在后续研究中,他们开发了一个更好的模型,使用NBI观察,无需事先染色。该模型重点分析息肉表面的微血管特征,区分腺瘤性和非腺瘤性息肉,准确率为90.0%[25]。他们还探索利用CADx识别腺瘤性息肉中的浸润性癌,准确率为94.1%[26]。

3.4 激光诱导荧光内镜和自体荧光内镜

CADx用于激光诱导荧光内镜,是指用AI分析吸收了诱导激光的组织所发出的光,来预测息肉是腺瘤性还是非腺瘤性。Rath等[27]开展了一项前瞻性试验,评估激光诱导荧光内镜下模型性能,诊断准确率为96.1%。而在另一项前瞻性研究中,Kunpiper等[28]采用了同样的模型,鉴别小息肉(≤5 mm)是腺瘤性还是非腺瘤性,准确率仅为73.5%。自体荧光内镜可以分析人体大肠黏膜发出的内源性荧光团,提供绿色或红色图像。Aihara等[29]采用前瞻性试验评估自体荧光内镜下CADx性能,敏感性和特异性分别为94.2%和88.9%。目前荧光内镜只在国内少数科研单位应用,很难在基层医院广泛开展。

4 溃疡性结肠炎

内镜评估和组织学评估相结合是制定溃疡性结肠炎(ulcerative colitis,UC)治疗方案和监测预后的关键。由于内镜医师对UC内镜表现的评估存在差异,因此常用内镜活检的病理组织学特征来评估疾病活动情况。Maeda等[30]认为CAD在评估UC炎症活动方面具有优势,他们首先让AI学习了100例UC患者结肠镜检查中的525个视频片段,随后对87例患者进行了测试,使用CAD预测炎症活动程度,同时以内镜活检病理作为参考标准,敏感性、特异性和准确性分别为74.0%、97.0%和91.0%。Takenaka等[31]将结肠镜活检部位的3幅连续图像与活检的组织学结果相关联,对AI进行培训,通过分析UC患者的内镜图像预测疾病是否缓解。对875例UC患者进行了前瞻性试验,使用内镜医师的诊断作为参考标准,内镜判断为缓解的准确度为90.1%;而使用活检病理结果作为参考标准,组织学判断为缓解的准确度达到了92.9%。最近一项关于CAD在炎症性肠病应用的系统回顾研究,通过检索PubMed并筛选,共有15个横断面研究符合条件(前瞻性7个、回顾性8个),其中关于UC的研究有11个。这些研究主要分析了肠黏膜的活动情况和UC相关的结肠肿瘤,准确率都达到了90%,但是可能存在偏移[32]。该研究还指出,CAD分析受多种因素影响,如肠道准备情况、肠黏膜暴露情况、炎症修复瘢痕、炎性后息肉等。CAD在克罗恩病中的应用,主要是分析小肠胶囊内镜的表现,在此不做详述。

5 检查质量控制

目前,肠道准备情况、达盲率和退镜时间是结肠镜检查质量控制的三个重要因素[33]。Gong等[15]为了提高结肠镜检查质量,同时提高大肠腺瘤和CRC的检出率,设计了一个质量改进系统。该系统可以判断内镜是否到达盲肠、监测内镜退出速度和退镜时间并实时提醒内镜操作过快造成的视野盲点。观察组355例患者接受了有AI的结肠镜检查,其中58例(16%)检测到一个或多个腺瘤性息肉,而对照组349例采用无AI检查,仅27例(8%)检测到腺瘤(OR:2.30;95%可信区间1.40~3.77;P=0.001)。亚力孔等[34]让AI学习了7140张结肠镜检查图像,建立了一个质量控制模型,可以分析肠道准备情况(波士顿评分4分法)并识别回盲瓣,波士顿评分的准确度为76.9%,回盲瓣识别的准确度为95.3%。邓少琦等[35]应用AI建立了肠道准备预测模型,将肠道准备情况分为准备充分组和准备不佳组,观察了302例患者,对照logistic回归预测模型,正确分类比例提高了18%。以上研究表明CAD能为医院对结肠镜检查质量的评估提供依据。然而在实际结肠镜检查过程中,许多干扰因素影响了CAD系统的准确度,如计算机运行速度慢、肠道粪水多、大肠皱襞形态改变等引起的假阳性或假阴性。

6 展望

目前,AI在结肠镜检查中的应用已经取得了一些研究成果,但是仍然存在一些问题。例如大多数研究采用回顾性方法,即使是前瞻性研究也往往是单中心研究,这可能产生很大的偏倚。将来开展研究可以参考如下几方面设计:①开展前瞻性试验研究,实时使用CAD评估;②设计对照研究(即有AI组和无AI组);③采用良好的观察指标,如ADR、敏感性、特异性等;④采用客观的参考标准,如病理组织学性质;⑤开展多中心研究,这一点尤为重要,可以确保研究结果的可重复性[36]。此外,CAD在判断病理类型时应尽量包含大肠息肉的所有病理类型。除腺瘤外的其他类型息肉如错构瘤性息肉、无蒂锯齿状病变、结肠炎相关癌症、遗传性息肉病等均应作为研究对象。以往研究也没有区分肿瘤是分化型还是未分化型,这点对后续治疗是非常有帮助的。今后我们不仅要进行高质量的研究来积累数据,还应了解如何获得监管部门的批准,使CAD在结肠镜检查中广泛应用。如果上述问题得到解决,AI将为新一代结肠镜检查打开大门。

AI在消化内镜的应用有着广阔的前景。AI将来可以辅助医院培训初学内镜检查或既往表现不佳的内镜医师,降低漏诊率[37];AI不但能提高内镜设备的图像质量,还可以使内镜图像呈现三维立体结构;AI的精准性既能降低医师的误诊几率,又能协助医师实时决策病变是否需要切除,选择内镜手术还是外科手术切除;AI不只专注于内镜检查,还能在内镜手术上帮助医师,例如准确显示病变边界、黏膜层次、血管位置等;AI不仅用于图像信息分析,还可以结合患者病史、体征及其他辅助检查进行综合诊断,协助医师制定诊疗方案。相信未来AI技术与内镜技术携手合作,将会创造更多发展的机遇。

猜你喜欢

结肠镜腺瘤息肉
普通结肠镜检查中缓解疼痛方法的研究进展
利那洛肽联合复方聚乙二醇在便秘患者结肠镜检查肠道准备中的效果
宫颈长息肉了怎么办
超声检查在甲状腺腺瘤诊断中的应用价值探析
肠息肉防治莫入误区
足部小汗腺汗管纤维腺瘤1例并文献复习
胃息肉会发展成胃癌吗?
心理行为干预和技术配合在电子结肠镜检查中意义评价
甲状腺腺瘤的类型有哪些?
乳腺纤维腺瘤的那些事