人工智能在结肠息肉检测与分类中的应用
2021-12-24王啸,黄鉴,吉祥,珠珠
王 啸,黄 鉴,吉 祥,珠 珠
昆明医科大学第一附属医院1信息中心,2肿瘤科,3日间手术中心,云南 昆明650032
结直肠癌(CRC)是全世界重要的公共卫生问题[1-3]。几乎所有的结直肠癌起源于结肠息肉,定期筛查和早期发现息肉是目前预防CRC的最有效方法[4-8]。近期研究表明,结肠镜检查被用于CRC筛查和监测,能有效地降低CRC的发病率和死亡率[9-11]。结肠镜检查被推荐为CRC筛查和监测的首选策略,已成为目前CRC筛查、监测和发现并切除癌前腺瘤性息肉的重要手段,降低CRC发病率和死亡率最常用一种有效的方法[12-14]。然而,结肠镜检查实践是依赖于操作者的重复性工作,可能致使内镜医师容易疲劳而产生心理和知觉错误[15-16],而在结肠镜检查息肉中出现遗漏和误诊[17]。因此,提高结肠镜检查的肿瘤检出率(ADR)对降低CRC的发生率和死亡率具有重要意义[18]。ADR被确立为评价内镜医师发现结直肠肿瘤能力的重要质量指标[19],有证据表明,ADR 可理想地反映肿瘤的发生率,ADR 每增加1.0%,间隔期CRC的风险则相应降低3.0%[20-21]。因此,提高结肠镜检查的ADR已成为胃肠病学检测实践领域研究的重要方向[22-23]。
1 人工智能(AI)技术
AI是模仿人类认知功能能在社会不同领域完成一定任务的机器智能,被宣称是21世纪公共医疗卫生服务最具突破性的创新技术[24]。随着AI技术应用的突破,计算机辅助诊断(CAD)已被用于结肠镜检查,因其在结肠息肉的自动检测和分类方面具有较高的灵敏度和准确性,有助于避免内镜医师对结肠息肉的漏诊和误诊,因而近年来倍受关注[25]。近年来,随着机器学习(ML)、深度学习(DL)和深度神经网络技术在计算机视觉领域的发展,基于AI的CAD(AI-CAD)系统在结肠镜检查应用方面取得了显著的进展[26]。ML是一种AI技术,可以训练计算机通过重复和经验学习大量识别或特征的图像,提高其在任务中的性能[26]。DL是机器学习的一个子集,是ML研究中的一个新的领域,它基于人工神经网络(ANN),旨在用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。ML,特别是DL,在结肠镜检查的临床实践中显示出重要的前景[27]。卷积神经网络(CNN)是一种基于人脑视觉皮层处理和识别图像原理的深度神经网络,为一种深度的监督学习下的机器学习模型,在结肠镜CRC检测或分类中可以高效地进行图像和视频分析[15]。新近研究表明,CAD-CNN模式可提高结肠镜检查的质量,增加CRC(或息肉)的检测或分类的ADR,降低误报率和增生性息肉的息肉切除术的成本[27],保持快速处理的速度,适用于接近实时的结肠镜检查[28]。有证据表明,在应用AI-CAD系统诊断程序进行结肠镜检查,其准确率为89%~95%[29],敏感性>90%[30],阴性预测值为95%~97%[31]。这些方法主要针对结肠内病变的微观特征和宏观特征,预测肿瘤和肿瘤前病变的可能性。未来在这领域的工作将需要继续发展新的AI-CAD系统,改进敏感性、特异性、准确性和阴性预测值。因此,利用AI-CAD系统的结肠镜一般被设计为提取来自结肠镜图像/视频中各种特征和输出基于ML所预测的息肉位置或病理,可提高结肠息肉的检出率和光学活检的准确性[29-31]。
2 计算机辅助结肠息肉检测(CACPD)
CACPD已经成为利用AI-CAD系统应用在结肠镜检查中的一种主要方式,在结肠镜检查过程中通过屏幕上数字视觉标记或声音提示内镜医生注意存在息肉。一些研究证明,利用AI-CAD系统的结肠镜检查可以帮助内镜医师避免遗漏息肉[32-33],可有效地防止患者避免后续发生结肠癌的风险[34-35]。近年来,CACPD的应用发展推动了结肠镜检查CRC领域的进展。
早期研究是基于静态的内窥镜图像和视频画面的分析。既往多研究报道,使用ANN对这些从独自静止图像中获得的特征进行分类,CACPD精度达到95%以上[32-33],而一些其他方法是利用纹路频谱和颜色直方图的特征对结肠状态分析为“正常”或“异常”[34]。研究表明,利用基于颜色小波协方差建立的颜色特征提取技术,开发出的一种新的CAD方法,比以前开发的基于灰度值特征或颜色纹理输入的提取方法具有更高灵敏度。颜色小波协方差方法用在高分辨率内窥镜检测息肉的结果显示90%的灵敏度和97%的特异性[35]。有研究显示,使用结合颜色、纹理和腔内轮廓信息的贝叶斯融合方案开发创建一种智能临床决策支持工具,被用于内镜图像检测出血病变和腔内不规则病变[36]。既往也有报告显示,采用一种标准低分辨率视频输入的模式识别框架,结肠息肉检测准确性超过94.5%[23]。随后的工作重点是将息肉检测方法转换为实时视频分析。一种使用混合上下文的形状方法的CAD系统被开发用于结肠息肉定位和排除非息肉样结构形状的信息分析,其实时检测结肠息肉的灵敏度为88%[37]。有报道利用一种基于息肉定位及其边界的能量图方法,称为凹处积累窗口中位深度能量图方法,被开发用于法检测结肠息肉,其灵敏度为70.4%,特异性为72.4%[38]。此外,一种利用边缘截面视觉特征和基于规则分类的方法开发用于检测“息肉边缘”,在43个息肉中,正确地检测出42个的息肉(97.7%),并且延迟时间很短[25]。最近,一些研究已经开始将DL方法纳入到CAD系统。2016年报道了首个用于检测结肠息肉的DL系统。在本研究中,对32305结肠镜图像训练过的CNN检测息肉的准确率为86%,灵敏度为73%,说明应用DL的计算机视觉程序可以从结肠镜图像中准确识别出结肠息肉[39]。2017年世界胃肠病学学会会议上展示了基于SegNet架构系统(Seg-Net architecture system)的DL息肉检测软件,该系统在中国进行了对5545张附有内镜医师注解的结肠镜检查图像的一组回顾性研究,随后对来自1235 例患者的27461张结肠镜检查图像进行前瞻性验证[40]。新近研究显示,一个利用DL的AI技术被开发,对105个息肉阳性和306个息肉阴性视频进行训练,结果表明该系统能够检测出息肉为94%,假阳性检出率60%[41]。利用DL的AI技术可自动提取相关的图像特征,在进行更详细的图像分析和实时应用方面的表现优于人类。因此,开发出具有高灵敏度、低延迟时间和假阳性率低的新的CACPD系统希望能在不久的将来得以实现。
3 计算机辅助结肠息肉分类(CACPC)
结肠息肉病变自动检测被称为CACPC,其目的是预测息肉病理(即肿瘤性或非肿瘤性),而不需要组织活检,以帮助内镜医生作出相应的光学诊断和选择性地切除肿瘤息肉的决策。CACPC应用的迅速发展,为今后AI-CAD系统在结肠镜检查CRC的临床应用和研究奠定了基础。
临床研究表明,在检测同一个数据库209张息肉图像(并进行相应的活检)时,使用ML的基于AI的结肠息肉CAD系统的敏感性为90%,而人的观测的敏感性为93.8%[42-43]。有研究报道,使用光学放大窄带成像的计算机算法组检测息肉的灵敏度为95%,而专家检测组的灵敏度为93.4%,非专家检测组的灵敏度为86.0%。一项研究使用窄带成像放大结肠镜预测结直肠腺瘤的组织学,对诊断腺瘤息肉病变的敏感性为97.8%,特异性为97.9%,准确性为97.8%,CACPC和2名有经验的内窥镜医师诊断诊的一致性为98.7%[44];另一项研究利用实时图像识别系统和窄带成像放大结肠镜进行结直肠息肉组织学计算机辅助诊断,其敏感性93.0%,特异性为93.3%,准确性为93.2%,图像识别软件和内窥镜医师操作内镜的诊断的一致性为97.5%,证明实时AI-CAD系统是可行的,使用放大窄带成像技术(NBI)可以与人的操作诊断媲美[45]。此外,其他一些先进的内窥镜成像模式也同样得益于AI-CAD系统的进步[46]。最近研究表明,使用EC-CAD系统(一种机器学习CAD系统)预测病理分类,其敏感性和特异性分别为92.0%和79.5%,而相比较内镜专家的敏感性和特异性分别为92.7%和91%[47]。ML-CAD系统被用于AI辅助细胞内镜图像分析EC-NBI结直肠病变的特征,该系统对腺瘤息肉的诊断的敏感性为85%,特异性为98%,准确性为90%[48]。有前瞻性研究显示AI辅助细胞内镜系统对腺瘤息肉的诊断敏感性为97%,特异性为67%,准确性为83%,阳性预测值为78%,阴性预测值为95%,延迟时间极低[49]。随着DL的应用,一种深卷积神经网络AI技术被开发并用于测试的125个连续遇到微小息肉视频测试资料显示,其中的106例被分类,精度为94%,其余19息肉则系统未能达到≥50%的可信度评分阈值,对于这106个息肉视频,该系统检测腺瘤的敏感性为98%,特异性检为83%[31]。未来利用AI-CAD系统结肠镜检测息肉领域的工作需要在致力于将CAD检测和CAD分类模式相结合的同时,继续提高实时光学分类方法的灵敏度、特异性、和准确性。
4 结论
AI技术和CAD系统在临床结肠镜检查的应用是一个令人兴奋的新的前沿研究领域。众多研究表明,AI-CAD系统,特别是DL和CNN技术,能够帮助处理大容量的结肠镜检查图片和视频数据,协助临床医生对结肠镜检测结肠息肉是否存在和息肉分类(肿瘤或非肿瘤)做出决定。然而,结肠镜检查的实践仍然高度依赖于操作者及其重复的活动,容易在结肠镜检查息肉中出现遗漏和误诊。因此,在未来的研究中,提高结肠息肉的检出率和光学活检的准确性,有效地防止患者后续发生CRC的风险,对于开发新型的AI-CAD系统的结肠镜将是至关重要的。