【评论】人工智能和结肠镜检查:两项随机试验的经验教训
2022-11-25袁作辉甘肃省人民医院消化科甘肃兰州730000mailyuanzuohui126com
袁作辉(甘肃省人民医院消化科,甘肃 兰州,730000;E-mail:yuanzuohui@126.com)
【评论】结直肠癌(colorectal cancer,CRC)是全球范围内最常见的恶性肿瘤之一[1]。通过结肠镜检查早期发现和切除腺瘤性息肉,仍被认为是预防CRC的“金标准”。目前结肠镜检查仍存在两大难点:一方面,内镜检查质量不理想而导致漏诊;另一方面,内镜医师检查水平参差不齐、高水平内镜医师稀缺。这两方面原因导致部分地区早期结直肠癌的诊断率仍偏低。文献报道,25%的腺瘤在检查过程中被遗漏,“漏诊的腺瘤”与CRC显著相关[2]。有证据表明,ADR每增加1.0%,CRC的发生风险将降低3.0%[3]。在高工作量的压力下,如果内镜医师疲劳或注意力不集中,屏幕上可见的息肉有时也会被遗漏;即使是经验丰富的内镜医师也可能遗漏一些病变,尤其是那些体积小、形状扁平的病变。因此,迫切需要开发一种用于结肠镜检查的人工智能辅助系统来协助内镜医师。
人工智能辅助诊断技术发展迅速,实时深度学习计算机辅助检测(CADe)系统应运而生。迄今为止,CADe辅助结肠镜检查的临床应用仍存在争议。有报道称CADe辅助结肠镜检查增加了患者的ADR,而增生性息肉切除术没有显著增多[4]。最近我国及意大利的两项RCT发现人工智能辅助系统显著增加了ADR,并指出这是由于小息肉数量增加,而大息肉(>10 mm)的检出率没有变化[5-6]。鉴于小腺瘤不太可能近期癌变,使用人工智能辅助系统的临床获益受到质疑。另有研究发现,在具有高ADR(>50%)的结肠镜检查中,人工智能辅助系统的性能与经验丰富的内镜医师相当[7],在这种情况下,人工智能辅助系统的益处甚微。在该研究中,通过多中心、平行、随机、对照、非劣效性试验的研究方法探讨非专业内镜医师进行结肠镜检查的结果,分析带或不带CADe系统的ADR,并与此前AID-1 RCT的数据进行比较。该研究的结果显示,在经验不足的检查者中,CADe辅助结肠镜检查增加了ADR;内镜医师的经验似乎对ADR起次要作用。
该研究的优势包括多中心、随机及对照明确:共5个中心参与研究(意大利4个,瑞士1个);受检者随机分组并按性别、年龄、个人腺瘤史分层;纳入及排除标准明确,并明确将肠道清洁度较差的患者排除在外(入组者需波士顿评分≥6分,且任何部位均>1分),规定退镜时间需≥6 min(活检、治疗干预、广泛清洗时暂停时间),非专业内镜医师定义为结肠镜检查量<2 000次。结肠镜检查质量与褶皱检查效果、黏膜清洁度、管腔扩张度及观察时间的充足性有关。因为CADe系统只能检测结肠镜检查可见的息肉,无法识别被粪便液体覆盖或隐藏在褶皱之间的息肉,因此明确规定肠道清洁度及退镜时间有利于统一标准并对比。
然而,该研究也有一些局限性。首先,未提及误报率。因存在粪便和黏膜皱襞,CADe系统会出现假阳性及误报,部分误报病变可以通过内镜医师来鉴定消除,但会导致检查者疲劳、分心且需重新调整注意力,且不必要的息肉切除术将导致手术时间和资源使用增加。其次,未进行成本—效益分析。CADe系统主要增加了非腺瘤性息肉和小型腺瘤的检出率,降低了晚期结直肠癌的风险,但用于间期癌的临床意义及其成本—效益尚未明确。再次,AID-2与AID-1的比较结果属于事后分析,可靠性可能有限。最后,对照组设定欠合理。如果能通过观察同一患者由不同医师操作的带或不带CADe系统的检查情况,且允许两次检查顺序完全随机,设定两名内镜医师具有相同资历,再比较传统结肠镜和CADe系统辅助结肠镜检查的ADR,将操作顺序和操作者经验水平对结果的影响最小化或有助于减少两组间内在差异。
综上所述,该研究表明对于使用CADe系统辅助结肠镜检查的非专业内镜医师及专业内镜医师,ADR增加情况类似,尤其与体积小的、扁平的病变有关。但仍需更大样本量的多中心的大型RCT研究来评估误报率并进行成本—效益分析以进一步明确是否推广或何种情况下应用CADe系统辅助结肠镜检查。