人工智能在癌症筛查中的研究进展
2020-01-09孙惠昕综述贾海晗王婉莹宋冰冰审校
孙惠昕 综述 贾海晗,王婉莹, 宋冰冰 审校
150081 哈尔滨,哈尔滨医科大学肿瘤防治研究所(孙惠昕、 宋冰冰);150081 哈尔滨,黑龙江省医学科学院(孙惠昕、 宋冰冰);150081 哈尔滨,黑龙江省癌症中心(孙惠昕、贾海晗、王婉莹、宋冰冰)
最新数据显示[1],2018年全球新增1 810万癌症病例,新增970万死亡病例。全球癌症防控形势仍十分严峻,从侧面反映了全球人口老龄化、日益增长的人口数量以及癌症的流行变化及主要风险因素的分布。《健康中国行动(2019~2030)》指出,根据筛查手段和技术方案比较成熟的重点高发癌症,要制定癌症筛查与早诊早治指南,各地根据本地区癌症流行状况,创造条件普遍开展癌症机会性筛查。目前,癌症的早诊早治工作被认为可以降低癌症死亡率和延长癌症患者生存时间。人工智能(artificial intelligence, AI)亦称智械、机器智能,指由人制造出来的机器所表现出来的智能。通常AI是指通过普通计算机程序来呈现人类智能的技术。AI在医学领域的应用范围很广,包括医药研究、病理诊断、放疗技术、癌症筛查等[2]。本文将围绕癌症筛查的相关内容,就AI在不同癌症筛查中的研究现状进行介绍和分析。
1 AI与肺癌
肺癌是目前发病率和死亡率最高的癌症,目前肺癌的早期筛查是通过评估出高危人群后进行低剂量螺旋CT检查。目前大多数医院是采用传统人工阅片的方式进行临床诊断,每位筛查患者的CT图像很多,再加上每天大量的临床筛查患者,临床医生工作量会很大,人工阅片的方法显然不适合当今的AI时代。刘晓鹏等[3]研究结果显示,AI和人工读片分别读取5 mm层厚的相同CT片,AI对肺癌结节的检出率优于人工读片。说明通过AI自动学习早期肺癌胸部CT图像,可以达到早期肺癌的识别,并且辅助医生进行临床诊断。李欣菱等[4]基于深度学习的AI胸部CT肺结节检测结果的研究显示,AI能够实现恶性肺结节的诊断,与人工阅片相比,具有更高的结节检出灵敏度,在排除微小结节后可以降低假阳性率。Hart等[5]利用基于个人健康信息的多参数人工神经网络来预测肺癌风险,发现其具有较高的特异性和适度的敏感性,为临床提供了一种经济有效、无创的诊断工具。同样Duan等[6]比较了人工神经网络模型与4种肿瘤生物标志物在肺癌筛查中的作用,肿瘤标志物的判别分析和人工神经网络模型预测的ROC曲线分别为0.67(95%CI:0.569~0.761)和0.76(95%CI:0.664~0.840)。人工神经网络模型对肺癌的预测优于肿瘤标志物的判别分析,为肺癌的诊断提供了一种优秀的智能化诊断工具。相关研究发现[7],根据相关函数和指标建立预测肺癌模型,利用图像数据库联盟和图像数据库资源计划提供的图像诊断肺结节的方法, 准确率为93.19%,敏感性为92.75%,特异性为93.33%。该研究团队认为该方法具有良好的检测效果,由于早期发现病变可使治疗干预更快,从而对患者预后更有利。AI技术在肺癌早期筛查、病理诊断和分类方面都取得了一定的研究进展,证实了AI技术在肺癌早期诊断中的可行性,但需要科研工作者建立自己的数据库和行业标准,使AI在肺癌筛查中的应用发展走得更远。
2 AI与乳腺癌
乳腺癌是女性最常见的癌症,严重威胁着女性健康,乳腺癌的早期筛查与患者的预后密切相关[8]。因此,将AI应用于乳腺癌的筛查和检测具有重要的意义,不仅可以为超声科医生节省时间,也可以弥补一些初学者的经验和技能不足[9]。相关研究显示[10],在计算机辅助下从超声弹性成像和B超提取双模态特征,包括B超提取5个形态学特征和超声弹性成像提取3个弹性特征,结果显示通过计算机辅助方法鉴别乳腺良恶性肿瘤和是否出现淋巴结转移有一定的参考价值。根据算法功能和形式的相似性,AI学习一般包括支持向量机、模糊逻辑、人工神经网络等。AI学习中提取和训练的特征越多,识别效率越高,Silva 等[11]对乳腺肿瘤的初筛结果表明,研究中所有22个特征所获得的结果判断优于减少特征集的学习。在不久的将来,我们相信AI在乳腺超声中不仅可以区分乳腺肿块的良恶性,还可以进一步对乳腺肿块的炎症性、纤维增生等特异性良性疾病进行分类。此外,AI在超声中还可以预测乳腺癌患者肿瘤淋巴结转移的分级、预后及治疗反应。AI在超声中区分乳腺良恶性病变的准确性可能不仅基于B超图像,还可以结合其他先进技术的图像,如A弹性成像、超声造影等[12]。AI获得较好的应用是医学影像学领域,医学影像学正是诊断乳腺癌的重要工具,相信不久的将来越来越多的医生和乳腺癌患者能够从AI的进步中获益[13]。
3 AI与胃癌
手术切除被认为是早期胃癌的根治性治疗手段,术后早期胃癌的5年生存率可达到90%,因此加强早期胃癌的诊断和筛查对患者具有重要意义[14]。相关研究显示[15],通过建立最优的数据挖掘模型对筛查人群进行初步筛选,对筛选的胃癌高危患者进行进一步的内镜检查加病理活检确诊,这种早期胃癌分级筛查策略具有良好的依从性和较低的成本,很容易在临床实践中增加早期胃癌的筛查覆盖率。Miyaki等[16]开发的软件可以自动区分癌变区和非癌区。作者使用了一个特征袋框架和密集采样尺度不变特征变换描述符来放大智能电子分光(flexible spectral imaging color enhancement,FICE)图像,并用46例粘膜内胃癌对模型进行了验证,计算机辅助诊断系统诊断癌症的准确率为86%,灵敏度为85%,特异性为87%。2018年,Hirasawa等[17]基于单次发射多盒探测器结构构建了网络学习模型。作者使用13 584张内镜图像训练该网络学习模型,并使用从69例77个胃癌病变的患者中收集的2 296张胃癌图像测试集评估其性能。该模型分析2 296张检测图像耗时47 s,正确诊断了71/77个胃癌病变,总灵敏度为92%。这个构建用于早期胃癌检测的网络学习模型在很短的时间内处理了大量存储的具有临床相关诊断能力的内镜图像,有可能在实时胃镜检查中发挥作用。Kubota等[18]针对344例胃癌患者的内镜图像,利用反向传播神经网络算法对其进行了胃壁浸润深度分析,开发了计算机辅助设计(computer aided design,CAD)系统。他们的交叉验证评估显示,该系统对T1、T2、T3和T4期胃癌的诊断准确率分别为77%、49%、51%和55%。其中粘膜内癌(T1a)和粘膜下浸润癌(T1b)的准确率为69%,该研究可能在不久的将来用到早期胃癌的筛查。
4 AI与皮肤癌
皮肤是人体最大的器官,和身体其他部位一样,皮肤细胞也会异常生长,导致皮肤癌变。 由于黑色素瘤的高发病率和死亡率,黑色素瘤的早期诊断已经成为一个极其重要的问题[19]。相关研究[20]提出的自动算法包括以下步骤:图像增强、病灶分割、特征提取、选择以及分类。该算法已经在300张皮肤镜图像上进行了测试,准确率达到92%,表明该方法能够正确地对大部分黑色素细胞病变进行分类。该算法不仅有助于准确诊断皮肤痣的类型,而且可以减少活检的次数,降低与皮肤病变切除相关疾病的发病率。Rofman等[21]基于个人健康管理数据提出了一个多参数的人工神经网络系统,可以用来预测和分析非黑素瘤皮肤癌的风险。他们的研究结果具有临床说服力,原因如下:首先,多参数的人工神经网络系统在大数据库中对463 080名受访者进行了训练和验证,并在另一个数据库对28 058名受访者进行了进一步的测试;其次,所开发的多参数人工神经网络能够在具有良好的特异性的同时,以较高的灵敏度评估非黑素瘤皮肤癌的风险。该研究根据癌症风险将患者分为3类:高、中、低,提供临床决策支持和个性化的癌症风险管理。因此,该研究的模型是一个预测模型,临床医生可以获得信息和患者的风险状态,从而早期发现和预防非黑素瘤皮肤癌。AI在通过图像诊断黑色素瘤方面优于皮肤科医生。由于黑色素瘤中致癌突变的累积性,更早期形态的演变很可能被AI算法检测到。相关研究通过黑色素瘤的演变进一步探讨了黑色素瘤的早期预测。作者发现在黑色素瘤发生前可以预测黑色素瘤,以前瞻性图像数据为训练对象的AI可能会诊断出更多的黑色素瘤早期病变[22-23]。
5 AI与前列腺癌
在美国,前列腺癌是最常见的癌症之一,在男性中前列腺癌死亡率仅次于肺癌。根据2016年统计数据显示,约有180 890名新发病例,约有26 120名患者死于前列腺癌[24]。前列腺癌的诊断金标准是穿刺活检,但是穿刺活检是一种有创检查,所以近年来计算机辅助诊断技术在前列腺癌的早期诊断中的相关研究逐渐增多[25-26]。Reda等[27]基于计算机辅助诊断技术将磁共振弥散加权成像(diffusion-weighted magnetic resonance imaging,DW-MRI)和前列腺特异抗原(prostate specific antigen,PSA)检查结果输入到自动编码器中,通过2级分类网络确定前列腺的最终诊断为良性或恶性。最终总的分类准确率、敏感性和特异性分别为94.4%、88.9%和100%。该系统可作为前列腺癌早期诊断的有力工具。该工具作为临床决策支持系统具有很大的潜力。利用该系统可以避免不必要的前列腺活检,降低诊断成本和诊断方法的并发症。还有研究显示表面增强拉曼光谱(surface-enhanced raman spectroscopy,SERS)与支持向量机联合检测外周血能成功地应用于早期列腺癌的筛查。首先建立3种支持向量机分类器模型,包括线性、多项式和核函数,并利用实测的血清SERS进行评价,结果显示外周血SERS将为前列腺癌的早期无创筛查开辟一条新的途径[28]。未来工作的重点将增加学习和评价CAD系统的参与人数,以增强和确认研究结果的稳定性。未来的另一项工作是获取更高扩散梯度因子(b值)的DWI-MRI数据集,以检查它们对系统准确性的影响[29]。
6 AI与结直肠癌
最新全球癌症统计报告显示[30],结直肠癌发病率在人群中排名第3,死亡率排名第2。5年相对生存率I期患者可达90.3%,因此结直肠癌的早期诊断和治疗显得尤为重要。结肠镜检查和切除腺瘤性息肉可降低结直肠癌的死亡率,这已在许多后续研究中得到证实[31]。因此,许多相关指南推荐结肠镜检查作为首选的结直肠癌筛查策略[32]。随着深层神经网络和机器学习算法的发展,使AI在图像和视频分析中具有很高的效率。用于结肠镜检查的计算机辅助系统-神经网络模型可以帮助内镜检查息肉和进行光学诊断。这些基于AI的模型在提高腺瘤检出率和降低增生性息肉切除成本方面具有巨大潜力。AI学习通过使用数千张结肠镜图像进行训练,以识别和区分增生性息肉和腺瘤性息肉[33]。据估计,如果能够在早期检测出更多的腺瘤,就会降低结直肠癌发生的风险[34]。Urban等[35]使用深度学习模型,利用深度卷积神经网络测试计算机辅助图像的分析能力,结果显示其检测结直肠息肉的准确率为96.4%,ROC曲线为0.991,说明该模型可以很好地提高腺瘤检出率并降低腺瘤的漏诊率。计算机辅助系统和AI技术如深度学习可以加快对大量图像数据的处理,并有可能帮助临床医生进行决策,如结直肠息肉的检测和分类[36-37]。利用AI的应用程序数量将在未来几年内随着计算能力的提高和复杂的决策算法而不断增加。避免训练数据中的各种偏差是建立精确计算机辅助系统模型的关键[38]。
7 AI与其他肿瘤
Tamashiro等[39]收集了5 403张来自日本东京癌症研究所医院的咽部202例浅表性癌和45例晚期癌的训练图像。利用这些图像,作者开发了一个基于卷积神经网络的AI诊断系统。并且准备了来自40位口咽癌患者和40位非口咽癌患者的1 912张验证图像来评估系统。基于AI的诊断系统正确地检测到了癌症患者的所有咽部癌病变(40/40),包括3个小于10 mm的小病变。对于每张图像,基于AI的诊断系统通过窄带成像内镜(narrow band imaging,NBI)获得的图像正确地检测到咽癌,灵敏度为85.6%,明显高于通过白光成像获得的图像(70.1%)。新的诊断系统仅用28 s就分析了1 912幅验证图像。急性淋巴细胞白血病是一种起源于B系或T系淋巴祖细胞的肿瘤性疾病,它可以迅速扩散到身体的不同部位。ALL分为L1、L2和L3三种类型,是通过病理学家对血液和骨髓涂片的筛查发现的。但人工检测血样既费时又枯燥,而且受人为失误风险的限制。相关研究提出了一种自动检测方法,利用模糊c均值聚类算法对细胞核进行分割。然后从核中得到一组丰富的特征,包括几何特征、一阶和二阶统计特征。采用主成分分析法降低特征矩阵维数,最后将不同内核函数和参数的支持向量机分类器应用于细胞分类,将细胞分为4组,即非癌细胞、L1、L2和L3。结果表明,该方法可作为实验室辅助诊断工具[40]。Forghani等[41]利用双能CT纹理分析和AI机器学习模型预测颈部淋巴结病变,该研究对87例头颈部鳞状细胞癌患者进行了评估。在65 kev或40~140 kev的多能量虚拟单色图像下,对虚拟单色图像进行纹理特征提取,除了单独的随机选择训练和测试外,还构建了随机森林模型,用于内部交叉验证的结果预测。使用该模型对头颈部鳞状细胞癌患者的诊断可分别获得88%、100%、67%和83%的准确性、敏感性、特异性。该研究指出通过AI学习可用于预测颈淋巴结转移,具有较高的准确性。
8 小结与展望
随着近年来云计算、大数据、互联网等信息技术的快速发展,AI通过人机协同、深度学习、自主操控等技术在医学领域快速发展,在癌症筛查中的作用尤其突出。未来“AI+”癌症筛查将成为医疗服务的重要手段,可能代替医生做出更精准、更有效的诊断,从而提高医疗服务质量,缓解医疗压力,促进癌症筛查的不断发展与进步。
作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。
学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。
同行评议:经同行专家双盲外审,达到刊发要求。
利益冲突:所有作者均声明不存在利益冲突。
文章版权:本文出版前已与全体作者签署了论文授权书等协议。