人工智能在泌尿系统肿瘤中的应用研究进展
2022-12-28徐文浩艾合太木江安外尔瞿元元施国海张海梁叶定伟
徐文浩,田 熙,艾合太木江·安外尔,瞿元元,施国海,张海梁,叶定伟
复旦大学附属肿瘤医院泌尿外科,复旦大学上海医学院肿瘤学系,上海 200032
1 前言
恶性肿瘤已占中国居民死因的23.91%,且发病率逐年升高,成为社会普遍关注的健康问题[1]。人工智能(artificial intelligence,AI)是指能够模拟、延伸和扩展人类智能的一套计算机科学理论、方法、技术及应用系统,试图发展计算机的智能来模仿人类的工作和思维方式[2]。其概念于1956年被首次提出,旨在研究如何通过利用计算机的软硬件特色模拟人类智能思维的基本理论、方法和技术,现已对生产、生活的多个学科领域产生了深远影响。AI在医疗卫生领域的应用不断发展,2017年国务院正式印发的《新一代人工智能发展规划》中明确指出要推广智能医疗,建立快速精准的智能医疗体系,探索建设智慧医院并加强群体智能健康管理。机器学习(machine learning,ML)是AI不可或缺的一部分,它将统计模型应用于机器,并允许它们以智能的方式独立运行,而无需一组明确的命令[3-4]。深度学习是ML的一个子类,它利用人工神经网络(artificial neural network,ANN)来模仿生物神经系统的结构方式及信息处理方式[5]。ANN具有可以充当神经元的人工节点的多层集合,这些人工节点接受输入,处理数据,最后将其传递给其他神经元。
在医学的其他领域中,AI已经扮演不可或缺的重要角色,如帮助临床医师或科研人员进行信息管理、诊断和医师决策[6-9]。根据最近的美国国立卫生研究院(National Institutes of Health,NIH)医学成像AI基础研究路线图,基于AI的算法将在未来10年内对临床医学成像实践产生重大影响[10]。此外,在诊断中,ML已成功用于筛选更多优质的生物标志物或疾病预测模型,以帮助诊断疾病,预测预后和复发率[11]。AI还可以通过分析骨骼X射线照片来诊断骨折,其准确度可与高级骨科医师相媲美[12]。肿瘤是医疗健康领域的重要攻关难题,各国学者纷纷探索AI与肿瘤筛查、诊断、治疗、护理和康复等领域的联合应用[11,13-14]。鉴于其他领域的这些进步,AI在泌尿系统肿瘤领域具有用于诊断和治疗优化的强大潜力[15-16]。本文就AI在泌尿系统肿瘤领域的技术方法和应用现状进行综述,探讨其面临的机遇与挑战,以期为AI助力肿瘤诊疗和护理提供参考。
2 肿瘤领域中用到的AI技术
2.1 ML
ML是AI的一大分支,即计算机借助算法模拟或实现人类学习行为,通过获取新知识或技能,重新组织已有知识结构使之不断改善自身性能的一种技术[17]。该技术不断学习标准化的多来源数据,如医学文献、医疗电子信息系统及医学检验数据等,训练出模型持续减少错误的发生,提高解决问题的效率和预测结局的效能,以帮助解决更多临床问题[18-20]。
深度学习可进一步划分为监督学习和无监督学习两大类,在肿瘤病理学和影像学诊断中应用广泛,本质就是发现输入数据集中的变量标签的结果,或直接分析数据集差异,达到鉴别分类的效果,如基于超声图像对乳腺癌亚型进行分类等[21-22]。监督学习在于从输入的样本集中推演出目的变量的结果,常见算法包括k-近邻(k-nearest neighbor,KNN)、决策树(decision tree model,DTM)、朴素贝叶斯算法(Naive Bayesian algorithm,NBA)、最小绝对紧缩与选择算子(least absolute shrinkage and selection operator,LASSO)多变量逻辑回归、支持向量机(support vector machine,SVM)及随机森林(random forest,RF)等。无监督学习旨在分析没有类别信息和目标变量的数据集,根据数据集中类似的对象生成新的分组或类别,甚至可以通过二维或三维方法可视化数据分类,常见算法包括k均值聚类分析、主成分分析(principal component analysis,PCA)等[23-25]。
2.2 自然语言处理
自然语言处理是AI和语言学的交叉,即一门基于ML技术来实现人与计算机之间自然语言有效通信的技术,使得机器能够理解人类的语言,为两者建立起有效的沟通渠道[26]。美国IBM公司的沃森肿瘤解决方案(Watson for oncology,WFO)可使用自然语言与肿瘤患者进行实时人机互动,不仅发挥聊天机器人的作用,还能通过情感分析和关系提取随时检测患者的碎片化信息,总结发现医师所忽视的细节,为患者的身心健康保驾护航[27]。此外,自然语言处理技术也可与社交媒体结合,在帮助肿瘤患者进行决策的同时实现个性化诊疗和满足情感需求。
2.3 自动规划
自动规划是一种问题求解技术,可以将问题分解成若干子问题并进一步解决,最终实现预期目标,在肿瘤个体化治疗和护理方案制订中有一定应用[28]。例如,利用该技术将弥散张量成像(diffusion tensor imaging,DTI)功能信息与磁共振成像(magnetic resonance imaging,MRI)结构信息相结合,进行脑干或前列腺肿瘤术前路径自动规划设计,能够有效地引导医师在术中规避重要的神经组织区域,降低手术风险[28-29]。
2.4 语音处理系统
语音处理系统是研究语音发声过程、语音信号统计特性、语音自动识别、机器合成及语音感知等各种处理技术的总称。目前已有研究[30]通过该技术对颞叶胶质瘤术后患者的发声及语音内容进行识别和处理,以评估患者手术恢复情况。
2.5 专家系统
传统的ML在开始真正意义上的普及化和商业化之前,几乎没有算法或系统程序能够突破常规计算的束缚,专家系统就是这样一个用于执行基于复杂逻辑运算的任务系统[24]。主要通过一种知识表达模式将肿瘤或其他临床领域专家知识和经验存入计算机“专家知识库”,再对输入的事实(如患者诊疗信息等)进行逻辑推理,根据已有信息匹配“专家知识库”中的固态条件和动态数据,模拟医学专家诊断疾病,作出开具处方药等类似医学专家的判断和决策[26]。WFO即是一款目前较为成功的专家系统,可进行癌症患者病史总结、为患者提供治疗方案建议和健康管理咨询。
2.5 ANN
ANN分类算法即模仿人类神经活动进行分布式并行信息处理的算法数学模型,可基于系统复杂程度,优化调整内部大量节点之间相互连接关系,从而达到处理信息的目的,具有自学习和自适应能力。深度卷积神经网络(convolutional neural network,CNN)模型是一种有代表性的常用技术模型,有助于病理学或影像学图像分类的深度学习[31]。在CNN的辅助下,计算机通过预先设计的特征变量,自动识别匹配目标图像的最佳特征,在不依赖大量数据预处理或人类操作、干扰的情况下直接分类。在如今的临床应用中,ANN已经逐渐广泛用于肿瘤患者的病理学和影像学诊断,通过图像处理技术对肿瘤图像进行压缩、增强、复原、匹配、描述和识别,辅助医师进行诊断[32]。
3 泌尿系统肿瘤领域AI技术的应用进展
3.1 前列腺癌
泌尿系统肿瘤的诊断和处理涉及大量临床数据的解析,包括组织学图像、MRI及生物标志物筛选等。在使用AI诊断前列腺癌的挑战中,研究者们正在开发一种去除异质性的方法来链接和平衡不同来源的定性数据,以创建决策的定量指标,甚至让AI创建一种使患者自己作出决定的方法[33]。尽管如此,Auffenberg等[20]最近设计了一个新模型,临床登记数据纳入了来自美国密歇根州45个不同医院泌尿外科的7 500多例前列腺癌患者,临床病理学数据包括前列腺穿刺活检时的患者年龄、诊断前的前列腺特异性抗原(prostate-specific antigen,PSA)水平及Gleason评分等,以此为基础,该团队测试并训练了一种ML算法来预测主要治疗结果。该工具现已通过网络和智能手机应用程序免费提供,使患者能够轻松利用大量相关的临床数据和ML算法进行长期主动监测,更有利于患者信息随访。
近年来,深度学习还被用于自动化前列腺活检组织标本的Gleason分级。尽管Gleason分级是前列腺癌患者重要的预后指标之一,但它不仅耗时较长,需要经验丰富的病理学家和穿刺临床医师,并且受试者之间的可重复性有限[34]。最新研究[35]表明,泌尿系统肿瘤病理学家对前列腺活检进行的Gleason评分和基于AI自动化的CNN算法结果可以达到65%的一致性,且上下偏差不超过1分。另外,ML也已被用于通过多参数MRI(multi-parameter MRI,mpMRI)图像结合纹理特征以高精度预测Gleason评分,从而大大降低利用有创的前列腺活检对癌症诊断的需求[36]。此外,有研究[11]显示,AI可以通过节省资源、提高可靠性和减少患者不适来改善前列腺癌诊断中的Gleason评分过程。
值得注意的是,ML的性能可因种族而异。2021年,Nayan等[37]纳入美国国家癌症中心68 630例患者,预测根治性前列腺切除术后存活率的XGBoost ML算法表现出不同种族的性能差异,强调了在临床决策前应彻底评估种族亚组中的ML算法适用性,不可以因ML的结果而忽视该部分人群积极癌症管理的重要性。Zhu等[38]研究发现,亚洲(尤其是东亚)人群与西方人群的前列腺癌流行病学特征存在明显差异,且东亚与欧洲后裔前列腺癌患者的基因多态性差异显著。因此,中国的前列腺癌诊疗策略不适合“一边倒”,还需结合大规模人群的不同临床病理学和遗传学特征,开发适用于中国前列腺癌人群的筛查、诊断和治疗的AI模型,探索AI在多学科交叉融合应用中的更多契机[39]。
3.2 肾癌
肾癌是致命的泌尿系统恶性肿瘤之一,高达25%的患者在初诊时发现转移[40]。肾癌的3种常见分类包括透明细胞癌、乳头状癌和嫌色细胞癌。由于不同肾癌类别之间肿瘤异质性极大,不同肾癌患者的的预后和治疗方案也大不相同。2019年,Han等[41]创建了CNN算法,用于标记特定关注区域的三相计算机体层成像(computed tomography,CT)图像来辅助肾癌分类鉴别,34个经活检证实的病例的验证集的曲线下面积(area under curve,AUC)高达0.9。
肾透明细胞癌通常根据Fuhrman方法进行核分级,该方法依赖于核多型性分析。然而,不同病理学家对病理学切片的分析依然存在很大的不一致,且现有的医疗资源无法让每1张H-E或免疫组织化学切片被多位病理学家共同诊断。2019年,Holdbrook等[42]设计了一种SVM,可以直接从活检的组织病理学全图像中对这些标本进行自动分级。SVM是ML算法中应用最广泛的一类,它使用许多功能子集(称为支持向量)来作出最终决策,从而使它们快速有效,结果表明,所生成的自动图像评分与另一种基于多基因检测的评分系统之间存在显著相关性,该评分系统可以准确预测肾癌患者预后。
此外,AI还可以被用于优化肾癌患者的全程治疗策略。晚期或高级别肾透明细胞癌患者可以通过一线细胞因子治疗或酪氨酸激酶抑制剂(tyrosine kinase inhibitor,TKI)进行靶向治疗[43-44]。但不同患者接受靶向治疗的效果和不良反应存在极大差别,很难实现个体化精准治疗。因此,Buchner等[45]近期开发了一种ANN,可以输入多个参数,包括但不限于治疗方案、组织学类型、体重指数(body mass index,BMI)及年龄等,利用这些数据,该算法能够准确地预测患者的36个月生存率,验证队列的准确度达到91%。
在肾癌的ML领域,Ma等[46]首次基于众多独立数据队列的共计超过1 500例肾透明细胞癌患者的转录组数据,探索转移和未转移患者肿瘤组织的全基因组特征。结合临床特征,通过多层逻辑算法和拟合回归森林树不断筛选关键生物标志物,建立了临床预测模型,描述肾透明细胞癌转移发生的10个关键分子标志物,并且在中位随访时间超过72个月的380例来自复旦大学附属肿瘤医院队列的肾透明细胞癌标本中进行验证,发现这些分子标志物、临床预测模型均能够用于预测患者的不良预后,且模型预测效能达到0.758(总生存期)和0.772(无病生存期),这对缺乏明确分子分型和分子标志物的肾癌管理来说是至关重要的。在肾癌免疫治疗的时代,Xu等[47]也率先对肾透明细胞癌微环境中免疫环境进行精确分组,发现免疫排斥型的Cluster B和C具有促肿瘤原性的免疫浸润,并且显示出比免疫荒漠型的Cluster A显著更差的生存,可以作为全新的独立预后指标,凸显了肿瘤表型与免疫背景之间的紧密关系,提示肾癌新型免疫分型能够很好地预测免疫检查点抑制剂(immune checkpoint therapie,ICT)的疗效。肾癌肿瘤亚型为传统的肿瘤免疫理论提出了一个挑战:虽然该类型肿瘤突变负荷并不高,但是免疫治疗对其有效;此外,肾癌中更高水平的CD8+T淋巴细胞浸润反而可能与较差的预后相关,这为肾癌免疫精准治疗带来了更多挑战[48]。随着肿瘤免疫治疗在肾癌等多种实体瘤临床治疗中的重要性逐渐提升,研究者们[49-52]陆续通过ML算法开发了如肿瘤新抗原(neoantigen)、肿瘤特异性抗原(tumor-specific antigen,TSA)、肿瘤纯度(tumor purity)、肿瘤微环境(tumor microenvironment,TME)及肿瘤免疫功能障碍和排斥(tumor immune dysfunction and exclusion,TIDE)等多种评分,极大地提高了预测抗原表位免疫原性的精确性,有助于更好地筛选适合肿瘤免疫治疗的群体,推动肿瘤治疗精准化和个体化管理。
3.3 膀胱癌
膀胱癌是全球第9大常见的癌症,在老龄化人群中往往呈现出显著升高的发病率和死亡率趋势[53]。2018年,Eminaga等[54]尝试通过开发CNN来采用AI方法解决膀胱镜检查术普适性的问题,该CNN算法纳入479个不同案例,其中包含44个不同的泌尿外科临床检查结果,经过训练算法,能够成功地识别出膀胱镜视野范围下所有癌变的图像。尽管膀胱镜检查是诊断膀胱癌的标准方法,但是它仍是一种侵入性的有创手术,非肌层浸润的膀胱癌患者在行电切手术后仍需每年进行1次膀胱镜复查。为解决这一难题,Eminaga等[54]最新设计了一种基于ML的方法,能够从尿液样本的细胞图像中检测出膀胱癌细胞或高度异型性的细胞,用于疾病诊断和复发预测,这种方法显示出94%的诊断准确度,与膀胱镜检查相比有显著改善。
在作出膀胱癌的诊断后,通常要进行临床和病理学分期以确定预后和后续治疗选择。Garapati等[55]训练了一个CNN算法用于准确使用来自CT泌尿系统造影术的图像将膀胱癌患者分为以下两组:不低于T2期或低于T2期,该模型显示出AI不仅在诊断膀胱癌方面具有巨大潜力,而且能够用于预测膀胱癌患者的预后和复发,对患者后续和长期的治疗选择有重要指导价值。Cha等[56]纳入了来自CT扫描的6 000多幅治疗前后的影像,利用深度学习算法,对不同的基于放射学的预测模型进行了分析,以根据肿瘤的化学反应准确地对膀胱癌患者的治疗响应率进行分类。虽然深度学习算法与放疗、化疗科专家在预测化疗响应上的差异无统计学意义,但这些尝试都为ML在泌尿系统肿瘤的应用打下坚实基础。
4 结语
近年来,以深度学习为代表的AI技术已经在多种肿瘤的病灶检出、病理学分型、临床分期、疗效评价及生存预测研究等方面显示出较为理想的效果。AI并非替代医师作出临床决策,而是加强和完善人机对话,让临床诊疗转型为更智能、精准、安全、高效的方式。规范大数据标准,开展多中心研究与验证是将AI由科研推向临床的重要过程,需要医、工交叉多学科的协作及共同努力。随着科技进步及经济发展,AI在肿瘤病理学分型、影像诊断、预测模型、手术导航及专家系统自动门诊等领域也将更加安全并被逐渐推广,在全国各级医院开展AI辅助下的泌尿肿瘤诊疗是必然趋势。面临未来的机遇与挑战,我们需要进一步强化技术研发,加强学科交叉的复合型人才培养,使AI助力人类在战胜肿瘤的道路上走的更远,从而全面提高医疗质量。
利益冲突声明:所有作者均声明不存在利益冲突。