人工智能在膀胱癌影像学中的研究进展
2024-01-03陈颖尚芸芸郝金钢
陈颖,尚芸芸,郝金钢*
膀胱癌是泌尿系统最常见的恶性肿瘤,2022 年全国肿瘤登记中心发布的数据显示,2016 年我国膀胱癌的发病率和死亡率分别位居全身恶性肿瘤的第14、15 位,极大危害了人类健康。如何尽早检出膀胱癌并客观准确地对浸润程度、是否有淋巴结转移等情况做出评估,这对于临床诊治十分重要。另外,当病人确诊并开始治疗后,正确评估治疗效果及复发风险等情况也尤为关键。影像学检查不仅有助于发现膀胱癌,还能更直观了解病变范围、周围脏器及淋巴结受侵情况,以便临床医师制定相应的治疗方案。近年来,随着人工智能(artificial intelligence,AI)在医学领域的发展,新的技术被不断运用到膀胱癌的诊疗,在膀胱癌的检出、鉴别、预测浸润程度、病理分级及淋巴结转移情况、评估新辅助化疗效果及预测复发风险与无进展生存期等方面取得了一定成果,为该领域带来了新发展的可能。
1 AI 概述
AI 是计算机科学的一个领域,简单来说,它是一种能够模仿人类智能行为的计算机算法。目前在医疗方面,AI 的大部分研究集中在机器学习(machine learning,ML)和深度学习(deep learning,DL)[1]。ML 是AI 的一个分支,它通过不同算法指导计算机从数据中学习,根据学习经验不断提高自身效能,主要包括支持向量机(support vector machine,SVM)、Logistic 回归、随机森林等。影像组学是ML与影像学结合衍生出的子领域,即从医学成像的兴趣区(ROI)或兴趣体积(volume of interest,VOI)中高通量地提取影像特征,采用ML 方法从中获取信息,进而建立模型进行预测研究[2]。DL 是ML 的一个分支,它能够利用一种特定类型的ML 架构大致模仿人类大脑的功能,即人工神经网络,通过组合低层特征形成更加抽象的高层属性类别或特征,以发现数据的特征性分布,最终达到诊断的目的;卷积神经网络(convolutional neural network,CNN)是其代表算法之一[3]。ML 和DL 最大的不同在于学习过程:ML 需要依赖专业知识来定义相关特性,而DL 能够自动学习数据中的各类特征,避免了人工选择,因此也被称为端到端的算法[4]。
2 AI 在膀胱癌影像学中的应用
2.1 膀胱癌的检出 近年来AI 在肺结节检出等方面取得一定成果,使人们认识到不同的纹理特征可能反映不同的组织类型,纹理分析在影像上可用于区分病变和健康组织,已被用于膀胱癌的检出。如Shi 等[5]从22 例膀胱癌病人及23 例志愿者的T2WI影像中提取出40 个2D 纹理特征进行分析,结果显示两者的膀胱壁之间存在纹理差异,在此基础上将22 例病人按肌层浸润程度进一步分组,以探究膀胱癌的纹理特征是否随病变进展而改变,结果表明利用纹理分析能进一步判断膀胱癌发展的阶段,从而预测其浸润程度。而比起2D 特征,影像的3D 纹理特征能更好地描述肿瘤异质性[6],Xu 等[7]从膀胱癌病人的T2WI 影像中分别提取2D 和3D 纹理特征用于区分肿瘤和正常膀胱壁,为了解决分组中样本量差距过大的问题,采用合成少数过采样技术(synthetic minority oversampling technique, SMOTE)平衡样本量,结果显示有38 个特征存在明显类别差异,且3D 纹理特征的效果优于2D 特征,再次验证了纹理分析用于膀胱癌检出的可行性,以及3D 纹理特征相比2D 特征的优越性。
2.2 与其他肿瘤病变的鉴别 除了膀胱癌,膀胱的其他病变在影像上也会表现为壁的局部增厚或突起而导致误诊,AI 与影像学的结合有助于鉴别。膀胱微乳头状癌是尿路上皮癌的一个亚型,该亚型病人预后较典型尿路上皮癌差,Fan 等[8]基于两者的动态增强CT 进行纹理分析,结果显示有28 个特征存在显著差异,证实了使用纹理分析识别出尿路上皮癌中的微乳头状癌的可行性,但由于后者在临床上相对少见,该研究的样本量并不理想,一定程度上影响了模型的效能。陈鹏飞等[9]基于40 例腺性膀胱炎和70 例膀胱癌病人的CT 动态增强影像,运用多种ML 算法建立了4 个影像组学模型,结果显示4 个模型的受试者操作特征曲线下面积(AUC)均>0.80。王亚奇等[10]从膀胱乳头状瘤病人与膀胱癌病人的CT 平扫,增强动、静脉期影像中提取并筛选影像组学特征,结合临床资料分别建立了非影像组学模型和影像组学联合模型对两者进行鉴别,结果显示后者在训练集和验证集中的AUC(分别为0.913、0.825)均大于前者(分别为0.781、0.643),决策曲线显示影像组学联合模型在不同阈值下均有更高的净获益度,表明基于CT 影像组学的模型在膀胱乳头状瘤与膀胱癌的鉴别中具有较好的诊断效能。
2.3 预测膀胱壁浸润程度 膀胱癌的T 分期可用于衡量膀胱壁浸润程度,侵犯尿路上皮(Ta期)和固有层(T1期)的肿瘤被称为非肌肉浸润性膀胱癌(non muscle-invasive bladder cancer,NMIBC),侵犯肌层(T2期)或以上(T3和T4期)为肌肉浸润性膀胱癌(muscle-invasive bladder cancer,MIBC)[11],由于两者的治疗方式不同,在术前进行准确、无创预测有利于膀胱癌诊疗方式的确定。Garapati 等[12]收集了76 例膀胱癌病人的CT 尿路成像(CT urography,CTU)影像,将其分为NMIBC 和MIBC 2 组,采用4种ML 算法建立预测模型,结果显示各模型的AUC均>0.88,表明ML 用于预测膀胱癌浸润程度的可行性。Zhang 等[13]将441 例膀胱癌病人的CTU 影像分为发展组、调整组、内部和外部验证组,利用DL 算法建立预测模型对NMIBC 和MIBC 进行分类,结果显示模型在内部和外部验证组的AUC 分别为0.861、0.791,表明DL 具有一定的应用潜能;该研究运用来自不同医院的外部队列,样本量相对较多且来源较广,模型泛化性好,但预测效能相对较低。相比MRI,CT 的软组织分辨力不足,在评估膀胱癌浸润程度方面能提供的信息有限。Xu 等[14]从膀胱癌病人的T2WI 影像上分割出118 个VOI,包括34 个NMIBC 和84 个MIBC,基于SVM 构建分类模型,结果显示模型的AUC 为0.861,这是首次尝试从常规MRI 序列中提取影像学特征用于术前预测膀胱癌浸润程度,但该研究中仅包含T2WI 序列,考虑到扩散加权成像(DWI)等功能性MRI 在评估生物行为和肿瘤异质性方面的优越性。后续的研究[15]又从包括T2WI、DWI 及表观扩散系数(ADC)图的多参数MRI 中提取特征,采用SMOTE 平衡样本量、递归特征消除支持向量机(SVM-RFE)构建最优判别模型,结果显示其AUC 达到0.985 7,且根据多参数MRI创建的联合最优判别模型效能优于单一模型,显示出多参数MRI 的优势。
2.4 预测病理分级 2016 年更新的WHO 膀胱癌病理诊断标准中,推荐应用国际泌尿病理学会1997年提出的分级标准,将其分为低度恶性潜能乳头状尿路上皮肿瘤、低级别乳头状尿路上皮癌以及高级别乳头状尿路上皮癌[16]。病理分级对膀胱癌病人的治疗和预后意义重大,目前膀胱镜活检是术前分级的常用方法,但它属于有创操作,可能导致一系列并发症。AI 的兴起和发展有望实现无创预测膀胱癌病理分级。刘震昊等[17]对术后病理证实为膀胱癌病人的53 个病灶的CT 平扫和增强影像进行纹理分析,筛选出2 组间的差异纹理参数9 个,最终发现平扫影像中的偏度是最有效的参数,AUC 为0.840±0.058,表明纹理分析可用于膀胱癌的分级预测。Zhang 等[18]从61 例膀胱癌病人的DWI 和ADC 图中提取影像组学特征,采用SVM-RFE 寻找最优特征子集建立模型,最后发现采用最优特征子集的模型在膀胱癌分级中表现最佳,AUC 达0.861,但该研究样本量较少,且未设置验证集,难以对模型的效能做出客观评价。Wang 等[19]将100 例膀胱癌病人按7∶3 分为训练集和验证集后,从70 例膀胱癌病人的T2WI、DWI 和ADC 图中提取影像组学特征,将它们结合得到多模态预测模型,结果显示不管在训练集还是验证集中,多模态模型均获得较高的AUC,显示出多模态的优势。Zheng 等[20]根据从185 例膀胱癌病人的动态增强和T2WI 影像中提取了影像组学特征,并与膀胱成像报告和数据系统(VI-RADS)评分结合得到的结果以列线图的形式呈现,构建联合模型预测病理分级,结果显示模型在训练集和验证集的AUC 分别为0.956 和0.958,决策曲线分析显示联合模型在训练集和验证集中均比VI-RADS 评分的临床净效益高。这是首次将影像学特征与VIRADS 评分结合的研究,但缺乏多中心研究来评估该模型的可推广性。
2.5 预测淋巴结转移 膀胱癌出现淋巴结转移提示预后不良,术前判断淋巴结转移主要依靠CT 和MRI,但其敏感性和准确性均不理想[21],AI 与影像学结合可能有助于改善现状。Wu 等[22]从118 例膀胱癌病人的CT 增强动脉期影像中提取影像特征,运用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)对特征进行筛选后构建影像组学模型,通过多因素logistic 回归分析确定影像组学评分和CT 报告的淋巴结转移状态为2 个独立预测因素,将它们结合后构建联合模型对淋巴结转移情况进行预测,结果显示联合模型在验证集的AUC 达0.898 6;随后以同样的思路对103 例膀胱癌病人的T2WI 影像进行分析,将影像组学评分和MRI 报告的肿瘤大小、T 分期、淋巴结转移状态这4 个独立预测因素结合构建联合模型,结果显示模型在验证集的AUC 为0.844 7[23],表明包含影像学特征的联合模型在预测膀胱癌病人的淋巴结转移方面具有可行性。而Starmans 等[24]收集了209 例来自不同机构的cT2-T4aN0-N1M0MIBC 病人的CTU及CT 增强影像,利用最佳放射分类的方法将多种算法自动优化组合后构建模型进行预测,而模型在训练期间发生了过拟合,加上多中心样本的差异以及CT 层厚对淋巴结显示情况的影响等因素,最终预测结果并不理想,该研究得出了“MIBC 病人淋巴结的影像组学特征与淋巴结转移之间没有关联”的结论。由于目前该领域的研究较少,各项研究得出的结果不尽相同,关于AI 预测膀胱癌病人淋巴结转移情况的作用还需进一步研究。
2.6 预测新辅助化疗疗效 与单纯手术相比,术前采用顺铂为基础的新辅助化疗药物可提高病人生存率[25],然而不同个体对化疗的反应具有差异性,加上化疗药物具有一定毒副作用,尽早明确新辅助化疗的有效性有利于病人预后。Cha 等[26]收集了膀胱癌病人在新辅助化疗前后的CT 平扫及动态增强影像,使用3 种DL 模型对病人的反应进行评估,并将结果与2 名放射科医生的评估结果比较,结果显示3 种模型和放射科医师评估结果的AUC 相当,表明使用来自膀胱癌新辅助化疗病人治疗前后CT 信息的DL 模型有助于评估治疗反应。Zhang 等[27]从70例MIBC 病人的T2WI、DWI 和ADC 图中提取影像特征,分别单独、相互联合建立模型,并与临床特征结合构建联合模型进行预测,结果显示单模态模型中基于T2WI 建立的模型效能最好,结合T2WI、DWI和ADC 特征的多模态模型的AUC 高于所有单模态模型;而结合临床T 分期和3 个序列的联合模型的AUC 达到0.973,高于其他所有模型,说明基于MRI和临床T 分期的联合预测模型具有较高诊断效能,可能有助于临床医生优化临床决策;但该研究样本少,也未使用单独数据集对模型效能进行验证。
2.7 预测复发风险与无进展生存期 高复发率是膀胱癌的一个重要特征,NMIBC 病人经尿道膀胱肿瘤电切术后2 年复发率可达61%,而对于MIBC 病人,根治性膀胱全切术虽然消除了大部分病灶,但仍有5%~50%的病人会在2 年内复发,故术前预测复发风险有利于病人的预后。Xu 等[28]从71 例膀胱癌病人的T2WI、DWI、ADC 图、MRI 动态增强影像中提取影像组学特征,采用SVM-RFE 和Logistic 回归构建影像组学模型,结合肿瘤的肌肉浸润状态这一因素构建联合模型预测病人术后2 年内复发风险,结果显示模型在验证集的AUC 达0.838,决策曲线表明当风险阈值>0.3 时,联合预测模型将获得比临床模型或影像组学模型更好的净效益,这表明AI可作为一种有效工具用于膀胱癌病人的早期个性化决策。而Lin 等[29]运用LASSO 和Cox 回归分析,结合来自动态增强CT 的影像组学特征、病人的RNA 测序数据和临床病理数据建立联合模型预测膀胱癌病人的无进展生存期,是一项首次综合影像组学、转录组学和临床因素对膀胱癌病人进行生存预测的研究,实现了多学科互补,展现出转录组学的重要作用,更显示出深入研究影像组学特征的必要性。
3 局限性与展望
随着AI 的不断发展,影像学中的更多影像特征信息得以被进一步发掘、量化、有效利用,而该领域的研究也存在一定挑战。首先,AI 在膀胱癌影像学中的应用研究仍处于不成熟阶段,医师分割影像、提取特征、设置参数、评价结果的标准尚未统一;其次,目前大部分相关研究的样本量均较小,且来自同一医疗中心或同一厂家的MR 扫描设备,容易产生过拟合的现象,不利于提高模型的泛化性和推广,需要大量、多中心的数据进一步验证;最后,ML 需要手动分割VOI 或ROI,故会导致一定误差。随着将来数据库的完善、标准的统一、计算能力的提高及各种算法的不断进步,AI 在膀胱癌影像学中将会有更大的应用价值。另外,随着基因组学、转录组学等学科的不断发展,多种学科的结合可能使AI在膀胱癌影像学中的研究获得新突破。