肝癌影像组学的临床应用:现状与展望
2023-10-27袁恩雨宋彬
袁恩雨, 宋彬
肝细胞癌(hepatocellular carcinoma,HCC)是最常见的原发性肝肿瘤,其在全球的发病率不断上升[1]。影像学检查是HCC无创检查的重要手段,由于其能提供对病灶结构和功能多参数、多维度、多模态的评估信息,因此在HCC的检出、鉴别诊断、生物学行为预测、疗效预测和预后评估等方面发挥重要作用。定性、半定量分析主要使用传统影像征象,具有直观、易评估的特点,而也存在观察者间主观差异、图像信息利用较少的缺点。影像组学是定量分析的代表方法,通过计算感兴趣区(region of interest,ROI)的高通量直方图、形态及纹理特征,将图像矩阵数据转化为定量数据,更加客观地描述ROI的影像特征,成为医学影像领域研究的热点。近年来,不断有研究探索影像组学在HCC诊疗中的应用价值,拓展了影像学在HCC临床实践中的指导价值。本文主要对影像组学在HCC诊断、治疗及预后评估中的研究进展进行综述。
影像组学概述
“影像组学”的概念在2010年由Gillies等[2]首次提出,Lambin等[3]对其概念进行了完善,并提出了影像组学研究的基本步骤,包括图像获取、病灶标注、特征提取与筛选、特征分析。影像组学的基本假设是基因组学和蛋白质组学等的信息可以传递到宏观图像中,通过对医学图像数据的定量分析,可以推断表型、基因-蛋白生物标志物甚至预后信息。
图像获取指根据研究目的收集用于提取影像组学特征的图像。在HCC相关的研究中,图像数据多为单中心的回顾性CT或MRI数据。先前研究表明,影像组学特征对图像采集和重建参数变化十分敏感[4,5],不同机型和不同参数采集的图像的影像组学特征存在较大差异。因此需要在特征提取前对图像进行预处理(如重采样、像素归一化)或特征提取后对特征进行预处理(特征归一化)来减小不同来源图像的影响。同时在特征分析时,有条件时应以不同来源的图像分为亚组,验证结果在不同亚组中的推广性。
病灶标注指通过标注软件或标注算法生成ROI的掩膜。在特征提取时,算法仅考虑掩膜内的像素值,从而计算得到ROI的影像组学特征。从标注方法上,手动标注最为简单易行,但受到标注者主观影响,因此不同标注者间或同一标注者的多次标注间都存在差异。目前的研究中主要通过计算多次标注ROI间的空间重合程度(如Dice相似系数、Jaccard相似系数)或多次标注ROI提取的多套影像组学特征间的一致性(如组内相关系数)来评价手动分割的重复性和稳定性[6]。另一种方法为半自动或自动标注,是指通过阈值分割、区域生长、深度卷积神经网络等方法,实现端对端的标注,不需要或仅需要少量的人工校正。相对于人工标注,这类标注方法更快、更稳定,也因此越来越受到研究人员的关注[7,8]。
特征提取是指按照预先定义的计算机算法从图像ROI中自动提取出大量的定量化影像特征。目前研究中使用的影像组学特征多为标准特征[9],主要分为:①直方图特征,反映ROI像素值的分布特点;②形态特征,反映ROI的几何形态特征;③纹理特征,同时考虑像素值和像素的空间分布,反映ROI对应的各种纹理矩阵的特征(如灰阶共生矩阵特征、灰阶游程矩阵特征等)。此外,在特征提取前,还可以使用各种滤波函数对图像进行变换,增强图像的某种特性。如高斯-拉普拉斯变换可以增强物体的边缘信息[10],平方根变换使像素间的差异变小。由于滤波函数的应用,病例的影像组学特征向量的维度往往非常高。特征筛选是从高维影像组学特征中筛选出稳定、高区分度的特征,常用方法包括最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归模型、主成分分析等。
特征分析在目前研究中主要分为有监督学习的分类模型构建和无监督学习的聚类分析。在有监督学习中,特征与结局事件同时输入分类模型,用于拟合特征与结局事件间的关系,最终评估分类模型的区分度、校准度和临床实用性等性能[11,12]。在无监督学习中,算法通过特征值的相似性将样本分为多个簇,通过比较簇间结局事件的发生情况及影像组学特征的表达情况,最终间接分析影像组学特征与结局间的关系。
影像组学在HCC诊疗中的临床应用
1.HCC的诊断与鉴别诊断
肝脏局灶性病变的诊断主要依靠影像检查。一些肝脏良性病变如血管瘤、囊肿等往往只需要随访,而恶性病变则需要积极的临床干预,并且HCC与非HCC恶性病变的诊疗策略也不同。尽管多数病变在影像上有较为典型的表现,但部分不典型的良、恶性病变仍易与HCC混淆,加大诊断的难度。
影像组学在HCC与其他肝脏良恶性病变的鉴别诊断中有重要价值。Zhao等[13]基于平扫CT图像上病灶区域的信息建立影像组学预测模型,用于诊断6种肝局灶性病变,包括肝血管瘤、肝囊肿、肝腺瘤、肝脏局灶性结节增生(focal nodular hyperplasia,FNH)、HCC和肝转移癌。他们发现对于6种病变的诊断,影像组学模型的受试者操作特征(receiver operating characteristic,ROC)曲线的曲线下面积(area under curve,AUC)均可达0.89以上,并且在鉴别良性病变与恶性病变的任务中AUC值也很高(0.899)。利用平扫影像组学模型,能有效鉴别诊断常见肝局灶性病变,从而帮助克服因对比剂过敏而产生的不良反应。
多项研究表明基于CT或MRI的影像组学模型能很好地鉴别诊断肝硬化背景下的HCC。Ding等[14]探究了增强MRI影像组学特征对鉴别诊断肝硬化背景下的HCC与FNH的效能,发现通过临床危险因素建立的临床预测模型在融合了影像组学特征后,诊断效能明显提高。类似的,Nie等[15]基于增强CT图像建立影像组学预测模型,能有效区分肝硬化背景下的HCC与FNH,并且影像组学标志物能显著提高临床模型的预测准确性。
影像组学模型也能够很好地区分HCC与非HCC的恶性病变。Wang等[16]使用MRI影像组学模型鉴别诊断HCC、肝内胆管细胞癌与混合型肝细胞癌-胆管细胞癌,发现基于延迟期特征的模型在区分病变上有更好的AUC值(0.91),且使用高阶影像组学特征的模型相对于仅使用低阶特征的模型能提高约10%的诊断效能。Huang等[17]也发现基于T2*WI序列的影像组学特征能很好地区分HCC与肝内胆管细胞癌。
2.HCC病理特征的术前预测
HCC的多种病理特征与其预后紧密相关,是HCC风险分层的重要参考标准,而准确的风险分层是合理制定治疗方案的关键。由于HCC的诊断不依赖于组织病理检查,因此在术前往往难以获得病灶的病理信息。影像组学提供了一种无创、安全、可重复的检测方法,并且已经在多项研究中展现出对HCC病理特征的术前精准预测能力。
影像组学可用于术前识别HCC的特殊组织学亚型。在Feng等[18]的研究中,使用术前增强CT图像建立的影像组学模型能够在内、外部验证集中较好地预测粗梁-团块型肝细胞癌亚型。通过分析批量和单细胞RNA测序数据,作者发现该影像组学标志物与B细胞浸润的体液免疫功能失调相关。Wu等[19]分别使用增强MRI动脉期、静脉期影像组学特征以及他们的组合构建双表型HCC的预测模型,结果表明基于静脉期特征的模型(AUC=0.879)与动、静脉期混合模型(AUC=0.908)的区分度显著优于临床预测模型(AUC=0.658)。
影像组学还可以用于预测HCC的组织病理学特征。Mao等[20]分析了297例HCC患者增强CT动脉期和静脉期病灶的影像组学特征,发现结合了临床特征、动脉期特征和静脉期特征的预测模型在预测Edmondson-Steiner分级上有最高的诊断效能(AUC=0.8014),且动脉期特征的预测效能优于静脉期特征。Meng等[21,22]发现无论CT或MRI,影像组学特征在预测HCC微血管侵犯上没有显著差别,并且基于临床特征、影像特征和影像组学特征建立的预测模型,在内、外部验证中能很好地预测微血管侵犯(AUC=0.835~0.864)。Yu等[23]探究了增强MRI图像上HCC肿瘤内部和肿瘤周围影像组学特征对于预测肿瘤包绕型血管的价值,结果发现瘤周1 mm区域的影像组学特征较瘤内特征有更好的预测效能,且该模型的预测结果是早期复发和无进展生存的独立预测因子。
影像组学还可以对免疫组化标记物进行预测,实现术前分子分型,帮助更好地理解肿瘤生物学行为和优化治疗方案。Wu等[24]分析了172例HCC患者的术前增强CT图像,发现结合血清甲胎蛋白水平、Edmondson-Steiner分级和影像组学标志物的模型能很好地预测肿瘤Ki-67的表达水平。Wang等[25]基于临床危险因素和增强MRI影像组学特征建立不同的模型预测HCC肿瘤CK-19表达情况,发现联合动脉期和肝胆期的MRI影像组学模型预测效能优于任何单一序列模型及单纯临床模型,而同时联合临床危险因素能提高MRI影像组学模型的预测效能。Gu等[26]基于肿瘤延迟期MRI图像和临床危险因素构建影像组学模型,其预测HCC肿瘤GPC-3表达情况的AUC为0.914。
3.HCC的疗效预测和预后评估
影像组学的模型预测结果还可以整合到诊疗方式的选择中。Chen等[27]分析了术前平扫和动脉期CT图像中病灶及病灶周围区域的影像组学特征,发现肿瘤+瘤周10 mm影像组学模型对预测中期HCC患者初次肝动脉灌注化疗栓塞术(transcatheter arterial chemoembolization,TACE)后的客观缓解准确性最高,并且结合临床、传统影像危险因素后,该模型能进一步提高诊断准确性,在内、外部验证集中AUC分别达到0.94和0.90。该研究结果有助于术前选择出可能从TACE治疗中获益的患者。Jin等[28]通过分析三中心TACE患者队列,发现基于术前增强CT图像的影像组学模型有助于预测初次TACE后肝外播散和血管侵犯,从而帮助发现不适合TACE治疗的初治患者。
早期HCC的首选治疗方法是手术切除,然而术后复发仍旧是造成不良预后的重要因素,因此高复发风险的患者可能需要额外的辅助治疗[29,30]。Li等[31]分析了行手术切除治疗的329例HCC患者的随访数据,发现基于增强CT图像的影像组学模型可以对患者的复发风险进行分层,模型预测高风险组与低风险组的复发概率差异有统计学意义。结合影像组学预测风险和术后病理肿瘤微血管侵犯情况建立的预测模型,可以进一步提高对早期复发与晚期复发的预测准确性(C-index=0.727)。Gao等[32]使用增强MRI图像和患者早期复发情况(≤2年)训练深度卷积神经网络,并将网络的全连接层输出作为深度学习特征,与影像组学特征结合,建立融合预测模型。该模型在预测HCC早期复发的任务中AUC能达到0.840,优于单用影像组学模型(AUC=0.780)和单用深度学习模型(AUC=0.813)。
影像组学在HCC诊疗中的挑战
尽管影像组学在HCC诊断、治疗与预后方面突显出重要价值,但其临床应用仍存在诸多问题。
一方面,目前的影像组学研究多关注模型的性能好坏,而忽视了对研究设计及结果分析的质量控制,导致大多数已发表的研究可能存在系统误差,或未提供足够的信息供读者评价其研究的发现[33-36]。例如,目前的研究中特征提取的参数设置缺乏详细报道,导致他人无法复现特征提取过程[37];研究多采用随机拆分验证,且同时缺乏样本量计算,因此难以保证模型验证的可靠性。系统误差可能导致模型的性能膨胀,即虚假性的高性能。
另一方面,目前的研究缺乏对影像组学特征和影像组学模型的生物学可解释性分析。尽管已有部分研究使用了如夏普利值等算法分析输入影像组学特征与输出间的数学可解释性[38],而影像组学特征与传统肉眼影像征象、组织病理特征与分子基因表达等的生物学可解释性仍较差[39]。缺乏潜在的生物学可解释性,“组学”这类黑盒模型难以广泛应用。
其次,以牺牲生物学可解释性换取的性能提升,缺乏多中心或前瞻性的外部验证,难以保证模型的泛化性。在应用了滤波函数后,影像组学特征的维度可达上千,属于高维数据。一项模拟研究表明,即使是随机生成的影像组学特征也可以产生“重要”的预后价值[34]。因此,高维度的影像组学数据极有可能产生与结局事件的虚假相关性。多中心空间外部验证或前瞻性时间外部验证能够很好地评估模型在真实环境中使用时的性能,而目前多数研究缺乏这样的可靠性和鲁棒性的验证。
最后,随着近年来算法的进步,以卷积神经网络系列模型和Transformer系列模型为代表的深度学习算法在上述临床应用中表现出相似甚至更好的性能。如Xu等[40]使用基于Swin-Transformer的深度学习模型评估肝脏病灶的肝脏成像报告和数据系统(liver imaging reporting and data system,LI-RADS)评分以及判断病灶是否为HCC。该模型在内部验证和外部验证中的LI-RADS评分和HCC诊断任务中都表现出较好的性能。Gao和Wang的团队发现预测肝癌早期复发的问题中,使用多层卷积神经网络的深度学习方法的性能显著优于影像组学方法,同时通过结合深度学习模型的全连接层特征和影像组学特征建立的混合模型,表现出比两者单独使用更好的预测性能[41]。此外,深度学习不受建模任务的限制,可以应用于病灶检测、病灶分割和病灶配准等影像组学无法完成的任务中[42-44],也可以利用海量无标注数据进行自监督表征学习,提高下游监督学习任务的性能[45]。因此,影像组学如何与深度学习有机结合,更好为临床个体化服务,是需要思考的问题。
展望与结语
在HCC的诊断、鉴别诊断、病理特征预测、疗效预测及预后评估中,加入了影像组学特征的预测模型可以获得更好的预测性能,但现有研究的局限性限制了影像组学在临床实践中的广泛应用。为了推进其临床应用,后续研究需要注意研究设计及统计分析的质量控制,提高影像组学特征和模型的生物学可解释性,并探索成熟的影像组学模型在真实临床诊疗中的价值。多中心、前瞻性的临床验证是最终应用前的关键步骤。