基于钆塞酸二钠增强MRI的LI-RADS v2018评分诊断肝细胞癌的价值
2021-04-17戴颖钰陈彤邵婉怡马新星刘永浩
戴颖钰,陈彤,邵婉怡,马新星,刘永浩*
1.苏州大学附属第一医院放射科,江苏苏州 215000;2.苏州大学附属第二医院放射科,江苏苏州 215000;*通讯作者 刘永浩 lyh0902@126.com
肝细胞肝癌(hepatocellular carcinoma,HCC)是目前最常见的原发性肝脏恶性肿瘤,也是导致肿瘤相关死亡的主要原因之一[1],早期发现和及时诊断对选择治疗方式及提高远期生存率十分重要。《原发性肝癌诊疗规范(2019年版)》[2]指出,动态增强CT 和多模态MRI 扫描是肝脏超声和血清甲胎蛋白(alpha-fetoprotein,AFP)筛查异常者明确诊断的首选影像学检查方法;若影像学符合肝癌的典型表现,无需病理学确诊可直接进入治疗流程。国外各指南也将影像学检查作为无创性诊断HCC 的重要手段[3-4]。
为了规范和标准化肝脏成像的图像采集、影像征象解读和报告,2011年美国放射学会提出CT/MRI 肝脏影像报告和数据系统(liver imaging reporting and data system,LI-RADS),并不断修订。2018年LI-RADS再次更新并被纳入美国肝病研究协会(American Association for Study of Liver Diseases,AASLD)2018年HCC 临床实践指南[5],体现了LI-RADS评分对HCC诊断的重要作用。
钆塞酸二钠(Gd-EOB-DTPA)是目前国内最常用的肝脏特异性对比剂,可作为高风险患者诊断HCC的重要方法[6]。既往学者研究了新版分类对HCC 的诊断效能,并与2017 版本进行对比[7-9],但大多数研究并未单独评估Gd-EOB-DTPA增强MRI 对HCC 的诊断价值,国内相关报道少见。本研究拟探讨基于Gd-EOB-DTPA增强MRI的LI-RADS v2018 评分对HCC 诊断和评价的准确性及可重复性,为HCC 诊断的规范化和标准化提供理论依据。
1 资料与方法
1.1 研究对象 回顾性分析2017年1月-2019年9月于苏州大学附属第一医院放射科接受Gd-EOB-DTPA腹部增强MRI检查的152例患者,男89例,女63例,年龄22~88岁,平均(57±12)岁。纳入标准:①存在HCC 风险因素(肝硬化或肝炎病史),MRI显示肝脏单发或多发病灶(病灶数≤3个);②接受MRI检查前未接受治疗,MRI检查后通过穿刺、手术获得明确的病理诊断结果;③无病理结果的患者至少随访2年。排除标准:①MRI检查未采用钆对比剂增强或MRI 图像质量不佳,不可用于分析;②肝脏病灶数量多于3个;③在最初MRI检查后至少6个月未获得病理诊断结果或随访图像;④有其他恶性肿瘤病史者。
1.2 仪器与方法 采用Philips Ingenia 3.0T MRI 扫描仪,患者检查前禁食7~8 h,扫描前3 min 进行屏气训练,取仰卧位,扫描范围自膈顶至双肾下极。常规轴位和冠状位 T2WI 扫描采用 TSE T2WI SPAIR 序列;同反相位T1WI 采用Dixon 技术,DWI序列选择b=0、10、100、200、500、800、1000、1500 s/mm2;经肘静脉团注GD-EOB-DTPA,剂量0.1 ml/kg,注射流速1 ml/s;追加生理盐水20 ml,注射流速2 ml/s。注入对比剂后20 s、50 s、15 min分别采集动脉期、门静脉期及肝胆期图像。各序列扫描参数见表1。
表1 Gd-EOB-DTPA增强MRI 扫描参数
1.3 LI-RADS评分 由2名放射科主治医师采用独立盲法,在未知患者临床信息、影像报告及病理结果的情况下,对所有MRI 图像进行解读(阅片者1和阅片者2,分别具有8年和5年腹部MRI诊断经验),按照LI-RADS v2018 版标准观察所有病灶的主要征象和辅助征象,并进行分类。由另一位阅片者记录病变的部位、大小,如果存在多个病灶,通过肝段或其他空间信息对每一病灶进行相对应的编号(最多不超过3个)。病灶最大直径在边界清楚的序列上评估(除外动脉期和DWI 图像)。LI-RADS v2018 将具有HCC高危因素患者的肝脏局限性病变分为以下几类:LR-1(肯定为良性)、LR-2(可能为良性)、LR-3(良、恶性的可能性均等)、LR-4(可能为HCC)和LR-5(肯定为HCC),LR-M(可能或肯定为非HCC 的其他恶性肿瘤),LR-TIV(肯定为静脉内瘤栓)。LR-3、LR-4、LR-5 详细评分标准见表2。
表2 LI-RADS v2018 诊断HCC 评分标准
1.4 统计学方法 应用SPSS 25.0 及Medcalc 19.20软件,正态分布的连续变量用表示。采用Kappa检验评估阅片者之间LI-RADS分类判读结果的一致性。分别以LR-5、LR-4 联合LR-5 作为预测HCC 的截断值,计算诊断HCC 的敏感度、特异度、准确度、阳性预测值、阴性预测值及受试者工作特征(ROC)曲线下面积。采用McNemar 配对χ2检验,比较LR-5、LR-4 联合LR-5 截断值下敏感度、特异度、准确度、阳性预测值、阴性预测值的差异;采用Z检验比较ROC曲线下面积的差异,P<0.05为差异有统计学意义。
2 结果
2.1 病灶情况 共分析165个病灶,病灶大小6~175 mm,平均(47.8±36.2)mm。其中恶性病灶110例,均获得病理证实,包括HCC 病灶87例,其他肝脏恶性肿瘤病灶23例(其中1例为肝脏神经内分泌癌,1例为混合型肝癌,1例为中间型性纤维母/肌纤维母细胞瘤,20例为胆管细胞癌);良性病灶55例,其中获得病理证实6例肝局灶性结节性增生,4例肝腺瘤,3例炎症性病变,12例为海绵状血管瘤;其余良性病灶均随访至少2年。
2.2 LI-RADS分类结果及阅片一致性 以最终病理结果为“金标准”,分类LR-1、LR-2、LR-3、LR-4、LR-5、LR-M、LR-TIV 时,阅片者1和阅片者2分类结果中HCC 所占比例见表3。分类为LR-1 时HCC可能性为0,分类为LR-3 时有可能为HCC,分类为LR-4、LR-5 时HCC 的可能性较大。LR-3、LR-4 和LR-5 的HCC 影像学资料见图1~3。2名阅片者LI-RADS v2018 评分的诊断结果一致性较好(Kappa=0.792,95%CI0.743~0.842)。
表3 LI-RADS v2018分类结果及各类肿瘤所占比例[例(%)]
2.3 HCC 诊断效能 2名阅片者LI-RADS评分对HCC 的诊断效能及ROC曲线下面积见表4。以LR-5为截断值时,诊断HCC 的特异度、阳性预测值较高(P<0.05);以LR-4 联合LR-5为截断值时,诊断HCC的敏感度、准确度和阴性预测值较高(P<0.05)。LR-4联合LR-5 与单独LR-5 诊断HCC 相比,ROC曲线下面积相对更高(阅片者1为0.83 和0.78,P=0.05;阅片者2为0.82 和0.73,P<0.05)。
图1 男,54岁,HCC(LR-3)。A~H依次为T1WI、T2WI 抑脂序列、DWI、ADC、T1WI增强扫描动脉期、门静脉期、肝胆特异期图像及病理图。肝右叶可见一最大直径为19 mm 的病灶(箭),动脉期非环形高强化(E),静脉期无强化包膜及非周边廓清(F),存在T2 高信号(B)、DWI 高信号(C)、ADC 低信号(D)、肝胆期低信号(G)等辅助征象,病理结果提示肝细胞癌(HE,×100,H)
图2 男,59岁,HCC(LR-4)。A~H依次为T1WI、T2WI 抑脂序列、DWI、ADC、T1WI增强扫描动脉期、门静脉期、肝胆特异期图像及病理图。肝右叶可见一最大直径为18 mm 的病灶(箭),存在动脉期非环形高强化(E)、包膜强化(F)2个主要征象,存在T2 高信号(B)、DWI 高信号(C)、ADC 低信号(D)、肝胆期低信号(G)等辅助征象,病理结果提示肝细胞癌(HE,×100,H)
3 讨论
与其他肿瘤不同,HCC 可直接通过影像学检查确诊,无需病理学证实。LI-RADS评分标准规范化了CT/MRI诊断具有HCC 高风险患者病变影像征象的解读,更有利于影像医师之间、影像医师与临床医师之间以及不同医院之间的交流[10]。在临床实践过程中,该标准经过不断修正,2018年进行最新修订,取消了LR-5g、LR-5us 的分类,同时简化了LR-5 的分类和阈值增长的定义[5]。新修订的LI-RADS v2018 对HCC的诊断效能以及各分类之间评判的一致性还需要进一步验证。
Lee 等[11]研究显示,LR-1、LR-2为HCC 的可能性为0,LR-3、LR-4、LR-5、LR-TIV、LR-M为HCC的可能性分别为31%、64%、95%、54%、33%。本研究结果发现,LR-1、LR-3、LR-5分类中HCC 所占比例基本与上述研究相符,LR-2 和LR-4分类中HCC所占比例高于该研究,其原因可能是由于纳入研究对象的地域差异及总病例中良恶性比例的差异所致。
图3 男,70岁,HCC(LR-5)。A~H依次为T1WI、T2WI 抑脂序列、DWI、ADC、T1WI增强扫描动脉期、门静脉期、肝胆特异期图像及病理图。肝左叶可见一最大直径为45 mm 的病灶(箭),存在动脉期非环形高强化(E)、迅速廓清(F)2个主要征象,存在T2 高信号(B)、DWI 高信号(C)、ADC 低信号(D)、肝胆期低信号(G)等辅助征象。病灶中央可见斑片状坏死区域(星号)。病理结果提示肝细胞癌(HE,×100,H)
表4 2名阅片者LI-RADS v2018 评分对HCC 的诊断效能评价(%,95% CI)
本研究结果显示,2名阅片者LI-RADS v2018分类结果的一致性较高,与文献报道基本一致[12-14]。杜婧等[15]研究发现2018版与既往版本LI-RADS阅片者间评分结果的一致性存在差异,可能是由于既往版本对于HCC 特异性征象的界定不严格,因而影响了分类结果的准确性。此外,LI-RADS v2018 对LR-5分类及阈值增长的定义进行简化,使得分类更简便、统一,因此分类结果一致性较好。
当LI-RADS分类为LR-5 时可以认为不需要进行肝活检而直接确诊为HCC[16-17],表明LR-5 诊断HCC的特异度较高。本研究结果显示,以LR-5 作为预测因子时,2名阅片者诊断HCC 的特异度和阳性预测值均较高,可达90%以上;以LR-4 联合LR-5 作为HCC 的预测因子时,2名阅片者诊断HCC 的特异度和阳性预测值降低(P<0.05)。Nakao 等[17]研究发现,Gd-EOB-DTPA增强MRI 以LR-5 诊断HCC 时阳性预测值为92.0%;LR-4 联合LR-5 预测HCC 的阳性预测值为91.2%,与本研究结果基本一致。此外,以LR-5 作为预测因子时,诊断HCC 的敏感度较低(阅片者1:62.07%,阅片者2:51.72%),以LR-4 联合LR-5 作为预测因子时,敏感度有所提高(阅片者1:75.86%;阅片者2:74.71%),与Kim 等[18]的研究结果基本相符,LR-5诊断HCC的敏感度为62.1%,LR-4 联合LR-5 诊断HCC 的敏感度为88.4%。因此,LR-5 作为预测因子时诊断HCC 的特异性较高,而LR-4 联合LR-5 时诊断HCC 的特异度相对减低,但敏感度更高,其原因为LI-RADS评分被设计为以HCC 的敏感性为代价,最大化HCC 的特异度,这在以肝移植为主要治疗选择的地区(如欧洲、北美等)具有重要意义,它需要与组织病理学诊断相当的高特异度才能最大程度地利用器官,从而避免将移植肝脏误分配给误诊HCC 的患者。当需要进行局部治疗时(亚洲等地区),可首选LR-4 和LR-5 联合诊断的评价方法,诊断敏感度更高[19]。因此,当考虑到临床环境的区域差异时,LI-RADS 可以与不同诊断标准结合使用,从而选择不同的治疗方式。
LR-M 被定义为极有可能代表恶性肿瘤,但无HCC特异性的影像学特征[5],病理类型大多为胆管细胞癌(intrahepatic cholangiocarcinoma,iCCA)或混合型肝癌(hepatocellular cholangiocarcinoma,cHCC-CCA)。按照LR-M分类表明该类病灶可能需要进行活检以建立明确的诊断,在这种情况下,需要较高的敏感度而非特异度。对比既往LI-RADS v2014 和v2017 的研究中,LR-M 病变中HCC 的比例高达37%[20],高于本研究,表明其诊断特异度并不高,这一结果在以肝移植为主要治疗选择的国家更为多见,因此与本研究结果有所差异,其原因为iCCA、cHCC-CCA患者接受原位肝移植术后的复发率较高,且预后较差,与被错误分类为LR-M 的HCC 进行活检相比,将iCCA 或cHCC-CCA 错误分类为LR-5 可能会导致移植错配而浪费移植资源[21],因此会出现LR-M分类中HCC 比例较高的情况。
本研究的局限性:①本研究为回顾性分析,仅纳入接受Gd-EOB-DTPA增强MRI检查的患者,选择上存在偏倚,且无法与增强CT 等其他检查方式的诊断结果进行比较,因此需要前瞻性设计进一步研究;②部分患者的最终病理诊断为穿刺所得,存在取样误差;③应用LI-RADS评分时未使用“阈值增长”的主要征象,临床上诊断HCC 时评估阈值增长十分重要,但本研究大部分怀疑恶性病变的患者检查后即接受穿刺或手术治疗,因而无法获得该征象的判断,也无法与LI-RADS v2017 评估结果进行对比;④本研究为单中心数据,且样本量有限,且尚未对各主要征象的一致性进行分析,未来还需要更大样本量数据进行验证;⑤本研究显示阅片者1以LR-4 联合LR-5 诊断HCC 与LR-5 诊断HCC 相比,ROC曲线下面积无显著差异,但有升高趋势,且阅片者2结果有显著差异,可能与样本量不足、诊断医师经验等有关。
总之,LI-RADS v2018 在HCC 诊断方面具有一定的临床应用价值:当以LR-5 作为预测因子时,诊断特异度及阳性预测值较高,但敏感度、准确度与ROC曲线下面积较低;当以LR-4 联合LR-5 作为预测因子时,特异度与阳性预测值有所减低,但敏感度、准确度、ROC曲线下面积相对增加,结合临床不同需求可选择不同的预测因子。此外,基于Gd-EOB-DTPA增强MRI的LI-RADS v2018 评分阅片者间的一致性较好,但还需要多中心、大样本研究验证与推广,本研究为推进HCC 诊断的规范化和标准化提供了一定的基础。