对比增强超声肝脏影像报告及数据管理系统对肝脏局灶性病变的一致性研究
2022-07-18何年安叶显俊李梦雪
房 静,何年安,叶显俊,胡 蕾,李梦雪,金 富
(安徽医科大学附属省立医院超声医学科 安徽 合肥 230000)
近年来全球肝癌的发病率有所下降[1],而在我国,原发性肝癌的发病率及死亡率高,位居全球第一[2]。其中,肝细胞肝癌(hepatocellular carcinoma,HCC)最常见。根据肝癌相关指南[3],HCC 可以依靠影像学检查与实验室检查相互联合进行诊断。所有影像诊断中,超声的诊断存在较大的操作者依赖[4]。2016 年由美国放射学会提出了对比增强超声肝脏报告和数据管理系统(contrast-enhanced ultrasound liver imaging reporting and data system,CEUS LI-RADS),旨在规范化HCC 的CEUS诊断[5],那么它能否减少操作者依赖性对诊断准确性的影响,本研究对此进行了相关分析,报道如下。
1 资料与方法
1.1 一般资料
选取2016 年1 月—2021 年1 月在安徽医科大学附属省立医院就诊的肝脏局灶性病变患者70 例为研究对象,共计81 个病灶。70 例患者中男性53 例,女性17例,年龄为27 ~85 岁,平均年龄为(56.00±4.94)岁,病变的最大直径范围为12 ~105 mm,平均直径为(42.50±21.40)mm。确诊为良性的病灶20 例,包含1 例肝囊肿,1 例局部脂肪浸润,3 例FNH,4 例肝脓肿,4 例肝硬化结节,7 例血管瘤;HCC 有20 例;非HCC 的恶性肿瘤30 例,其中15 例为肝转移癌,15 例为ICC。HBsAg 阳性的有26 例,CA19-9 阳性的有17 例,AFP 阳性的有25 例。
纳入标准:①经手术或穿刺病理明确诊断局灶性病变性质的患者;②临床资料完整,术前行常规US、多普勒US 及CEUS 检查,并且能够明确观察到HCC 各个造影时期变化者;③患者行CEUS 检查前未行肝脏手术与介入治疗者。排除标准:①无明确病理结果患者;②病情危重无法获取完整图像或对超声对比剂过敏者;③有肝脏治疗史者。
1.2 方法
使用迈瑞Resona 7 彩色多普勒超声显像仪进行诊断,宽频凸阵探头,频率(1 ~5)MHz,选用成人腹部模式。造影剂选用意大利Bracao 公司生产的SonoVue(声诺维)。选取合适的切面,进入CEUS 模式。造影时抽取1.5 mL的造影剂混悬液,经肘静脉快速推注,在造影剂开始注射时立即开始开启计时器,同时录制动态视频。根据相关指南,将病变的CEUS 时相标准[6]分为动脉期、门脉期及延迟期。两名高年资组(>10 年)和两名低年资组(<5 年)医师分别在对患者所有检查结果均未知的情况下,采用2017 年ACR 推出的CEUS LI-RADS 分类标准[7]及诊断原则,将不同肝局灶性病变分为LR-1 ~5 及LR-M 类。
1.3 统计学方法
采用SPSS 22.0 统计软件分析数据,以病理学或随访数据为标准,进行处理并生成交叉表,分析结果。应用Kappa 检验分析不同年资组超声医师间诊断的一致性。
2 结果
2.1 高年资组及低年资组间CEUS LIRADS 分类情况
高年资组间CEUS LI-RADS 的分类情况见表1,低年资组间CEUS LI-RADS 的分类情况见表2。高年资组间的一致性较强,Kappa 值为0.741,两位医师共有12例分类诊断结果不一致。经讨论协商最终确定分类结果后,应用LR-3 作为分层诊断指标的阳性预测值、阴性预测值分别为92.6%,100.0%,准确度为94.3%,敏感度为100.0%,特异度为80.0%。应用LR-4 作为分层指标的阳性预测值及阴性预测值分别为94.4%,100.0%,应用LR-4 作为分层指标阳性预测值更高,它的准确度为95.7%,敏感度为100.0%,特异度为85.0%。应用LR-5作为良恶性分层指标的阳性预测值、阴性预测值、准确度分别为94.1%、89.5%、92.9%,敏感度及特异度分别为96.0%,85.0%。低年资组的Kappa值为0.697,一致性较强,两位低年资超声科医师共有14 例分类诊断结果不一致。
表2 低年资组间CEUS LI-RADS 的分类情况 单位:例
2.2 高年资组与低年资组应用CEUS LI-RADS 分类诊断的一致性
高年资组与低年资组分类诊断的情况见表3,两者间的诊断Kappa值为0.656,共有16 例分类情况不相同。结合数据分析,低年资组更倾向于将良性结节分为LR-2 类,且低年资组相较于高年资组对不确定性质的结节分类更高。低年资组医师应用LR-3 作为良恶性分层诊断标准的阳性预测值、阴性预测值、准确度分别为89.3%,100.0%,91.4%,敏感度和特异度分别为100.0%,70.0%,应用LR-4 作为分层指标的阳性预测值、阴性预测值、准确度、敏感度和特异度阳性预测值分 别 为92.6%、100.0%、94.3%、100.0% 和80.0%, 应用LR-5 作为良恶性分层指标相应数值分别为98.0%、94.4%、85.7%、98.0%和85.0%。
表3 高年资组与低年资组应用CEUS LI-RADS 分类诊断的情况单位:例
3 讨论
本研究中的2 名高年资组医师间应用CEUS LIRADS 对肝脏局灶性病变患者分类的Kappa值为0.741,两者间的一致性较强。这与SCHELLHAAS B[8]所研究得出的0.309 不同,但接近另一研究[9]的0.606,与LING WW[10]的0.690 处于同一分类。结合实验条件分析可能与2 名超声诊断医师的工作年资有关[11]。本研究的2 名超声诊断医师工作年资为10 年以上,经验丰富,对肝脏局灶性病变的判断更为准确。本研究中的低年资组间诊断的Kappa值为0.697,一致性也较强,这也有可能是对CEUS LI-RADS 的掌握程度有关,本研究中的2 名低年资组医师均进行了指南研读培训,对CEUS LI-RADS 指南较为熟悉。
比较高年资医师与低年资组医师的诊断信息后我们发现,高年资医师的诊断阳性预测值更高,通过对比CEUS LI-RADS 分类情况与病理结果我们可以发现,对于性质不定,存在争议的结节,低年资组更倾向于将其划分为更高的等级,这虽然降低了漏诊的风险,但是诊断的阳性预测值也有所下降。本研究最后得出低年资医师与高年资医师之间诊断的一致性较强(Kappa值为0.656)。这说明应用CEUS LI-RADS 减少了高年资与低年资组因经验丰富程度不同导致的误差,应用此标准可以较好地减少观察者间的差异性。说明应用CEUS LI-RADS 可以减少不同超声诊断医师对肝脏局灶性病变诊断的差异,有利于不同医师之间的沟通交流。
结合两位高年资医师的诊断数据,我们可以看到,2名超声诊断医师进行分类时,共有12 例存在争议,其中有5 例是对于LR-2 类与LR-1 类的划分有差异。进行资料翻阅回顾后我们发现这5 例均为良性结节,病理结果分别为2 例肝硬化结节,1 例肝脏局灶性结节增生(focal nodular hyperplasia of liver,FNH),1 例血管平滑肌脂肪瘤及1 例经穿刺病理明确为良性病变,但因取样标本较少,不能明确其病变类型的结节。这2 例肝硬化结节均在动脉期表现为低增强,于门脉期及延迟期表现为等增强。肝硬化结节的CEUS 典型特征表现[12]为动脉期、门脉期及延迟期均与肝实质增强程度相等。本研究中,虽在动脉期结节表现为低增强,但结合患者结节大小我们可以发现,2 例结节的直径偏大,考虑为内部轻度缺血所致。由于结果存在争议,故1 位高年资超声诊断医师将其分为LR-2 类。1 例FNH,结节最大直径约为100 mm,在动脉期快速高增强,门脉期及延迟期与肝实质相比仍为高增强,未见明显减退。本例FNH 表现并不典型,但由结节始终为高增强可诊断其为良性结节,最终参照CEUS LI-RADS 所说的提示良性,但并不能定性为良性,分为LR-2 类。本研究中的肝血管平滑肌脂肪瘤表现为动脉期高增强,门脉期及延迟期呈等增强,由于结节状增强特征并不明显,故需要协商。另有6 例恶性病灶的分类不同,分析其原因可能与不同医师在廓清时间上存在争议导致结节被错误分级,针对此现象我们建议使用超声诊断仪的CEUS 定量分析软件对肝脏局灶性结节内造影剂廓清时间及程度进行明确的划分,以减少这一误差。
尤其需要注意的是,本实验中存在2 例FNH 及1 例肝脓肿被划分恶性肿瘤类别里(LR-5 及LR-M 类)。这2例FNH 均在动脉期表现为高增强,门脉期减退,与FNH的典型表现[13]不符。这可能与FNH 内部的血供尚未完全形成所致。另1 例肝脓肿在动脉期出现了快速整体高增强,门脉期减退。结合CEUS 图像表现情况我们可以看出这例患者应当处于炎症早期,这一时期肿块内部的血管受炎症浸润较严重[14],图像可能因此表现不典型。
我们分别对不同年资组用LR-3 类或LR-4 类作为分层诊断标准进行研究,发现不论年资高低,应用LR-4类对肝脏恶性肿瘤诊断的准确度更高。本研究受条件限制,样本量不足,无法确定LR-3 类中HCC 的占比问题,但我们通过查阅文献发现,LR-3 类中恶性肿瘤占11.5%~47.0%,因此它的危险度较低。将LR-4 作为分层诊断的准确度更高。
同时,本试验还存在一些不足,如样本数据少,没有探究高年资组医师对结节动脉期与门脉期的增强、消退方式是否具有一致性,且本研究为一项回顾性的分析研究,可能存在因病理数据不明造成数据偏倚的情况,还需要大样本量的前瞻性研究对此进行验证。
综上所述,CEUS LI-RADS 是一种可以对肝脏局灶性病变进行较好分类的诊断标准,观察者间的一致性较好,受操作者经验影响相对小,在未来将会得到更广泛的应用。