临床、CT影像组学及融合模型预测肝细胞癌分化程度

2021-07-27曾凤霞刘仁懿陈卫国秦耿耿

中国医学影像技术 2021年7期

曾凤霞，刘仁懿，曾辉，陈卫国，秦耿耿

(南方医科大学南方医院放射科，广东广州 510515)

肝细胞癌(hepatocellular carcinoma， HCC)是全球第二大癌症相关死亡疾病[1]，占原发性肝癌的90%，术后复发率和转移率均较高[2]，5年复发率高达45%～60%[3-4]。分化程度是决定HCC侵袭性的重要因素，低分化HCC易发生转移，预后差，准确预测分化程度有助于早期干预及评估预后[5]。目前主要通过病理组织学检查评价HCC分化程度，而穿刺活检存在并发症风险[6]。作为新兴的医学图像处理方法，影像组学已在肿瘤研究领域显示出巨大潜力[7]。本研究观察临床、CT影像组学及融合模型预测HCC分化程度的效能。

1 资料与方法

1.1 研究对象回顾性分析2014年1月—2019年12月330例于南方医科大学南方医院经病理证实的HCC患者，男284例，女46例，年龄18～87岁，平均(52.5±12.0)岁。纳入标准：①年龄≥18岁；②病理学诊断为HCC，且分化程度明确；③CT检查前未经任何治疗，且与穿刺或手术时间间隔≤3个月；④CT图像质量符合诊断要求。根据HCC分化程度将患者分为高分化组(n=85)、中分化组(n=161)及低分化组(n=84)。检查前患者均签署知情同意书。

1.2 仪器与方法采用Siemens Somatom Definition CT机/Philips Brilliance 64排CT扫描仪。嘱患者仰卧，行上腹部轴位CT平扫，扫描参数：管电压120 kVp，管电流80 mAs，旋转时间0.5 s/0.8 s，层间距0/5 mm，层厚5 mm。之后经肘前静脉以2.0～3.0 ml/s流率注射优维显370对比剂(1.0～1.5 ml/kg体质量)，分别于开始注射后30～35 s、60～65 s、120 s采集动脉期、门静脉期、延迟期CT图像。见图1。

图1 患者男，50岁，低分化HCC A～D.分别为平扫、动脉期、门静脉期及延迟期CT图像，临床模型预测低分化HCC概率为0.33，影像组学模型预测概率为0.56，融合模型为0.61； E.病理图(HE，×400)

1.3 图像分析将CT图像输入至ITK-SNAP软件，由1名具有5年工作经验的放射科医师在不知晓病理结果的情况下针对显示病灶最大层面平扫及增强CT图像勾画ROI并测量或评估病灶基本征象，包括病灶直径、形态、密度、边界及包膜，以及有无肝硬化、静脉内癌栓、胆管扩张、非环状动脉期高强化及非边缘廓清等，并经另1名具有10年以上工作经验的放射科医师确认，意见不一致时经协商达成共识。采用Python 3.7/Pyradiomics 2.2.0/Sklearn 0.20.3等开源软件提取ROI的影像组学特征，并采用t检验、假阳性率检验、主成分分析等方法减少特征冗余。

1.4 临床资料记录血清谷丙转氨酶(glutamic-pyruvic transaminase， GPT)、谷草转氨酶(glutamic-oxaloacetic transaminase， GOT)、甲胎蛋白(alpha-fetal protein， AFP)、总胆红素(total bilirubin， TBIL)、白蛋白(albumin， ALB)及血小板(platelet， PLT)等。

1.5 模型构建与验证将每组HCC患者按3∶1比例随机纳入训练集和测试集。通过10倍交叉验证法训练训练集，并选择评估性能最佳模型，利用测试集数据评估模型预测效能。以局部可解释性技术SHAP(shapley additive explanation)计算每个特征的重要性，SHAP值=原始预测值-删除1个特征后预测值，结果为正数表示该特征支持预测，即该特征与分化程度呈正相关，负数则表示预测不受支持，即该特征与分化程度呈负相关。将筛选得出的影像组学特征、临床资料及CT征象纳入支持向量机，分别构建临床模型(临床资料+CT征象)、影像组学模型(组学特征)及融合模型(临床资料+CT征象+影像组学特征)。

1.6 统计学分析采用SPSS 22.0及Medcalc软件进行统计学分析。以±s表示计量资料，组间比较采用t检验；以频数表示计数资料，组间比较采用独立样本χ2检验。绘制受试者工作特征(receiver operating characteristic， ROC)曲线，计算曲线下面积(area under the curve， AUC)评价各模型的预测效能，AUC>0.90为诊断效能好，0.75

2 结果

2.1 临床资料 3组间性别、年龄、GPT、TBIL及ALB差异均无统计学意义(P均>0.05)。中、低分化组间GOT存在显著差异(t=-2.27，P=0.02)；高、低分化组间PLT存在显著差异(t=2.25，P=0.03)；高分化组与中、低分化组AFP差异均具有统计学意义(P均<0.05)，见表1。

表1 不同分化程度HCC患者临床资料比较

2.2 CT征象 3组间病灶边界及形态差异均具有统计学意义(P均<0.05)；高分化组与中、低分化组间病灶直径、密度及静脉内癌栓情况差异均有统计学意义(P均<0.05)；高、中分化组间肝内胆管扩张情况差异显著(χ2=6.14，P=0.01)；高、低分化组间非动脉期高强化情况差异显著(χ2=4.98，P=0.03)，见表2。

表2 不同分化程度HCC的CT征象比较

2.3 CT影像组学特征共于训练集中提取428个影像组学特征，其中形状特征56个、一阶特征72个、灰度特征140个、纹理特征160个。通过特征筛选及10倍交叉验证后调整模型参数，最终CT影像组学模型共纳入109个特征用于鉴别高、中分化HCC，84个鉴别中、低分化HCC，159个鉴别高、低分化HCC。

2.4 模型效能 3种模型鉴别中、低分化HCC的效能均一般，临床模型AUC为0.58，影像组学模型及融合模型的AUC均为0.64(P均>0.05)，见表3及图2。其中CT影像组学模型鉴别高、中分化HCC，融合模型鉴别高、低分化HCC的AUC最高，分别为0.80、0.88，但与其他模型差异均无统计学意义(P均>0.05)。

表3 各模型鉴别不同分化程度HCC的效能

图2 各模型鉴别不同分化程度HCC的ROC曲线 A.高、低分化HCC； B.高、中分化HCC； C.中、低分化HCC

2.5 筛选特征根据SHAP图(图3)，鉴别高、中分化HCC的前10个重要特征中，6个来自门静脉期组学特征，来自平扫和延迟期各2个；鉴别高、低分化HCC的前10个重要特征中，临床及影像征象各5个。CT影像组学特征中，与分化程度相关性较高者包括灰度区域大小矩阵(gray-level size zone matrix， GLSZM)、灰度共生矩阵(gray-level cooccurrence matrix， GLCM)、灰度依赖矩阵及一阶特征等。AFP水平、边界、密度、形态及表征纹理一致性的GLSZM及表征灰度空间分布特征的GLCM等与分化程度呈正相关，门静脉期病灶灰度值的90%百分位数及中位数等与分化程度呈负相关。

图3 鉴别高、低分化HCC(A)与高、中分化HCC(B)效能最优模型的特征SHAP图(接近红色表示特征值高，接近蓝色表示特征值低)

3 讨论

既往HCC影像组学研究多集中于评价不同类型医学影像学征象与HCC分化程度的关系。YOON等[8]认为HCC强化模式与其分化程度相关，但本研究所见非环状动脉期高强化仅在高、低分化组间具有显著差异，非边缘廓清在各组间均无显著统计学差异，可能与肿瘤异质性及样本差异有关。多项研究[9-10]表明，病灶大小是预测HCC分化程度的重要因素，中分化HCC直径大于高分化HCC；本研究结果与之相符。本研究临床模型对于鉴别高、低分化HCC具有较好效能，但鉴别高、中分化及中、低分化HCC的效能均一般，提示根据肉眼所见影像学征象区分分化程度差异较小的HCC存在局限性。

组学特征可有效评估HCC的生物学特性及预后[11-12]。本研究中，CT影像组学模型鉴别高分化与中、低分化HCC的AUC较高，提示其具有较高效能；融合模型鉴别高、低分化HCC效能较高，但鉴别高、中分化HCC的AUC略低于CT影像组学模型，可能由于纳入了冗余特征，而筛选特征时删去了部分有用特征，导致模型效能降低。本研究3种模型鉴别中、低分化HCC的效能均一般，可能与中分化与低分化HCC恶性程度均较高，其影像学表现差异较小以及样本量有关。

目前支持向量机、随机森林和人工神经网络等机器学习方法均不具有可解释性，导致相应影像组学模型亦缺乏可解释性[13]。本研究采用SHAP技术计算模型纳入特征的重要性，增加了模型的可解释性；AFP水平、病灶边界、密度、形态等在鉴别高、低分化HCC时重要性较高，与既往文献[14]报道相符。CT影像组学特征中，表征纹理一致性的GLSZM、表征灰度空间分布特征的GLCM、反映ROI内像素强度分布的一阶特征与HCC分化程度相关性较高；其中平扫图像中灰度不均匀性与模型输出值呈负相关，即病灶灰度越不均匀，HCC为低分化的可能性越大。本研究SHAP图示门静脉期一阶特征中的灰度第90百分位数值与模型输出值呈负相关，表明对比剂清除越慢，越倾向于高分化HCC。根据影像组学特征可较好地评估肿瘤的异质性，捕捉肉眼不可见的重要信息，为评估HCC分化程度及精准治疗提供理论依据。

综上，本研究构建3种术前预测HCC分化程度模型，在不增加额外扫描时间及费用的前提下获得了较好预测效能，其中临床模型评估高、低分化HCC的效能较高，影像组学模型评估高分化与中、低分化HCC的较能较高，融合模型评估高、低分化HCC的效能较高，提示其有望成为术前评估HCC分化程度提供有效的辅助手段。但本研究样本构成均一性有所欠缺，以中分化HCC居多；仅于病灶最大径层面勾画ROI，缺乏三维影像组学特征信息；且单一模态成像对病灶细节显示不足，有待进一步深入观察。