磁共振成像三维纹理特征结合临床参数放射组学模型评估肝细胞癌术后早期复发的初步研究
2018-09-13王敏,宋彬
王 敏,宋 彬
四川大学华西医院放射科,四川 成都 610041
肝细胞癌(hepatocellular carcinoma,HCC)是最常见的肝脏原发性恶性肿瘤,在世界范围癌症死亡相关疾病中位列第2[1]。截至2015年,中国HCC发病率位列第4,死亡率位列第3。早期复发是影响患者术后生存率至关重要的因素,大肝癌术后5年复发率达80%,小肝癌为40%~50%,复发高峰在术后1~2年。因此,准确预测术后早期复发是改善患者总体生存的基础。
目前用于评估HCC患者术后早期复发的研究多为单因素研究,HCC术后早期复发是肿瘤因素、背景肝脏因素及全身状态综合作用的结果,因此仅将某一独立危险因素作为评估预后的指标,结果通常不准确。而将三者联合起来应用于HCC预后评估的预测模型较少,临床普遍应用的是巴塞罗那临床肝癌分期(Barcelona Clinical Liver Cancer,BCLC)系统,其优势在于将背景肝功能储备、肿瘤因素及全身状态等综合起来进行评估,预测效能较高。但对于我国多数HCC患者而言,BCLC分期尚存在一些不足:首先,患者就诊时已属中晚期,且肿瘤多>5 cm,BCLC分期并不适用于此类患者,然而此类患者接受手术切除后同样获益。此外,BCLC分期中尽管提到了肿瘤对大血管的侵犯,但是肿瘤微血管侵犯是导致HCC术后早期复发的另一独立危险因素,只有依赖术后病理显微镜检查才能做出诊断,BCLC分期会低估此类患者术后早期复发的风险。因此,有必要在BCLC分期的基础上进一步建立更加适合我国HCC患者预后的预测模型。
影像组学旨在通过包含疾病病理生理信息的高维度影像组学特征,最大限度地挖掘医学影像对疾病诊断的潜力[2]。目前已广泛应用于乳腺癌、肺癌等患者的预后评估,但是针对HCC预后的研究较少。Zhou等[3]和Akai等[4]发现,HCC的CT纹理特征可以作为预测HCC术后早期复发的预测指标,表明这些不可见的纹理特征中确实包含肿瘤的预后信息。Zhou等[3]同时发现,纹理特征结合临床特征预测肿瘤术后早期复发的准确性显著高于单独使用纹理特征。以上两项研究均采用基于肿瘤单独层面的二维CT纹理特征,而相比于CT,磁共振成像(magnetic resonance imaging,MRI)有更好的软组织分辨率。本研究采用了基于肿瘤整体的三维纹理(threedimensional texture,3D-texture)特征,更能全面、客观地反映肿瘤的异质性。本研究旨在通过机器学习的方法,将肿瘤的MRI 3D-texture特征与临床参数结合起来构建预测模型,对术后早期复发进行初步探讨。
1 资料和方法
1.1 纳入患者
将纳入的患者按照建立预测模型的要求分为回顾性与前瞻性两部分,纳入标准见图1。首先,回顾性地从2013年12月—2015年7月213例术后病理诊断为HCC的患者中纳入98例,用于构建模型和训练模型;其次,前瞻性地选取2015年12月—2017年12月215例临床诊断为HCC的患者,最终纳入83例,术后病理为HCC,前瞻性患者用于验证预测模型的诊断效能。
1.2 临床参数
与HCC术后早期复发有关的临床参数有患者年龄、性别、慢性乙型肝炎、肝硬化、血小板计数(blood platelet count,PLT)、淋巴细胞绝对值(LYMPH)、PLT/LYMPH、天门冬氨酸氨基转移酶(aspartate transaminase,AST)、丙氨酸氨基转移酶(alanine transaminase,ALT)、谷氨酰转肽酶(glutamyl-transpeptidase,GGT)、总胆红素(total bilirubin,TBL)、血清白蛋白(albumin,ALB)、肿瘤大小、病理分化程度和微血管侵犯(micro-vascular invasion,MVI);MRI图像包括肿瘤边缘、包膜、肿瘤内脂肪、肿瘤外周强化、肿瘤内动脉、肝动脉期快速强化、门静脉期廓清和门静脉大分支侵犯。
1.3 MRI扫描参数
采用西门子Trio平扫:扫描范围由膈顶至肝脏消失层面。检查序列包括:① FSPGR同反相位T1WI,重复时间(repetition time,TR)为81.0 ms,回波时间(echo time,TE)为1.4 ms/2.42 ms,层厚/层间距为6.0 mm/2.7 mm,激励次数(number of excitation,NEX)为1,视野(field of view,FOV)为400 mm×325 mm,采集矩阵为286×352,反转角70°;② FSEFS序列常规轴位T2WI,采用呼吸促发技术,并于轴位T2WI施加预饱和脂肪抑制技术获得轴位抑脂T2WI,TR/TE为2 160 ms/100 ms,层厚/层间距为6.0 mm/2.7 mm,NEX为1,FOV为433 mm×325 mm,采集矩阵为320×216。
增强扫描:三维容积式内插值法屏气检查序列(volumetric interpolated breath hold examination,VIBE),简称3D VIBE序列,并于轴位VIBE T1WI施加预饱和脂肪抑制技术获得轴位抑脂T1WI。TR/TE为4.0 ms/1.9 ms,层厚/层间距为2.0 mm/0.4 mm,NEX为1,FOV为400 mm×296 mm,反转角9°。扫描范围与平扫一致,采用高压注射器注射对比剂,运用腹带减少呼吸干扰,对比剂注射剂量0.1 mmol/kg,速率2 mL/s。注射对比剂后15、55 s分别行VIBE双期扫描,分别获得动脉期(arterial phase,AP)和门静脉期(portal venous phase,PVP)图像,16 s扫完1次肝脏。
图 1 回顾性和前瞻性患者入组流程图
1.4 MRI 3D-texture特征提取
首先,基于全肿瘤的图像分割,将AP、PVP图像导入ITK-SNAP软件,手动逐层勾画肿瘤,肿瘤的边界参照T2WI脂肪抑制序列,尽可能避开出血和坏死区域。肿瘤边界、出血和坏死区域由放射科2位腹部诊断医师按照LI-RADS 2017版指南[5]达成共识后,由第3位医师勾画。然后,将分割好的图像导入AK软件进行纹理特征的提取。
1.5 统计学处理
1.5.1 预测模型特征筛选
按照多变量回归的要求,样本量至少应是自变量的10倍左右[6],对患者临床参数和肿瘤MRI 3D-texture特征均采用数据去冗余和Lasso回归进行特征的选择。数据去冗余对纳入特征的相关性进行分析,当两特征间相关系数(Pearson系数)≥0.7时,特征之间为高相关,然后递归地对其中一个特征进行剔除。再将去冗余后的数据进一步纳入Lasso回归模型中,用向前(LR)法进行多变量分析。通过设定调整参数λ,3折交叉验证时,误差最小的log(λ)值即Lasso回归最优λ值,此时对应的非零系数特征即用于建立预测模型的有意义的特征。
1.5.2 构建预测模型
将筛选出的临床参数特征和3D-texture特征分别用于建立临床参数预测模型、影像组学模型和临床参数结合影像组学的综合模型。以患者实际复发状态为参考标准,经受试者工作特征(receiver operating characteristic,ROC)曲线计算3个模型预测HCC术后早期复发的准确率(accuracy,ACC)、灵敏度及特异度。统计学分析软件为R软件3.4.2。
2 结 果
2.1 患者基线资料
98例回顾性患者中,男性88例,平均年龄(53.8±10.7)岁,女性10例,平均年龄(48.2±15.4)岁,其中早期复发患者45例(45.9%);83例前瞻性患者中,男性66例,平均年龄(51.4±9.6)岁,女性17例,平均年龄(47.2±12.9)岁,其中早期复发患者43例(51.8%)。全部HCC患者均于MRI检查后3~5 d在四川大学华西医院接受手术切除治疗,病理学检查于术后1周证实为HCC。回顾性患者与前瞻性患者临床实验室检查结果见表1,影像征象见表2。
2.2 预测模型特征选择
临床参数特征包括实验室检查结果和MRI征象共计23项特征,数据去冗余后LYMPH、PLB/LYMPH及肿瘤内动脉3项参数被剔除,剩余20项特征,进而经Lasso回归后剩余的8项特征为意义显著的特征(图2)。每例患者AP和PVP序列各提取出的纹理特征为385项,经数据去冗余和Lasso回归后最终筛选出的特征分别为6项和2项。
2.3 3个预测模型对HCC术后早期复发的预测效能
AP-3D-texture Radiomics signature=-3.81×10-1GLCM Entropy_angle90_offset1+2.81×10-4Inertia_angle135_offset4-1.07×104correlation_All Direction_offset7_SD+2.57×10-9HaralickCorrelation_AllDirection_offset7_SD-16.6 HaraEntroy-4.72×10-4Long Run High Grey Level Emphasis_AllDirection_offset4_SD+17.6。训练集中AP-3D-texture模型预测早期复发的ACC为0.735,ROC曲线的曲线下面积(area under curve,AUC)为0.759;验证集中ACC为0.735,AUC为0.769;测试集中ACC为0.651,AUC为0.669(图3)。
训练集中PVP-3D-texture模型预测早期复发的ACC为0.721,AUC为0.591;验证集中ACC为0.367,AUC为0.498;测试集中ACC为0.402,AUC为0.560。结果表明,PVP-3D-texture模型对HCC切除术后早期复发无预测价值(图4)。
将临床参数与AP-3D-texture相结合,在训练集中评估HCC术后早期复发的ACC为0.838,AUC为0.876;验证集中ACC为0.833,AUC为0.864;测试集中ACC为0.663,AUC为0.656(图5)。3D-texture与临床参数综合后的模型为:Radiomics signature combined=-0.053 3+0.961 5×Rad_score_AP+1.138 7 clinical signature。其中clinical signature=-20.126+1.596×MVI+0.222×肿瘤大小+病理分化程度+0.766×肝硬化-0.111×肝边缘状态-1.175×肝包膜完整状态+17.013×动脉期快速强化-1.103×门静脉期廓清。
表 1 回顾性、前瞻性HCC患者临床基线资料[n(%)]
表 2 回顾性与前瞻性HCC患者MRI影像特征[n(%)]
图 2 训练集患者lasso法决定最优调整参数λ和特征筛选过程
图 3 AP-3D-texture模型在训练集、验证集、测试集中评估HCC术后早期复发的预测效能
图 4 PVP-3D-texture模型在训练集、验证集、测试集中评估HCC术后早期复发的预测效能
图 5 临床参数结合肝动脉期纹理特征综合评估HCC术后早期复发的预测效能
3 讨 论
导致HCC术后早期复发的因素众多,主要归纳为患者相关因素、背景肝脏因素及肿瘤异质性因素3个方面,应将这些因素综合起来对HCC术后早期复发进行预测。而且当预测变量的个数显著高于样本量时已超出传统医学统计学的范畴,而机器学习可以对回顾性数据特征学习后对前瞻性数据中与之类似的特征进行预测。本研究采用监督学习算法对术后早期复发的HCC患者MRI纹理特征、临床参数进行学习,进而前瞻性地预测HCC患者术后的早期复发。
纹理是一种视觉感知的图像局部特征的综合,图像某一位置的纹理特征与这一位置周围的灰度变化规律密切相关[7],而纹理分析则是对每个像素强度和空间分布的特点进行数学分析与运算以量化评估图像异质性的一种工具。恶性肿瘤的生物学异质性与纹理异质性有一定的相关性[8]。基于此相关性,有研究发现肿瘤内部的CT纹理特征可用于评估肿瘤的异质性[9-10]。本研究中,PVP-3D-texture对HCC术后早期复发无预测价值,确切机制尚不清楚。AP-3D-texture模型在训练集和验证集的预测效能如下,AUC分别为0.759和0.769,ACC均为0.735,低于Zhou等[3]报道的研究结果,可能是由于本研究用于建模的样本例数(45例)少于文献中的建模例数(102例)。其次,不同图像模式的纹理特征的预测效能是否存在差异尚未见文献报道,但表明一个趋势,即MRI AP-3D-texture模型同样具有预测HCC患者术后早期复发的价值。在AP-3D-texture模型的6个纹理特征中,entropy是熵,为基于灰度共生矩阵提取出的特征,描述了共生矩阵的复杂性,其值越大则表示共生矩阵越复杂,提示病灶越复杂,异质性越大。Inertia是惯性,描述病灶部位的差异性大小,差异越大,则其值也越大。Correlation是相关性,它度量空间灰度共生矩阵元素在行或列方向上的相似程度,其值大小反映图像中局部灰度相关性,即反映图像纹理的一致性。如果图像中有水平方向纹理,则水平方向共生矩阵correlation值大于其余方向共生矩阵correlation值。当矩阵元素值均匀相等时,correlation值大;相反,如果矩阵像元值相差很大,则correlation值小[11]。Long run high grey level emphasis描述的是病灶局部的明暗程度和复杂程度,基于游程矩阵提取。游程矩阵反映的不再是图像内每一对像素间的空间和像素灰度的相关性,而可以表征图像中感兴趣区(region of interest,ROI)内一组像素间的灰度相关性,进而评估ROI的纹理异质性[12-13]。Inertia和correlation这两个纹理特征反映病灶局部像素灰度差异性的大小,不同的是Inertia值越大,局部差异越大,correlation值越大,局部差异越小。本研究中inertia与术后早期复发具有正相关性,而correlation则相反,表明复发患者肿瘤MRI肝动脉期图像局部像素相差很大,图像异质性大,强化不均匀,符合分化程度低的HCC的肝动脉期强化方式。然而,本研究并不能解释entropy值与术后早期复发负相关的机制。尽管Kiryu等[14]通过平扫CT纹理特征评估HCC患者预后时,同样发现entropy值与患者的总体生存期和无瘤生存期呈负相关,但并未就此机制给予阐述。另外,本研究是注射对比剂后强化图像,与平扫CT图像的entropy应有很大不同,有关entropy与术后复发的机制有待进一步深入研究。
将AP-3D-texture与临床参数综合后,在训练集与验证集中的预测效能明显提高,符合HCC术后早期复发是患者相关因素、背景肝脏因素及肿瘤异质性因素综合作用的假设。当肝硬化患者肿瘤存在MVI、直径较大、肿瘤边缘分叶、边界不清及病理分化程度较低时,术后更容易早期复发。MVI占有更大的权重,因为MVI阳性会导致切缘不足,于癌旁肝组织残留微小转移灶是导致术后早期复发的原因[15]。Hanazaki等[16]也认为,肝硬化程度、Child分级和靛氰绿代谢率等背景肝脏因素,以及病理分型、血管浸润等肿瘤因素等均可影响HCC术后复发。
此外,为了验证模型预测效能的可靠性,在施加内部验证的同时进行了外部验证。该模型在外部验证的前瞻性患者中效能低下,主要是由于回顾性和前瞻性的样本量偏少,两个数据集中具有共性的特征偏少,使得训练集生成的模型在前瞻性患者中的预测效能减低。
本研究存在以下不足:首先,训练集样本量偏少,会影响机器学习模型预测的效能,在后续的研究中会进一步增加训练集样本量,改善模型在测试集中的效能;其次,对回顾性和前瞻性HCC患者的肿瘤直径未进行分层分析,但肿瘤直径是影响HCC患者术后早期复发的因素之一。尽管存在上述不足,本研究首次采用3D-texture,更加客观地反映了肿瘤异质性,结合临床参数,可以作为术前预测HCC早期复发的一种有效方法。