APP下载

灰阶超声影像组学鉴别肝细胞肝癌与肿块型肝内胆管细胞癌的价值

2020-05-11林莹冯湛蒋国平

中国医学影像学杂志 2020年4期
关键词:灰阶直方图组学

林莹,冯湛,蒋国平

1.浙江大学校医院超声科,浙江杭州 310000;2.浙江大学医学院附属儿童医院超声科,浙江杭州 310051;3.浙江大学医学院附属第一医院放射科,浙江杭州 310006;

肝细胞肝癌(hepatocellular carcinoma,HCC)与肝内胆管细胞癌是常见的肝脏恶性肿瘤,其中肿块型胆管细胞癌( intrahepatic mass-forming cholangiocarcinoma,IMCC)是肝内胆管细胞癌的主要亚型,约占肝内胆管细胞癌的60%[1]。HCC 与IMCC 的病理类型不同,治疗方法与预后相差较大,术前依靠临床症状、肿瘤标志物及影像检查诊断困难,因此准确诊断对于临床治疗具有重要意义[2-4]。超声检查无创便捷,是肝脏病变筛查、定性和随访的常规影像方法。影像组学可以提取肉眼无法识别的图像特征,客观量化病灶的像素灰度值变化及分布潜在规律[5]。本文拟探讨基于灰阶超声图像的影像组学分析鉴别IMCC 与HCC 的价值。

1 资料与方法

1.1 研究对象 选取2016年12月—2017年12月收治的原发性肝癌患者124例,其中HCC 62例,男39例,女23例,年龄37~81岁,中位年龄54岁;IMCC 62例,男36例,女26例,年龄31~76岁,中位年龄57岁;纳入标准:①经手术或穿刺病理证实;②超声检查前均未接受任何放疗、化疗或免疫治疗;③超声检查均在同一台Philips 超声诊断仪上完成,使用预先设定的条件;④术前超声检查肝内为单个病灶。排除病灶最大径≤5 mm、图像质量不佳、影响数据分析者。

1.2 影像组学特征提取 肿瘤图像评估采集均由一名高年资超声医师完成,病灶使用最大肿瘤层面,收集的超声图像导入 MaZda 4.7软件(http://www.eletel.p.lodz.pl/programy/mazda/),由同一名医师在软件上手动勾画感兴趣区提取影像组学特征参数(图1),相应的纹理参数为:直方图参数(平均值、方差、峰度、偏度、百分位数等)、灰度共生矩阵(能量、对比度、自相关、熵、共生和等)、游程检验(长度不均匀性、长游程权重、短游程权重、灰阶异质性)、自回归模型、小波转换(小波转换系数能量)及绝对梯度(梯度均数、方差、偏度与峰度)。

图1 MaZda 在常规灰阶超声图上勾画感兴趣区

1.3 统计建模 使用R3.3.2软件(http://www.Rproject.org)进行数据统计建模分析。按照训练数据与测试数据7∶3 分割数据,IMCC 43例、HCC 44例;另外37例作为验证集,IMCC 19例、HCC 18例。由于纹理参数较多,故采用glmnet 包进行LASSO(least absolute shrinkage and selection operator)和10 折交叉验证的方法选择特征参数。以病理结果作为因变量,将特征筛选后的特征作为自变量建立多因素Logistic 回归模型,并在测试集中应用该模型,采用受试者工作特征(ROC)曲线评估模型效能。

2 结果

通过LASSO 算法降维后(图2),诸多影像组学特征仅剩下基于直方图的偏度、直方图99%百分位数、基于灰度共生矩阵参数中对比度和共生和(表1)。基于这些特征参数构建的多变量Logistic 回归,结果显示在训练集中模型敏感度为95%,特异度为95%,曲线下面积(AUC)为0.97,而在测试数据中敏感度为100.0%,特异度为77.8%,AUC 为0.94(图3)。

图2 LASSO 降维图。横坐标为log(Lambda)值,图片顶端的数值为特征数,10 折交叉验证方法确定2个log(Lambda)值,分别对应10个与4个特征,为防止过拟合,选择为4个特征进行后续建模

表1 多因素Logistic 回归分析结果

图3 多变量Logistic 回归分析的ROC曲线,红色为模型在训练集中表现,蓝色为测试集表现

3 讨论

HCC是我国常见肿瘤之一,常在慢性肝炎和肝硬化基础上发生;胆管细胞癌是一种原发于胆管上皮的恶性肿瘤,常发生于肝内胆管2级以上胆管分支,约占原发性肝癌的5%~30%。目前胆管细胞癌的发病率和病死率仍不断上升,尽管两者均为原发性肝癌,但是病理、手术及预后显著不同,胆管细胞癌的术后生存率较低[4]。胆管细胞癌按大体形态可以分为肿块型、管周浸润型、腔内生长型或息肉型,其中IMCC 与HCC 影像学表现比较相似[6],两者的早期鉴别诊断一直是研究热点,具有重要的临床价值。

目前灰阶超声在常规体检中非常普及,彩色多普勒超声及超声造影对于两者的鉴别诊断已有报道[7-8],但目前灰阶超声鉴别诊断十分依赖超声医师的主观判断及临床经验。随着数据科学的发展,医学图像的数据挖掘工作成为近年的研究热点。Lambin 等[9]于2012年提出影像组学的概念,通过对肿瘤图像进行自动化数据特征分析及高通量特征提取,将感兴趣区的影像数据转化为具有高分辨率的可发掘的特征空间数据,再通过目前的机器学习算法处理医学大数据,提取有价值的信息建立临床决策模型[10]。近年影像组学研究多集中于CT 与MRI 定量图像的定量特征分析[11-13],如肝癌预测[14]、脑胶质细胞瘤预后评估[15]、评估乳腺癌新辅助化疗效果[16]等。事实上超声影像图像同样包含大量肉眼无法识别与分析的医学信息,但目前超声影像组学较CT、MRI 少很多,但已应用于甲状腺结节研究[17],本研究初步探索了灰阶超声图像影像组学分析在HCC 与IMCC 鉴别诊断中的应用价值,证实超声影像组学模型有较好的预测价值。

影像组学方法提取的超声图像纹理特征,在一定程度上减少了对超声诊断医师个人经验的依赖程度[18]。本研究结果表明,HCC 和IMCC 的灰度直方图的偏度、99%百分位数和灰度共生矩阵的对比度、共生和均值具有重要的鉴别诊断价值。直方图类参数中的偏度为描述病变灰度值分布对称性的统计量,评价偏离正态分布的不对称程度[19],同样99%百分位数也反映出分布的偏移程度。与简单的直方图参数不同,灰度共生矩阵是研究灰度的空间相关特性,能反映图像灰度关于方向、相邻间隔、变化幅度的综合信息,是分析图像的局部模式和其排列规则的基础。对比度反映了图像的清晰度和纹理沟纹深浅程度,纹理沟纹越深,灰度差即其对比度越大;反之,对比度小,沟纹浅,图像模糊。共生和均值可反映纹理的规则程度[20-21]。肝癌由于组织学细胞异常、异常血管、坏死、间质纤维化等原因导致肿瘤成分复杂,即肿瘤存在异质性[22],这种异质性通过超声成像后表现为图像灰度异常改变。本研究中的4个纹理特征参数在不同程度上反映了HCC 与IMCC 在图像灰度分布及空间异质性方面的差异。

为了防止过拟合,本研究选用4个参数建模,基于这4个特征的Logistic 回归模型全面地分析两种肿瘤的特点,模型在训练集中性能非常突出,敏感度为95%,特异度为95%,AUC 为0.97。在后续的测试集中性能稍有下降,但AUC 仍>0.9,证明模型可靠稳定,无明显的过拟合。与传统的统计学分析不同,机器学习模型已成为数据分析科学的首选,本研究中的LASSO 与Logistic 回归的组合大大提高了HCC 与IMCC 的鉴别诊断效能,为今后临床预测诊断提供客观的鉴别方法。

本研究为回顾性研究,存在以下局限性:①灰阶超声图像获取仍然存在操作者的主观性,不同操作者可能导致最后模型存在差别,将在后续研究中评估主观性。②研究可能会漏掉一些潜在有鉴别价值的特征参数,最后分类器的预测效能可能仍然存在不稳定性。③样本量较小,而且仅分析了常规灰阶超声图像,未纳入超声造影与多普勒图像,今后会继续收集更多样本以验证超声影像组学在HCC 与IMCC 鉴别中的应用价值。

总之,灰阶超声作为肝脏影像学检查的首选方法,但既往应用中只能提供主观性信息,而影像组学分析可客观量化肿瘤的纹理特征,深度挖掘肿瘤的生物学特性,为临床鉴别HCC 和IMCC 提供了一项重要手段,具有广阔的应用前景。

猜你喜欢

灰阶直方图组学
OLED屏幕Demura补偿数据生成算法
MRI 增强信号比值对G2、G3 级胰腺神经内分泌肿瘤和胰腺癌鉴别诊断价值
符合差分隐私的流数据统计直方图发布
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
基于FPGA的直方图均衡图像增强算法设计及实现
正常人群肾皮质超声灰阶量化对照研究
用直方图控制画面影调