不同设备不同扫描参数对影像组学特征可再现性影响分析
2021-02-05张白霖戴振晖朱琳杨耕朱远湖招什武蔡春雅李飞王学涛
张白霖,戴振晖,朱琳,杨耕,朱远湖,招什武,蔡春雅,李飞,王学涛
前言
临床放射图像的计算机辅助分析提供了针对个性化医疗的大规模数据分析方法[1-2],比如通过分析整个肿瘤的图像而不是选择性获取样本活检来推断肿瘤表型。在表型变异性会影响临床结果的前提下[3],医学成像提供了一种有效且无创的方法来确定预后。这种方法具有巨大的潜力,可以被用来支持个性化临床决策[4]。对基于图像的标记(即放射影像组学)的研究表明,医学断层影像中蕴藏着相比于人眼可见更多的预后信息[4-8]。为了推广应用于临床,首先需要在模体中测试特征可再现性,然后再在不同环境和多个独立机构中基于患者来验证模型[5-13]。
研究表明特征重现性可能受图像采集参数差异的影响,如切片厚度和重建算法[14-17]。由于临床图像采集参数是不同医院之间图像差异的主要来源之一,类似诊断影像的质量保证(Quality Assurance,QA)可以使用模体来测试和比较影像组学特征。假设简单模体中已经不稳定的特征,不可能在更严格的条件下变得稳定。
本研究中,笔者选取3台不同型号的计算机断层扫描设备CT 对简单模体进行扫描成像。分析了部分扫描参数对影像组学特征的影响。之所以选择CT,因为这个图像模态更加普及,具有完善的校准、质量保证和日常维护,并且是用于放射治疗的主要成像模态。
1 材料与方法
1.1 模体A
COPDGene Phantom II(Phantom Laboratory,Greenwich,NY,USA)是一种被定量图像生物标志物联盟技术委员会推荐用于临床试验的胸部CT 模体。如图1a 所示,外部由聚氨酯环模拟组织衰减,而内部椭圆体(横截面椭圆长轴和短轴分别为25 和15 cm)模拟肺衰减。内部椭圆体有许多圆柱形空腔,用于填充泡沫、丙烯酸和水[18-19]。
1.2 模体B
3Dmultimodality Abdominal Phantom (CIRS,Norfolk,Virginia,USA)是一种用于各种模态影像(CT、MR、US)引导肝组织活检训练的模体。如图1b所示,体模中包含了肝、门静脉、肾脏、肺底、腹主动脉、腔静脉、腰椎和6 个最低的肋骨。勾画了一大一小两个肝病变区域。
图1 使用的模体Fig.1 phantoms used in the study
1.3 影像获取
3 台不同的CT 设备,按照胸腹部放疗计划设计标准进行CT 扫描,产生各设备的基线参考影像,基线扫描参数如表1所示。改变扫描参数:(1)设置重建层厚(1、3、5 mm);(2)使用不同重建核函数;(3)设置不同曝光时间(50、100、300 mAs),获得多组不同参数条件下的扫描图像。
1.4 特征提取
基于Pyradiomics 库使用Python 语言编写程序,读取CT 影像及感兴趣区域(ROI)提取影像组学特征共851 个,包括基于影像灰度18 个、基于形态14个、基于纹理75 个以及经小波变化滤波后提取的特征744 个。纹理特征具体分为灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)24 个、灰度相关矩阵(Gray-Level Dependence Matrix,GLDM)14 个、灰度行程矩阵(Grey-Level Runlength Matrix,GLRLM)16 个、灰度区域大小矩阵(Gray-Level Size Zone Matrix,GLSZM)16 个、局部灰度差分矩阵(Neighbourhood Grey-tone Difference,NGTDM)5 个。
表1 3台设备的基线扫描参数Tab.1 Baseline scan parameters of 3 machines
1.5 分析
使用变异系数(Coefficient of Variation,CV)评估特征受扫描参数改变的影响,CV 定义为标准差与平均值之比,以CV 判断特征可再现性,认为CV 小于10%的特征具有可再现性。
2 结果
2.1 不同重建层厚对特征可再现性影响
对于同一设备,其他扫描条件固定,设置不同重建层厚(1、3、5 mm),各扫描2个模体。以CV小于10%筛选特征。图2显示3台设备的特征筛选情况,在3台设备中均不满足条件的特征占81.6%(694/851),在至少一台设备中满足条件的特征占18.4%(157/851),在3台设备中均满足条件的特征占8.8%(75/851)。可见,重建层厚对特征可再现性的影响明显。
图2 不同层厚对特征可再现性影响Fig.2 Influence of different thickness on feature reproducibility
图3显示两个模体的特征筛选情况,模体A 中满足条件的特征占25.6(218/851),模体B 中满足条件的特征占10.6%(90/851)。说明重建层厚不同,对模体A的特征可再现性影响小于模体B。
图3 不同模体比较Fig.3 Comparison of different phantoms
2.2 不同重建核函数对特征可再现性影响
对于同一设备,其他扫描条件固定,使用不同重建核函数扫描重建2个模体。设备A使用的重建核函数有B31f、B41f、B60f、B75f、B80f;设备B使用的重建核函数有B、A、C、D;设备C使用的重建核函数有I30f、I40f、I44f、I49f、I50f、I70f。以CV小于10%筛选特征。图4显示3台设备的特征筛选情况,在3台设备中均不满足条件的特征占46.4%(395/851),在至少一台设备中满足条件的特征占总数的53.6%(456/851),在3台设备中均满足条件的特征占12.1%(96/851),31.7%(270/851)的特征只在单一设备中达到可再现性要求。
图4 不同重建核函数对特征可再现性影响Fig.4 Influence of different reconstruction kernel on feature reproducibility
2.3 不同曝光时间对特征可再现性影响
使用设备A 和设备B,设置不同曝光时间(50、100、300 mAs),其他扫描条件固定,分别扫描两种模体,以CV 小于10%筛选特征。图5显示两个模体的特征筛选情况。在2 台设备中均满足条件的特征占32.8%(280/851)。54%(460/851)的特征只在单一设备中达到可再现性要求。
图5 不同曝光时间对特征可再现性影响Fig.5 Influence of different current-exposure time on feature reproducibility
3 讨论
因为采集参数和重建技术的差异,单中心或者多中心研究中提取的影像组学特征,其泛化是存在疑问的。本研究分析了部分扫描参数对影像组学特征的影响,结果显示,图像层厚、重建核函数、曝光时间对影像组学特征的影响都是不可忽略的,图像层厚不同影响了81.6%的特征,有近五成特征受到重建核函数和曝光时间的影响。并且不同设备受影响的特征不完全相同,说明设备间的差异也是不可忽略的。Berenguer 等[18]利用一台CT 设备对一个盆腔体模进行不同重建核函数的扫描成像,提取特征并对比分析特征重现性,有43.1%(76/177)的特征认为具有重现性,与本研究结果相近。
本研究使用的模体厂家明确说明非设计用于影像组学特征研究,目前不存在一个用于影像组学研究的经典模体。本研究中已证实重现性不佳的影像组学特征,不可能在多中心多设备人体研究中有理想的重现性。需要注意的是,因为体模内的几何结构过于简单且密度均匀,人体器官和肿瘤组织中纹理特征以及形态特征的复杂性,并未在这2个模体中很好地体现。本研究所用模体B结构比模体A复杂,模体B中提取的影像组学特征受影响的程度更大,所以,剩余特征的重现性需要经过更多包含逼真肿瘤信息的模体的验证。Mackin 等[19]设计出包含10 个暗盒的模体,其中包含3D 打印不同填充度的ABS 塑料、不同种类的木头、切碎的橡胶颗粒、固体树脂及类骨材料,多设备扫描,研究纹理特征的可再现性。
目前在影像组学特征标准化方面已有一些工作,包括专业术语的命名以及特征值计算。而本工作显示出CT 扫描参数差异对大部分特征重现性不可忽略的影响,影像组学特征数据标准化还有一段路要走。在此之前,应用影像组学建立模型研究临床问题时,为了避免该因素对预测模型的不利影响,可行的方式有:(1)在限定的适用范围(某台设备的某种扫描参数)内建立预测模型;(2)想办法建立不同扫描参数间特征的关系,借助修正因子减弱扫描参数对特征的影响。有小组运用机器学习建立不同扫描参数之间特征的转换关系。