APP下载

基于CT影像组学术前预测胃癌淋巴血管侵犯

2019-08-01李武超王荣品

中国医学影像技术 2019年7期
关键词:勾画淋巴组学

李武超,陈 琦,蒋 仪,王荣品*

(1.贵州省人民医院放射科,3.信息科,贵州 贵阳 550002;2.贵州省智能医学影像分析与精准诊断重点实验室,贵州 贵阳 550002)

胃癌是胃黏膜上皮细胞起源的恶性肿瘤,在我国男性胃癌发病率仅次于肺癌,居恶性肿瘤的第2位,女性发病率居第4位[1]。手术切除是胃癌主要的治疗方式,但术后5年生存率仅约30%[2]。淋巴血管侵犯是指肿瘤周围间质淋巴管及动静脉存在肿瘤细胞浸润,是胃癌转移、复发及预后较差的独立预测因子[3-4],因此术前准确评估及判断淋巴血管侵犯对于个性化诊疗具有重要价值,但目前CT、MRI、胃镜超声等常规影像学检查技术尚不能实现术前诊断。影像组学基于医学成像高通量提取海量数据信息,可将医学影像图像转化成为可挖掘的特征数据,进而实现客观、定量分析疾病的生物学特征[5]。本研究探讨CT影像组学对术前预测胃癌淋巴血管侵犯的价值。

1 资料与方法

1.1 一般资料 收集2012年9月—2015年10月我院收治并经手术病理证实的181例胃癌患者,男123例,女58例,年龄22~85岁,平均(58.7±11.7)岁。纳入标准:①接受根治性胃癌切除术;②病理确诊为胃癌;③术后病理可确定有无淋巴血管侵犯;④术前20天内接受腹部增强CT检查。排除标准:①术前接受治疗(放射治疗、化学治疗或放化疗);②无完整CT图像,或图像质量较差无法评估;③临床病理信息不完整。根据术后病理结果,181例中,96例存在淋巴血管侵犯,85例无淋巴血管侵犯。

1.2 仪器与方法 采用Siemens Somatom Definition Flash双源CT扫描仪,CARE kV管电压及CARE Dose4D管电流最优自动调节技术,参考管电压为120 kV,参考管电流为180 mAs;FOV 350 mm×350 mm,矩阵512×512,准直器宽64×0.6 mm,螺距1.0,旋转时间0.5 s,重建层厚5 mm。对比剂采用优维显(370 mgI/ml),以高压注射器经肘静脉注射,剂量1.5 ml/kg体质量,流率3.5 ml/s,随后以相同流率注射20 ml生理盐水。于注射对比剂后25~30 s和60 s分别行动脉期和静脉期扫描。

1.3 图像分割 基于CT静脉期图像勾画ROI。以DICOM格式导出图像,由2名具有10年以上腹部影像学诊断经验的放射科医师A和B协同选择肿瘤最大层面并确定轮廓,如不能达成一致,则由另1名有22年腹部诊断经验的放射科医师C进行判断。最终由医师A基于ITK-SNAP(www.itk-snap.org)软件于肿瘤最大层面沿肿瘤轮廓手动勾画ROI,见图1。

1.4 组内及组间影像组学特征可重复性评估 随机选择30例CT图像,由医师A间隔2周各勾画1次ROI,医师B勾画1次ROI,分别提取影像组学特征,采用组内相关系数(interclass correlation coefficient, ICC)评价影像组学提取特征的一致性。ICC>0.75为一致性较好。

1.5 特征选择和组学标签建立 按2∶1比例将181例随机分为训练集和验证集,进行模型训练及验证。采用开源的PyRadiomics(https://pyradiomics.readthedocs.io/en/latest/index.html)平台对训练集每个ROI进行特征提取,包括一阶特征、形状特征、灰度共生矩阵特征、灰度游程矩阵特征、灰度区域大小矩阵特征、相邻灰度差矩阵特征和灰度依赖矩阵特征。滤掉低方差和高共线性的特征之后,采用最大相关最小冗余算法进一步筛选,并以t检验得到对淋巴血管侵犯最有预测价值的影像组学特征。根据不同特征的回归系数,最终通过线性组合构建影像组学标签。

1.6 预测模型评估 采用ROC曲线和校准曲线检验模型的预测效能及拟合度,以评估该模型对于淋巴血管侵犯的预测效果。对校准曲线使用1 000次自举重采样进行修正,然后使用Hosmer-Lemeshow检验进行评价,P>0.05为该模型与理想模型的拟合程度高。在训练集和验证集中分别进行影像组学模型预测效能评估,并基于训练集的最优阈值计算模型的准确率、敏感度和特异度。

1.7 统计学分析 采用R软件3.4.3版(http://www.r-project.org)进行统计分析。以两独立样本t检验比较训练集与验证集患者年龄的差异,以χ2检验比较患者间性别、TNM分期和淋巴血管侵犯的差异。使用R软件中的“caret”包过滤低方差和高共线性特征,以“mRMRe”包用来实现最大相关最小冗余算法,“pROC”包绘制ROC曲线,“rms”包绘制校准曲线。P<0.05为差异有统计学意义。

2 结果

训练集120例,男80例,女40例,年龄31~84岁,平均(58.8±12.0)岁;其中淋巴血管侵犯阳性62例(62/120,51.67%),阴性58例(58/120,48.33%);TNM分期Ⅰ期4例,Ⅱ期37例,Ⅲ期79例。验证集61例,男43例,女18例,年龄30~85岁,平均(58.3±11.3)岁;其中淋巴血管侵犯阳性34例(34/61,55.74%),阴性27例(27/61,44.26%);TNM分期Ⅰ期4例,Ⅱ期12例,Ⅲ期45例。训练集与验证集患者性别(χ2=0.272,P=0.602)、年龄(t=0.255,P=0.799)、TNM分期(χ2=3.184,P=0.204)及淋巴血管侵犯占比(χ2=0.269,P=0.604)差异均无统计学意义。

2.1 影像组学特征提取可重复性评估 基于医师A两次勾画ROI提取的影像组学特征具有较好的组内一致性,ICC为0.812~0.977;基于医师A和医师B勾画ROI提取的影像组学特征也具有较好的组间一致性,ICC为0.761~0.969。

2.2 影像组学标签构建 基于每例胃癌患者CT静脉期ROI共提取1 479个特征,以R软件滤掉低方差和高共线性特征后,特征缩减到120个,再以最大相关最小冗余算法筛选出15个特征,并以t检验进一步筛选,继而获得7个对胃癌淋巴管血管侵犯最有预测价值的影像组学特征,包括2个一阶特征(square_firstorder_InterquartileRange和original_firstorder_InterquartileRange)、1个形状特征(original_shape_Elongation)、2个灰度共生矩阵特征(square_glcm_Imc1和wavelet.HHH_glcm_MaximumProbability)和2个灰度区域大小矩阵特征(wavelet.LHH_glszm_SmallAreaEmphasis和original_glszm_SmallAreaEmphasis)。最后,基于每个特征对应的回归系数,线性组合构建影像组学标签,构建公式为:yi=∂ixi+β,其中∂i表示特征值,xi表示回归系数,β表示截距。

2.3 模型预测胃癌淋巴管血管侵犯的效能 在训练集中,影像组学标签预测胃癌淋巴管血管侵犯的ROC曲线AUC为0.742[P=0.001,95%CI(0.652,0.831)],验证集的AUC为0.727[P=0.002,95%CI(0.593,0.853)],见图2。基于训练集所得最优阈值为0.422,模型在训练集中的准确率、敏感度和特异度为0.708、0.586、0.806;将此阈值用于验证集,其准确率、敏感度和特异度分别为0.689、0.519和0.824。采用校准曲线评估该模型的拟合度,均显示较好的拟合度(训练集P=0.370,验证集P=0.604),见图3。

3 讨论

影像组学最早由荷兰Philippe Lambin教授[6]于2012年提出,是一种新兴的影像分析方法,其目的是利用大数据分析技术,从影像数据中挖掘可量化病变的海量特征,并构建特征性影像组学标签,以期解析影像与基因、病理、临床的潜在关联[6-7]。CT是影像学检查胃癌最重要的方法之一,针对基于CT的影像组学在胃癌分级分期、预测预后及评估疗效等方面已进行了初步研究[8-11],但既往研究主要基于各中心内部开发的软件,缺乏标准化的图像处理流程及统一的特征定义,无法实现不同数据集之间的共享和对比。针对以上不足,本研究采用开源的PyRadiomics平台进行图像处理及特征提取,以期为模型的推广和临床应用奠定良好基础[12]。

淋巴管血管侵犯是胃癌患者预后不良的重要因素,术前准确评估有助于实现个性化诊疗。有学者[4]基于CT对术前淋巴结血管侵犯进行了探索性研究。Yin等[13]提出增强CT动脉期、动脉-门静脉期对比增强率与血管侵犯相关,而静脉期对比增强率与淋巴管侵犯有关;此外,Komori等[14]研究发现,动脉期胃癌病变与正常胃壁强化比与淋巴血管侵犯具有相关性。虽然上述研究表明胃癌CT征象有望提示淋巴血管侵犯,但由于纳入病例较少,且仅为相关性分析,未能实现有效预测淋巴血管侵犯。Ma等[15]基于282例胃癌患者进一步探讨CT征象对淋巴血管侵犯的预测能力,结果显示门静脉期CT值具有最好预测价值,但该研究未对模型进行验证,同时人为测量可能会存在选择偏倚。针对以上不足,本研究以病变最大层面作为ROI,提高勾画的鲁棒性,同时进行了组内及组间提取特征的一致性检验,以保证提取特征的可重复性;并将患者分为训练集和验证集,分别对模型进行构建、验证和优化,以提高模型在临床应用中的泛化能力和鲁棒性。

图1 基于肿瘤最大层面沿肿瘤轮廓手动勾画ROI示意图 图2 影像组学标签预测胃癌淋巴血管侵犯的ROC曲线 图3 影像组学标签的校准曲线 A.训练集; B.验证集

基于本研究的影像组学模型,训练集和验证集均表现出良好准确率,同时校准曲线一致性佳,通过最优阈值,该模型预测胃癌淋巴管血管侵犯的特异度明显高于既往研究[16],但敏感度较低。笔者认为较高的特异度有利于术前评估,特别是新辅助化疗主要用于改善中、高危胃癌患者的生存及预后,因此准确的预后评估尤为重要;而较高的特异度可保证纳入患者淋巴血管侵犯的真阳性率,提高个体化药物疗效,同时有效规避假阳性导致的纳入低危患者,避免过度治疗损害。然而完美的预测模型应同时具有较高的敏感度和特异度,后续研究中将扩大样本量,以进一步提高模型的预测效能。

本研究存在一定的局限性。首先,本研究为单中心单机型回顾性分析,有待大样本、多中心、多机型前瞻性研究进一步验证模型的有效性;此外,本研究基于5 mm的重建层厚,在肿瘤最大层面进行ROI勾画及特征提取,但二维图像对肿瘤生物学特性的表征尚有不足,可能影响模型的预测能力。

总之,本研究基于CT影像组学实现了术前无创个体化预测胃癌淋巴血管侵犯,可为评估预后风险、制定个体化诊疗方案提供有力、客观的影像学依据。

猜你喜欢

勾画淋巴组学
教你一套全身淋巴按摩操
不同数学模型多b值DWI在预测子宫内膜癌淋巴血管侵犯中的能力
影像组学在肾上腺肿瘤中的研究进展
放疗中CT管电流值对放疗胸部患者勾画靶区的影响
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
定量评价Atlas模板库病例数目对宫颈癌危及器官自动勾画的影响
注意,有种“胖”不能靠运动去减
淋巴水肿的预防与照顾——乳癌康复者的隐忧