基于T1WI动脉期影像组学模型预测胰腺导管腺癌淋巴结转移的研究
2022-10-08刘琢玉黄小华陈雨薇胡云涛唐玲玲刘念
刘琢玉,黄小华,陈雨薇,胡云涛,唐玲玲,刘念
作者单位:川北医学院附属医院放射科,南充 637000
胰腺导管腺癌(pancreatic ductal adenocarcinoma,PDAC)占胰腺恶性肿瘤的95%,5 年存活率仅为1%~5%[1-2]。接受根治性手术的PDAC 患者生存率有所提高,但伴有淋巴结转移的患者预后差,且术后复发风险高[3-5]。因此,术前准确评估PDAC 淋巴结状态对指导临床医师治疗方案的选择及预后预测的评估至关重要。计算机体层摄影(computed tomography, CT)和MRI 检测PDAC 的敏感度分别为76%~96%、83%~93.5%[2],但在术前评估淋巴结状态的准确性方面仍存在很大挑战[6-7]。影像组学通过量化定量特征来表征肿瘤的生物学特点[8-9],已用于胰腺肿瘤的鉴别诊断、疗效评估与预后预测等方面[10-14]。目前已有少数基于影像组学预测PDAC 淋巴结转移的研究,然而这些研究多基于增强CT图像且研究多采用单一建模方法[15-18]。因此,本研究旨在利用三种机器学习模型探讨T1WI 动脉期图像预测PDAC 患者淋巴结转移的价值,以期获得一种无创、准确且便利的术前预测淋巴结转移的方法。
1 材料与方法
1.1 研究对象
本研究经川北医学院附属医院伦理委员会批准,免除受试者知情同意,批准文号:2022ER045-1。回顾性分析本院2016 年3 月至2022 年3 月收治的121 例经术后病理证实为PDAC 患者的MRI 图像及临床病理信息。男73 例,女48 例,年龄(61±10)岁。纳入标准:(1)术后病理证实为PDAC;(2)术中行淋巴结清扫且具有术后详细淋巴结病理报告;(3)MRI 增强扫描在术前1 个月内进行。排除标准:(1)图像质量不符合诊断标准;(2)术前进行抗癌治疗;(3)有其他恶性肿瘤患者。根据术后淋巴结病理结果:淋巴结转移阳性者44例,阴性者77例。
本研究患者纳入过程:在本院图片归档和通信系统(picture archiving and communication system,PACS)中查找疑似PDAC 且行MRI 扫描患者共307 例,排除未行T1WI 增强扫描患者21 例、非PDAC 患者20 例、图像质量不符合标准14 例,共获得MRI 诊断为PDAC 患者252 例。而后排除术前进行抗癌治疗患者23 例、未进行术后病理证实为PDAC 患者71 例、未进行术后淋巴结病理检查29 例、同时患有其他恶性肿瘤者8 例,最终纳入患者121 例。将患者按7∶3 的比例随机分为训练组(83例)与验证组(38例)。
1.2 MRI扫描
采用GE Discovery MR 750 3.0 T 及联影UMR790 3.0 T 扫描仪和32 通道相控阵线圈行腹部常规序列扫描,GE Discovery MR 750 3.0 T 扫描序列及参数:轴位LAVA 三期动态增强扫描序列,TR 4 ms,TE 1.9 ms,层厚5 mm,间距0 mm,矩阵224×190,视野36 cm×36 cm。联影UMR790 3.0 T 扫描序列及参数:轴位Quick 3D三期动态增强扫描序列,TR 3 ms,TE 1.5 ms,层厚5 mm,间距0 mm,矩阵256×224,视野40 cm×30 cm。以2.5 mL/s的流速静脉注射钆贝葡胺注射液(0.1 mmol/kg;上海博莱科信谊药业有限责任公司),然后用10 mL 生理盐水冲洗。考虑到患者年龄、心功能等个体差异,动脉期时间约为注射对比剂后16 s~20 s。
1.3 图像分割及特征提取
使用3D slicer(version 4.11.20210226,美国,https://www.slicer.org/)进行感兴趣区(region of interest, ROI)勾画及特征提取。一位具有5 年工作经验的影像科医师在T1WI动脉期图像上逐层勾勒胰腺肿块轮廓,获取胰腺肿块的三维感兴趣容积(图1)。同时一位具有7年工作经验的影像科医师随机抽取一半图像进行ROI 勾画。基于3D slicer 软件中Python包“PyRadiomics”提取特征,包括形状特征、一阶特征、灰度共生矩阵特征、灰度区域大小矩阵特征、灰度行程矩阵特征、灰度相关矩阵特征、邻域灰度差矩阵特征及经小波及拉普拉斯变换后的特征共1223个。由于本研究收集不同型号磁共振扫描仪的图像,为保证模型的泛化能力和结果的可重复性,在特征提取之前进行重采样,并对提取的数据进行Z-score标准化处理。
图1 胰腺肿块三维感兴趣区勾画示意图。1A、1B:男,64岁,淋巴结转移阳性;1C、1D:男,53岁,淋巴结转移阴性。1A、1C:肿瘤最大层面的横断面图像,1A中红箭所示为转移性淋巴结;1B、1D:3D-Slicer软件靶区勾画示意图。Fig.1 Schematic diagram of the three-dimensional region of interest (ROI) of pancreatic masses. 1A and 1B: Male, 64 years old, positive for lymph node metastasis.1C and 1D:Male,53 years old,negative for lymph node metastasis.1A and 1C are the cross-sectional images of the largest level of the tumor,red arrow in 1A shows the metastatic lymph nodes.1B and 1D are the sketch diagrams of 3D-slicer software target area.
1.4 评估观察者间的一致性检验
影像组学特征在观察者间的一致性检验采用组间相关系数(interclass correlation coefficient,ICC)作为度量指标,对两名医师勾画ROI后所提取的影像组学特征进行ICC 检验,ICC≥0.75 认为具有较好的一致性。
1.5 特征选择及模型建立
采用单因素分析(Student'st检验和曼—惠特尼U检验)选择两组间差异有统计学意义的特征,进而使用最小绝对收缩与选择算子(least absolute shrinkage and selection operator, LASSO)进行特征选择,将部分参数的回归系数抑制为0,再通过LASSO 算法下十折交叉验证完成参数筛选,选择最优影像组学特征。使用支持向量机、逻辑回归及决策树3种机器学习方法对最优特征子集进行模型构建。将121 例患者按7∶3 随机分为训练集(83 例)和验证集(38 例)。在训练组中进行模型的训练、并在验证组中进行模型性能验证。
1.6 统计学方法
采用SPSS(25.0 版,IBM 公司,美国)完成临床病理资料的统计分析,满足正态分布的计量资料用平均值±标准差(±s)表示,组间比较采用独立样本t检验。不满足正态分布的计量资料用中位数±四分位数间距(M±Q)表示,组间比较采用曼—惠特尼U检验。计数资料以例数表示,组间比较采用χ2检验。采用R(x64 4.1.1)和python(3.9.12)完成特征筛选及模型建立,绘制并计算受试者工作特征(receiver operating characteristic, ROC)曲线下面积(area under the curve, AUC)来评估各模型的预测效能,使用Hosmer-Lemesow 检验和校准曲线进行模型的拟合优度检验。使用Delong检验实现三种机器学习模型之间的比较。P<0.05认为差异有统计学意义。
2 结果
2.1 淋巴结转移阳性组与阴性组临床病理特征比较
两组间患者在年龄、性别、肿瘤部位、组织学分级、CA199、T分期的差异均无统计学意义(P>0.05)(表1)。
表1 淋巴结转移阳性组与阴性组患者的临床病理资料比较Tab.1 Comparison of clinicopathological data between patients with positive and negative lymph node metastasis
2.2 训练组与验证组临床病理特征比较
两组间患者年龄、淋巴结状态、性别、肿瘤部位、组织学分级、CA199、T分期的差异均无统计学意义(P>0.05)(表2)。
表2 训练组与验证组患者的临床病理资料比较Tab.2 Comparison of clinicopathological data between training group and validation group
2.3 影像组学特征筛选
根据一致性检验分析结果,ICCmean=0.81,ICCmedian=0.86。为了选择受观察者影响较小的特征为后续模型特征,选择ICC 值≥0.75 的影像组学特征,共895 个。单因素分析和LASSO 筛选出5 个预测PDAC 淋巴结转移最优的特征,分别为1个灰度共生矩阵特征[相关度(correlation)]、2个灰度行程矩阵特征[长行程灰度优势(long run ray level emphasis)、长行程优势(long run emphasis)]、2个灰度区域大小矩阵特征[小区域低灰度优势(small area low gray level emphasis)、灰度非均匀归一化(gray level non uniformity normalized)]。
2.4 三种机器学习模型对淋巴结转移的预测效能
在训练组中,支持向量机模型、决策树模型和逻辑回归模型的AUC分别为0.882 [95%置信区间(confidence interval,CI):0.797~0.968]、0.842(95%CI:0.755~0.930)、0.813(95%CI:0.710~0.915)。在验证组中,三种模型的AUC 分别为0.726(95%CI:0.546~0.906)、0.753(95%CI:0.606~0.899)、0.702(95%CI:0.522~0.883)(表3、图2)。Delong 检验显示三个模型两两比较差异均无统计学意义(P>0.05)。分别绘制三种机器学习模型在验证组中的校准曲线图(图3)。Hosmer-Lemeshow 检验(逻辑回归模型P=0.42;支持向量机模型P=0.24;决策树模型P=1.00)验证了预测值和实际临床观察值之间存在一致性,其中决策树模型拟合最佳。
图2 训练组和验证组三个模型的受试者工作特征曲线(ROC)及曲线下面积(AUC)。2A:训练组;2B:验证组。 图3 三种机器学习模型在验证组中的校准曲线图。Fig. 2 Receiver operating characteristic (ROC) curve and area under the curve (AUC) of three models in training group and validation group. 2A: The training group;2B:The validation group.Fig.3 Calibration plots of the three machine learning models in the validation group.
表3 3种机器学习模型对胰腺导管腺癌淋巴结转移的预测价值Tab.3 Predictive value of three machine learning models for lymph node metastasis in pancreatic ductal adenocarcinoma
3 讨论
本研究回顾性分析121例PDAC患者的T1WI动脉期图像,旨在通过影像组学模型为术前预测PDAC 淋巴结转移提供一个潜在无创的新方法。研究发现基于三种分类器的机器学习模型均具有较好的预测价值,Delong 检验显示三个模型两两比较差异均无统计学意义。提示基于T1WI动脉期图像的影像组学模型可以在术前进行PDAC 患者淋巴结状态的评估,可在传统医学图像的基础上提供额外有价值的信息,为临床医师治疗方案的选择提供参考。
3.1 PDAC淋巴结转移研究现状
淋巴结转移是PDAC患者重要的生存预测因子,但术前检测存在困难[19-22]。不利于临床医师进行肿瘤的术前分期及治疗方案的选择。近年来,血清标志物如MMP7、MUC1、MUC2和中性粒细胞数与淋巴细胞数的比值等被提出可用于术前检测PDAC淋巴结状态,但由于技术和准确性等问题,其临床应用受到限制[19-20]。超声内镜引导下细针抽吸(endoscopic ultrasound-guided fine needle aspiration, EUS-FNA)对检测淋巴结转移非常敏感,但EUS-FNA是一种有创的诊断工具,很大程度会导致患者发生胰腺炎等并发症[21]。影像组学可以从医学图像(CT、MRI 等)中提取大量的高维量化特征,揭示肉眼无法清楚观察到的疾病的隐藏特征[23-24]。既往研究[15-17,25-26]多采用增强CT 影像组学预测PDAC 淋巴结转移情况,Bian 等[15]研究发现CT 动脉期影像组学评分(RAD-score)越高,淋巴结转移的风险越高。Li等[17]结合临床数据和CT静脉期特征建立模型进行研究,发现联合影像组学特征与临床特征的预测模型对术前淋巴结转移的识别能力优于临床模型。证明了CT 影像组学在PDAC 淋巴结转移中的预测价值。但CT检查产生的电离辐射对人体有一定的损伤,且碘对比剂可能会使患者发生过敏反应甚至肾功能损害。
3.2 PDAC淋巴结转移主要研究结果分析
目前,MRI 检查以其无辐射、高软组织对比及多参数成像被越来越多的患者所选择,有学者研究[27-28]认为增强T1WI影像组学模型对肿瘤组织淋巴结转移及预后评估具有重要价值。由于在增强T1WI 序列中,动脉期的肿瘤与背景胰腺信号强度差异最大,因此本研究采用T1WI 动脉期影像组学预测PDAC 淋巴结转移情况。降维处理后获得5 个预测淋巴结转移最优的特征,分别为1个灰度共生矩阵特征、2个灰度行程矩阵特征、2 个灰度区域大小矩阵特征。灰度共生矩阵可以获得图像中具有相似或特定强度的像素对的空间相关关系,灰度行程矩阵反映了图像灰度关于方向、相邻间隔和变化幅度等信息,灰度区域大小矩阵是在二维空间中记录图像区域内有j个i元素相邻的情况的出现次数或概率[29-30]。Shi 等[18]同样基于T1WI 动脉期图像进行分析,该研究仅采用逻辑回归分类器建立模型。而本研究除采用逻辑回归模型外,还使用支持向量机和决策树进行建模。其中支持向量机模型的预测效能较逻辑回归模型与决策树模型好,AUC 在训练组与验证组中分别为0.882 与0.726。总之,构建的3种机器学习模型在训练组均表现为较好的预测效能(AUC>0.8),虽在验证组略有下降,但都维持在一个较理想的范围内(AUC>0.7)。
此外,由于胰腺不同部位的PDAC 淋巴结转移途径不同,本研究根据是否有淋巴结转移将患者分为阳性组与阴性组。并进行了淋巴结转移阳性组与阴性组、训练组和验证组间的临床及病理资料的比较,结果显示淋巴结转移阳性组和阴性组间的年龄、性别、肿瘤部位、组织学分级、CA199 及T 分期等临床及病理资料差异均无统计学意义。临床病理资料在训练组与验证组中差异无统计学意义提示临床病理信息在组间分布具有均衡性,排除临床和病理特征在影像组学模型中的潜在干扰因素。Bian 等[15]的研究同样得出年龄、性别、肿瘤部位及组织学分级在淋巴结转移阳性与阴性组间差异无统计学意义。Li 等[17]的研究发现年龄、性别及肿瘤部位在PDAC 患者淋巴结转移阳性及阴性组间的差异无统计学意义,但组织学分级在两组间差异有统计学意义。然而,通过组织学分级等临床因素构建的临床模型在训练组及验证组中预测效能欠佳。因此提示仅凭借临床信息较难预测淋巴结转移。在Shi 等[18]的最新研究中发现PDAC组织学分级在淋巴结转移阳性与阴性组间差异有统计学意义,和本研究结果的差异可能与本研究样本量较小有关。此外,Shi 等[18]的研究依据淋巴结转移是否大于3例来进行分组,与本研究的分组情况略有不同。因此后续研究将继续扩大样本量,排除其他因素对实验结果的影响。
3.3 局限性
本研究的局限性:(1)本研究是一项回顾性研究,外科医师所清扫的淋巴结可能与影像上所观察到的淋巴结不一致,较难获得淋巴结病理和影像的精准对应;(2)本研究仅采用TIWI 动脉期进行建模,可能会丢失其他序列所提供的有用信息,后续将采用多期相、多序列联合建模以期获得一个最佳的预测模型;(3)由于是回顾性分析,部分临床病理资料缺失的特征被排除在外,因而所纳入临床病理资料有限,可能忽略对预测淋巴结转移有价值的临床特征。因此,未来需要进一步进行多中心、大样本研究,同时纳入更全面的临床特征以进一步提高模型的鲁棒性和预测效能。
综上所述,基于T1WI 动脉期图像提取影像组学特征构建机器学习模型,能客观反映PDAC 的空间形态学异质性特征,在术前预测PDAC 淋巴结转移方面具有较高的诊断效能,可帮助临床获得更准确的诊断和分期。
作者利益冲突声明:全体作者均声明无利益冲突。