APP下载

基于CT影像组学特征的机器学习模型预测早期急性胰腺炎进展的价值

2022-07-12范海云陈基明陈亮亮吴莉莉

皖南医学院学报 2022年3期
关键词:训练组组学胰腺

范海云,陈基明,陈亮亮,羊 琦,吴莉莉,周 慧

(皖南医学院第一附属医院 弋矶山医院 1.医学影像中心;2.消化内科,安徽 芜湖 241001)

急性胰腺炎(acute pancreatitis,AP)是消化系统最常见的疾病之一,发病率逐年增高[1]。大多数轻症患者预后良好,而重症患者常引发器官功能衰竭,病死率可达28%~69%[2]。因此,在AP早期阶段准确预测疾病进展,并进行密切监测和及时干预,能够有效改善患者的预后[3]。临床表现及实验室检查难以预测AP进展[4]。CT是诊断AP并发症及评估患者预后最常用的影像学方法,然而在早期阶段,对胰腺坏死检出率不高,导致病重程度被低估[5]。影像组学通过计算机算法高通量地从常规影像图像中提取大量数据,检测到肉眼无法识别的细微变化,故能对疾病的异质性进行全面量化分析,辅助临床诊断、治疗等工作[6-7]。机器学习通过数据属性定义数据,利用临床数据和特定算法来预测各种结局指标并构建模型[8],对不同算法进行比较,能够提高临床预测效能[9]。本研究利用CT平扫及增强图像进行影像组学分析,并利用多种机器学习算法构建预测模型,旨在探讨影像组学特征的机器学习模型预测早期AP进展的价值。

1 资料与方法

1.1 研究对象 回顾性分析2013年11月~2021年1月弋矶山医院104例根据新修订的亚特兰大分类诊断为AP患者的资料。根据是否出现新的并发症及局部并发症的加重,将AP患者分为进展期与非进展期。其中进展期40例,男24例,女16例,平均年龄(51.38±16.15)岁;非进展期64例,男26例,女38例,平均年龄(49.41±16.60)岁。采用完全随机方法将患者按7∶3的比例分为训练组73例和验证组31例。纳入标准:①首次发病入院;②发病1周内接受CT平扫及增强检查;③有CT或MRI复查。排除标准:①图像不全或质量不佳者;②自身免疫性胰腺炎、胰腺肿瘤或创伤者;③胰腺边界不清难以勾画ROI者。局部并发症包括:急性胰腺周围积液、急性坏死性积聚、胰腺假性囊肿、包裹性和感染性胰腺坏死、静脉血栓、假性动脉瘤;全身并发症包括:全身炎症反应综合征、器官功能衰竭;局部并发症的加重包括:急性胰腺周围积液增多、急性坏死性积聚范围增大。

1.2 检查方法 采用飞利浦64排螺旋CT机行上腹部或全腹部MSCT平扫及增强扫描,患者取仰卧位,屏气下进行扫描,扫描参数:管电压为120 kV,管电流为220 mA,层厚5 mm,层间5 mm,DFOV为30 cm×30 cm。经右肘前静脉注射造影剂碘化醇1.5 mL/kg,注射速率为2.5 mL/s,分别采集注射后动脉期25 s、静脉期60~70 s和延迟期3 min图像。

1.3 特征提取、筛选及影像组学标签的建立 将所有患者的CT平扫及三期增强图像导入ITK-SNP软件,由两名放射科医师沿胰腺边缘逐层手动勾画ROI(包括胰腺坏死并尽量避开大血管及胆总管),并合成三维容积感兴趣区(VOI),再将勾画的图像导入AK软件。通过提取影像组学特征及滤波变换获取图像信息(包括一阶特征、形态特征、灰度共生矩阵特征及小波变换等)。用组内相关系数(ICC)评估观察者的一致性,并保留一致性较好(ICC>0.80)的特征,依次使用最小冗余最大相关(mRMR)和最小绝对值收敛和选择算子(LASSO)回归进行降维,获取最优影像组学特征。分别构建各期影像的组学标签,计算每个患者的标签得分(Rad-score)。

2 结果

2.1 影像组学特征提取的一致性 两名医师测量组间ICC为0.851(95%CI:0.705~0.923,P<0.05),ICC>0.80说明一致性较好。

2.2 影像组学特征的提取 从平扫、动脉、静脉及延迟期每个序列图像各获得1 316个纹理特征,4期序列联合提取5 264个纹理特征,通过mRMR去除冗余和不相干特征后保留15个有效特征,用LASSO回归对特征进一步降维,各期分别最终获得12、11、10、12、13个最优特征(图1)。

2.3 预测模型的建立及效能评估 基于平扫、动脉、静脉、延迟及四期联合筛选出的最优特征用多因素Logistic方法建立5个LR模型。经ROC曲线分析,延迟期序列影像组学标签在训练组和验证组间均有相对更好的预测效能(AUC分别为0.86、0.84)(表1),经DeLong检验各序列LR模型间在训练组和验证组中差异均无统计学意义(P>0.05)。延迟期LR模型训练组和验证组经Hosmer-Lemeshow检验都显示了良好的拟合效果(训练组χ2=6.773,P=0.561,验证组χ2=9.735,P=0.284)。基于延迟期特征构建RF和SVM模型,不同机器学习模型预测AP进展的诊断效能及ROC曲线见表1和图2。经DeLong检验LR模型与RF模型间在验证组中差异有统计学意义(Z=2.402,P=0.016),在训练组中差异无统计学意义(P>0.05);其余延迟期机器学习模型间在训练组和验证组中差异均无统计学意义(P>0.05)。

表1 临床模型、影像组学标签及影像组学预测模型ROC结果

A.训练组;B.验证组。

3 讨论

早期准确判断病情演变方向,对可能进展为重症AP的患者及时采取针对性治疗,能够有效改善患者预后。为有效探索早期、准确、简便预测AP进展的方法,本研究基于平扫及增强CT影像组学特征不同机器学习模型预测AP进展,结果显示延迟序列LR模型具有较高的诊断效能(在训练组和验证组中,AUC分别为0.86、0.84,准确性分别为0.82、0.81)。

延迟序列LR模型筛选的纹理特征分析:本研究中延迟期LR模型的预测效能在训练组和验证组中略高于其他几期序列模型。与平扫相比,延迟期扫描可以提供反映病灶的血供及血流灌注等更加丰富的信息,能够有效显示胰腺小范围坏死、出血情况,可提供更全面地反映病变的异质性的特征。延迟期共筛选出12个最有价值的纹理特征,其中6个纹理特征由局部二值模式变换获得,其能有效提取图像的纹理信息,保留像素空间位置关系,且具有旋转不变性和灰度不变性等显著优点[10],可以有效反映CT检查图像局部信息的不变性。另外4个纹理特征是经小波滤波分解获得,且权重较重,小波变换在许多领域都得到了成功应用[11-12],通过小波变换把图像信号分解成不同子带,针对不同子带应用不同的算法来增强不同频率范围内的图像分量,突出不同尺度下的近似和细节,小波变换系数能提供病变边缘轮廓信息,具有重要影像解析能力,较其他特征价值高[13]。

机器学习算法在预测AP进展的应用价值:本研究探索性采用多种机器学习算法构建预测模型,结果显示LR和SVM模型均有较好的预测价值(训练组AUC分别为0.86、0.84,验证组AUC分别为0.84、0.77),优于RF模型;LR模型无论在训练组还是验证组均具有很好的预测效能。传统LR实现简单、快速,模型可解释性好[14];SVM最大的优点是仅需少量样本便能取得很好的效果,且在处理高维度和非线性数据上有优势,泛化能力较强[15]。

本研究的局限性:①样本量较小且为单中心回顾性研究,有待于大样本、多中心研究进一步补充;②只探讨了影像组学标签模型的预测效能,下一步将加入临床及影像资料进行深入研究;③手动勾画ROI受个人主观因素影响。

综上所述,基于延迟期CT图像的影像组学特征构建的LR模型能够有效预测AP进展,实现个体化精准医学。

猜你喜欢

训练组组学胰腺
新型抗阻力训练模式改善大学生身体素质的实验研究
影像组学在肾上腺肿瘤中的研究进展
基于影像组学的直肠癌术前T分期预测
胰腺微创手术中胰腺残端处理
不同检查方式对胰腺损伤的诊疗价值
产后妇女盆底功能障碍康复治疗方法及应用效果观察
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
胰腺超声检查
运动可延缓衰老