术前预测胃癌Lauren分型的CT影像组学诺模图的构建和验证

2020-09-21丁奕卢超王霄霄陈建单秀红

江苏大学学报（医学版） 2020年5期

丁奕，卢超，王霄霄，陈建，单秀红

(1. 江苏大学医学院，江苏镇江 212013; 2. 江苏大学附属人民医院影像科，江苏镇江 212002)

胃癌的发病率在所有恶性肿瘤中处于第5位，而死亡率处于第3位，男性发病率约为女性的2倍以上[1]。Lauren分型是胃癌临床组织病理学简单有效的分类方法之一。根据胃癌的组织形态学和细胞特性，Lauren分型分为肠型、弥漫型和混合型。研究表明肠型胃癌患者预后优于弥漫型，弥漫型胃癌复发率高于肠型[2]。如果术前能预测是肠型或弥漫型，对治疗方案的选择、预后的评估及生活质量的提高有重要意义。

影像组学是一种从医学图像中提取和分析大量高级定量成像特征的高通量方法，它的出现为肿瘤的个体化诊疗提供了新的思路，包括在肿瘤的诊断与鉴别诊断[3-4]、肿瘤转移预测[4-5]、疗效评价[6-7]、预后及生存率预测[8-9]等方面都显示出了很好的前景。Liu等[10]对基于CT的纹理分析的研究表明，动脉期的熵和标准差以及门脉期的最大衰减、平均衰减和模式等特征，可以为胃癌Lauren分型的预测提供重要帮助。Ma等[11]通过计算肿瘤动态增强MRI图像感兴趣区(region of interest,ROI)中的细胞外和血管外体积分数，发现弥漫型胃癌患者的体积分数高于肠型。目前还未见利用瘤内与瘤周的信息构建影像组学模型用于术前预测胃癌Lauren分型的研究。本研究拟构建并验证一个结合瘤内、瘤周和部分临床信息的CT影像组学模型，用于术前预测胃癌的Lauren分型。

1 资料和方法

1.1 研究对象

本次回顾性研究由江苏大学附属人民医院伦理审查委员会批准，收集2011年12月至2017年12月连续就诊的经病理学检查证实的胃癌患者1 097例。纳入标准： ① 组织病理学检查证实为胃癌； ② 手术前1周内行标准的腹部增强CT检查。排除标准： ① 接受过任何针对胃癌的治疗(n=184)； ② 合并其他类型腹部肿瘤(n=7)； ③ 临床资料不全(n=26)； ④ 低张力药物禁忌证，如青光眼、前列腺肥大等(n=11)； ⑤ 碘对比剂过敏史(n=7)； ⑥ Lauren分型混合型(n=323)。最后共有539例入组，按照7 ∶3的比例被随机分为训练集和验证集。收集患者的临床资料，包括年龄、性别、病理学Lauren分型、CT-T分期、CT-N分期。CT-T分期及CT-N分期根据国际抗癌联合会与美国癌症联合委员会的指导方针确定。

1.2 图像的采集和分割

所有患者均采用西门子公司Siemens Sensation 64层及飞利浦Briliance 256层螺旋CT进行扫描，扫描参数：电压120 kV,电流220～250 mA,图像层厚0.625 mm和0.5 mm。患者检查前空腹8 h，CT扫描前10 min肌注盐酸山莨菪碱20 mg，口服温开水800～1 000 mL，以使胃部充盈，经肘静脉注射非离子型对比剂碘海醇(碘浓度270 mg/100 mL),注射总量为1.5 mL/kg,注射速率为3.0 mL/s，注射后35 s采集动脉期图像，70 s采集静脉期图像。

收集静脉期CT图像，导入ITK-SNAP软件。进行最大层面ROI的手工分割，首先由两名影像科腹部组主治医师分别对所有的目标病灶进行手动分割，然后由影像科主任医师对所有的目标病灶进行校对。分割范围应该覆盖整个肿瘤区域。一个月后从539例胃癌病例中随机选择30例由上述3位影像科医师重复以上分割过程，以便进行可靠性和再现性测试。将分割完成的肿瘤ROI导出存储为DICOMG格式的图像。同时在每位患者CT图像上勾画的边界上自动创建一个周围环。

1.3 瘤内瘤周影像组学特征提取及筛选

利用Python软件对ROI内的影像组学特征进行提取，所有CT图像在特征提取前均以3.0 mm×3.0 mm×3.0 mm的像素间距重新采样，以保证像素大小和切片厚度的正确性。从每位患者CT图像中的瘤内及瘤周区域提取影像组学特征，包括形状特征、一阶特征和纹理特征。

首先对提取的特征进行预处理，利用平均值替代缺失值及异常值。其次采用z-score方法，根据训练队列中患者的平均值和标准差参数，对大量影像组学特征进行标准化。再次采用组内相关系数(intraclass correlation coefficient，ICC)来评价两次图像分割的影像组学特征的一致性[12]，本研究认为ICC>0.75提示为一致性较好的特征。最后采用10倍交叉验证的最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归选择出最优的特征组合。

1.4 模型的构建

将筛选出的瘤内及瘤周的最优特征输入多变量Logistic回归，通过将各回归系数加权后的相应特征相加，得出影像组学标签。影像组学模型结合了影像组学标签、CT-T分期、CT-N分期及年龄构建而成。同时根据上述最优影像组学特征中的瘤内及瘤周特征，分别建立基于瘤内及瘤周的模型。临床模型1基于CT-T分期和CT-N分期建立。临床模型2基于CT-T分期、CT-N分期及年龄构建，由于临床模型2由具有显著统计学差异的临床特征建立，因此可以验证影像组学标签对影像组学模型的增量值。所有模型都是在训练集上建立，并在验证集上进行测试。

1.5 模型的比较和验证

在训练集和验证集中使用ROC曲线来评估模型的预测能力。使用Delong检验比较模型之间预测性能。采用校准曲线验证模型预测能力与实际结果的匹配性，同时采用决策曲线证明本次研究临床信息的有效性[13]。使用综合判别改善指数(integrated discrimination improvement,IDI)对影像组学模型的分类能力进行评估。最后基于最优模型生成影像组学诺模图，实现模型可视化从而应用于临床。

1.6 统计学分析

所有的统计学分析均使用R软件(版本3.4.3，https:∥www.r.project.org)进行。在单因素分析中连续临床因素变量(年龄)采用t检验；分类变量(性别、CT-T分期、CT-N分期)采用χ2检验或Fisher精确检验。双侧P值<0.05为差异具有统计学意义。

2 结果

2.1 临床特征

训练集及验证集之间Lauren分型类别分布无统计学差异(P=0.566 6)。通过训练集中的单因素分析，确定了预测Lauren分型的临床特征为年龄、CT-T分期及CT-N分期。训练集和验证集的临床特征见表1。

2.2 特征的筛选及模型的建立

从所有病例的CT图像中共提取瘤内及瘤周影像组学特征2 074(1 037+1 037)个。对所提取的特征进行预处理及z-score方法标准化，然后以ICC>0.75为可靠性标准，提取出232个瘤内特征和206个瘤周特征，采用LASSO回归对影像组学特征进行降维，筛选出3个最优特征组合，包括两个基于瘤内的一阶特征(original_firstorder，wavelet.LL_firstorder)和一个基于瘤周的形状特征(original_shape_Maximum2DDiameterSlice)，以此构建影像组学标签。

基于上述临床及影像组学特征，本研究构建了6个预测模型：基于CT-T分期及CT-N分期的临床模型1；基于CT-T分期、CT-N分期及年龄的临床模型2；基于瘤内影像组学特征模型；基于瘤周的影像组学特征模型；基于瘤内及瘤周特征的影像组学标签；基于临床特征及影像组学标签的影像组学模型。

2.3 模型的比较和验证

通过ROC曲线对6个模型进行分析，结果显示影像组学模型表现优于其他模型。训练集AUC为0.745，验证集AUC为0.758，均高于其他模型。训练集准确度为0.716，验证集准确度为0.673,均高于其他模型。见图1、表2。至此确定影像组学模型为术前预测胃癌Lauren分型的最佳模型。模型生成的诺模图可以实现模型的可视化(图2)，通过该诺模图可以实现胃癌术前Lauren分型的个性化预测，计算出的数值越高，则认为弥漫型胃癌的可能性越高。

关于影像组学模型与影像组学标签之间的关系，尽管验证集中Delong检验显示影像组学模型和影像组学标签之间没有显著的统计学差异(P=0.120 4)，但是验证集中5.71%的IDI显示出影像组学模型较影像组学标签的提升。此外在验证集中，影像组学模型相较于临床模型2，17.73%的IDI和Delong检验P值<0.000 1显示影像组学标签给影像组学模型带来的提升。Delong检验结果见图3。

表1 训练集和验证集的临床资料比较

图1 训练集及验证集中的ROC曲线

图2 影像组学诺模图

影像组学模型的校准曲线显示出良好的适应度(图4A)。与阈值概率范围在1以内的两种临床方案相比，验证集中的决策曲线分析(图4B)表明影像组学模型在指导不同Lauren分型胃癌患者的治疗时增加了更多益处。

3 讨论

术前Lauren分型对治疗方案的选择有重要影响。弥漫型胃癌的浸润范围通常超过边界数厘米，因此弥漫型胃癌的切除范围较大，切口边缘距肿瘤边缘约8～10 cm[14]。另一方面，弥漫型胃癌通常比肠型预后差[15]。因此，在术前准确预测Lauren分型尤为重要。目前术前Lauren分型主要依靠胃镜病理活检，但术前胃镜病理活检因活检组织标本较少，结果并不能让人满意。研究显示术前胃镜活检与手术标本的Lauren分型符合率仅为64.7%[16]。因此，研究者们试图突破传统方法，寻求创新的检查和治疗方案。

表2 训练集及验证集模型预测性能比较

A：训练集；B：验证集；标红的方框表示两个模型之间的P值<0.05

A：训练集和验证集的校准曲线；B：验证集中的影像组学模型、临床模型1及临床模型2的决策曲线分析

本研究结果显示影像组学模型可以作为一种有效工具，用于术前预测胃癌Lauren分型，并获得良好的诊断效能。与单一基于瘤内影像组学特征模型相比，影像组学标签预测性能稍高(AUC为0.659和 0.715)。研究显示肠型胃癌和弥漫型胃癌的组织学改变不仅在肿瘤区有显著差异[17]，而且在癌周胃黏膜也有显著差异。与弥漫型胃黏膜相比，肠型毗邻胃黏膜很少有正常或接近正常的结构。弥漫型胃癌周围黏膜常有多层褶皱，被胃表面上皮覆盖。然而，类似的褶皱形成很少在肠型中遇到。因此，我们认为结合瘤周影像组学特征的影像组学标签可以为术前预测胃癌Lauren分型提供更全面和准确的信息。

对训练集中病例的分析显示，Lauren分型与年龄、CT-T分期和CT-N分期显著相关。通过对可视化的影像组学诺模图的解读，可以发现弥漫型胃癌的发生更可能与年龄小、CT-T分期及CT-N分期级别高有关。这些结果与先前的研究一致[17-18]。

与其他Lauren分型的无创研究相比，在训练集和验证集中，影像组学模型AUC分别为0.745和0.758，具有良好的鉴别性能。Liu等[19]回顾性分析了69例胃癌患者的MRI图像发现胃癌的平均及最小表观弥散系数值显著低于正常胃壁，不同Lauren分型胃癌患者的平均及最小表观弥散系数值有显著性差异。Ma等[11]分析32例胃癌病例，计算出肿瘤动态增强磁共振图像ROI细胞外和血管外体积分数，发现弥漫型胃癌的体积分数高于肠型。然而，他们的研究由于病例数较少和没有进行模型构建，无法应用。

综上所述，本研究基于瘤内及瘤周的影像组学特征、CT-T分期、CT-N分期、年龄构建的影像组学诺模图，可以用于个性化的术前预测胃癌患者的Lauren分型，辅助临床决策的制定。本研究是一项回顾性研究，存在如下不足： ① 仅对门脉期的CT图像进行影像组学特征提取。② 只分析了肿瘤最大层面图像。③ 分割的CT图像层厚是0.625 mm和0.5 mm，对直径2 cm以下的胃癌分割图像的容积效应明显。④ 因为存在特征干扰将Lauren分型中的混合型撤除，但临床上混合型的比例并不少。