卷积神经网络在T3/4期胃癌影像学诊断中应用

2021-11-23张训营张凯明张超马金龙卢云王东升

青岛大学学报(医学版) 2021年5期

张训营,张凯明,张超,马金龙,卢云,3,王东升

(1 青岛大学附属医院胃肠外科,山东青岛 266003; 2 青岛大学附属医院影像科; 3 山东省数字医学与计算机辅助手术重点实验室)

胃癌目前在全球癌症发病率中位居第5,死亡率位居第3,严重威胁人类健康[1]。东亚是胃癌高发病及高死亡地区,尤其是中国及日本[2]。中国胃癌病人占全球胃癌发病人数的42.6%,占相关死亡人数的45.0%[3-4]。尽管目前手术是治愈胃癌的唯一方法,但是新辅助化疗的应用可以明显提高胃癌的治愈率及病人的生存率[5]。中国临床肿瘤学会建议,新辅助化疗适用于T3 期及以上胃癌病人,T2期及更早的胃癌建议行手术治疗[6]。因此,为了提高治愈率及降低新辅助化疗的不利影响,需要对T3/4期胃癌病人进行有效筛选[7]。CT 由于具有非侵入性、实用性、便利性及稳定性等优点,是术前评估胃癌分期的常规检查方法[8]。但是,CT 预测胃癌T 分期的总体准确率为43%～82%,容易对胃癌T 分期产生误判,造成不必要的姑息性手术及过度的放化疗治疗[9-12]。在这种情况下,需要一种替代技术对T3/4期胃癌病人进行有效的筛选。

人工智能处理数据具有运算速度快、精度高等优点[13-14]。近年来,在临床实践中卷积神经网络(CNN)越来越多地被用来识别和区分医学图像。该技术在影像图片诊断中已经显示出具有较高的诊断性能,例如在检测冠状动脉粥样硬化、乳癌、转移淋巴结[15-17]、皮肤病变的分类[18]及糖尿病视网膜病变筛查[19]等时,在各种深度学习模型中CNN 是最成熟的算法。本研究主要基于CNN 在图像处理及识别方面的强大能力,探索利用上腹部增强CT 图像建立CNN 对T3/4期胃癌的自动识别平台,并验证、评估其准确性。现将结果报告如下。

1 资料和方法

1.1 病人选择

回顾性收集2018年6月—2019年12 月在青岛大学附属医院行根治性胃癌手术的564例病人的上腹部增强CT 图片。病人的纳入标准:术前行胃镜检查经病理诊断为胃癌;术前于我院行上腹部增强CT 检查;于我院行根治性切除手术,术后病理确诊为T3/4期胃癌。排除标准:肿瘤直径较小无法勾画感兴趣区域(ROI);术前接受新辅助放化疗;胃腔充盈状态不理想或胃部蠕动导致成像不理想病人;手术后复发的病人。最终共208例病人被纳入研究,其中T3期病人90例,T4期病人118例。收集病人性别、年龄及肿瘤病理分期、部位等基本信息。本研究经青岛大学附属医院伦理委员会批准。

1.2 病人分组及CT 检查方法

以肿瘤分期及肿瘤部位为分类标准将病人按7∶1 比例随机分入训练集(182 例)和验证集(26例)。研究小组在训练集中共挑选出1 200张优质图像确定为阳性图像,同理在测试集中挑选出210张阳性图像。本研究所有病人均采用飞利浦Brilliance iCT 扫描仪行上腹部增强CT 扫描,扫描层厚为1 mm,层间隔为1 mm,间距为0.985。检查前所有病人均签署碘对比剂知情同意书,禁食4～6 h,检查前20 min给予病人500～1 000 m L 饮用水。通过高压注射器以3 m L/s的流量将90 m L非离子造影剂碘海醇注入前肘静脉进行增强扫描。在动脉期延迟扫描33 s,在静脉期延迟扫描65 s,在平衡期延迟扫描120 s。扫描范围为横膈膜到脐部平面。

1.3 图像标识及数据增强处理

利用labelImg软件对图像进行标识,由两名高年资放射科医师分别独立阅读CT 图像并标记肿瘤病变,标识方法采用肿瘤分割方法。根据相关文献的研究结果,与邻近胃壁相比,局灶性胃壁增厚≥6 mm 确定为异常增厚和癌变[20]。两名影像科医师结合病人胃镜报告及术后最终病理结果,仅标识影像图像中肿瘤浸润胃壁最深的位置。根据术后病理结果,由第三位影像科医师检查上腹部增强CT 图像上肿瘤标识部位,以保证增强CT 图像中病变部位的准确性及一致性。

利用CNN 提取上腹部增强CT 图像上不同大小的ROI,然后对1 200张阳性图片中的ROI使用裁剪、翻转等数据增强方法进行数据扩增,最后筛选出2 500张阳性图像作为训练数据集,以增强研究数据集,同时减轻模型处理数据集时产生的过度拟合问题[21]。

1.4 识别平台构建及验证

1.4.1 构建识别平台构建识别平台前对图像进行预处理,包括采用图像强度范围归一化和直方图均衡化方法来处理图像[22]。统一将训练图像缩放为512×557像素大小,然后对识别平台进行训练,识别平台在学习阳性图像同时,将训练集中正常胃部解剖图像默认为阴性图像一并学习。本研究采用的CNN 是一个具有101层深度的CNN,可以对图像特征进行提取。每个层面的模型分别经过800个epoch的训练。优化器采用SGD 优化器,初始学习率为0.000 2。对CNN 学习成果分析采用Python编程语言,提取Metric模块里面的结果生成结论。

1.4.2 平台验证利用验证集中210张阳性图像和200张阴性图像对该平台识别性能进行验证。对比影像科医师对胃癌肿瘤区域标注结果,判定平台对验证集识别结果准确性。通过绘制受试者工作特征(ROC)曲线,计算ROC曲线下面积(AUC),评估诊断平台识别T3/4期胃癌图像的准确性,并统计识别的准确度、灵敏度、特异度、阳性预测值及阴性预测值等指标。

1.5 统计学分析

应用SPSS 20.0软件对数据进行统计学处理。统计所有结点处的真阳性和假阳性的数目,计算得到不同概率阈值下真阳性率和假阳性率,从而绘制出ROC曲线,通过计算AUC,得出平台识别T3/4期胃癌的准确率。

2 结果

2.1 平台的学习效果

为评估平台的学习效果,研究小组将验证集输入经过训练的识别平台中进行验证。由诊断平台学习结果的损失函数(loss)学习曲线可知,诊断平台在进行800个epoch学习后达到最佳优化参数。用于识别T3/4期胃癌诊断平台的AUC为0.924,准确度、灵敏度、特异度分别为0.927、0.924、0.930,阳性预测值为0.933,阴性预测值为0.921。见图1。

图1 T3/4期胃癌自动识别平台的ROC曲线

2.2 平台验证

如图2所示,A、C 图片是影像科医师基于病理结果手动标识的肿瘤位置,B、D 图片是识别平台对图片中肿瘤的分割及识别。可以得出结论,基于上腹部增强CT 图像,该识别平台识别T3/4期胃癌具有很高的准确性。

图2 自动识别平台对T3/4期胃癌图像的识别

3 讨论

准确的术前T 分期对胃癌病人围手术期选择治疗方案以及评估预后均至关重要[23]。有研究证实,胃癌病理T3/4期是术后切缘阳性的独立危险因素,术后切缘阳性病人总体预后较差[24]。中国临床肿瘤学会建议治疗胃癌之前需要准确地区分胃癌T 分期以制定精准的治疗计划。第8版美国国立综合癌症网络指南(NCCN 指南)提出上腹部增强CT是诊断胃癌T 分期的主要影像学方法。影像科医师主要通过术前腹部CT 等影像资料评估胃癌病人T 分期,继而指导临床医师选择治疗方案。然而,目前实际临床工作中术前通过腹部CT 判断T 分期还存在一些问题:①不同影像科医师通过上腹部增强CT 评估胃癌病人T 分期存在主观差异;②在目前国内各三级甲等医院病人数量庞大的背景下,面对通过CT 等影像资料进行胃癌临床分期的复杂性,影像科医生承受着巨大的工作量。因此,迫切需要一种新的方法来提高临床诊断效率。而深度学习网络技术的发展,为解决这一问题创造了可能。有研究报道,CNN-CAD 系统已经应用于乳房组织病理学图像的分类检测[25]和结肠直肠癌的检测[26]。本研究基于CNN 建立了识别T3/4期胃癌的诊断平台,实现了术前利用上腹部增强CT 对胃癌进行快速精确筛选。

本研究小组在前期已经开发出基于深度学习网络的直肠癌转移淋巴结的MRI图像自动识别系统[27]。在前期经验的基础上,本研究建立了基于CNN 的T3/4期胃癌自动识别平台,并评估了其临床价值。上腹部增强CT 为胃癌病人的常规辅助检查手段,有研究证实,上腹部增强CT 静脉期图像对胃癌肿瘤浸润的诊断性能优于动脉期图像,所以本研究选用上腹部增强CT 静脉期图像[28]。最新版胃癌NCCN 指南指出,上腹部CT 对胃癌T 分期的识别准确率为43%～82%[23]。兰州大学第二医院的一项回顾性研究将胃癌术后病理结果与影像科高年资医师读片报告对比,结果显示,增强CT 评估T3、T4期胃癌的准确度分别为76.7%和92.7%[29]。本研究中通过放射科高年资医生结合病理结果对增强CT 图片的标识,对T3/4期胃癌识别平台进行深度训练,经验证识别平台对于T3/4期胃癌病人增强CT 静脉期图像具有较高的识别准确度,其AUC为0.924。表明识别平台的准确性接近于影像科高年资医师的诊断水平。考虑其原因可能为:①T4期胃癌肿瘤较大、浸透浆膜层,在CT 图片中易于辨认;②T3期胃癌侵犯至胃壁的固有肌层,而固有肌层在增强CT 中构成了低密度条纹层的外层[30],在病理切片中占据了胃壁的大部分,这降低了识别T分期的难度;③T3/4期胃癌图片较多,诊断平台参数优化较完善。基于诊断平台对病人全静脉期连续图像的T 分期最终判定结果与术后病理T 分期诊断结果完全相符。上述结果表明,该诊断平台具有较高的可行性、准确性、客观性和高效性,可以辅助放射科医生完成胃癌的筛选工作,减少放射科医生的工作量;可以辅助临床医生制定诊疗方案,从而有利于胃癌病人接受更加精准和高效的治疗。

本研究的局限性:①本研究为单中心试验研究,数据量有限;②本研究是基于CNN 的监督学习,平台的训练准确性依赖于放射科医师对增强CT 图片肿瘤区域的精确标识。因此,为了进一步提升人工智能辅助平台的可靠性,今后研究将联合多中心增加数据量,并优化算法和提升标识效率,最终实现临床验证,以达到辅助医师诊断与治疗的目的。

综上所述,本研究建立的T3/4期胃癌自动识别平台能够利用上腹部增强CT 图像自动分割识别T3/4期胃癌,显示出了与经验丰富的影像科医师相当的准确性,有望协助影像科医师做出更为精准、直观及高效的诊断,极大减轻影像科医师的工作负担;有望指导临床医师制定诊疗方案,利于病人接受更加精准及个性化的治疗。