APP下载

机器学习在肺癌外科的研究进展

2020-12-19李宗元陈晓烨刘伦旭

临床外科杂志 2020年7期
关键词:结节准确率肺癌

李宗元 陈晓烨 刘伦旭

肺癌是目前国内外发病率、死亡率最高的恶性肿瘤,外科手术治疗是非小细胞肺癌(non-small cell lung cancers,NSCLC)的主要治疗方式。随着医疗领域新技术的发展,供临床决策的肺癌数据容量、信息维度不断增多,如何利用庞大的临床数据实现精准化决策成为肺癌外科研究的重要方向[1]。机器学习(machine learning,ML)是人工智能的一个分支,通过模拟人类的学习行为,将从数据样本中学习的问题与推理的一般概念联系起来,其主要方法包括监督学习和无监督学习两类[2]。ML在大样本和多维数据的处理、学习过程的标准化和预测的高效性及准确性等方面具有独特优势,其在肺癌外科领域的诊断及分期、手术方案制定及预后预测等方面均具有重要应用。

一、ML在肺癌诊断及分期中的应用

1.肺癌筛查和肺结节诊断:胸部影像学检查是目前临床上肺癌筛查和辅助诊断使用最广泛的检查手段。随着高分辨率CT的应用、人群早期筛检意识的提高,肺癌防治水平明显提高,越来越多的肺癌病人在早期得到检查并确诊[3]。尽管如此,由于图像蕴含信息丰富、阅片医师的主观性和人眼视觉的局限性,传统人工阅片方法对于肺部结节的检出率不确定,且对检出结节特别是肺磨玻璃结节的性质鉴别和危险度分层仍是一个难题[4]。运用计算机智能技术辅助诊断已成为大势所趋,基于ML和深度学习的算法模型和计算机辅助诊断系统,在肺结节检出和分类方面表现出极高准确性,具有很高研究潜力和重要应用价值[5-6]。Massion等[7]使用国家肺结节筛查研究(NLST)发现的未定性肺结节CT图像,训练肺癌预测卷积神经网络模型,并在两个学术机构的队列中进行外部验证,结果显示,外部验证队列的AUC分别为0.835和0.919,与传统的梅奥风险预测模型相比,准确性有所提升。Choi等[8]建立一种低剂量CT肺结节分型的放射组学预测模型,采用分层聚类方法识别来自数据库的72份CT影像特征,利用支持向量机(support vector machine,SVM)分类器和套索算法(least absolute shrinkage and selection operator,LASSO)建立预测模型,并与美国放射学会肺部CT筛查报告和数据系统(Lung RADS)比较,结果表明,边界框前后维和反差矩标准差的SVM-LASSO模型对诊断肺结节良恶性的准确率为84.6%,比Lung RADS高12.4%。随着ML算法的优化和大样本的训练,其辅助肺癌筛查和肺结节恶性肿瘤危险性鉴别的诊断效能,尚具进一步提高的潜力。另一方面,尽管采用低剂量CT对高风险人群进行肺癌筛查应用广泛,但仍存在界定标准不一、假阳性率高和效益成本比较低等问题。近年来,随着医学检验技术的进步,特别是生物芯片等技术的出现,新兴的生物标志物在肺癌筛查中展现出不俗的潜力,将ML、影像组学和生物标志物结合并建立综合预测模型,对未来提升肺癌筛检能力具有重要价值。Shin等[9]使用正常细胞系和肺癌细胞系外泌体(exosomes)的表面增强拉曼光谱(surface-enhanced Raman spectroscopy,SERS),训练深度学习模型以识别早期肺癌,结果显示分类准确率达95%,提示其作为一种肺癌早期液体活检的方法具有巨大潜力。

2.肺癌亚型诊断:肺癌的准确分类是个体化治疗和系统治疗决策至关重要的一步。活检和术后病理切片是常规临床实践中确定肺癌亚型的主要方法,但均属侵入性诊断,耗时且具有一定风险。开发非侵入性的肺癌亚型分类方法可更好帮助临床决策。Guo等[10]回顾性纳入920例肺癌病人,分别使用三维深度学习和放射组学方法,实现自动区分肺腺癌(lung adenocarcinomas,ADC)、鳞状细胞癌和小细胞肺癌并比较其表现,结果表明,两模型准确率分别为71.6%和74.7%,AUC分别为0.840和0.789,该方法有望成为无创性预测肺癌组织学亚型的有效方法。Zhao等[11]使用包含651个亚厘米肺结节CT影像的数据集,训练并开发出一套基于三维卷积神经网络和多任务学习的、自动预测ADC浸润程度的深度学习系统,以鉴别不典型腺瘤样增生、原位腺癌、微浸润腺癌和浸润性腺癌,结果显示模型加权平均F1得分为63.3%,优于放射科医生。

3.肺癌淋巴结转移分析:ML的算法模型具有很大潜力,可基于计算机视觉技术辅助肺癌影像的识别,或作为“虚拟活检”的手段提供淋巴结转移预测,可有效减少有创性检查、提高分期的精确性。Wu等[12]回顾性分析1102例直径≤2 cm NSCLC的临床和影像学特点,并纳入23项预测因子,通过多个ML算法建立病人术前淋巴结转移的预测模型,结果表明,8种模型的AUC为0.784~0.899,其中引入9个变量的随机森林分类器(RFC)最佳。

4.肺癌相关驱动基因突变预测:随着影像技术和人工智能技术的发展,影像基因组学应运而生,将分子表型和肿瘤成像特征(如密度、纹理特征等)联系起来,为指导精准医疗、个体化治疗提供了工具。肺癌相关驱动基因中,表皮生长因子受体(epidermal growth factor receptor,EGFR)突变最早被发现且研究较深入,近年来也出现很多针对ALK重排和KRAS突变的研究。Nair等[13]通过对50例已知EGFR突变NSCLC病人的胸部CT和FDG PET-CT影像进行人工轮廓分析,提取出纹理特征用于开发多变量逻辑回归模型,以预测EGFR外显子19和外显子20的突变,结果表明由CT和FDG PET-CT纹理特征得出的模型准确率分别为0.78和0.71。

二、ML在肺癌外科治疗及预后中的应用

1.辅助手术方案决策:ADC中,肿瘤气道内播散(spread through air spaces,STAS)与淋巴血管侵犯和淋巴结转移相关。有研究证实,STAS为亚叶切除联合淋巴结采样术后早期复发的独立危险因素[14],提示STAS阳性病人可能应采用肺叶切除术和纵隔淋巴结清扫,故术前预测ADC STAS阳性率可为手术决策提供重要参考。Chen等[15]纳入2011~2013年间经手术切除肿瘤的233例Ⅰ期ADC病人,对88项CT影像组学特征进行无监督聚类分析,选取代表性特征构建贝叶斯模型(Bayes model)以预测病人STAS阳性率,结果显示AUC为0.69,可辅助外科医师参考选择手术方案。

2.辅助治疗决策:由于辅助化疗的毒性作用,筛选何种术后病人行辅助化疗仍存在争议,尤其对于早期NSCLC的治疗。Depeursinge等[16]纳入手术切除的I期ADC 101例,基于术前CT磨玻璃影和肿瘤实体部分的尺寸的方向提出纹理模型,通过SVM和Lasso算法得到AUC为0.8的预测模型,并发现腺癌侵袭性与肿瘤实体部分的强度和形态高度相关,为易复发病人的特异性指标,对术后是否进行辅助化疗有一定的指导意义。Chen等[17]通过多中心回顾性研究280例NSCLC病人的基因特征和T分期,构建人工神经网络模型,对术后辅助化疗的风险进行评估,发现DUSP6和LCK的表达结合T分期对于预后预测的准确率为65.71%。研究表明,利用ML可指导辅助化疗的应用,未来可通过选择更具特异性的基因位点进行分析从而提高预测的准确率。

3.肺癌远处转移特异性征象:肺癌易转移至肝、肾上腺、脑及骨,找出相关影像学及临床特征能综合预测肿瘤特异性转移的可能性,据此对病人进行危险性分层,可对高危病人进行有针对性的干预。Kniep等[18]纳入225例原发肺癌病人,采用随机森林(RF)算法在1423个定量影像特征和基本临床信息中筛选脑转移特异性特征并训练分类模型,结果显示AUC达0.89,表明此分类模型具有良好预测效能。脊柱转移性肺癌病人预后较差,Lang等[19]纳入30例既往无肿瘤、后确诊为肺癌且转移至脊柱病人的动态增强MRI,深度学习其纹理特征和直方图并获得信号强度-时间曲线,通过特异性较高的特征如曲线上升期信号强度增幅(Peak SE%)、曲线最大上升线性斜率(max wash-in SE%)、曲线下降斜率(wash-out SE%)等半定量参数构建卷积神经网络,准确率可达0.81,证明模型具有预测肺癌脊柱转移的能力,可作为早期诊断的工具。

三、总结与展望

通过ML对临床信息、影像组学和生物组学资料进行高效的分析和挖掘,是信息时代医学与大数据结合的重点方向之一,各种模型和分类器在肺癌外科得到良好应用,辅助外科医生制定诊治决策,推动精准医疗的发展。目前,国内外已投入ML在肺癌及医学研究的应用,但离实际临床应用还存在一定距离。虽然数据来源不断增大,数据维度不断增多,但仍缺少有效整合不同维度数据的高质量标准化肺癌临床数据库。目前绝大多数预测和诊断研究仅适用于某一类病人,后续研究需优化算法,探索模型在训练人群以外的适用性。部分研究指出,目前对模型的分析结果仍需要影像医师的审阅,需要不断提高诊断的准确度和智能化。在社会法规方面,诊疗结果的医疗责任问题、信息安全问题等仍未被规范。随着医学大数据信息的不断积累、计算机技术与医学的进一步融合,ML在肺癌外科的应用机遇与挑战并存,有广泛的应用前景和很高的临床价值。

猜你喜欢

结节准确率肺癌
氩氦刀冷冻治疗肺癌80例的临床观察
体检发现的结节,离癌症有多远?
肺结节,不纠结
发现肺结节需要做PET/CT吗?
肺结节≠肺癌,发现肺结节如何复查?
长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
CXCL-14在非小细胞肺癌中的表达水平及临床意义
2015—2017 年宁夏各天气预报参考产品质量检验分析