APP下载

基于深度学习的X线诊断乳腺癌研究进展

2019-01-08聂贞慧刘丽东苏丹柯

中国医学影像技术 2019年5期
关键词:肿块乳腺乳腺癌

聂贞慧,刘丽东,苏丹柯

(广西医科大学附属肿瘤医院医学影像中心,广西 南宁 530021)

乳腺X线摄影作为乳腺癌的重要检查手段广泛应用于临床,但在乳腺X线片上,可疑乳腺癌病变通常与致密纤维腺体组织相互重叠,导致X线诊断乳腺癌的假阴性率较高。近20年来,基于机器学习的计算机辅助诊断(computer aided diagnosis,CAD)快速发展,使影像科医师的诊断效率及准确率显著提高[1]。深度学习是近年来机器学习的热点,具有易学、通用及高效的优点,适用于CAD。本文对深度学习在X线诊断乳腺癌中的研究进展进行综述。

1 深度学习及其模型概述

深度学习被《麻省理工科技评论》(MIT Technology Review)称为2017年重要的突破性科学技术之一。深度学习是由多个处理层组成的计算模型,其中每层均为典型的神经网络,通过反向传播算法学习具有多个抽象级别的数据。在深度学习模型中,由低层神经网络自动学习和提取有效的图像特征,随后根据较高层神经网络提取的特征将图像分为不同的目标类别,发挥分类器的作用。与传统机器学习相比,深度学习能够自动从原始输入数据中学习分层特征,具有较传统分类器更高的分类性能[2]。目前,应用于图像分析的深度学习网络主要包括卷积神经网络(convolutional neural networks,CNN)、深信度网络(deep belief networks,DBN)、多层反馈循环神经网络(recurrent neural network,RNN)及上述学习网络的改进模型[3]。深度学习最初用于计算机语音、图像识别等领域,近年来逐渐应用于医学领域,如肺部微小结节分类[4]以及预测胶质瘤患者生存时间[5]等。

2 深度学习应用于X线诊断乳腺癌的步骤

深度学习用于X线诊断乳腺癌主要包括5个基本步骤,分别为数据集选择、图像处理、预训练、病变检测与分割、特征提取与病变分类。

2.1 数据集选择和图像处理 用于深度学习模型训练的乳腺X线片通常来源于公共数据集或私人数据集。常用的公共数据集包括乳腺X线摄影数字化数据库、全数字化乳腺X线摄影数据库等[6],不仅数据量充足,且包含详细的图像信息及精确的专家注释,为训练和验证深度学习模型提供数据保障。非公开的私人数据集的数据选择较前者更灵活,可以根据研究目的构建相应的X线摄影数据集,但因私人数据集的建立通常未遵循统一标准,可能影响模型之间性能的比较。此外,选取私人数据集时,其研究对象通常存在一定的局限,如仅对包含异常征象的乳腺X线片进行训练而忽视正常乳腺,可能导致测试结果产生偏差[7]。

模型训练之前对图像进行一定的预处理,可以提高训练结果的准确性。当训练集数据量不充足时,可通过对图像进行几何变换(如旋转、平移、缩放)或增加噪声等技术手段进行扩增[8],使图像数据集增至1 000倍以上,以保证数据量充足,避免发生过拟合现象。此外,预处理可降低计算的复杂性、提升训练速度,如Qiu等[9]使用传统平均方法将每个ROI从512×512像素缩小至64×64像素下采样,Mohamed等[10]将直方图均衡化应用于所有图像作为预处理步骤,以校准图像对比度。

2.2 预训练 预训练模型为解决相似目标任务而建立,构建模型时可仅针对模型中的数层结构进行微调,避免对整个模型结构进行训练。研究[11]表明,预训练不仅可显著缩短运算时间,还能提高对乳腺X线片的分类效率。通常由迁移学习完成数据预训练。首先选择在图像识别可视化数据库(ImageNet)等大型数据集上进行训练,为之后的深度学习模型训练提供参数优化,并增加图像细节信息;然后将预训练模型相应的结构和权重直接应用于目标任务中[12]。

2.3 病变检测与分割检测 病变是决定深度学习模型精度的关键环节,通常由3个阶段组成:首先使用图像滤波器检测候选区域,划定ROI;随后利用支持向量机、线性判别分析等不同类型的分类器消除检测的假阳性结果;最后采用贝叶斯优化[13]等细化步骤,改进所划定的ROI边框的尺寸和定位,以降低图像重叠率,实现对病灶形状、大小和密度变化的稳健建模,提高检测精度。

从乳腺X线片中准确分割病变是深度学习模型开发的另一关键技术[9],分割的准确性直接影响下一步病灶分类的性能,其影响因素包括肿块形状及大小、图像SNR等。目前用于分割病变的方法主要包括阈值法、马尔可夫随机场[14]及具有强大形状先验功能的水平集方法。Dubrovina等[15]采用阈值法对乳腺X线片中的乳头、胸肌、纤维腺体组织及皮肤进行分割,显示出良好的组织分割性能。此外,Chan等[16]将水平集方法用于分割细化阶段,将图像调整至高分辨率进行输入,便于组织划分。

2.4 特征提取与病变分类 深度学习利用模式识别的方法,从大量乳腺X线片原始数据中提取数字化特征,并在此基础上进行数据挖掘。不同于医师解读的图像特征,深度学习提取包含一阶、二阶和更高阶的数据特征,包括病变大小、形状、位置、灰度直方图等低级别特征及根据病变分布计算出的纹理、小波、分形维度等高级别特征。病变分类过程中,通常将这些提取的特征作为模型输入,然后基于支持向量机或多层感知器等传统机器学习方法对病变进行分类[17]。Jiao等[18]从卷积层中自动提取肿块的不同深度特征,并对图像进行分类,结果显示其对病变的分类准确率与医师诊断结果相当,提示该方法能够较好地模拟医师的诊断过程。

3 深度学习在乳腺癌X线诊断中的研究现状

肿块边缘、形态、密度及微钙化形态、分布均是乳腺X线摄影诊断乳腺癌的重要征象。针对这些征象开发单一或组合的深度学习模型,可用于辅助乳腺X线摄影诊断乳腺癌。目前深度学习在X线诊断乳腺癌中的应用主要包括乳腺肿块分类、微钙化检测及早期预测乳腺癌风险等。

3.1 乳腺肿块分类 对乳腺肿块进行分类是深度学习在X线诊断乳腺癌中最为广泛的研究方向之一。1996年,Sahiner等[19]将深度学习网络应用于X线摄影检测乳腺肿块与分类,验证了在乳腺X线摄影中应用CNN的可行性。随着对乳腺X线摄影深度学习模型的不断完善和改进,自动学习肿块特征方法的分类性能明显提高,且可在未行预训练的情况下直接将特征用于模型的分类阶段[20]。Kooi等[21]开发了一种在乳腺X线摄影中区分良性孤立性囊肿和恶性肿块的模型,通过采用组织增强的方法对重叠组织实现稳定分类,准确率高达80%,接近于光谱乳腺X线摄影的性能。总之,基于深度学习对乳腺肿块进行分类有助于早期识别良恶性病变,提高肿块分类的准确性,减少二次检查或穿刺活检,为恶性病变患者赢得最佳临床治疗时机并改善其预后。

3.2 微钙化检测 微钙化在检测和诊断乳腺癌中具有重要价值。Chan等[22]于1995年首次应用CNN检测微钙化簇,但由于数据量有限,仅显示CNN可降低假阴性率,并不能基于微钙化对病变进行明确的良恶性分类。Bekker等[23]通过对2个摄影方位的乳腺X线片进行单独的神经网络训练,再组合成单神经元层进行整体决策,使微钙化的分类准确率至少提升12%。Samala等[24]探讨不同卷积层结构对分类性能的影响,以对微钙化分类模型进行筛选,结果显示增加卷积层中过滤器数量可明显提高微钙化分类的准确性。Wang等[25]采用堆叠去噪自动编码器同时检测乳腺X线片中的肿块和微钙化点,用以评估深度学习模型在大数据集中的分类性能,使检出微钙化的敏感度显著提高,对早期发现乳腺癌及其准确分期具有重要指导意义。随着深度学习模型的开发,微钙化的分类准确性有望进一步提高。

3.3 早期预测乳腺癌风险 早期预测乳腺癌风险对指导筛查高危人群及评估受试者是否需要接受干预性化疗或手术具有重要作用。Wang等[26]将风险预测模块应用于X线诊断乳腺癌,结果显示该模型预测乳腺癌的准确率达71.4%,提示深度学习对开发早期预测乳腺癌风险模型具有巨大潜力。Li等[27]构建具有迁移学习的CNN模型,以区分乳腺癌高风险与低风险人群,并在456名包含正常及2种风险人群的数据集中进行测试,发现与传统纹理分析对比,该模型具有更好的提取特征及区分癌症风险人群的性能。Sun等[28]对每个图像划定的ROI进行DNN训练,并基于所有ROI的总风险评分做出最终预测,结果表明该模型诊断乳腺癌的AUC达0.72,提示此法有望使深度学习模型用于有限数据量早期预测乳腺癌风险。

4 挑战与展望

深度学习在乳腺X线摄影领域发展迅猛,但其未来发展仍面临巨大挑战。首先,建立统一的乳腺X线摄影数据库十分困难,需要多个单位的配合并制定规范统一的标准;其次,巨大的神经网络参数量影响运算速度,需在保证诊断准确率的前提下不断完善网络结构,提升运算速度;再次,深度学习模型在未来的不断发展离不开影像科医师和计算机专家的通力合作,需要对现有研究适时改进,不断优化模型结构。尽管存在诸多困难,但深度学习近年来的飞速发展不断拓展着医学影像学的边界,有望在不久的将来实现深度学习在X线诊断乳腺癌中的有效应用,成为影像科医师阅片、诊断的有力助手。

猜你喜欢

肿块乳腺乳腺癌
超声造影在周围型肺肿块穿刺活检中作用
绝经了,是否就离乳腺癌越来越远呢?
乳腺癌是吃出来的吗
乳房有肿块、隐隐作痛,怎么办
胸大更容易得乳腺癌吗
体检查出乳腺增生或结节,该怎么办
别逗了,乳腺癌可不分男女老少!
得了乳腺增生,要怎么办?
容易误诊的高回声型乳腺病变
慢性肿块型胰腺炎诊断和外科治疗