APP下载

基于深度学习乳腺超声计算机辅助诊断系统研究进展

2020-01-13吕明慧

中国医学影像技术 2020年11期
关键词:声像乳腺医师

吕明慧,周 帅,朱 强

(首都医科大学附属北京同仁医院超声诊断科,北京 100730)

2018年全球女性乳腺癌新发病例约208.88万,占女性新发癌症的24.2%[1]。中国乳腺癌世界人口标准化发病率约36.1/10万,虽低于其他国家,但呈逐年增长趋势,如能及时诊断并进行干预,患者死亡率可低于其他恶性肿瘤[2-3]。不同于欧美女性多为脂肪型乳腺,中国女性乳腺以纤维结缔组织含量较多的致密型腺体为主,超声声像图中病变与腺体明显不同。超声是我国诊断及筛查乳腺癌的主要手段,但较依赖操作者经验,诊断结果差异较大。除须提高超声医师专业素质及诊断能力外,还应从技术角度寻找解决方案[4]。

计算机辅助诊断(computer-aided diagnosis, CAD)系统采用机器学习方法对医学图像进行识别和概率性判断,是人工智能技术的一大分支[5]。通过模拟人脑神经网络结构,深度学习(deep learning, DL)将信息从低层传至高层,提取图像特征并分类,是当下极具应用前景的机器学习方法之一[6]。基于DL的CAD系统在提高诊断准确率、减少漏诊或误诊及减轻医师工作负荷等方面均具有极大潜力和应用价值。本文对乳腺CAD系统的背景及基于DL的乳腺超声CAD系统研究进展进行综述。

1 研究背景

LEDLEY[7]于1966年首次提出CAD系统。随着计算机技术及算法等方面的进步,直至20世纪八九十年代,相关研究才得以在医学影像学领域纵深开展,并逐步成为影像科医师的辅助工具,例如辅助分析肺CT、乳腺及前列腺MRI和甲状腺超声等[8-12]。1998年R2 Technology公司开发了乳腺CAD系统,并通过了美国食品药品管理局认证,基于钼靶X线图像进行诊断。随后国外诸多相似乳腺CAD产品应运而生,侧重于检测微钙化及识别病变等。近年来,亚洲国家及拥有部分拉丁裔、亚裔人群的西方国家越来越重视乳腺超声的应用,乳腺超声CAD系统的研发逐渐兴起[13],其过程中所运用的核心算法也逐步从传统机器学习算法过渡到更为智能的DL算法[4]。

2 基于DL的乳腺超声CAD系统

传统CAD系统处理步骤主要包括图像预处理、选择和定位ROI及提取ROI特征并分类,高度依赖人工选择及分类器整合特征[14]。DL具备自动提取特征能力,能处理大量图像,其应用提高了CAD系统的鲁棒性及泛化能力[15],代表算法为卷积神经网络(convolutional neural network, CNN)。

2.1 DL DL的概念源自人工神经网络。人工智能研究的一大难点是计算机面对大量数据信息时如何能够快速提取特征信息并加以处理。DL的本质在于使机器在大量带标签样本中学习最佳特征,寻找数据内在规律,减少人工定义特征带来的不准确性。

2.2 CNN基本结构及技术 CNN是包含卷积计算且具有深度结构的前馈神经网络,由输入层、隐藏层及输出层组成,可实现“端-端”模型训练,广泛用于计算机视觉领域[16-17]。输入层导入图像;隐藏层包括卷积层、池化层(下采样层)及全连接层,其中卷积层利用卷积核提取图像特征,池化层对提取出的特征进行降维,以减少参数且在一定程度上保持特征尺度的不变,可提高模型的泛化能力及鲁棒性;卷积层与池化层交替排列,层数不固定;全连接层可对输出特征进行分类;输出层输出最终分类结果[18]。

学习模型在训练过程中易出现参数过拟合现象,可影响模型在测试数据集中的泛化性能,而数据增强、Dropout模块(训练中按一定概率将神经网络单元暂时丢弃)及随机下采样可避免该现象[19-20]。训练CNN需要大量数据。即使加入增强数据,医学图像的样本量仍有所不足。迁移学习可将预训练模型用于另外任务,从而减轻训练数据量对模型性能的影响[17,21]。基于DL搭建CAD模型时,采用迁移学习方法微调模型,可利用较小样本量获得性能较好的模型,有助于缩短训练时间。

2.3 研究及应用现状 通过设计不同CNN架构或使用不同DL算法可提高模型的诊断效能。BYRA等[22]观察882幅超声声像图,利用经过ImageNet预训练的VGG19 CNN模型将乳腺病变分为良性和恶性,提高了系统的诊断效能。YAP等[23]提出一种基于CNN模型自动检测乳腺病变的超声CAD系统,并比较3种不同模型(基于补丁的LeNet、U-Net和基于迁移学习的FCN-AlexNet)的诊断效能,结果显示基于迁移学习的FCN-AlexNet性能最佳。CAO等[24]利用乳腺数据集评估不同DL框架,发现SSD 300和DenseNet分别在检测病变区域和分类任务中展现出最佳性能,表明高性能的CNN框架可提高检测和分类乳腺病灶的效能。HUANG等[25]提出一种两阶段CNN模型,即ROI-CNN(用于识别ROI)和G-CNN(用于分类),对乳腺超声声像图进行乳腺影像报告和数据系统(breast imaging reporting and data system, BI-RADS)分类,针对BI-RADS 3类及4A、4B、4C及BI-RADS 5类乳腺病灶,其准确率分别为99.8%、94.0%、73.4%、92.2%及87.6%。SEUNG等[26]提出一种弱监督和半监督学习的系统算法,以少量强注释数据及更多弱注释数据进行模型训练,可有效避免过拟合。TANAKA等[27]结合2个CNN模型(VGG19和ResNet152)构建出1个集成网络,微调后综合评估针对病变的全部图像,并对其进行分类,显示出优异的分类性能,敏感度为90.9%[95%CI(84.5,97.3)],特异度为87.0%[95%CI(79.5,94.5)],曲线下面积(area under curve, AUC)为0.95[95%CI(0.916,0.987)]。

乳腺超声CAD系统具有一定临床应用价值。乳腺超声CAD系统多侧重于建立鲁棒性及泛化能力较强的模型,以弥补声像图质量良莠不齐且颇具主观性的缺陷,具有极大潜力和发展前景。利用乳腺超声声像图区分良恶性肿物,CNN模型的诊断效能与超声医师相同或更高(敏感度95.8%和58.3%~91.7%,特异度92.5%和60.4%~77.1%,准确率92.5%和65.8%~79.2%)[28]。CHOI等[29]指出,基于DL的乳腺超声CAD系统可提高超声医师诊断乳腺癌的特异度、准确率及阳性预测值,且不降低其敏感度和阴性预测值。LEE等[30]发现CAD系统可显著提高经验不足的超声医师的诊断水平。冀鸿涛等[31]构建基于CNN的CAD模型,鉴别诊断乳腺良恶性结节的敏感度为84.1%,特异度为95.0%,准确率为91.2%。ZHOU等[32]发现通过DL模型可有效预测原发性乳腺癌腋窝淋巴结转移风险,其中性能最优的CNN模型的AUC达0.89。HAN等[33]采用Google LeNet模型分析4 254个乳腺良性病变和3 154个恶性病变的声像图并进行分类,敏感度为86.0%,特异度为93.0%,准确率为91.0%,AUC>0.90。

2.4 面临的挑战 DL虽在处理大数据等方面具有显著优势,提高了CAD系统的性能,但仍面临多重挑战;其运行的关键步骤是收集数据,并评估其准确度、完整性及可信度等,数据量较大时易发生遗漏与错误。目前尚无影像学诊断相关数据库及其统一使用标准或指南,且罕见疾病数据收集不足可能会产生类别不平衡等问题。常用于评估CAD系统性能的方法包括特异度、敏感度、准确率、受试者工作特性曲线、AUC、阳性预测值及阴性预测值等,为加以充分评估,往往需结合多种方法,但尚无统一标准。目前乳腺钼靶X线CAD系统已商品化且被纳入常规诊疗流程,其他大多仅用于教学与培训;若以CAD系统进行诊断决策,影像科医师如何正确解读诊断结果仍是需要解决的问题。为此需临床医师与计算机专家紧密合作,于临床应用和技术领域等发现问题,并不断改进。此外,乳腺超声CAD系统面临患者隐私泄漏及责任划分等伦理问题,需通过加强隐私和数据保护、建立完善的法律法规和监督体系等措施加以解决[34]。

3 小结与展望

基于DL的乳腺超声CAD系统超越了传统的技术系统,可提高模型性能,在辅助诊断与鉴别诊断乳腺癌领域已取得业界的初步肯定,对缩小不同年资医师之间、不同地区及级别医院之间专业水平差异有一定价值。

目前乳腺超声CAD系统仅通过分析超声声像图得出诊断,尚不能整合病史、体格检查、实验室指标及随访信息等;将这些临床信息汇总并导入CAD系统,进而得出更全面、准确的诊断是未来的目标。建立中国女性乳腺多中心超声声像图数据库,为训练CAD模型提供病史详细、病种丰富、图像或视频质量规范的数据集,将可使CAD模型具有更好的鲁棒性和泛化能力,为筛查及诊断乳腺癌提供更加可信的辅助工具。

猜你喜欢

声像乳腺医师
中国医师节
韩医师的中医缘
中国医师节
基于高频超声引导的乳腺包块导丝定位在乳腺病变中的诊断价值
乳腺结节状病变的MRI诊断
《中国医师节》
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
校外教育机构声像档案管理创新探析
能“看到”的声像定位 Bowers & Wilkins(宝华)705 Signature
体检查出乳腺增生或结节,该怎么办