APP下载

基于自适应感受野机制的颈部淋巴结自动识别算法

2019-01-06秦品乐李鹏波张瑞平曾建潮刘仕杰徐少伟

计算机应用 2019年12期
关键词:注意力机制

秦品乐 李鹏波 张瑞平 曾建潮 刘仕杰 徐少伟

摘 要:針对目前应用于医学影像目标检测的深度学习网络模型仅拥有固定的感受野,无法针对形态尺度差异明显的颈部淋巴结进行有效检测的问题,提出了一种新的基于自适应感受野机制的识别算法,将深度学习首次应用于完全三维医学图像的颈部淋巴结自动识别中。首先,采用半随机采样方法对医学序列图像进行裁剪,生成基于网格的局部图像块及对应真值标签;然后,通过局部图像块及标签构建并训练基于自适应感受野机制的DeepNode网络;最后,利用预训练的DeepNode网络模型进行预测,通过输入整体序列图像,可以端到端且快速地获得整体序列对应的颈部淋巴结识别结果。在颈部淋巴结数据集中,采用DeepNode网络识别颈部淋巴结的召回率可达98.13%,精确率可达97.38%,每次扫描的假阳性数量仅为29,同时耗时相对较短。实验结果分析表明,与当前表现优良的二维与三维卷积神经网络相结合的算法、三维通用目标检测算法、基于弱监督定位的识别算法等相比,所提算法可以实现颈部淋巴结的自动识别,并取得最优的识别效果。该算法端到端,简单高效,易于扩展到其他医学图像的三维目标检测任务中,可应用于临床的诊断和治疗。

关键词:颈部淋巴结检测;计算机辅助诊断;注意力机制;自适应感受野;三维医学影像

中图分类号: TP391.41 图形图像识别文献标志码:A

Automatic recognition algorithm of cervical lymph nodes using

adaptive receptive field mechanism

QIN Pinle1, LI Pengbo1, ZHANG Ruiping2, ZENG Jianchao1*, LIU Shijie3, XU Shaowei1

(1. School of Data Science, North University of China, Taiyuan Shanxi 030051, China;

2. Shanxi Bethune Hospital, Taiyuan Shanxi 030001, China;

3. First Hospital of Shanxi Medical University, Taiyuan Shanxi 030001, China)

Abstract: Aiming at the problem that the deep learning network model applied to medical image target detection only has a fixed receptive field and cannot effectively detect the cervical lymph nodes with obvious morphological and scale differences, a new recognition algorithm based on adaptive receptive field mechanism was proposed, applying deep learning to the automatic recognition of cervical lymph nodes in complete three-dimensional medical images at the first time. Firstly, the semi-random sampling method was used to crop the medical sequence images to generate the grid-based local image blocks and the corresponding truth labels. Then, the DeepNode network based on the adaptive receptive field mechanism was constructed and trained through the local image blocks and labels. Finally, the trained DeepNode network model was used for prediction. By inputting the whole sequence images, the cervical lymph node recognition results corresponding to the whole sequence was obtained end-to-end and quickly. On the cervical lymph node dataset, the cervical lymph node recognition using the DeepNode network has the recall rate of 98.13%, the precision of 97.38%, and the number of false positives per scan is only 29, and the time consumption is relatively shorter. The analysis of the experimental results shows that compared with current algorithms such as the combination of two-dimensional and three-dimensional convolutional neural networks, the general three-dimensional object detection and the weak supervised location based recognition, the proposed algorithm can realize the automatic recognition of cervical lymph nodes and obtain the best recognition results. The algorithm is end-to-end, simple and efficient, easy to be extended to three-dimensional target detection tasks for other medical images and can be applied to clinical diagnosis and treatment.

Key words: cervical lymph node detection; Computer-Aided Diagnosis (CAD); attention mechanism; adaptive receptive field; three-dimensional medical image

0 引言

淋巴结作为哺乳动物非常重要的免疫器官,是接受抗原刺激产生免疫应答反应的场所。其形态呈现为椭圆形或蚕豆形,能够摧毁病原体,起着过滤、增殖和免疫作用。在人体所有淋巴结中,位于头颈部的淋巴结数量接近40%[1]。颈部淋巴结肿大是临床最常见的病症,也是病理科最常检查、诊断的病变之一。诱发颈部淋巴结肿大的因素也极其多样,有时即便检查组织切片也很难确诊[2]。淋巴结肿大非常多见,可发生于任何年龄段人群,可见于多种疾病。因此,检测和识别颈部淋巴结对于患者及早发现和诊治具有重要意义。

计算机断层扫描(Computed Tomography, CT)是目前最常用的方法,能良好地显示出病变的区域。在断层扫描成像下,颈部淋巴结与周围软组织之间灰度差异小,具有病理复杂、形态变化明显、分布区域广泛等特点。由于淋巴结自身的生理特性和复杂的成像效果,放射科医生提取淋巴结较为困难。目前,常见的解决方案为传统的机器学习方法。如文献[3]提出基于CT图像的颈部淋巴结半自动分割算法,能够在较少人为干预的条件下实现淋巴结的精准分割;文献[4]提出基于支持向量机的淋巴结判决算法,将淋巴结及周围软组织生理特征之间的差异及成像差异作为最终的判决特征,从而实现在复杂的组织结构中快速定位淋巴结区域。

随着强大高效的图形处理器以及大量可用的训练数据出现,深度学习在语音识别、目标检测等各领域都表现出了卓越的性能[5-8]。对比传统的机器学习方法,深度学习具有高效率、可塑性、普适性等优点,更重要的是它能够自动提取最具代表性的判别特征,避免传统算法在提取特征时由于人为因素导致的性能问题。目前深度学习应用于三维医学影像的检测和分析总体分为四种思路:

1)二维与三维相结合的思想。首先采用二维目标检测或语义分割网络快速定位单张切片的疑似淋巴结区域,然后根据距离度量标准将相邻多张切片间相近感兴趣区域合并生成三维图像块,最后输入三维分类网络以去除过多的假阳性样本,如文献[9-11]。其优势在于将原生的三维目标检测问题简化为二维,在有效节约内存的同时保证一定的检测效果。然而其存在一定的局限性:a)二维检测网络丢弃目标的空间信息,容易导致过多假阳性样本;b)距离度量标准的选取可能导致生成错误的三维样本;c)阶段数过多导致耗时较长。

2)三维目标检测的思想。将目前最先进的通用物体检测模型扩展到三维并改進,即3D Faster R-CNN(Faster Region-based Convolutional Neural Network)系列,以解决二维检测网络丢失目标空间信息的问题。首先通过区域提案网络(Region Proposal Network, RPN)产生大量三维感兴趣图像块,然后通过分类与回归层对其进行分类和位置微调以获得更精准的定位结果,如文献[12-15]。其优势在于充分利用样本空间信息,且端到端的方式保证速度和精度,然而其存在一定的局限性:a)由多个子网络构成,算法复杂度高;b)区域提案阶段产生大量三维图像块,导致计算成本过高。

3)三维局部定位的思想。采用基于三维图像块的弱监督定位算法,用以解决三维目标检测算法复杂度高的问题。首先从CT序列中随机裁剪5×20×20的三维局部图像块,输入到三维网络中进行分类,然后预测时使用滑动窗口策略将网络应用于整体CT序列,得到整体CT序列的目标激活区域(probability heatmaps),例如文献[16-18]。相比三维目标检测思想,其优势在于充分利用空间信息的同时降低算法复杂度,但自身存在一定的局限性:a)随机裁剪导致训练涉及大量交并比运算;b)随机采样的不确定性导致收敛过慢;c)三维局部图像块所提供的可用信息有限,无法利用全局信息作出更精准的判断。

4)三维整体定位的思想。采用基于网格分类的定位算法,用以避免三维局部定位算法无法利用全局信息的问题。首先将整体CT序列按照网格分块后,整体输入网络以便同时对所有网格进行分类,进而得到整体序列的概率图,例如文献[19-20]。其优势在于端到端识别且充分利用全局信息,但仍存在一定的局限性:a)整体输入,导致无法对有限数据进行有效数据增广;b)容易对目标位置产生偏向性。

颈部淋巴结具有病理复杂、形态小、不规则、分布区域广泛等特点。目前深度学习应用于识别颈部淋巴结领域的研究较少,仍需解决以下两个关键问题:1)无法平衡全局信息识别目标与避免对目标位置产生偏向性的问题;2)淋巴结尺度变化明显,采用常规网络同时识别较大目标与较小目标的难度较大,整体识别效果并不理想。

针对颈部淋巴结自动识别的关键问题,本文提出基于自适应感受野机制的识别算法。针对第1)个关键问题,本文提出半随机采样方法,结合三维局部定位和三维整体定位的优点,既充分利用全局信息识别目标,又避免对目标区域产生偏向性,同时实现有效的数据增广。针对第2)个关键问题,本文提出基于自适应感受野机制的DeepNode网络,能够自适应学习适当的感受野以增强对尺度差异明显的目标识别,在仅耗费较少的计算代价前提下实现更好的检测效果。

本文的主要工作如下:

1)本文所提算法将深度学习首次应用于完全三维CT图像自动识别颈部淋巴结中。

2)提出半随机采样方法,结合三维局部定位和三维整体定位思想,有效平衡全局信息识别目标与避免对目标区域产生偏向性的问题。

3)提出基于自适应感受野机制的DeepNode网络,将自适应感受野机制扩展到三维,针对尺度变化明显的淋巴结实现更好的检测效果。

1 颈部淋巴结识别

1.1 总体框架

颈部淋巴结识别整体框架如图1所示。训练时采用半随机采样方法裁剪略小于原图尺寸的训练图像与对应标签,输入DeepNode网络进行训练。测试时由于其为全卷积网络,且输入图像对应网络的感受野不变,故直接将整体CT序列图像输入预训练的DeepNode模型,得到最终的检测结果[16-18]。

1.2 半随机采样方法

常规随机采样方法首先在图像上随机裁剪出固定尺度的图像补丁,然后通过映射关系在真值标签上裁剪出对应区域,进而在真值标签的对应区域划分出网格,最后通过计算网格与对应区域内真实淋巴结掩码的交并比[16-18],将覆盖真实淋巴结的网格对应的分类标签置为1,代表该网格属于淋巴结区域;其余网格对应的分类标签置为0,代表背景区域,如图2(a)所示。其局限性在于每张图像的每次训练均需交并比运算,费时费力。而半随机采样方法首先在真值标签上整体划分网格,计算整体网格与真实淋巴结掩码的交并比,标记好每个网格正负分类标签;之后按照单个网格的距离间隔进行随机裁剪,根据感受野大小映射到原图裁剪对应区域,如图2(b)所示。在整个训练过程中,每张图片仅需计算一次交并比,由于其与在图像上完全随机裁剪有所区别,故称为半随机采样方法。

采样过程仅针对图像长宽,深度保持不变,故仅考虑二维情况。假设原图像尺寸为H×W,标注信息尺寸为h×w。记缩放比例为s,即标注信息中一个像素点映射到原图像表示对应位置s×s区域信息,则存在比例关系:

假设半随机采样后图像左上角坐标为(X, Y),对应真值标签左上角坐标为(x, y),则存在以下映射关系:

记采样比例为λ,通常为0~1(本文默认0.6),则半随机采样后的图像尺寸L及标签尺寸l为:

再结合式(1)进行化简,可得:

半随机采样优势在于:1)通过基于感受野的映射关系避免完全随机采样带来的大量交并比运算,加速训练;2)对比三维局部定位,该方法避免了三维图像块可用信息较少而导致无法利用图像的全局信息的问题;3)相比三维整体定位,该方法裁剪略小于原图尺寸的图像进行训练,既实现数据增广,缓解训练时网格内类别严重不平衡问题,又有效平衡全局信息识别目标与避免对目标区域产生偏向性的问题。

1.3 DeepNode网络

1.3.1 自适应感受野卷积

为了使神经元能够根据不同的刺激动态调节其自身的感受野,文献[21]提出自适应感受野卷积(Selective Kernel convolution, SK)。针对三维医学影像中尺度变化明显的淋巴结检测问题,本文将其基本卷积结构进行修改并扩展到三维,用于进一步拟合淋巴结尺寸来提高识别效果。三維自适应感受野卷积具体结构如图3所示,主要分为三个阶段:分支阶段(Split)、融合阶段(Fuse)、选择阶段(Select)。

1)分支阶段。

对于给定的特征图X∈RC×L×H×W,采用3×3×3和5×5×5两种不同感受野的卷积核构建两条分支:X→U~∈RC×L×H×W和 f^:X→U^∈RC×L×H×W,然后进行空间批量归一化、修正线性单元。为提高效率,5×5×5卷积由扩张率为2、填充为2、卷积核为3×3×3的扩张卷积替代。

2)融合阶段。

首先通过逐元素求和操作获得融合特征U:

U=U~+U^(5)

为扩展到三维,通过特征块平均池化(Feature Block Average Pooling, FBAP)[9]替代原有结构的全局平均池化(Global Average Pooling, GAP)[22],压缩融合特征U特征块的长宽高维度,仅保留通道维度,获取到融合特征U通道级别的全局信息S。假设Uc为融合特征U第c个特征块,Sc为全局信息第c个元素,则存在以下关系:

Sc=ffbap(Uc)=1L×H×W∑Ll=1∑Ww=1∑Hh=1Uc(l,w,h)(6)

基于全局信息S进行降维操作,得到紧凑特征Z∈Rd,然后对紧凑特征Z进行升维操作,得到a∈RC、b∈RC。通过降维升维,使得网络具有更多的非线性,以便更好地拟合融合特征U通道间复杂的相关性。

紧凑特征Z∈Rd的长度d由输入特征的通道数C、降维比例r及下界L决定,本文r、L默认为4。

d=max(Cr,L)(7)

3)选择阶段。

通过通道注意力权重a∈RC、b∈RC分别对两种不同感受野特征U~∈RC×L×H×W、U^∈RC×L×H×W进行通道加权后逐元素求和,得到最终的融合特征V∈RC×L×H×W:

Vc=ac·U~c+bc·U^c ; ac+bc=1(8)

1.3.2 网络结构

DeepNode网络以残差块结构为基础,其整体结构如表1所示,由15个三维残差块、4个三维最大池化层、1个三维卷积层组成,其中三维残差块是基于三维自适应感受野卷积构建。针对自适应感受野卷积,M为分支数,默认为2,表示分支阶段采用3×3×3和5×5×5两种不同感受野的卷积核;r表示降维比例,默认为4。网络最后接入Sigmoid激活函数,并采用二值交叉熵(Binary Cross Entropy, BCE)作为损失函数,输出预测结果。

LBCE=-∑ni=1i·lb yi+(1-i)·lb(1-i)(9)

其中:i为预测结果中第i个网格的预测值;yi为对应真值标签第i个网格的真值。

作为对比的基线方法,将DeepNode网络中的三维自适应感受野卷积替换为当前主流的基于通道注意力机制的压缩激励卷积(Squeeze-and-Excitation convolution, SE)[23],组成基线网络,其中r表示通道学习时的降维比例,默认为4。

2 实验设计与结果分析

2.1 实验数据集

实验数据集来源于山西省肿瘤医院CT放射科,影像类型为头颈部CT序列图像,图像大小为512pixel×512pixel,切片厚度为0.625mm。参照标准由4名经验丰富的专家手工注释。为了保证注释的准确性,4名放射科医师独立对每张图像进行标注工作。最终挑选出直径大于3mm并由3名及以上专家共同注释的颈部淋巴结,图4为数据集中不同形态及分布的颈部淋巴结样本(第一行为原始CT图;第二列黄框位置放大后的局部图像)。最终获得70例,共计2220张CT图像,其中包含1140張颈部淋巴结图像。

2.2 模型训练方法

实验数据分为两部分:随机抽取80%用于训练模型;剩余20%作为测试数据来测试。针对数据增强,半随机采样方法在数据处理的同时已实现数据增强操作,有助于缓解训练时类别不平衡问题。针对模型优化,DeepNode模型采用随机梯度下降(Stochastic Gradient Descent, SGD)算法,学习率初始化为0.01,衰减率设为0.1,批处理大小设置为32,动量设置为0.9,训练轮次为100轮,并在第30、60、90轮次时衰减学习率。所训练的网络模型均在图形处理器(Graphic Processing Unit, GPU) Tesla M40上使用Pytorch深度学习框架实现,全部模型训练约为8.2h,测试所有病例的总时间约为63s(15例CT序列,包含450张CT图像)。

2.3 评价指标

针对DeepNode网络模型,采用召回率及精确率分析其检出淋巴结的性能。

召回率(Recall)的计算式为:

Recall=TPTP+FN(10)

式中:Recall为召回率;TP为所有被检测出的真实颈部淋巴结的个数;FN为所有错误检测出的真实颈部淋巴结的个数。

精确率(Precision)的计算式为:

Precision=TPTP+FP(11)

式中:Precision为精确率;TP为所有被检测出的真实颈部淋巴结的个数;FP为所有未被检测出的真实颈部淋巴结的个数。

2.4 结果分析

通过对比召回率、每次扫描的假阳性个数、耗时等因素,分析不同算法对于检测结果的影响。为保证公平比较,采用同一批颈部淋巴结数据集进行不同算法对比。表2给出了用于检测识别的不同算法对比结果,其中:文献[11] 算法为二维与三维相结合的算法2D+3D CNN;文献[15] 算法为3D Faster R-CNN 算法,属于三维目标检测的思想;文献[17] 算法基于三维图像块的DeepMed算法,属于三维局部定位的思想;文献[19] 算法为S4ND(Single-Shot Single-Scale Lung Nodule Detection)算法,属于三维整体定位的思想;基线方法Baseline用于对比测试,为基于通道注意力机制的算法,本文算法DeepNode为基于自适应感受野机制的DeepNode算法,均属于三维局部定位和三维整体定位相结合的思想。不同检测算法的损失对比如图5所示。

2D+3D CNN算法将原本的三维检测问题简化为三阶段:二维候选样本提取、合并三维图像块、三维去假阳性。通过主流的医学影像目标检测框架取得不错的召回率和精确率,但由于:1)二维候选样本提取过程丢弃了淋巴结原有的空间信息;2)合并三维图像块过程由于距离度量标准选取的不同可能导致合并错误的三维样本;3)阶段数过多导致真实淋巴结丢失,使得实验结果中假阳性样本数量最多且耗时最长。

3D Faster R-CNN算法将主流的医学影像目标检测框架扩展到三维,进行完全三维目标检测,充分利用淋巴结原有的空间信息,使得召回率上升,但相较其他算法,基于感兴趣区域(Region of Interest, ROI)的多阶段算法由特征提取网络、区域提案网络(RPN)、分类与回归网络等组成,导致其容易产生大量假阳性样本数量,精确率下降且耗时较长。

DeepMed算法通过基于三维图像块的分类网络激活淋巴结区域,充分利用空间信息的同时网络本身端到端、简单高效,使得假阳性样本数量减少,耗时也大幅减少;但由于训练时采用三维图像块(3D Patches),其仅利用了三维图像块本身的内部信息,所提供的可用信息有限,针对较难检测的样本,网络无法利用到三维图像块周围的全局信息进行识别,使得实验结果中召回率不太理想。

S4ND算法通过将整体CT序列输入网络,直接得到最终检测结果,在保持端到端、快速高效的同时,在检测过程中充分利用全局信息,使得召回率上升明显,假阳性样本数量也大幅降低。相较于DeepMed算法利用滑动窗口进行预测,能直接得到整体预测结果,使得耗时进一步减少,但由于整体图像输入,导致:1)无法对有限数据进行有效数据增广,使得网络训练不足;2)容易对目标位置产生偏向性,使得网络泛化能力较差,导致实验结果中召回率提升有限,精确率相对略有下降。

基线方法通过半随机采样方法与基于通道注意力机制的网络,避免识别时对目标位置产生偏向性,使得网络泛化能力增强,召回率和精确率得到小幅提升,假阳性样本数量略有减少。同时相较于S4ND算法采用较为复杂的密集块,基线方法简单清晰的结构使得耗时进一步减少;但由于淋巴结尺度变化明显,基于固定感受野的常规网络并不适合尺度差异较大目标的检测识别。

相较于基线方法,DeepNode引入自适应感受野机制,对于淋巴结目标尺度变化明显的特点,能够自适应学习适当的感受野用于拟合识别淋巴结,使得召回率和精确率达到最优,假阳性样本数量也达到最少,但由于自适应感受野机制导致网络结构较基线方法略复杂,故耗时次优。

3 结语

针对目前应用于医学影像目标检测的深度学习网络模型仅拥有固定的感受野,无法针对形态尺度差异明显的颈部淋巴结进行有效检测的问题,本文提出了一种新的基于注意力机制的识别算法,首次将深度学习应用于完全三维CT图像自动识别颈部淋巴结中。实验结果表明,所提的半随机采样方法结合三维局部定位和三维整体定位思想,有效平衡了全局信息识别目标与避免对目标区域产生偏向性。所提的基于自适应感受野机制的DeepNode网络能够自适应学习适当的感受野用于拟合识别尺度变化明显的淋巴结,取得了最优的检测精度。在三维医学图像的研究中,该算法相对简单高效,可应用于临床的診断和治疗。然而本文算法在自动识别颈部淋巴结时,仍存在一些局限性:1)虽然检测效果较好,但基于网格的识别算法容易导致识别结果与真实淋巴结位置出现较小距离的偏差。针对这种情况,将尝试基于网格中心点生成不同尺度锚框的方式,以更精确匹配淋巴结的位置。2)本文算法虽然在召回率等方面存在优势,但仅利用到患者的影像数据,无法依靠患者的多维度信息进行全方位的识别。针对这种情况,将探索结合医学影像与病例信息,以便进一步提高检测精度。

参考文献 (References)

[1]PATEL N U, LIND K E, MCKINNEY K, et al. Clinical validation of a predictive model for the presence of cervical lymph node metastasis in papillary thyroid cancer [J]. American Journal of Neuroradiology, 2018, 39(4): 756-761.

[2]BEJNORDI B E, VETA M, VAN DIEST P J, et al. Diagnostic assessment of deep learning algorithms for detection of lymph node metastases in women with breast cancer [J]. Jama, 2017, 318(22): 2199-2210.

[3]魏骏,何凌,车坤,等.CT 图像的颈部淋巴结半自动分割算法[J].计算机工程与设计,2015,36(11):3014-3018.(WEI J, HE L, CHE K, et al. Semi-automatic detection and segmentation of neck lymph nodes in CT image [J]. Computer Engineering and Design, 2015, 36(11): 3014-3018.)

[4]KAN Y, DONG D, ZHANG Y, et al. Radiomic signature as a predictive factor for lymph node metastasis in early-stage cervical cancer [J]. Journal of Magnetic Resonance Imaging, 2018, 49(1): 304-310.

[5]ESTEVES C, ALLEN-BLANCHETTE C, MAKADIA A, et al. Learning SO(3) equivariant representations with spherical CNNs [C]// Proceedings of the 2018 European Conference on Computer Vision, LNCS 11217. Cham: Springer, 2018: 54-70.

[6]ELSAYED G F, SHANKAR S, CHEUNG B, et al. Adversarial examples that fool both computer vision and time-limited humans [C]// Proceedings of the 32nd Conference on Neural Information Processing Systems. New York: Curran Associates Inc., 2018: 3914-3924.

[7]RAJPURKAR P, IRVIN J, ZHU K, et al. CheXNet: radiologist-level pneumonia detection on chest X-rays with deep learning [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1711.05225.pdf.

[8]RAJPURKAR P, HANNUN A Y, HAGHPANAHI M, et al. Cardiologist-level arrhythmia detection with convolutional neural networks [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1707.01836.pdf.

[9]秦品乐,李鹏波,曾建潮,等.基于级联全卷积神经网络的颈部淋巴结自动识别算法[J].计算机应用,2019,39(10):2915-2922.(QIN P L, LI P B, ZENG J C, et al. Automatic recognition algorithm of cervical lymph nodes using cascaded fully convolutional neural networks [J]. Journal of Computer Applications , 2019, 39(10): 2915-2922.)

[10]苗光,李朝鋒.二维和三维卷积神经网络相结合的CT图像肺结节检测方法[J].激光与光电子学进展,2018,55(5):129-137.(MIAO G, LI C F. Detection of pulmonary nodules CT images combined with two-dimensional and three-dimensional convolution neural networks [J]. Laser and Optoelectronics Progress, 2018, 55(5): 129-137.)

[11]DING J, LI A, HU Z, et al. Accurate pulmonary nodule detection in computed tomography images using deep convolutional neural networks [C]// Proceedings of the 2017 International Conference on Medical Image Computing and Computer-Assisted Intervention, LNCS 10435. Cham: Springer, 2017: 559-567.

[12]ZHU W, VANG Y S, HUANG Y, et al. DeepEM: deep 3D convNets with EM for weakly supervised pulmonary nodule detection [C]// Proceedings of the 2018 International Conference on Medical Image Computing and Computer-Assisted Intervention. Cham: Springer, 2018: 812-820.https://arxiv.org/pdf/1805.05373.pdf

[13]TANG H, LIU X, XIE X. An end-to-end framework for integrated pulmonary nodule detection and false positive reduction [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1903.09880.pdf.

[14]TANG H, KIM D R, XIE X. Automated pulmonary nodule detection using 3D deep convolutional neural networks [C]// Proceedings of the IEEE 15th International Symposium on Biomedical Imaging. Piscataway: IEEE, 2018: 523-526.

[15]ZHU W, LIU C, FAN W, et al. DeepLung: 3D deep convolutional nets for automated pulmonary nodule detection and classification [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1709.05538.pdf.

[16]HAMIDIAN S, SAHINER B, PETRICK N, et al. 3D convolutional neural network for automatic detection of lung nodules in chest CT [C]// Proceedings of the Medical Imaging 2017: Computer-Aided Diagnosis, SPIE 10134. Bellingham, WA: SPIE, 2017: Article No. 1013409.

[17]PEZESHK A, HAMIDIAN S, PETRICK N, et al. 3D convolutional neural networks for automatic detection of pulmonary nodules in chest CT [J]. IEEE Journal of Biomedical and Health Informatics, 2019, 23(5): 2080-2090.

[18]WANG D, KHOSLA A, GARGEYA R, et al. Deep learning for identifying metastatic breast cancer [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1606.05718.pdf.

[19]KHOSRAVAN N, BAGCI U. S4ND: single-shot single-scale lung nodule detection [C]// Proceedings of the 2018 International Conference on Medical Image Computing and Computer-Assisted Intervention, LNCS 11071. Cham: Springer, 2018: 794-802.

[20]OZDEMIR O, RUSSELL R L, BERLIN A A. A 3D probabilistic deep learning system for detection and diagnosis of lung cancer using low-dose CT scans [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1902.03233.pdf.

[21]LI X, WANG W, HU X, et al. Selective kernel networks [EB/OL]. [2019-05-10]. https://arxiv.org/pdf/1903.06586.pdf.

[22]ZHOU B, KHOSLA A, LAPEDRIZA A, et al. Learning deep features for discriminative localization [C]// Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway: IEEE, 2016: 2921-2929.

[23]HU J, SHEN L, ALBANIE S, et al. Squeeze-and-excitation networks [EB/OL]. https://arxiv.org/abs/1709.01507.

QIN Pinle, born in 1978, Ph. D., associate professor. His research interests include big data, machine vision, three-dimensional reconstruction.

LI Pengbo, born in 1995, M. S. candidate. His research interests include machine learning, computer vision, digital image processing.

ZHANG Ruiping, born in 1975, Ph. D., professor. His research interests include molecular imaging, nanomedicine.

ZENG Jianchao, born in 1963, Ph. D., professor. His research interests include maintenance decision and health management of complex system.

LIU Shijie, born in 1990, M. S. candidate. His research interests include molecular imaging, nanomedicine.

XU Shaowei, born in 1995, M. S. candidate. His research interests include machine learning, computer vision, digital image processing.

收稿日期:2019-06-24;修回日期:2019-08-31;錄用日期:2019-09-12。

作者简介:秦品乐(1978—),男,山西长治人,副教授,博士,主要研究方向:大数据、机器视觉、三维重建; 李鹏波(1995—),男,山西运城人,硕士研究生,主要研究方向:机器学习、计算机视觉、数字图像处理; 张瑞平(1975—),男,山西太原人,教授,博士生导师,博士,主要研究方向:分子影像学、纳米医学; 曾建潮(1963—),男,山西太原人,教授,博士,博士生导师,主要研究方向:复杂系统的维护决策和健康管理;刘仕杰(1990—),男,河北邢台人,硕士研究生,主要研究方向:分子影像学、纳米医学; 徐少伟(1995—),男,山西太原人,硕士研究生,主要研究方向:机器学习、计算机视觉、数字图像处理。

文章编号:1001-9081(2019)12-3535-06DOI:10.11772/j.issn.1001-9081.2019061069

猜你喜欢

注意力机制
基于注意力机制的行人轨迹预测生成模型
基于注意力机制和BGRU网络的文本情感分析方法研究
多特征融合的中文实体关系抽取研究
基于序列到序列模型的文本到信息框生成的研究
基于深度学习的手分割算法研究
从餐馆评论中提取方面术语
面向短文本的网络舆情话题
基于自注意力与动态路由的文本建模方法
基于深度学习的问题回答技术研究
基于LSTM?Attention神经网络的文本特征提取方法