APP下载

一种改进Faster R-CNN 检测乳腺肿块的方法

2020-07-04杰,

影像研究与医学应用 2020年14期
关键词:锚点池化肿块

郑 杰, 郭 朋

(深圳蓝韵医学影像有限公司放射研发部 广东 深圳 518000)

1 概述

乳腺癌作为女性最常见的恶心肿瘤之一,发病率正呈逐年上升的趋势,严重威胁妇女的身心健康。因此,乳腺癌的早期诊断和早期治疗就显得尤为重要。乳腺病变主要表现为肿块[1]、钙化点[2]、双侧不对称[3]及结构扭曲[4]等形式,其中肿块和钙化点簇是乳腺癌最主要的表征,因此肿块和钙化点的自动检测成为计算机辅助诊断系统[5]的两个主要方面,其中肿块由于其边缘模糊,形状各异,与周围组织对比度较低等因素,一直是计算机辅助诊断系统的一个难点。

传统乳腺病变检测的步骤为:首先对原始乳腺图像进行预处理,然后在给定图像上基于区域、边缘以及聚类选取感兴趣区域,最后进行感兴趣区域的分类识别。传统的病变检测存在人工提取的特征鲁棒性不高,泛化能力较差;以及获取感兴趣区域的方法大多都是针对特定形态、灰度、大小的病变,不具有普适应的缺点。

2012年以后,基于卷积神经网络的计算机视觉的飞速发展使得深度学习成为目标检测领域当之无愧的王牌。与传统方法相比,卷积神经网络具有以下三点优势:(1)大规模的训练数据;(2)网络结构更加复杂、层数更多;(3)GPU 加速技术使得大规模的并行计算成为现实。2014年Girshick R[6]将区域生成和CNN 网络相结合,提出了目标检测模型R-CNN。2015年Girshick R[7]将空间金字塔池化[8]方法融入到R-CNN 中,提出了Fast R-CNN 模型,大幅减少了运算次数,同时降低了资源消耗。2016年,REN 和Girshick R[9]等利用区域生成网络(Region Proposals Networks,RPN)来产生候选框,降低提取候选框的计算压力,提出了Faster R-CNN 网络。

本文将Faster R-CNN 网络应用于数字乳腺X 线图像的肿块检测,并根据肿块的特性,对Faster R-CNN 进行了优化,大幅提高了病灶检测效率和检出率,并且保持了较低的假阳率。

2 乳腺肿块检测

改进Faster R-CNN 的乳腺肿块检测方法主要包括显著性检测和Faster R-CNN 检测两个过程,下面分别介绍。

2.1 显著性检测

基于频率调谐的显著性检测方法[10]是一种全分辨率的显著性检测方法。该方法通过对比局部颜色和亮度特征,定义了图像中每个像素的显著性,通过保留更多的频率内容来保留原始图像中感兴趣区域的边界。具体实现步骤如下:

(1)对原始图像进行高斯平滑;

(2)将图像的颜色由RGB 空间转换成Lab 空间,分别计算L、a 和b 通道的均值、和;

(3)计算高斯平滑和求均值后图像的欧式距离,生成显著图。

这种方法简单高效,对于背景不复杂的数字乳腺X射线图像具有良好的检测效果,可大幅提高图像中肿块与周围正常组织的对比度。

2.2 Faster R-CNN 检测

Faster R-CNN 网络是在R-CNN 网络和Fast R-CNN网络的基础上进化而来,是深度学习目标检测领域的主流框架之一。该网络框架将目标检测方法中涉及到的生成候选框、提取候选框特征、对候选框进行分类和回归候选框集成到一个卷积神经网络中,简化了整个目标检测系统,系统集成度更高,真正实现了“端到端”的检测识别算法。流程如图2 所示。

Faster R-CNN 框架包含用来生成候选区域的区域生成网络和Fast R-CNN 检测网络两部分。将区域生成网络得到的候选区域送入Fast R-CNN 检测网络,对候选区域进行分类和边界回归。在Fast R-CNN 检测网络环节中,ROI池化层采用了MLRP 方法[11],结合了多层卷积层的特征,使得候选框包含的信息更加丰富。RPN 网络和Fast R-CNN网络在训练时可以共享基础卷积特征,分别用于各自的任务。

2.2.1 区域生成网络 训练区域生成网络时,通过对基础网络生成的特征图中的每一个像素点设置一定数量的不同尺寸和宽高比的锚点,使用IoU(InterseCTion over Union)来选择正负样本集进行网络训练,选择规则如下:

(1)正类:IoU >0.7 或锚点与目标框的IoU 值最大

(2)负类:IoU <0.3

(3)其它:跨越图像边界和剩余样本不参与训练

在训练中,使用梯度下降法进行反向传播训练,损失函数定义如下:

式中:i是每一批次的所有锚点,Pi是正类锚点的概率,当锚点为正类锚点时,Pi*取1,反之取0。ti是预测框的修正参数的坐标向量,ti*是预测框对应目标框的坐标向量。Ncls和Nreg目的在于对该公式的两个子项进行归一化,λ用于平衡两个子项的权重。Lcls(·)是预测置信度的损失函数,该损失函数为一个二分类的逻辑回归函数,可描述为如下表达式:

Lreg(·)是修正参数的损失函数,表达式如下:

其中smoothL1(·)函数为:

在得到预测框的坐标参数后,需要对坐标参数进行回归调整,使预测框更接近目标框的真实坐标:

2.2.2 Fast R-CNN 检测网络

Fast R-CNN 网络对输入到网络中的图像首先得到卷积特征图;然后对每个候选区域进行ROI 池化,本文方法中ROI 池化采用MLRP 方法,与原始算法中仅将Conv5_3 层输出的特征映射进行池化不同,MLRP 方法是将基础网络中的Conv4_3 层和Conv5_3 层输出的特征映射分别进行ROI 池化后串联,再利用窗口的卷积核将串联后的特征图进行融合;再从融合后的卷积特征图中提取固定长度的特征向量,并将该特征向量输入到全连接层中,分别通过全连接层和softmax 计算每个候选区域属于每个类别的概率,得到cls_prob 概率向量;最后通过回归每个候选框的位置偏移量bbox_pred,获得检测框的精确位置。

区域生成网络输出的候选框区域形状、大小各异,所以不同候选区域所包含的特征向量维度也各不相同。而全连接层对输入特征向量维度有固定限制,所有输入特征向量维度必须相同,因此通过ROI 池化层将不同候选区域所包含的特征图转化成固定维度的特征向量,从而匹配后续的全连接层。

3 实验结果与分析

本文实验数据采用DDSM(Digital Database for Screening Mammography)乳腺数据库和多家使用蓝韵医学影像有限公司数字乳腺X 摄影系统Luna 的二、三级医院,经过整理,共选出6500 幅满足条件的图像,其中5000 幅图像作为训练数据集,另外1500 幅图像作为测试数据集。DDSM 数据集是美国南佛罗里达大学和马萨诸塞州综合医院以及桑迪亚国家实验室共同参与的合作项目,包含约2500项研究,每项研究包括每个乳房的两幅图像。

实验环境:Windows 下的Tensorflow+Keras 框架进行模型的训练,在Nvidia 1080Ti GPU 下加速训练。

常用的衡量肿块检测系统优劣的两大指标为:检出率(Sensitivity,Sens)和假阳率(False Positive Marks Per Image,FPI),其表达式如下:

检出率是指阳性肿块被检测出来的比率,假阳率是指平均每幅图像中被检测出的假阳性肿块的数量。

3.1 显著性检测的有效性分析

我们通过一组对比实验验证显著性检测的有效性,对于相同的测试集,第一次直接用Faster R-CNN 进行检测,第二次先进行显著性检测,再用Faster R-CNN 进行检测,实验结果见表1。

表1 是否进行显著性检测结果对比

见表1 所述,增加显著性检测环节的实验结果有着更高的检出率以及略微升高的假阳率,说明显著性检测是有效的。实际临床应用中,高检出率和低假阳率很难同时满足,要在保证较低假阳率的基础上,尽可能的提高检出率。

3.2 修改锚点对检测结果的影响

通过统计训练数据集中医生标记的肿块大小发现,最小肿块约50×50 像素点,而最大肿块可达1000×1000 像素点左右。为了更好地检测出测试数据集中不同尺寸的肿块,我们将原始Faster R-CNN 中3 种尺度(128、256、512)和3 种长宽比(1:1、1:2、2:1)的9个锚点调整为9 种尺度(50、100、200、300、500、650、800、950、1050)和1种长宽比(1:1)的9个锚点。如此一来,这9个尺度基本能覆盖全测试数据集中肿块的尺寸。实验结果见表2 所示。

表2 修改锚点前后检测结果对比

见表2 所述,与修改锚点前相比,修改锚点后具有更高的检出率和更低的假阳率,说明通过修改锚点的方式,可以有效的提高肿块检测的检出率,降低假阳率。

3.3 池化方法对检测结果的影响

我们通过一组实验来对比池化方法对检测结果的影响,即在相同的测试集上分别利用原始检测模型和利用MLRP 池化方法的检测模型进行对比测试,实验结果见表3所示:

表3 更改池化方法前后检测结果对比

见表2 所述,在假阳率基本保持一致的情况下,采用MLRP 池化方法的检测模型具有更高的检出率,说明使用MLRP 池化方法可以有效的提高肿块检测的检出率。

3.4 检测效果

本文方法的乳腺肿块检测结果如图2 所示。

4 结束语

本文将常用于自然图像目标检测的Faster R-CNN算法应用于乳腺肿块的检测,并且根据肿块的特性,对Faster R-CNN 进行了适当改进。实验结果表明,改进后的Faster R-CNN 算法,在保持较低假阳率的前提下,有效提高了肿块检测的效率和检出率,在辅助医生对乳腺癌的诊断方面具有重要作用,本文方法具有一定的临床应用价值。

猜你喜欢

锚点池化肿块
基于高斯函数的池化算法
卷积神经网络中的自适应加权池化
颈部肿块256例临床诊治分析
基于NR覆盖的NSA锚点优选策略研究
5G手机无法在室分NSA站点驻留案例分析
5G NSA锚点的选择策略
乳腺假血管瘤样间质增生1例并文献复习
5G NSA组网下锚点站的选择策略优化
基于卷积神经网络和池化算法的表情识别研究
乳房有肿块、隐隐作痛,怎么办