联合特征相似性度量和交并比的检测框优选研究

2019-12-16孙世强左海维赵露婷

电脑知识与技术 2019年29期

孙世强左海维赵露婷

摘要：非极大值抑制（Non-Maximum Suppression，NMS）算法作为Faster R-CNN（region-based convolutional neural net-work，R-CNN）的后置处理算法，从物理空间判定检测框的重叠比例，忽略内在特征联系，造成漏检和误检问题。因此提出联合特征相似性度量和交并比的检测框优选方法（Optimized box Based on lou and Feature similarity，OBIF）。该方法首先计算两个检测框的交并比（Intersection over Union，lou），判断检测框之间的重叠比例;然后计算闵式距离，表示重叠的检测框之间的特征相近性，进行深层次判断;最后联合闵氏距离和交并比实现检测框优选。当运行效率一致和时间复杂度相同时，将Faster R-CNN+OBIF应用到PASCAL VOC 2007数据集和结直肠腺癌数据集，比较传统NMS算法，平均识别准确率分别提高了1.4%和1.1%，方法检测精度得到显著的提升。

关键词：目标检测;非极大值抑制算法;FasterR-CNN;交并比;特征相似性度量

中图分类号：TP391.41 文献标识码：A

文章编号：1009-3044（2019）29-0190-04

根据2018年的世界癌症报告，癌症已成为主要的公共健康问题和首要死亡原因。早期癌症可以临床治愈，治愈率达80%，而对于中晚期癌症，通过正规治疗，可以延长生命期，但治愈率较低，不足20%。与中晚期癌症患者相比，早期病人的长期生存率和生活质量都有显著提高，治疗费用也大幅下降，所以早期诊断和治疗意义重大。

在临床上，病理学检查往往被视为癌症诊断的金标准。其中，病理图像是对患者病变部位的组织进行切片，在显微镜下进行放大成像得到的图像。能够直接反映出组织内部所发生的病变，是医生进行癌症诊断的重要依据，甚至是最终依据。由于病理学人才的缺失、病患人数的增加、对癌症准确诊断率和诊断时间的更高要求，目前将深度学习技术嘲融入计算机辅助系统，承担病理图像前期预分析工作，将病理图像中存在问题的细胞核进行框选，最终由医生进展针对性诊断，可以较大程度缩短早期病理诊断时间，减少和舒缓病理医生的工作量和精力，提高癌症诊断效率。

本文实验采用Faster R-CNN（region-based eonvolutionalneural network，R-CNN）框架应用至结直肠腺癌数据集，癌症病理图像特征图经RPN网络嗍（Region Proposal Network，RPN）后会生成大量的检测框。NMS （Non-Maximum Suppression，NMs）算法对检测框集合进行合理筛选，合并同类别检测框，以达到问题细胞核分类和检测框回归的目的。由于NMS算法仅将交并比（Intersection over Union，IoU）作为评价指标，容易造成目标的漏检和误检。此外，NMS算法忽略各检测框特征图的内在特征联系，不具有特征敏感性。所以本文提出联合特征相似性度量和交并比的检测框筛选方法（optimized box Based on louand Feature similarity，OBIF），通过设置合理OBIF指标阈值，完成病理图像中问题细胞核的检测工作，辅助医生完成癌症诊断。

1相关知识

1.1Faster R-CNN

Faster R-CNN是目标检测领域经典算法，它将feature既-traction、proposal提取、bounding box regression、classification整合在一个网络中。如图1所示，FasterR-CNN分为4个主要内容：

（1）Faster R-CNN采用一组基础的conv+relu+pooling层提取图像的特征图。该特征图被共享给RPN和全连接层。

（2）RPN网络用于生成region proposals。RPN实际分为两条操作线，一条通过softmax分类anchor属于foreground或者background，另一条计算对于anchor的框回归偏移量，修正an-chor获得精确的proposals。

（3）Roi Pooling层收集输入的feature maps和proposals，综合后提取proposalfeaturemaps，送入全连接层判定目标类别。

（4）利用proposalfeaturemaps计算proposal的类别，同时再次框回归获得检测框最终的精确位置。

其中，特征图经过RPN网络后产生约20K个anchor，但如此数量的检测框不可能全部送入Fast R-CNN。一方面这20K个anchor中存在大量重叠的检测框，另一方面会产生巨大的计算开销，造成检测速度下降。因此在RPN网络生成检测框后要采用一定的机制来进行优化筛选，在Faster R-CNN中，目前采用的是非极大值抑制的方式，具体如下：

（1）检测框集合P，检测框置信度集合c和保留检测框集合K;

（21將集合c从大到小排列，将置信度最大所对应的检测框移至集合K中，并在集合P中将该检测框删除;

（3）计算集合P剩余检测框与该检测框的IoU值，删除大于设定阈值T的检测框;

（4）重复（2）和（3）的操作步骤，直至集合P为空。

1.2闵可夫斯基距离

在智能分类算法中，为区分样本之间的差异性，通常需要做样本特征的相似性分析，并以“距离”作为评价指标。根据数据特性的不同，可以采用不同的相似性度量方法，本文选用的是闵可夫斯基距离。

闵式距离是衡量数值点之间距离的一种非常常见的方法，两个n维向量