基于颜色拮抗和纹理抑制的轮廓检测模型
2018-09-10赵浩钧林川陈海杰张玉薇
赵浩钧 林川 陈海杰 张玉薇
摘 要:作为目标识别的关键步骤,轮廓检测已成为计算机视觉研究领域的热点之一.仿生学研究发现,在初级视皮层(V1)细胞中,驱动彩色亮度单元的双拮抗细胞感受野对亮度和颜色信息敏感且具有方向选择性,对于轮廓检测起到重要作用.本文提出一种基于颜色拮抗和纹理抑制的轮廓检测模型,通过二维高斯差分DOG函数来模拟纹理抑制模板,对不同的双拮抗细胞通道进行纹理抑制,在基于颜色拮抗特性检测模型中考虑了抑制纹理的作用.实验结果表明:在BSDS300图像库下本文模型在纹理抑制方面較现有模型有一定的优势,能够较好的提取目标轮廓,是颜色拮抗目标轮廓检测模型中的一种新思路.
关键词:颜色拮抗;轮廓检测;纹理抑制
中图分类号:TP391.41 DOI:10.16375/j.cnki.cn45-1395/t.2018.04.002
0 引言
早期边缘检测通常使用Roberts算子、Laplacian算子、Canny算子等空间微分算子[1].上述边缘检测算法的核心思路是沿不同方向计算空间梯度以获得边缘,检测出来的边缘中包含大量纹理边缘,这些纹理边缘会干扰后续的分割、识别等任务;因此,该类边缘检测算法本质上难以区分显著目标边界和纹理边缘,而与边缘检测不同的是,轮廓检测能标识别目标与背景的分界,因而成为目标识别的关键步骤[2].轮廓检测需要消除纹理信息并将轮廓与非轮廓部分区分开来,并侧重于提取形状和其他中等视觉信息等特征[3].针对人类如何准确地感知和理解视觉信息问题,视神经科学家在视网膜信息采集、视神经通路和大脑皮层等各方面做了大量研究.另外,计算机研究领域的科学家一直在研究生物视觉和计算机科学的结合并取得了一系列研究成果,为目标轮廓检测的视觉仿生检测奠定了基础[4].Grigorescu等[5]采用Gabor模型模拟经典感受野,提出二维高斯差分函数来模拟非经典感受野的抑制特性,后续的研究用改进的神经元激活函数sigmoid提取局部尺度信息[6].该类仿生型轮廓检测模型主要是利用图像中的亮度信息,而颜色信息有助于识别其他难以区分的实例,颜色通常用于视觉增强和吸引注意力,颜色的存在有助于视觉搜索和对象识别等任务[7-8].
在颜色信息的轮廓检测任务中,Martin等提出的Pb算法[9],通过机器学习技术整合亮度、颜色和纹理梯度特征来获取图像轮廓,后续的Pb算法通过采用多尺度机制或全局信息来提高边界检测能力[10-11].这些方法都取得了较好的效果,但是基于深度学习的方法往往需要大量的样本来进行训练以及较好的硬件平台来加速实现,而近期出现的一些轮廓检测方法在获得较好的轮廓检测结果的同时,计算效率也非常高.现有方法从两个典型的颜色拮抗通道(红-绿拮抗和黄-蓝拮抗)中检测彩色轮廓,Zhou和Mei等[12]使用配对差分(Pairwise Difference)算子在两个平滑后的颜色拮抗通道上提取轮廓.Zhang等[13]提出一个基于颜色拮抗机理的颜色描述方法,能够有效地提高纹理梯度的轮廓检测算法的性能.最近,Yang等[14]提出CO模型,基于颜色拮抗机理的方法检测亮度边缘和颜色边缘.后续的研究通过引入空间稀疏约束(spatial sparseness constraint)的纹理抑制提出SCO模型[15].本文在颜色拮抗机理的生理学依据上模拟信息传递通路从视网膜到外侧膝状体(LGN)到初级视皮层(V1)提出基于颜色拮抗和纹理抑制的轮廓检测模型,引入高斯差分函数(DOG)[5]进行通道纹理抑制.实验结果表明:本文的轮廓检测模型经过DOG函数进行纹理抑制,获得了较高的性能评测指数,有效地提高了轮廓检测的准确性.
1 模型
对于彩色图像的轮廓检测,大量的研究显示在生物视觉系统中以拮抗方式进行处理颜色信息,单拮抗感受野和双拮抗感受野以两种主要类型的神经元感受野存在于前端视觉通路中.存在于视网膜节细胞和LGN神经元中[16]的单拮抗细胞感受野包括:中心-外周结构的拮抗细胞感受野(图1(a))和单中心结构的拮抗细胞感受野(图1(b)).初级视皮层(V1)神经元中含有更为复杂的感受野结构包括:同心圆结构双拮抗感受野(图1(c)),和具有朝向选择性双拮抗感受野(图1(d))[17],对颜色和亮度边缘信息敏感.只有颜色对比度的区域,彩色图像检测出的轮廓图比灰度图像检测出的轮廓图提供更多的有效信息,如图2所示.
本文依据两种颜色拮抗沿视网膜、外侧膝状体、初级视皮层通路进行传递信息,提出基于颜色拮抗和纹理抑制的轮廓检测模型,模型中红-绿拮抗框架如图3所示,蓝-黄拮抗框架如图一致,在提取红-绿轮廓和蓝-黄轮廓之后再用最大值方法处理得到本文最终轮廓.
1.1 视锥细胞层
在视网膜中,光刺激可以激活视锥细胞,细胞被激活的长度取决于光的波长.本文基于RGB颜色模型提取出图像的3个颜色分量,用[R(x,y)]表示红颜色分量,[G(x,y)]表示绿颜色分量,[B(x,y)]表示蓝色分量.黄色分量是一种合成分量,用[Y=(R+G)/2]表示.
1.2 节细胞/LGN层
LGN层的细胞具有单一的拮抗细胞感受野并且显示空间低通特性.使用视锥细胞层响应作为输入,计算出红-绿和蓝-黄通道的单拮抗细胞响应,它们的响应可以被描述为:
[Sr+g-(x,y)=ω1?R(x,y)+ω2?G(x,y)], (1)
[Sr-g+(x,y)=ω1?R(x,y)+ω2?G(x,y)], (2)
[Sb+y-(x,y)=ω1?B(x,y)+ω2?Y(x,y)], (3)
[Sb-y+(x,y)=ω1?Y(x,y)+ω2?B(x,y)], (4)
[ω1ω2≤0ω1 , ω2?[0,1]] (5)
当[ω1=ω2]时,亮度信息不响应;[ω1≠ω2]时,亮度信息和颜色信息都存在响应.[ω1]、[ω2]始终具有相反的符号,当[ω1>0],[ω2<0]时,可提取R-on/G-off细胞的响应;用[Sr+g-]表示;相反,当[ω1<0],[ω2>0]时,可提取R-off/G-on细胞的响应,用[Sg+r-]表示.
1.3 初级视皮层(V1层)
V1层的细胞中的大量神经元(29%)对颜色和亮度敏感.初级视皮层中驱动彩色亮度单元的神经网络在空间上变换LGN层彩色信号,以实现对颜色的空间选择性[18].特别地,朝向选择性双拮抗感受野被认为在颜色边界检测中起重要作用,使用以下公式进行描述:
[RF(x,y;θ)=?f(x, ;θ)?x], (6)
[f(x,y;θ)=12π(kσ1)2exp(-(x+γ2 2)2π(kσ1)2)], (7)
[xy=xcosθ+ysinθ-xsinθ+ycosθ], (8)
[γ] ——橢圆形感受野长轴与短轴比例的常数([γ] = 0.5 );[θ?[0,2π)]表示细胞的最优响应朝向;[σ1] ——高斯函数中的标准偏差决定了感受野的大小;[k>1] 表示V1神经元具有比神经节/ LGN细胞更大的感受野,本文设置[k=2].图4显示了由式(6)模拟出来对颜色和亮度边缘信息敏感的感受野示意图,从左到右分别为[0°、60°、120°、180°、240°、300°].
(a) (b) (c) (d) (e) (f)
图4 朝向选择性双拮抗感受野
Fig.4 The receptive field model of the oriented double-opponent neurons
对于不同方向的双拮抗响应可以表示为:
[Dr+g-(x,y;θ)=m,n?Cr+g-Sr+g-(x+m,y+n)*RF(m,n;θ)], (9)
[Dg+r-(x,y;θ)=m,n?Cg+r-Sg+r-(x+m,y+n)*RF(m,n;θ)], (10)
[Db+y-(x,y;θ)=m,n?Cb+y-Sb+y-(x+m,y+n)*RF(m,n;θ)], (11)
[Dy+b-(x,y;θ)=m,n?Cy+b-Sy+b-(x+m,y+n)*RF(m,n;θ)], (12)
式中*表示卷积算子,[Cr+g-]表示颜色拮抗感受野区域的大小.
[θi?[0,2π)]表示[Nθ] 个用于提取朝向信息的滤波器朝向:
[θi=2(i-1)πNθ , ][i=1 , 2 , … , Nθ][ ], (13)
最后,通过计算每个方向下的最大响应作为该通道下最终的边界响应为:
[Drg(x , y)=max{Dr+g-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ], (14)
[Dgr(x , y)=max{Dg+r-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ], (15)
[Dby(x , y)=max{Db+y-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ], (16)
[Dyb(x , y)=max{Dy+b-(x , y ; θi)|i=1 , 2 , … , Nθ}][ ]. (17)
1.4 纹理抑制模型
中枢神经元的反应受到外围神经元细胞感受野的抑制,抑制作用随着距离增大而减小.传统的抑制模板使用高斯差分函数(DOG)[5],对于图像中给定的点,抑制项是在围绕着相关点的感受野周围的环形区域内计算出来的.DOG函数可以表达如下:
[DOG(x , y ; σ2 , k2)=12π(k2σ2)2exp(-x2+y22(k2σ2)2)-12πσ22exp(-x2+y22σ22)][ ], (18)
[ω(x , y ; σ2)=N(DOG(x, y ; σ2))DOG(x , y ; σ2)][ ], (19)
[N(X)=X , X>00 , X≤0][ ], (20)
式中[·]表示[L1]范数,[N(X)]函数确保滤波器响应非负.通过V1层计算出来的双拮抗细胞响应经过DOG函数滤波抑制可以表示如下:
[DOGρ(x , y ; σ2)=Dρ(x , y)*DOG(x , y ; σ2 , k2)][ ], (21)
[Rρ(x , y ; σ2)=Dρ(x , y)-αDOGρ(x , y ; σ2)][ ], (22)
其中[ρ∈{rg,gr,by,yb}] .通过线性归一化对每个通道的响应进行归一化,获得最终的轮廓响应为:
[T(x , y)=max(Rρ(x , y ; σ2)|ρ?{rg , gr , by , yb})][ ]. (23)
2 实验结果与分析
本文模型在一台硬件条件为CPU为Intel(R) core(TM) i3-4130k,主频为3.4 GHz,内存为8 GB的计算机上,对CO模型[14]以及本文提出的检测模型使用MATLAB 2016a仿真软件进行仿真实验.基于伯克利数据库BSDS300[19]使用标准评价指数将本文模型得出的轮廓检测结果与数据库中给出的真实轮廓做定量比较,用来全面评估本文轮廓检测的性能.表1给出了主要参数设置情况.
为了检测本文模型的性能,使用Martin等提供的Berkley分割数据集(BSDS300),进一步评估了模型的性能.每幅自然原始图像有多个以人为标记的手绘图像标准轮廓结果(Ground Truth),为了便于比较,所有检测器的输出图像(即边界)的像素值在非最大值抑制操作之后作为轮廓边界的概率,使用精确度-回归度(覆盖率)来评估轮廓检测的性能.评价标准为[F]指数,其定义如下:
[F =2PR/P+R], (24)
其中:[P]代表精确度,[R]代表覆盖率,[F]指数为二者的调和平均,表示模型的检测结果与人类观察到轮廓之间的相似性,它被广泛用于评估边缘检测器的性能.
为了增强不同双拮抗通道提出来的图像信息,用DOG函数对每组双拮抗通道进行纹理抑制,目的是突出背景响应并减弱边缘响应,使用提取出来双拮抗响应减去DOG函数调制的抑制项后就能抑制更多的背景噪点,从而凸显轮廓信息.为了验证不同拮抗通道抑制效果,本文基于BSDS300图像库进行实验,实验结果如图5所示,图5(a)为自然图像,图5(b)为真实轮廓图,图5中(c1)、(d1)、(e1)、(f1)分别为红-绿拮抗,绿-红拮抗,蓝-黄拮抗和黄-蓝拮抗,用DOG函数对不同拮抗通道进行抑制分别得到图5(c2)、(d2)、(e2)、(f2),图5(g1)为CO模型提取轮廓图,图5(g2)为本文最终轮廓图.实验结果表明,DOG函数在不同拮抗通道的调制能够有效地抑制图像背景中多余的噪点使提取的轮廓更加完整.
CO模型中不同通道的F值与本文模型中不同通道经过DOG函数进行抑制的F值如图6所示,本文经过DOG函数抑制的情况下评价指数F值均比未经过DOG函数抑制的情况下评价指数F值有所提高,这充分体现出了本文所提出的DOG函数抑制方法改善了模型的整体轮廓检测性能.
表2列举了本文检测模型和CO模型在BSDS300图像库中3幅图像(65033,69020,108005)的轮廓提取F值结果.为定性实验对比选取了BSDS300数据库中另外5幅图像(43074,37073,12084,351093,302008),如图7所示,本文提出的轮廓提取模型能够较好地提取出自然图像中的轮廓,F值均有所提高.实验结果表明:检测模型能够从多组颜色拮抗信息中有效的区分轮廓和纹理,消除不同颜色通道中背景纹理边缘的响应,减少无关成分的影响,增强目标的弱边缘信息,保持目标轮廓的完整性.通过模拟视锥细胞对不同颜色的敏感程度,双拮抗色细胞的拮抗响应,对不同的两种红绿和蓝黄颜色拮抗信息处理进行纹理抑制,实现了较好的轮廓检测效果.
3 结论
近年来,许多生物学和视神经学方面的研究都主要关注于神经视皮层V1区的颜色信息,这些研究的发现为计算机视觉的发展提供了新的研究思路.尽管这些方法在提高检测轮廓成功率方面取得了不小进步,然而很少有利用纹理抑制调制不同颜色拮抗通道信息.针对这一问题,本文提出了一种基于视颜色拮抗机制和纹理抑制的轮廓检测模型,用于检测自然图像中的轮廓信息,该模型通过DOG函数滤波器对不同组的双拮抗通道信息进行纹理抑制处理,提高了轮廓检测率,实现了较好的轮廓检测效果.
V1层中的神经元单元(29%)同时响应颜色和亮度信息,但V1层中也有特定的神经元专门响应颜色(11%)或亮度(60%)信息.本文仅仅对颜色信息在轮廓检测中的应用进行研究,如何整合视觉系统中的V1层颜色和亮度信息或更高级别皮质中的颜色信息,仍需要进一步的研究和探索.
参考文献
[1]俞昊,林川,譚光兴,等. 视觉注意机制与Canny算子结合的目标轮廓检测方法[J].广西科技大学学报,2016,27(2):87-92.
[2]闫夏,谭光兴,林川. 基于免疫聚类算法的MRI膝关节图像分割[J].广西科技大学学报,2015,26(1):70-74.
[3]LAGUNOVSKY D,ABLAMEYKO S. Fast line and rectangle detection by clustering and grouping[M]. Berlin:Berlin Heidelberg Springer,1997.
[4]SHPANER M,MOLHOLM S,FORDE E,et al. Disambiguating the roles of area V1 and the lateral occipital complex (LOC) in contour integration[J]. Neuroimage,2013,69(4):146-156.
[5]GRIGORESCU C,PETKOV N,WESTENBERG M a. Contour detection based on nonclassical receptive field inhibition[J]. IEEE Transactions on Image Processing a Publication of the IEEE Signal Processing Society,2003,12(7):729-739.
[6]潘亦坚,林川,郭越,等. 基于非经典感受野动态特性的轮廓检测模型[J]. 广西科技大学学报,2018,29(2):77-83.
[7]MEHRANI P,MOURAVIEV A,GONZALEZ O J A,et al. Color-opponent mechanisms for local hue encoding in a hierarchical framework[J/OL].arXiv.org,2018(2)[2018-03-02]. http://cn.arxiv.org/pdf/1706.10266v2.
[8]吴璟莉,刘袁静. 一种基于颜色拮抗感受野的轮廓检测模型[J].计算机科学,2016,43(7):319-323.
[9]MARTIN D R,FOWLKES C C,MALIK J. Learning to detect natural image boundaries using local brightness,color,and texture cues[J]. Transactions on Pattern Analysis and Machine Intelligence,2004,26(5):530-549.
[10]MAIRE M,ARBELAEZ P,FOWLKES C,et al. Using contours to detect and localize junctions in natural images[C]// Using contours to detect and localize junctions in natural images. Computer Vision and Pattern Recognition,2008 CVPR 2008 IEEE Conference.
[11]ARBELA?EZ P,MAIRE M,FOWLKES C,et al. Contour detection and hierarchical image segmentation[C]// Contour Detection and Hierarchical Image Segmentation. IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE.
[12]ZHOU C,MEL B W. Cue combination and color edge detection in natural scenes[J]. Journal of Vision,2008,8(4):1-25.
[13]ZHANG J,BARHOMI Y,SERRE T. A new biologically inspired color image descriptor[C]// A New Biologically Inspired Color Image Descriptor. European Conference on Computer Vision,312-324.
[14]YANG K,GAO S,LI C,et al. Efficient color boundary detection with color-opponent mechanisms[C]// Efficient Color Boundary Detection with Color-Opponent Mechanisms. IEEE Conference on Computer Vision and Pattern Recognition,2810-2817.
[15]YANG K F,GAO S B,GUO C F,et al. Boundary detection using double-opponency and spatial sparseness constraint[J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society,2015,24(8):2565-2578.
[16]LK P,WS B,R A,et al. Agenesis of the corpus callosum:genetic,developmental and functional aspects of connectivity[J]. Nature Reviews Neuroscience,2007,8(4):287-299.
[17]杨开富. 前端视觉通路信息加工的计算模型及应用研究[D].成都:电子科技大学,2016.
[18]JOHNSON E N,HAWKEN M J,SHAPLEY R. The spatial transformation of color in the primary visual cortex of the macaque monkey[J]. Nature Neuroscience,2001,4(4):409-416.
[19]MARTIN D,FOWLKES C,TAL D,et al. A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics[C]// A Database of Human Segmented Natural Images and its Application to Evaluating Segmentation Algorithms and Measuring Ecological Statistics. Computer Vision.
Contour detection model based on color opponent and texture suppression
ZHAO Haojun, LIN Chuan*, CHEN Haijie, ZHANG Yuwei
(School of Electric and Information Engineering, Guangxi University of Science and Technology,
Liuzhou 545006, China)
Abstract: As a key step in target recognition, contour detection has become one of the hotspots in the field of computer vision research. Bionic studies have found that in primary visual cortex (V1) cells the double-opponent cell receptive field is antagonistic to color and spatially responsive, sensitive to brightness and color information and has orientation selectivity, which plays an important role in contour detection. In this paper, a two-dimensional Gaussian difference DOG function is proposed to simulate the texture suppression template. And the texture suppression of different double antagonist cell channels is made up to make up for the defects of the traditional color antagonism algorithm in ignoring the background texture. Experiments show that under the BSDS300 image library, the algorithm considers the effect of suppressing texture, enhances the weak texture and suppresses the background texture in each group of color antagonism and the model can achieve better contour detection. It is a new idea in the color opponent target contour detection model.
Key words: color opponent; contour detection; texture suppression
(學科编辑:黎 娅)