基于非经典感受野动态特性的轮廓检测模型
2018-09-10潘亦坚林川郭越吴艳
潘亦坚 林川 郭越 吴艳
摘要:轮廓检测是计算機视觉的重要任务之一,并广泛地用于医学,工程,交通等领域.针对这些领域的检测需求,本文受非经典感受野动态特性的启发提出一种仿生型轮廓检测模型:在模拟初级视皮层(V1区)神经元的经典感受野响应时,用改进的神经元激活函数sigmoid提取局部尺度信息,然后用局部最优尺度代替现有模型中的全局感受野尺度,并将提取的局部最优尺度信息对非经典感受野抑制进行调制.基RUG40和伯克利图像数据库的实验结果表明,本文的轮廓检测模型较同类模型获得了较高的性能评测指数,有效地提高了轮廓检测的性能。
关键词:轮廓检测;非经典感受野;动态特性;局部最优尺度
0引言
在杂乱的环境中分离背景纹理与目标轮廓一直是计算机视觉中一项重要的任务,轮廓检测需要消除背景纹理及噪声的影响从而提取图像中的目标轮廓,成为图像分割、目标轮廓提取等问题的重要基础技术。
大量视觉生理研究表明,初级视皮层(V1区)的神经元在从视觉场景中提取目标轮廓信息中扮演着重要的角色,是近年来轮廓检测的主要研究对象.普遍认为v1区神经元的每个感受野都有它自己的一个小的兴奋区域,该区域被称作经典感受野(Classical Receptive Field,CRF),而周边广大区域则是其相邻单元所产生的抑制区,该区域被称作非经典感受野(non-Classical Receptive Field,nCRF).其中,神经元的活动被邻近单元所施加的抑制所减弱,这种相互影响的侧抑制作用在机器视觉研究中受到越来越多的关注.2003年Grigorescu等采用Gabor模型模拟经典感受野的输出,并利用非经典感受野的抑制特性,提出圆环形抑制区域采用高斯差分(Difference 0fGaussian,DoG)模型来模拟其距离权值.基于该模型,不少研究者在非经典感受野对视觉刺激响应的抑制作用方面进行了相应的改进.2007年Sang等根据初级视皮层循环抑制特性建立了一种基于侧抑制区的抑制模型,其通过抑制机制消除了背景中大量繁杂的纹理所产生的局部有向边缘,但侧抑制机制的引入导致部分检测到的轮廓断裂,在一定程度上降低了边缘响应,2009年杜晓凤等为了弥补侧抑制机制对弱轮廓区域的损坏,引入了去抑制机制,使得较弱的轮廓区域得以保存,提取轮廓的整体性得到了进一步的加强.2011年Zeng等提出了蝶形抑制区域模型以及一种中心周边相互作用的自适应抑制方法,较好地去除了背景纹理产生的边缘.Yang等通过上下文调制结合视觉系统中的线索来调制最终的神经元周边抑制,通过结合不同的视觉特征来加强抑制作用的性能.在之前的研究成果中,课题组模拟V1神经元相互抑制机制提出了一种基于空间总和特性的轮廓检测模型,有效地降低了背景纹理对于轮廓的负面影响。
然而上述轮廓检测模型在模拟感受野的响应计算中设定了全局尺度(定值),即每个像素点对应的尺度因子均相同,导致目标轮廓的信息不能被完整地提取.2014年Wei等模拟神经节细胞的自适应机制,通过动态的尺度信息来自适应地表达图像,说明感受野尺度在表达图像局部信息中起到重要作用.而本文着重关注动态尺度信息对于后续轮廓提取的调制作用.人类的感知机制能够迅速地提取视野之中的目标物体,是由于各视皮层中多种神经元机制相互作用,只依赖一种类型神经元的响应很难实现提取最优化.根据文献[12]描述的人类视觉系统中视网膜——外膝体—初级视皮层(V1区)这一视觉通路,视网膜神经节细胞的感受野动态特性会对V1区中经典感受野响应与非经典感受野的抑制效应造成影响,这也是本文实现的理论基础.单一空间频率尺度下的经典感受野响应仅仅能表现出一定程度下的目标轮廓提取细节,而单尺度下的感受野尺度模板是不足以完全表现不同空间频率尺度下图像的各种细节.本文基于以上生理学依据提出基于非经典感受野动态特性的轮廓检测模型,引入尺度判断这一处理机制,通过修正的sigmoid激活函数对像素点对应的感受野模板尺度进行判断,并得到每个像素点的局部尺度.将判断后得到的尺度信息用于经典感受野响应的计算,同时用提取的尺度矩阵对周边抑制进行调制从而得到最优轮廓检测结果.实验结果表明,本文的轮廓检测模型较同类模型,获得了较高的性能评测指数,有效地提高了轮廓检测的性能。
1基于感受野动态特性的轮廓检测模型
1.1轮廓检测总体模型
本文提出的基于非经典感受野动态特性轮廓检测模型总体框架如图1所示。
1.2局部尺度计算方法
每个尺度对应一组神经元感受野大小,不同的感受野大小的神经节细胞存在不同尺度下的特性.如图2所示展示了不同尺度下的gabor能量表示经典感受野响应,可以发现大尺度下的响应能够体现轮廓的整体情况,而小尺度下的响应则突出了图像更多的细节.本文定义一个高斯差分算子DoG(x,y)来对输入图像进行卷积计算作为尺度判断的输入。
1.3经典感受野响应
文中对于方向选择性的V1神经元模型,使用二维Gabor函数描述它们对cRF中刺激响应的特性,其描述如下:
1.4非经典感受野响应
经典感受野响应在孤立的边缘和纹理上的响应都很强烈,不足以区分这两种模式.相比之下抑制项对背景纹理的响应要高于独立的边缘,所以当经典感受野响应减去非经典感受野抑制的时候,最终响应就只会在独立的边缘上响应强烈.对于输入图像中的某个像素点来说,抑制项通过经典感受野周边的圆环形区域计算得到.用标准化权重函数w(x,y)描述非经典感受野:
2实验结果与讨论分析
在硬件平台CPU为Intel(R)core(TM)i3-4130,主频为3.4GHz,内存为8 GB的计算机上,使用MATLAB 2016a仿真软件对各项同性模型、蝶形抑制模型、自适应抑制模型、多线索抑制调制模型、文献[10]中的轮廓检测模型、Canny轮廓检测模型以及本文提出的检测模型进行仿真实验,同时使用标准评价指数F对所有模型得到的图像数据结果进行评测。
为测试本文检测模型性能,分別从定性和定量两个方面进行实验来论证本文模型的有效性:1)基于RUG40数据库,给出一个与同类模型的比较来说明本文的轮廓提取结果在抑制背景纹理方面得到了提高;2)基于伯克利数据库BSDS300,将本文模型得出的轮廓检测结果与数据库中给出的真实轮廓做定量比较来全面评测本文轮廓检测的性能,表1给出了主要参数设置情况。
2.1基于RuG数据库的实验结果及分析
图3显示的是基于RUG40数据库的两种模型的抑制效果比较,分别是本文模型与各向同性抑制模型(Isotropic Inhibition,ISO),其中图3(a)是原始输入图像,图3(b)为经过1.2小节判断之后得到的局部尺度信息,图3(c)是经局部尺度调制后得到的CRF响应,图3(d)是经局部尺度调制后得到的nCRF抑制项,图3(e)是图3(c)减去图3(d)后再经过非极大值抑制和滞后阈值处理后得到的二值轮廓图像,图3(f)是ISO各项同性模型中提出的CRF响应,图3(g)是ISO中提出的nCRF响应,图3(h)是图3(f)减去图3(d)后再经过非极大值抑制和滞后阈值处理后得到的二值轮廓图像.通过图3(e)和图3(h)的对比可以看出本文检测模型的优势之处:1)调制后的CRF的响应使得图3(e)保留了更完整的轮廓信息;2)调制后的nCRF响应使得图像的背景纹理得到了有效的抑制,可以清楚的看到就图像下半部分的背景区域来说图3(e)中的噪点要远少于图3(h),这说明输入图像中多余的背景杂草部分通过本文方法检测后大部分都得以消除。
2.2基BSDS300数据库的实验结果及分析
基于表1中的参数设置,在伯克利图像数据库BSDS300中测试轮廓提取模型的性能,图4给出了几种轮廓检测模型经过非极大值抑制后的轮廓比较.其中第一列和第二列分别是数据库给出的自然图像以及人工绘制的边界图像,第三列是各向同性抑制模型ISO的实验结果,第四列是自适应抑制模型的实验结果,最后一列是本文模型的实验结果,通过横向比较可以发现我们的检测模型对轮廓边缘的还原度最高,并且在抑制背景纹理方面优于其他两种模型。
本文也通过该数据库下的100幅图像对提出的模型进行定量评测,该数据库包括200张训练图像和100张测试图像.每一个图像都对应有5-10幅由不同人员绘制的真实轮廓图.文献[18]中用精确度一回归度(覆盖率)框架(precision-recall framework)来评价轮廓检测性能的高低.当对轮廓检测模型进行评价时,有几个重要的检测量需要注意:1)True Positives-TP:正确检测出轮廓的样本数;2)False Positives-FP:错误检测出的轮廓的样本数,比如将背景误检测为轮廓输出;3)False Negatives-FN:漏检样本,即实际上是轮廓的区域被检测成背景区域的样本.于是评价方式为:精确度一回归度(覆盖率)曲线,这是一个包含阈值参数的曲线并且权衡了精确性和噪声,在这条曲线中F值最大的点即为该算法的最优性能指数.精确度(P)是P=TP/(TP+FP);回归度是R=TP/(TP+FN),即真实轮廓中轮廓的覆盖率(R)评价标准为F指数,其定义如下:
F指数为P和R的调和平均,其代表着模型的检测结果与人类观察轮廓的相似度。
表2中列出了一些优秀检测模型的F值结果,可以看到在最近几年的仿生类轮廓检测模型中,本文的方法达到了0.63,高于蝶形方法、多线索抑制调制模型(Multi-ple-Cue Inhibition,MCI)等,为了更加直观地比较本方法与其他同类检测方法的性能,用图5中的PR曲线图展示本文检测模型同其他检测模型的精准度一回归度走势.由于F值表示精准度和回归度的调和平均,可以看到随着精准度降低,回归度升高,最终本文的F指数都高于其他方法。
2.3对nCRF抑制调制的实验结果
为了表现不同尺度下的局部图像信息,用提取的尺度信息对经典感受野响应进行计算;为了增强nCRF抑制项的抑制效果,又用局部尺度对nCRF抑制项进行调制,目的是为了突出背景响应,减弱边缘响应,这样经典感受野响应减去该调制的抑制项后就能抑制掉更多的背景噪点,从而突出轮廓信息.
为了验证这一步骤,本文基于BSDS300数据库进一步实验在无抑制调制的情况下,轮廓响应的结果.PR曲线结果如图6所示,本文的轮廓检测算法在无抑制调制的情况下评价指数F值只能达到0.60,但是在进行抑制调制过后评价指数F值达到了0.63,这充分说明了本文的抑制调制方法使得模型整体的轮廓检测性能得到了提高。
同时本文选取了5幅实验结果图像用于对比有抑制调制和无抑制调制下的轮廓检测结果,如图7所示,可以看出抑制调制能够有效地抑制图像背景中多余的噪点使提取的轮廓更加完整。
3结论
近年来,有许多生理学和神经物理学方面的研究都主要关注于神经视皮层V1区的周边抑制现象,受到这些研究的启发,不少提取目标轮廓的计算模型相继被提出,尽管这些方法中的一部分在提高检测轮廓成功率方面取得了不小进步,然而很少有利用图像的尺度信息对CRF响应和nCRF抑制进行调制.针对该问题,提出了一种基于感受野尺度调制的轮廓检测模型:将尺度信息融入到传统的基于V1区神经元感受野特性的轮廓检测中.后续对于实验结果的分析也说明本文的模型能够在保留轮廓完整性的基础上最大限度地抑制背景纹理,今后工作的重点是进一步研究尺度线索能否与其他线索相结合对基于非经典感受野的检测模型进行改进,如何更有效地利用局部最优尺度也将会成为轮廓提取的重点。