APP下载

边缘检测和证据理论在机器人目标识别中的应用

2019-06-03夏国廷李立伟

实验室研究与探索 2019年3期
关键词:算子摄像头边缘

王 凯, 夏国廷, 李立伟, 兰 勇, 冯 晓

(青岛大学自动化与电气工程学院,山东青岛266071)

0 引言

近年来,人工智能的发展成为科技前沿的热门研究领域。仿生机器人作为机器人领域中的最先进的代表,融合了传感技术、信息传输、自动化控制等多学科的知识,成为了研究最为广泛的一类机器人。NAO机器人作为世界上最热门的仿人智能机器人,广泛应用于人们的生活中[1-5]。

NAO机器人具有25个自由度,并在不同的部位配有相应的传感器,该机器人的视觉开发是一个非常热门的研究方面。NAO机器人主要靠视觉系统来感知周围的环境,首先采集相应的图像,然后结合HSI颜色空间的边缘检测进行图像的预处理。除去图像噪点,得到较优化的图像,然后再对目标物体进行颜色的辨别。

对于机器人的不精确环境下的颜色识别问题,已有人工智能(AI)、模糊系统(FS)、遗传算法(GA)和神经网络(NN)方法来解决。对于实时移动的机器人,FS方法被认为是效率和精度最高的方法。一般的颜色识别方法基本思想是构造隶属函数,以确定HSI三维颜色空间的定义程度,然后使用Mamdani推断来计算检测到的输出颜色[6-11]。

本文为了克服由于最小/最大算子涉及到的非线性问题,主要采用了HSI空间下的Takagi-Sugeno Fuzzy System with Constant Conclusions(TSCC)系统。在一个决策不精确的环境下进行双摄像头的目标颜色标定,与上述检测到的目标边缘信息融合,实现模糊系统下有色目标的识别[12-14]。

1 边缘处理

边缘处理是是整个图像处理中最基础也是非常重要的环节,它是后续图像处理的数据源,提供了高效准确的原始图像。图像处理包含两个方面,首先通过HSI颜色空间对原始图像进行色彩分割;然后对色彩分割图像进行离散小波滤波处理;最后对图像进行边缘检测。

1.1 HSI颜色空间

通常色彩空间有 RGB、CMY、YUV、HSV、HSI等。为了更好地对图像进行数字化处理,进一步提高识别效果,本文采用了HSI颜色空间进行图像的预处理。

HSI颜色空间是一种均匀的颜色空间,色彩空间的距离与坐标点上的欧几里德距离成正比(见图1)。HSI颜色空间具有以下优点:当采用RGB颜色空间时,改变其中某一颜色的属性,比如改变色度就必须同时改变R、G、B 3个坐标。因为HSI空间中的3个坐标式是独立存在的,当采用HSI坐标空间时,只需要改变H坐标。

图1 HSI圆锥空间模型

在NAO机器人中,彩色图像都采用RGB模式,因此,需要进行颜色空间的转换。RGB模式到HSI模式的常用转换公式如下:

式中:

利用RGB-HSI模式转换原理,将RGB颜色空间下的图像进行转换。

如图2所示,(a)为RGB颜色空间下的原图,(b)为HSI颜色空间下的H通道示意图,(c)为HSI颜色空间下的S通道示意图,(d)为HSI空间下的I通道示意图。HSI颜色空间对R、G、B 3个分量重新编码,其中,色度分量在[0,2π]的范围内;饱和度分量和亮度分量在[0,1]的范围内。HSI空间有两个重要特点:亮度分量H与图像的彩色信息无关,色度分量S、饱和度分量I与人感知彩色的方式紧密相关。

图2 RGB转HSI示意图

由于从RGB颜色空间到HSI颜色空间的转换是非线性的,对图像的噪声较为敏感,因此采用离散小波变换对图像进行平滑去噪,即分别对R、G、B分量进行滤波处理。

1.2 离散小波变换去噪处理

本文利用离散小波变换(Discrete Wavelet Transform,DWT)进行图像的去噪处理,避免了由于连续小波变换导致的较大的计算量。使用滤波器进行离散小波变换的示意图如图3所示。图中:S代表的是原始信号,通过高通滤波器与低通滤波器产生了A与D信号;A信号表示的是原始信号的近似值;D信号表示的是原始信号的细节值。实现离散小波变换,将内部尺度因子与平移因子进行了适当的离散化。在图像处理中,噪声大多存在于高频部分,通过小波变换可对图像进行有效的降噪处理。

图3 离散小波变换示意图

1.3 HSI边缘检测

在对数字图像进行边缘检测时,有几种常用的边缘检测算子:梯度算子、Roberts边缘检测算子、Sobel边缘检测算子、Prewitt边缘检测算子、Laplacian边缘检测算子等。但实际应用中,Canny算子不止是简单地通过计算图像的梯度信息检测边缘,而是通过邻域像素点的特点进行边缘的寻找和连接,这样就可以获得更加完整的边缘。

本文提出在HSI颜色空间中采用离散小波变换Canny算子边缘检测的方式对图像进行处理,通过最大熵决策机制提取梯度信息,融合多方向的边缘信息。用一结构元素作为“探针”探测融合的图像边缘信息,保留与结构元素相匹配的结构,抑制正负脉冲噪声,保持细节和边缘。图像识别流程可简单描述如图4所示。

图4 HSI边缘识别流程图

Canny算子具有较好的检测性能和比较高的定位精度,并且边缘响应次数较少,可以实现单像素边缘的检测,而且不会受噪声的影响产生伪边缘。图5所示为离散小波变换下的可自动适应阈值Canny算子得到的示意图。

图5 Canny算子示意图

Roberts边缘检测算子只用了相近的4个点的灰度值进行边缘的计算,所以该算子可以实现精确的定位并且计算量很小,但是对噪声比较敏感。Prewitt算子通过计算邻域内像素点之间的差值进行边缘的检测,由于边缘部分得到的计算数值比较大,可以利用这个优势消除一部分的虚假边缘,对于噪声有一定的平滑能力,具有降噪的效果,如图6、7所示。

图6 Robert算子

对经过Canny算子得到的图像进行非极大值抑制,即对边缘进行细化处理。通过比较邻域内的梯度幅值,保留了梯度变化最为剧烈的位置达到精确定位的目的,如图8所示。

图7 Prewitt算子

图8 对像素进行非极大值抑制示意图

设f(x)为定义在二维离散空间上的离散函数,结构元素g1(x)和g2(x)为Z2上的有限子集,则广义形态开(GO)和广义形态闭(GC)滤波器分别为:

图像的像素进行非极大值抑制之后,对图像的点φ(x,y)进行双阈值标定,即对边缘色度进行带状区域M识别,在阈值范围之内的像素点标定为

采用双阈值法对边缘点进行像素点的标定,给边缘点留有一定的裕量,提高了目标识别的准确性和边缘的容错性,使得目标轮廓无限逼近真实目标。图9为NAO机器人HSI空间下经过非极大值限制和双阈值法进行处理的的目标识别示意图。

图9 目标边缘检测

2 双摄像头颜色识别系统

通常,目标的不确定性的主要原因之一是源于它的不精确性。事实上,识别信息的不精确性会增强决策的不确定性。同样地,利用信息的不确定性也会导致其处理序列的不精确性,通常这两个缺陷是相关的。

为了改善以上缺陷,本文构建了双摄像头融合的系统。图10显示了该架构的结构开发方法,它的运行是基于模糊系统中的证据理论。单一摄像头色彩识别容易受不确定因素(例如:光照,动态目标移动,容错误差等)影响,导致识别精度下降。假定有n个摄像机可供观察目标,这些输出值被传送到融合机制做出颜色判定[15]。

图10 多摄像头颜色识别流程

2.1 模糊系统

设Ω是一个有限的非空集合,包含颜色识别问题中所有可能的决策。P=2Ω是所有可能的子集组成的源集,Ω和P分别为:

证据理论始于使用基本概率分配(BPA)在Ω中表示证据的程度的思想,BPA中的m是一个从P到[0,1]对源集中的每个元素标定可靠度的映射,具有以下属性:

空集的0值代表完全不相信假设;1代表完全相信。ω的值表示为m(Ω),代表不确定的数量,具有非空集的子集称为焦点元素。在此背景下,系统的输出,即寻求颜色Ci的结果必然是一个包含所有可能的集合:

冲突情况不代表被丢弃,可以认为是在选择阈值时,对颜色的标定是不确定的。为了减少目标搜寻的时间复杂度,对每种颜色Ci的辨别空间Ωi定义如下:

Ωi中包含所有可能的子集的源集空间由Pi提供:

模糊化方法在于将一个清晰的目标值作为模糊系统的输入。如图11所示严格划分识别空间,建构具有三角形和梯形隶属函数。在该框架中,给每个子集分配模糊的隶属函数。因此,系统提供的输出是在可能的识别空间子集上模糊化。根据这一原则,与TSCC系统相关的值向量的模糊输出被构造出来。在这种情况下,对于颜色C的矢量值m(C)由下式给出:

图11 模糊系统下的色度分布

2.2 颜色识别

基于以上理论,本文使用NAO机器人头部的上下两个摄像头进行验证所述的融合方法,通过两台摄像机识别目标建筑的颜色。

根据表1,棕色的数字是5(C5)。在检测过程中,两台摄像机捕捉同一个对象但给出不同的结果,即Out1=5.85和Out2=4.45。但是,两者的结果却处于冲突状态(相机之间分别犹豫不决{红色(C4),棕色(C5)}和{棕色(C5),黄色(C6)}之间。在这个例子中,Out1=5.85(与相机1有关)是更接近黄色,但它不是黄色(因为这个值在褐色的区间检测之外,即5.85[5.9,6.1])。在这种情况下,识别系统(模糊系统)犹豫在红色和棕色之间。换句话说,颜色可以是红色或棕色。同样的标定在摄像机2中作出Out2=4.45,引起冲突棕色和红色之间的情况(颜色可以是棕色或红色)。在这个框架中,一些关于棕色的库颜色存储在冲突的替代颜色中:{红色,棕色}和{棕色,黄色}。证据理论的目的是解决这些出现的冲突问题,以便更精准地做出相关颜色的标定。

表1 颜色标识码

如果待检测目标物体被认为是可靠的,基于距离的算法也被使用,那么检测到的颜色肯定会是棕色。如图11所示,棕色是距离最近的,到相对于相机1的输出。然而目标源只有部分可靠,而基于距离的算法则不能给出连贯可靠的结果。在这种情况下,初始的证据理论可以作为一个可替代方案,因为在解决冲突的决策进程中证据理论具有提取有用信息和整合可靠性的能力。

在此例证的背景下,减少的辨别空间是Ω5={C4,C5,C6}和包含所有可能的功率集合空间的子集:

根据图11能够从中得到模糊系统下的色度分布情况。事实上,表2显示了单摄像机系统下的m1和m2两个摄像头没有可靠性。在加权之前,模糊系统的m1和m2之间的冲突等于0.802。这里需要注意的是,来自不同的证据源(摄像头)在精确的环境下可能会得到不完全可靠的信息。

表2 单摄像机系统下的颜色识别

因此,在融合过程中必须考虑证据源的可靠性,如果这些源可靠性较好,可以给定它们一定的权值来表征影响。在本算法中,假定摄像机m1的可靠度α1=0.7,摄像机m2的可靠度α2=0.6。对于每个证据源,加权方法都会乘以可靠性因素。因此,可靠度改变了每个来源的权值以反映其信誉,从而改善决策过程。表3显示了相机可靠性 α1=0.6、α2=0.7。系统中m1和m2之间的冲突k=0.337意味着两个来源之间的合理冲突加权之后的可靠性被削弱。使用Dempster-Shafer(DS)规则和最大pignistic概率给出的决定如表3所示,从中可以看出,融合后的决定是棕色C5。所以机器人可以识别目标对象并据此做出决策。

表3 融合后的颜色识别决策

考虑单摄像头、双摄像头系统分别识别有色目标,其中双摄像头系统采用的是所述模糊系统证据理论方法。识别性能结果如表4所示。

表4 颜色识别性能 %

在HSI颜色空间中,模糊系统下的双摄像头系统识别质量和精度要提高约29%,经计算融合过程的执行时间为0.37 s,保证了目标识别的实时性。

3 结语

本文采用基于HSI颜色空间的离散小波变换方式,利用可自动适应阈值Canny算子边缘检测方法和双阈值法提高了图像边缘的准确性和容错性,使得目标轮廓无限逼近真实目标。通过基于TSCC系统下的证据理论融合与决策机制对NAO机器人双摄像头系统进行图像的颜色标定,将目标图像的识别性能提高了约29%。本研究未来将着重于将这种方法扩展到3D彩色域,使用模糊和渐变的相机进行动态多元目标识别。

猜你喜欢

算子摄像头边缘
浙江首试公路非现场执法新型摄像头
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
一类截断Hankel算子的复对称性
摄像头连接器可提供360°视角图像
拟微分算子在Hp(ω)上的有界性
Heisenberg群上与Schrödinger算子相关的Riesz变换在Hardy空间上的有界性
一张图看懂边缘计算
奔驰360°摄像头系统介绍
找出摄像头花屏的“罪魁祸首”
在边缘寻找自我