基于小波矩的自主式水下机器人目标识别

2014-06-24黄蜀玲张铁栋

哈尔滨工程大学学报 2014年2期

关键词：声呐神经元激光

万磊，黄蜀玲，张铁栋，王博

（哈尔滨工程大学水下机器人技术国防科技重点实验室，黑龙江哈尔滨150001）

基于小波矩的自主式水下机器人目标识别

万磊，黄蜀玲，张铁栋，王博

（哈尔滨工程大学水下机器人技术国防科技重点实验室，黑龙江哈尔滨150001）

由于水体对可见光的衰减和散射较强，为克服传统CCD摄像机所得图像的低对比度、以及低信噪比的缺陷，提出以距离选通激光成像设备和前视声呐为传感器建立水下目标识别系统。通过前视声呐图像获取目标的距离信息，自主调节激光成像设备的接收摄像机与目标的距离，克服了水下机器人的距离选通激光图像自动采集的困难。对传统小波矩进行改进，获得反映目标全局和局部信息的具有旋转、平移、缩放不变性的小波矩，通过类内特征的均值和方差建立了特征选择模型。以特征选择后的小波矩作为广义回归神经网络GRNN的输入向量，对6类水池实测目标进行识别。试验结果表明建立的自主式水下机器人的目标识别系统具有较好的识别率，验证了所建系统的有效性和可行性。

目标识别；前视声呐；距离选通激光成像系统；小波矩；特征选择

人类在感知外部环境信息中，其中大约有83%的信息是通过视觉获取的，其他来自于触觉、嗅觉、听觉等感觉器官［1］。水下环境的特殊性决定了只有少数传感器可用于水下环境信息的感知。与传统的视觉传感器不同，智能机器人的视觉系统不仅需要获取外界图像和视频的能力，同时还必须具有对图像的自动采集、处理和按照特定功能对目标进行识别或跟踪等能力。文献［1-2］提出了利用水槽中的微光图像对目标进行识别。但是由于水对可见光吸收和散射使得其衰减比空气中强很多，因此在水中的能见度较空气中低得多，图像的信噪比较低。特别是对于外界光照条件变化时，图像目标信息变化较大，因此采用传统CCD摄像机获取水下目标图像进行识别较困难。而采用主动式距离选通激光成像对水下目标进行成像时目标成像清晰、对比度高［3］，并且不受外界光源的影响，激光器发出激光束，不同距离反射回来的激光到达探测器的时间不同，对探测器的成像进行快门选通，仅保证一定距离的反射光能被探测器接收。因此选择合适的距离能克服水这一特定介质所具有的强散射效应和快速吸收功率衰减特性对成像质量的限制［4］。水下机器人通过前视声呐图像处理可实时获得前方障碍物的方位、距离、形状等信息［5］。但是前视声呐图像的分辨率较低，干扰强，仅凭一幅静止的图像难以对目标进行准确的识别。鉴于前视声呐和距离选通激光成像系统所提供的信息不同，本文提出了一套采用前视声呐和距离选通激光成像设备的水下目标自主识别系统。

1 目标识别系统

本文搭建了如图1所示的水下目标识别系统的图式模型。该系统由前视声呐和距离选通激光系统2部分组成。

图1 水下目标识别系统Fig.1 Underwater object recognition system

声呐系统为距离选通激光成像提供目标的距离和方位信息，通过串口协议RS-232获取前视声呐的采样数据，采用灰度级别为256的.bmp的位图格式进行实时图像显示，对声呐图像去噪、分割处理，检测出目标区域，确定目标的位置和方位信息，调整机器人的运动。距离选通激光系统与声呐系统通过UDP网络协议进行数据交换。声呐系统将前方目标的方位和距离信息传递给激光系统，距离选通激光系统通过目标的距离信息选择激光的发射距离，对探测器的快门选通，实现激光图像自动采集，提取目标特征，完成识别。

2 图像处理

图像获取和数据传输过程等都不可避免地产生了噪声。本文采用滑动窗口为3×3的中值滤波对激光图像和声呐图像进行去噪。中值滤波在一定的条件下可以克服线性滤波器如最小均方滤波器和均值滤波器等带来的图像细节模糊，而且对滤除脉冲干扰极为有效。

典型声呐图像如图2所示，其具有如下特点：目标与背景的声波强度干扰很强且图像的分辨率较低；与光学图像相比，其信噪比较低；而且图像中的不同区域可能代表同一个物体［6］。采用单阈值分割往往不能将目标区域完整地分割出来，本文采用双阈值对目标和背景进行分割。由于声呐图像反映的是声波的回波强度，在图像中，目标表现为亮区域，背景表现为暗区域。选用阈值Thigh和Tlow，遍历整幅图像，首先利用Thigh分割出核心目标区域，以核心目标区域的边缘点作为种子点，对核心目标区域附近的像素点利用阈值Tlow进行判断，最终分割图像。在双阈值分割中，Tlow的选择保证目标具有低于阈值Thigh的像素点，这避免了通过Thigh进行图像分割时，目标像素点被误分割为背景而使目标欠分割。尽管采用了Tlow对图像进行分割，同一目标仍然可能被分割成距离较近的不同区域，因此有必要合并距离相近的目标。设定面积阈值，去掉图像分割区域中的伪目标。对分割出来的目标区域的上、下、左、右边界进行标记，获取目标的信息（目标区域质心的极坐标：半径和角度），处理结果如图3所示。

图2 声呐图像Fig.2 Image of forward looking sonar

图3 检测结果Fig.3 Object detection result

通过声呐图像实时获取目标的距离信息，对探测器快门选通，获取激光图像，图4中给出了部分激光图像，从图中可以看出，距离选通激光成像清晰、对比度高，信噪比大。本文采用简单的迭代阈值对激光图像进行分割，结果见图5。

图4 部分激光图像Fig.4 Parts of laser image

图5 激光图像处理结果Fig.5 Processing results of laser image

3 特征提取

为了使机器人具有真正意义上的“视觉”，须从图像中提取有用的数据和信息，得到计算机能识别的目标信息描述，即为特征。在二维图像模式识别中提取目标的不变矩特征［7-11］是一种重要方法。但是传统的矩特征不变量是对图像进行全局处理，计算量大。小波分析通过在不同频率提供不同大小的时间窗进行分析，克服短时傅里叶变换（STFT）的窗口大小不随频率变化的缺点，同时小波变换克服了STFT缺乏离散正交基的缺点。但是小波分析不具有平移、旋转，伸缩不变性，图像的一些细微的移动就会造成小波特征极大改变。考虑到矩特征和小波特征各自具有的特点，结合而成的小波矩既有矩特征的平移、旋转和缩放不变性及抗噪性强的特点，同时又包含了小波的局部分析和多分辨率特性。

3.1 图像分割

2-D数字图像极坐标系下的小波矩定义为

Fpq不具有旋转、平移、缩放不变性，首先对其进行变换，构造具有旋转不变性小波矩：

式中：f（r，θ）为图像尺度为M×N的2-D数字图像f（x，y）在极坐标系下的灰度映射，r∈［0，，θ∈［0，π／2］。gp（r）为变换核的径向部分，而ejqθ是角度部分。设Sq（r）＝∫f（r，θ）ejqθdθ，以小波函数作为式中的gp（r），就可以得到小波矩的表示式。小波函数沿着径向可以定义为

‖Fm，n，q‖不具有平移和伸缩不变性，在计算小波矩前必须先对图像进行规范化处理，使各个图像的中心位于坐标原点，且各图像的区域面积保持一致，以构造具有平移和缩放不变性的小波矩。

3.2 小波矩的平移和缩放不变性

2-D数字图像f（x，y）的（p+q）混合原点矩［2］：

式中：f（x，y）为图像灰度，M、N为图像尺度。计算m00、m10、m01，求得目标的重心坐标：

目标的期望尺寸为Aconst为一常量，则图像的缩放尺寸为α＝。获得具有平移和伸缩不变性的小波矩特征，对图像中目标进行规范化处理，将目标区域按照式（4）进行变换。

通过除以图像对角线的长度（以像素为单位）把图像尺寸归一化到r≤1的范围后，利用不同的尺度因子m、位移因子n，ψm，n（r）可以遍及整个径向空间［0，1］，小波矩‖Fm，n，q‖提供了图像f（r，θ）在不同尺度水平上的特征，得到了图像的全局特征和局部特征。

3.3 小波矩特征提取及选择

本文采用小波分析中通用的三次B样条母小波ψ（r）［12］，其表达式为

式中：n＝3，a＝0.697 066，f0＝0.409 177，＝0.561 145。将式（2）和（5）代入式（3），对于固定的r值，计算原点为图像的左下方，Sq（r）代表f（r，θ）在相位空间［0，π／2］中的第q个特征。其中尺度因子m＝0，1，2，3，平移因子n＝0，1，…，2m+1，q＝0，1，2，3，通过对分割图像进行特征提取，得到4× 34＝136个小波矩。由于各小波矩的取值范围较大，对各小波矩取对数处理lg‖Fm，n，q‖，并对每组特征进行归一化处理。由于提取的小波矩特征数量较多，这不利于改善分类器的总体性能。因此有必要对小波矩进行特征选择，简化特征的获取过程，获取最佳的特征组合。然而采用特征后向选择（SBS）［13］和前向选择（SFS）［14］以及增l-r方法［15］对提取的小波矩进行选择时，得不到具有较好辨别能力的特征组合。本文通过以下提出的方法对小波矩离线选择。对于两类目标Si、Sj的小波矩特征‖Fm，n，q‖之间的差异表示为

式中：η＝3，m（Si，‖Fm，n，q‖），m（Sj，‖Fm，n，q‖）分别表示Si类和Sj类目标小波矩‖Fm，n，q‖的均值；σ（Si，‖Fm，n，q‖），σ（Sj，‖Fm，n，q‖）分别表示Si类和Sj类目标小波矩‖Fm，n，q‖的标准差；|m（Si，‖Fm，n，q‖）-m（Sj，‖Fm，n，q‖）|表征了Si类和Sj类目标‖Fm，n，q‖均值差异，其值越大，表征类间的分辨能力越强；σ（Si，‖Fm，n，q‖）+σ（Sj，‖Fm，n，q‖）越小，‖Fm，n，q‖在类内的差异越小。e是一个很小的正数，相对于‖m（Si，‖Fm，n，q‖）-m（Sj，‖Fm，n，q‖）‖可以忽略不计，引入的目的是为了防止‖m（Si，‖Fm，n，q‖）-m（Sj，‖Fm，n，q‖）‖为零的情况下除法溢出。因此Q（‖Fm，n，q‖，Si，Sj）越小，表征Si类和Sj类的类间差异越大，聚类能力越强。

选用立方体、三棱柱、球、角反射体、圆柱和椭球体等6种目标，每类目标的初始训练样本为40幅图像，提取目标的小波矩特征，对各小波矩特征进行投票：利用式（6）计算各小波矩在两两目标类型之间的差异，按Q（‖Fm，n，q‖，Si，Sj）从小到大的顺序排列，产生15个序列Seq，取出每个序列Seq的前半部分的特征序号，对每个特征进行投票，取胜出的前6个特征作为识别神经网络的输入模式向量。通过投票获胜的特征有：‖F0，0，0‖、‖F1，0，0‖、‖F2，5，0‖、‖F1，0，1‖、‖F2，1，1‖、‖F3，9，1‖。通过特征选择降低了识别网络的输入维数，并实现了对图像的局部保拓性和变换不变性的多尺度特征提取。

4 识别网络

获取目标的特征后，设计具有分类精度高，容错性和鲁棒性好，学习能力强和可靠性高的分类器是水下目标识别的最终目的。

广义回归神经网能够根据样本数据逼近其中隐含的非线性映射关系，即使样本数据稀少，网络的输出结果也能够收敛于最优回归表面。与诸如支持向量机（support vector machine，SVM）和BP网络等方法相比，GRNN具有更强的学习能力和鲁棒性。并且GRNN学习过程中所需要优化的参数只有平滑参数σ，因此在计算效率上有更大的优势。

本系统选用广义回归神经网络对目标进行识别。其网络结构［16-17］如图6所示。

图6 广义回归神经网络Fig.6 Generalized Regression Neural Network

对网络各层结构解释如下：

1）输入层：输入层的神经元数目等于学习样本的特征向量，X＝［‖F0，0，0‖，‖F1，0，0‖，‖F2，5，0‖，‖F1，0，1‖，‖F2，1，1‖，‖F3，9，1‖］T。

2）模式层：学习阶段，模式层的神经元数目等于除输入层学习样本以外的其余样本的数目，识别阶段，模式层的神经元数目等于训练样本的个数。各神经元对应不同的学习样本，神经元i的传递函数为

式中：σ为平滑参数。

3）求和层：求和层包括2种类型的神经元，分别为求和神经元SD和其他神经元SN。其中，SD＝，模式层与求和神经元的连接权值为1。其他神经元与模式层的连接权值为yij，yij表示输出样本中的第j个元素的期望输出。求和层中其他神经元计算式SNj＝，j＝1，2，…l。

4）输出层：学习阶段，该层的神经元数目等于学习样本个数，识别阶段，该层神经元个数为1。神经元的输出yj通过求和层中的神经元结果计算，yj＝。

5 实验结果

在哈尔滨工程大学水下机器人重点实验室水池（图8（a））（50 m长×30 m宽×10 m深）进行了试验，采用如图7所示的试验装置，试验条件如图8，水池目标如图8（b）布置，图像采集如图8（c），实验过程中水池模拟真实海洋情况，即在不同海流，不同光照情况对图9所示的6种类型目标进行采集、识别。

图7 水下目标识别系统试验装置Fig.7 Configuration equipment for the underwater object recognition

图8 试验场景Fig.8 Experiment scene

图9 目标物Fig.9 Objects in experiment

选用四棱柱、三棱柱、球体、椭球、圆柱和角反射体六类目标（图9），选取具有代表性的6×40＝240幅图像组成训练样本，提取目标的小波矩和传统不变矩［1，2，9］，其特征曲线如图10和图11所示。

图10 目标的小波矩特征分布Fig.10 Object wavelet moment distributions

在图10和图11中图像的横坐标表示样本数，纵坐标表示特征值，尽管采用距离选通成像能减少水对可见光的散射，提高图像质量，但是由于训练样本采用的是不同时间和空间上的水下目标激光图像，所以在特征分布曲线上表现有一定波动。

图11 目标的不变矩特征分布Fig.11 Object wavelet moment distributions

比较图10和图11的特征分布结果，各类目标的小波矩分布曲线相距较远，聚类能力越强；而图11中的不变矩曲线较为紧密，彼此交叉较多，聚类能力较弱。利用广义回归神经网络对训练样本进行学习，获得平滑参数σ＝0.5。在水池中通过对水下图像采集，处理，提取目标的小波矩，对其进行识别。为验证文中的识别系统的可靠性，采用水池实时采集的六种类型的目标图像进行验证分析，结果见表1所示。

表1 目标识别结果Table 1 Results of object recognition

从表1可以看出，利用传统矩对目标识别时，圆柱的识别率较低，这是由于传统矩是基于全局信息的特征描述，从图11可以看出，采用不变矩［1，2，9］获取的训练样本特征分布中显示椭球体与圆柱的各不变矩特征的分辨能力较差，其特征交叉比较大，因此识别时圆柱与椭球体之间相互干扰。而采取本文提出的小波矩由于具有局部保拓性而对于相似目标具有更好的特征描述，因此在目标识别系统中具有更高的识别率。而且从表1看出，通过小波矩作为目标的识别特征，虽然训练样本的小波矩具有较大的波动，识别率均能保持在90%以上，这也表明该系统具有较好的鲁棒性。通过小波的多分辨率分析，小波矩具有描述目标的全局信息和局部特征的能力，而不变矩只反映了目标的全局信息，所以利用小波矩对目标的识别率较传统不变矩高。因此将小波矩作为识别网络的输入向量，具有更好的泛化能力。

6 结束语

本文基于前视声呐和距离选通激光成像系统相结合的水下目标识别系统能实现距离选通激光成像系统对目标的自动采集，克服了水下机器人的距离选通激光图像自动采集的困难，为水下机器人的水下目标自动识别的一体化提供了基础。同时本文提取的小波矩相对传统的不变矩具有更高的聚类能力，能同时反映图像的全局信息和局部信息，对于相似目标具有较高的分类能力。文中提出的特征选择方法简单，方便快捷。利用小波矩进行识别其结果较传统矩准确性更高，更有效，且计算量更小；同时广义回归神经网络需要优化的参数少，计算效率高，便于机器人目标识别系统的实时处理。

［1］唐旭东.智能水下机器人水下管道检测与跟踪技术研究［D］.哈尔滨：哈尔滨工程大学，2011：1.

TANG Xudong.Research on underwater pipeline detecting and tracking by AUVs［D］.Harbin：Harbin Engineering U-niversity，2011：1.

［2］唐旭东，朱炜，庞永杰，等.水下机器人光视觉目标识别系统［J］.机器人，2009，31（2）：171-178.

TANG Xudong，ZHU Wei，PANG Yongjie，et al.Target recognition system based on optical vision for AUV［J］.Robot，2009，31（2）：171-178.

［3］徐效文，郭劲，于前洋.距离选通激光成像系统发展现状［J］.仪器仪表学报，2003，24（4）：616-618.

XU Xiaowen，GUO Jin，YU Qianyang.Presentstate of laser range gated imaging system［J］.Chinese Journal of Scientific Instrument，2003，24（4）：616-618.

［4］孔捷，张保民.激光水下成像技术及其进展［J］.光电子技术，2006，26（2）：129-132.

KONG Jie，ZHANG Baomin.The review of underwater laser imaging technology and its development［J］.Optoelectronic Technology，2006，26（2）：129-132.

［5］张铁栋，万磊，马悦.一种单波束前视声呐成像方法［J］.声学与电子工程，2008，（3）：14-18.

ZHANG Tiedong，WAN Lei，MA Yue.A preprocess method of the looking forward sonar image［J］.Acoustics and Electronics Engineering，2008，（3）：14-18.

［6］ZENG Wenjing，WAN Lei，ZHANG Tiedong，et al.Simultaneous localization and mapping of autonomous underwater vehicle using looking forward sonar［J］.Journal of Shanghai Jiao Tong University，2012，17（1）：91-97.

［7］SHEN J，SHEN W，SHEN D.On geometric and orthogonal moments，multispectral image processing and pattern recognition［C］.Series in Machine Perception Artificial Intelligence，World Scientific，Singapore，2001，44：17-36.

［8］KAN C，SRINATH M D.Invariant character recognition with Zernike and orthogonal Fourier-Mellin moments［J］.Pattern Recognition，2002，35（1）：143-154.

［9］LIAO S X，PAWLAK M.On the accuracy of Zernike moments for image analysis［J］.IEEE Transactions on Pattern Analysis and Machine Intelligence，1998，20（12）：1358-1364.

［10］陈波，杨阳，沈田双.一种基于不变矩和SVM的图像目标识别方法［J］.仪器仪表学报，2006，27（6）：2093-2094.

CHEN Bo，YANG Yang，SHEN Tianshuang.Image target recognition method based on moment invariant and SVM［J］.Chinese Journal of Scientific Instrument，2006，27（6）：2093-2094.

［11］刘国海，蒋志佳.基于改进ART-2网络和不变矩的高压瓷瓶裂缝识别［J］.仪器仪表学报，2009，30（7）：1420-1425.

LIU Guohai，JIANG Zhijia.Recognition of porcelain bottle crack based on modified ART-2 Network and invariant moment［J］.Chinese Journal of Scientific Instrument，2009，30（7）：1420-1425.

［12］SHEN D，IP H H S.Discriminative wavelet shape descriptors for recognition of 2-D patterns［J］.Pattern Recognition，1999，32（2）：151-165.

［13］李伟红，陈伟民，杨利平，等.基于不同Margin的人脸特征选择及识别方法［J］.电子与信息学报，2007，29（7）：1744-1748.

LI Weihong，CHEN Weimin，YANG Liping，et al.Face feature selection and recognition based on different types of margin［J］.Journal of Electronics and Information Technology，2007，29（7）：1744-1748.

［14］徐旭东，周源华.基于小波矩不变量的模式识别方法［J］.红外与毫米波学报，2000，19（3）：215-218.

XU Xudong，ZHOU Yuanhua.Pattern recognition based on wavelet moment invariants［J］.J Infrared Millim，Waves，2000，19（3）：215-218.

［15］张琦，樊养余.基于小波矩不变量的海上目标识别［J］.计算机工程与科学，2007，29（2）：59-61.

ZHANG Qi，FANG Yangyu.Target-on-sea recognition based on wavelet moment invariants［J］.Computer Engineering and Science，2007，29（2）：59-61.

［16］王建星，付忠广，靳涛，陈颖.基于广义回归神经网络的机组主蒸汽流量测定［J］.动力工程学报，2012，32（2）：130-134.

WANG Jianxing，FU Zhongguang，JIN Tao，et al.Main steam flow measurement based on generalized regression neural network［J］.Journal of Chinese Society of Power Engineering，2012，32（2）：130-134.

［17］吴心宏，金海.在线广义神经网络交通状态预测的网格并行算法［J］.华中科技大学学报：自然科学版，2009，37（5）：49-52.

WU Xinhong，JIN Hai.Grid parallel computation of online traffic status prediction using generalized neural network［J］.Journal of Huazhong University of Science and Technology：Natural Science Edition，2009，37（5）：49-52.

Object recognition system for an autonomous underwater vehicle based on the wavelet invariant moment

WAN Lei，HUANG Shuling，ZHANG Tiedong，WANG Bo
（State Key Laboratory of Autonomous Underwater Vehicle，Harbin Engineering University，Harbin 150001，China）

Water has serious effects on the attenuation and scattering of visible light.In order to overcome the defects of the images captured by a conventional CCD camera with low contrast and a low signal-to-noise ratio，it is proposed that an underwater objectrecognition system be established with the underwater laser gated system and the forward looking sonar as the sensor.Through the image obtained by the forward looking sonar，the object distance information may be gained，the distance between the receiving camera of the laser imaging system and the object may be autonomously regulated，so as to overcome the difficulty of automatic acquisition for the range-gated laser image of the underwater vehicle.The conventional wavelet moment is improved to acquire a wavelet moment with the properties including rotation，horizontal movement and invariant scaling，which reflects the global and local information of the object.A feature selection model is proposed for the mean and variance of the inside-category feature，the wavelet moments after feature selection are used as the input vector of the generalized regression neural network GRNN for the recognition of six types of pool actually-measured objects.The test results show that the established object recognition system of the autonomous underwater vehicle has an excellent recognition rate and as a result the established system is effective and feasible.

object recognition；forward looking sonar；underwater laser gated system；wavelet moment；feature selection

10.3969／j.issn.1006-7043.201306061

TP242

1006-7043（2014）02-0148-07

http：／／www.cnki.net／kcms／doi／10.3969／j.issn.1006-7043.201306061.html

2013-06-19.网络出版时间：2014-1-2 14：52：03.

国家863计划资助项目（2011AA09A106）；国家自然科学基金资助项目（51009040＼E091002）；中央高校基本科研业务费资助项目（HEUCF110111）；中国博士后基金资助项目（2012M510928）；黑龙江省博士后基金资助项目（LBHZ11205）.

万磊（1962-），男，研究员，博士生导师；

黄蜀玲（1986-），女，博士研究生.

黄蜀玲，E-mail：lingqing.2009＠163.com.