基于样本间最小欧氏距离的多特征融合识别算法研究∗
2018-01-04刘如松
刘如松
(中国航空工业集团公司西安航空计算技术研究所 西安 710068)
基于样本间最小欧氏距离的多特征融合识别算法研究∗
刘如松
(中国航空工业集团公司西安航空计算技术研究所 西安 710068)
在目标跟踪过程中,为了提高目标图像识别的准确率和实时性,提出了一种基于样本间最小欧氏距离和DS证据理论的多特征融合识别方法(E-DS)。在对目标图像进行预处理和Sobel边缘检测的基础上,提取目标的颜色和几何两类视觉特征,加以归一化,形成目标图像特征向量;根据多特征DS融合理论,以2类单特征样本间的最小欧氏距离作为独立证据构造基本概率分配函数,结合DS证据组合规则,给出最终的识别结果。将多特征E-DS融合识别方法应用于目标识别试验中,计算结果表明此识别方法平均正确识别率达到95.49%,最高正确识别率达到97.16%,且此组间识别率的方差最小,验证了这一方法的有效性。
多特征融合识别;最小欧氏距离;DS证据融合理论
1 引言
在目标跟踪过程中,常引入多特征融合方法来提高目标跟踪的性能,多特征融合是把不同图像特征加以综合以提高算法的鲁棒性,通常并行地计算多个目标特征并加以融合,得到有利于跟踪的假设条件。跟踪算法的效果可以不依赖于单个特征的鲁棒性,其中一个主要的问题是如何对不同的线索作一个合理的融合。多特征融合的好处是多种特征在跟踪过程中优势互补,改善了跟踪的效果。跟踪系统中关于目标表象和运动的特征越多,算法鲁棒性相应更好,然而对被跟踪目标的约束也越多。因此好的基于融合的算法需要在两者中做相应的折中,在提高算法鲁棒性的同时也有较好的通用性。
目标识别是目标跟踪的前提,在对目标识别过程中,为了提高目标识别率,本文拟采用信息融合的方法将真实目标从各种虚假目标中识别出来,包括两个方面内容,一是目标特征提取,二是对目标多特征信息融合识别。信息融合不同层次对应不同的算法,DS证据理论是适合于目标识别领域应用的一种不精确推理方法。但是,利用DS证据理论时,基本概率分配函数的获得是一个与应用密切相关的课题,它大大限制了证据理论的实际应用。针对不同目标种类的特点,本文提出了一种DS证据融合多特征的目标识别方法,为了降低构建基本概率分配函数的复杂度,采用了一种基于样本间最小欧氏距离的概率分配函数确定方法,进一步提高目标识别率。
2 图像处理
2.1 目标图像预处理
在对目标进行跟踪和识别的过程中,图像的画质可能会出现一些退化,所以抑制使图像中各种干扰信号的处理、增强图像中有用信号的处理,以及将观测到的不同图像在同一约束条件下进行校正处理等就显得非常重要了,这一系列处理称为目标图像预处理,这个过程包括空间几何变换、图像归一化处理、图像平滑去燥处理、图像增强和图像复原等步骤。
针对于图像采集系统产生的系统误差和仪器位置变换产生的随机误差,需要相应的变换对图像进行修正,这种变换称为空间几何变换;图像归一化实际上是通过一些处理使图像的某一些特征在给定变换下具有不变性质的一种图像标准形式,图像的某一些性质可以是目标的面积和周长,在坐标旋转的情况下并不会发生任何改变;图像平滑去燥是为了消除图像中的随机噪声,同时要求在消除噪声时不影响图像轮廓或使线条变得模糊不清;增强是指对图像中的信息有选择地加强和抑制,以改善图像的视觉效果,或将图像转变为更适合于机器处理的形式,以便于数据抽取或识别;在实际应用中常常发生图像退化现象,例如大气流的扰动,光学系统的像差,相机和物体的相对运动都会使图像发生退化,图像复原是对各种原因造成的图像退化使用先验知识进行改善,试图重建或恢复一幅退化的图像[1]。
2.2 图像边缘检测
图像分割在图像工程中占有非常重要的地位,它是从图像处理到图像分析的关键步骤,也是进一步图像理解的基础。一方面它是目标表达的基础,对特征测量有重要的影响。另一方面,因为图像分割及其基于分割的目标表达、特征提取和参数测量等,将原始图像转化为更紧凑的形式,使得更高层的图像分析和理解成为可能。图像中的边缘含有丰富的信息,人的视觉对这种变化较快的部分是比较敏感的,当人们观察各种场景时,首先注意到的就是不同物体的相交处,并很快得到每个物体的边缘。人们研究了很多的方法,利用边缘检测进行图像的分割试图通过检测出包含不同区域的边缘来解决图像分割问题。
常用的边缘检测算子有Roberts交叉算子、So⁃bel算子、Prewitt算子等。Roberts算子是一种利用局部差分算子来寻找边缘的算子。由于此算子使用当前像素的2×2邻域,所以计算非常简单,但是对噪声敏感,适用于边缘明显且噪声较少的图像边缘提取;Prewitt算子是一种边缘样板算子,这些算子样板由理想的边缘子图像构成,依次用边缘样板去检测图像,与被检测区域最为相似的样板给出最大值,用这个最大值作为算子的输出值,这样可以将边缘像素检测出来,此算子边缘定位准,但计算量相对较大。
Sobel算子是一阶离散性差分算子,用来运算图像亮度函数的灰度值近似值。Sobel算子有两个,分别检测水平边缘和垂直边缘,距离不同的像素具有不同的权值,距离越大,产生的影响越小。运算时将模板在图像上移动并在每个位置计算对应中心像素的梯度值[2]。Sobel算子对噪声具有平滑作用,能提供较为精确的边缘方向信息,降低边缘模糊程度,对灰度渐变和噪声较多的图像有较好的处理效果。因此,我们选择Sobel算子检测目标图像边缘,测试图像及其边缘检测效果如图1所示。
图1 目标图像及其边缘的Sobel算子检测检测效果
根据图1可以看出:Sobel算子中的垂直模板得到的梯度图,由于梯度方向与边缘走向垂直,所以该梯度图对水平边缘有较强的响应,从而水平细节信息非常清晰;Sobel算子中的水平模板得到的梯度图,它对垂直边缘有较强的响应,垂直细节非常清晰;而Sobel算子水平和垂直方向叠加的梯度图,水平和垂直细节都非常清晰。
3 特征提取
3.1 颜色特征
颜色信息是最重要的视觉特征之一,对于目标的旋转,非刚性变换和目标的遮挡有良好的鲁棒性。颜色特征被广泛的应用在基于目标外观模型的视觉跟踪中。由于人的视觉对亮度的敏感程度远强于对颜色浓淡的敏感程度,为了便于色彩处理和识别,人的视觉系统经常采用HSI色彩空间,它比RGB色彩空间更符合人的视觉特性。HSI色彩空间是从人的视觉系统出发,用色调、色饱和度和亮度来描述色彩,其色彩空间可以用一个圆锥空间模型来描述,用这种描述HIS色彩空间的圆锥模型相当复杂,但确能把色调、亮度和色饱和度的变化情形表现得很清楚[3]。在图像处理和计算机视觉中大量算法都可在HSI色彩空间中方便地使用,它们可以分开处理而且是相互独立的,因此,在HSI色彩空间可以大大简化图像分析和处理的工作量。HSI色彩空间和RGB色彩空间只是同一物理量的不同表示法,因而它们之间存在着转换关系,假设有一幅RGB彩色格式的图像,则每一个RGB像素的H、S、I分量为
鉴于HSI颜色模型在处理彩色图像上的优势,本文选择在HSI颜色空间下提取图像的颜色特征。颜色矩是一种简单有效的颜色特征表示方法,有一阶矩(均值)、二阶矩(方差)和三阶矩(斜度)等,由于颜色信息主要分布于低阶矩中,所以用一阶矩,二阶矩和三阶矩足以表达图像的颜色分布,颜色矩已证明可有效地表示图像中的颜色分布,该方法的优点在于:不需要颜色空间量化,特征向量维数低;但实验发现该方法的检索效率比较低,因而在实际应用中往往用来过滤图像以缩小检索范围。一阶、二阶和三阶颜色距的数学定义:
其中,N为图像的像素个数,pi,j表示彩色图像第i个颜色分量灰度为j的像素出现的概率[4]。HSI颜色模型的前3阶颜色矩组成一个9维直方图向量,即图像的颜色特征表示
3.2 几何特征
图像的几何特征相对颜色特征而言,对图像的含义的表达来说更加复杂。对图像几何特征提取的要求是提取算法要满足对图像平移、旋转、尺度改变等变化具有不变性,即图像平移、旋转等改变不影响图像的形状特征描述算子。Hu不变矩是一种基于内部参数的几何描述,是具有区域的全局方法,通过对图像区域内的像素集合来提取特征量,用于对图像几何的描述[5]。不变矩原理是对图像区域的像素进行统计,由此,不变矩描述算子对于图像的平移、尺寸、旋转等变化不敏感,在图像识别中应用广泛。
设二值化图像函数为 f(x,y),其(p+q)阶矩的几何中心矩数学表示式
其中,(x0,y0)是图像重心坐标。
为了获得尺度不变性,对上式进行归一化处理,采用的为零阶中心矩[6]。归一化后的中心矩:
其中,r=(p+q)/2,p+q=2,3,4,…。
组合二阶和三阶中心矩,可以得到7个Hu不变矩数学表达式作为特征向量
所以图像的几何特征表示
综合颜色特征和几何特征,我们总共提取了16个目标图像特征:
由于这16个特征的描述方法不同,提取的特征值量纲也不同,不能直接比较和融合,因此我们对这些特征值进行归一化计算。我们用 fnk表示第n个样本的第k个特征的特征值,则第n个样本的第k个特征的特征值平均值和方差为
根据平均值和方差值,将各个特征进行归一化
4 多特征E-DS数据融合方法
4.1 DS证据理论
光电跟踪系统中用于目标识别的特征融合算法一般有经典推理方法、贝叶斯推理技术、聚类分析以及DS证据理论等。经典推理方法中常用的是二值假设检验,它是在已知先验概率的条件下对事件存在与否进行判别,它的不足就是它同时只能处理两个假设,对多变量数据处理无能无力;贝叶斯推理是在经典的统计归纳推理——估计和假设检验的基础上发展起来的一种新的推理方法,它的实现在于不需要概率密度函数的先验知识,可以直接使用贝叶斯定理迅速实现运算,但它主要的缺点在于定义先验似然函数困难,当同时存在多个可能假设时,会变得很复杂;聚类分析法为探索新的数据关联提供了一个有价值的工具,所有聚类分析法都需要定义一个相似性函数,以提供一个表示任意两个特征向量之间相似程度或不相似程度的值,该方法的缺陷是其本身的启发性使得数据排列方式、相似性参数的选择、聚类算法的选择都有可能影响到所有的聚类结果;DS证据理论采用概率区间和不确定性区间来确定多证据下假设的函数,是目前决策级融合算法中应用最广泛的一种数据融合方法,它可以使目标的判决证据综合成为对目标对象的一致描述,从而提高了系统对目标类别或属性判决的可信度[7]。因此,我们采用DS证据理论来对特征进行融合处理。
DS证据理论理论是概率论的进一步发展,它对概率论的概念进行了扩展。定义Θ为序列图像目标信息的一个互不相容事件的假设集合,有2Θ个子集,Θ表示对某些问题的可能答案的一个集合,正确答案只有一个,一个证据的出现会给某些子集以一定程度的支持[8]。因此,对于每个证据,都有一个基本概率赋值函数(BPA),m(A)为命题A的基本概率函数,表示对A的信任程度,即对A的直接支持。对于∀A⊆Θ,DS理论的信任函数则可以定义为
其中:Bel(A)为命题A上的信任度,它表示了对命题A总的信任程度。
Dempster组合规则是综合了多源的基本概率函数,得到一个新的基本概率函数作为输出。假设m1和m2是两个相同辨识框架Θ上的基本概率函数,Bel1,Bel2是其对应的信任函数,焦元为A1,A2,…,Ak和 B1,B2,…,Bn,应用正交和规则可以得到新的基本概率函数
利用DS组合规则可以把若干条独立证据组合起来得到证据的融合结果,最后再对计算结果利用置信函数对目标类别进行判断。DS数据判决条件:
1)判定的目标类型应具有最大的置信函数值;
2)判定的目标类型与其他目标类型的基本置信值之差要大于某个门限T1;
3)目标类型的基本置信值要大于某个门限T2;
4)不满足以上3条,则识别结果为“不确定”。
4.2 构造多特征基本概率函数
在DS证据理论应用过程中,基本概率赋值函数的确定是一个难题。距离函数可以用作模式分类,常用的是集群分析技术。在集群分析中,我们掌握的先验知识是一批未知类别的样本集,要求该样本集隐含着可分类的信息,具有集群特性,每个集群可认为是一类模式,划分同一类或不同类的基本原则是“相似性”,将相似的样本归为同一类,而将不相似的样本归为不同类[9]。集群准则函数的作用是优化技术使集群的准则函数达到最优,集群分析是事先不了解一批样本中每个样本的类别,而唯一的分类的依据是样本的特征,利用样本的特征来构造分类器,如“相似性”尺度法[10]。用于衡量两个目标的相似程度的方法中最简单、应用最广泛的关联度量是欧氏距离[11]。测试样本和训练样本之间的距离越小,相似程度越大,表明测试样本与训练样本是同一类的可能性越大。基于最小欧氏距离的概率分配函数构造过程如图2。
图2 基于最小欧氏距离的概率分配函数构造过程
假设测试样本的概率密度与欧氏距离的比例关系:
式中,d是测试样本与训练样本之间的欧氏距离,λ是修正系数,α是比例系数,反映了样本概率分布概率密度以及与训练样本之间欧氏距离的比例关系。当α=2时,说明样本概率密度分布与训练样本所在点为球心所构成的球形表面积成反比;当α=3时,说明样本概率密度分布与训练样本所在点为球心所构成的球形体积成反比。
假设训练样本中描述目标图像的颜色特征向量 为 xci(i=1,2,…,9) ,几 何 特 征 向 量 为xmj(j=1,2,…,7),根据欧氏距离定理,我们可以得到测试样本颜色特征向量与训练样本颜色特征向量之间的欧氏距离:
式中,xoi是测试样本颜色特征向量,同理,测试样本几何特征向量与训练样本几何特征向量之间的欧氏距离:
式中,xoj是测试样本几何特征向量。我们将得到各种特征的欧氏距离进行比较训练图像各特征的欧氏距离,选择最小值:
将最小距离代入式(13)和(14),就可以求得基于最小欧氏距离的E-DS融合识别的基本概率函数:
将得到的基本概率函数进行判决,实现目标的融合识别。
5 实验结果及分析
随机抽取5组训练样本,分别进行单特征识别、多特征DS融合识别和改进的多特征E-DS融合识别,进一步分析和验证改进的E-DS融合识别方法的优势。为了减小偶然性的影响,对5组识别结果作均值和方差计算,识别结果如表1所示。
表1 不同方法识别结果
将训练样本和所对应的测试样本分别进行单特征识别、多特征DS融合识别和改进的多特征E-DS融合识别,由表1可知,颜色特征和几何特征对目标的识别能力相差不大,都在75%左右,两者相对而言,几何特征的平均识别率更高,但其5组识别的方差也最大,反映了几何特征的稳定性相对最差;颜色特征的平均识别率最低,但相对稳定性好。采用多特征DS融合识别方法的平均识别率可达到89.39%,最高识别率可达到91.87%,而采用改进的多特征E-DS融合识别方法对目标的最高识别率达到97.16%,平均识别率达到95.49%,且5组随机样本识别率的方差最小,说明了改进的多特征E-DS融合识别方法对样本选择的敏感性小,泛化性好。
6 结语
在对目标识别过程中,为了提高目标识别率,本文采用多特征DS融合的方法将真实目标从各种虚假目标中识别出来,而在DS证据理论的实际应用中,如何根据实际情况构造基本概率赋值函数,是实际应用中而临的一个重要课题。为了降低构建基本概率分配函数的复杂度,文中提出了一种样本间最小欧氏距离的基本概率分配函数确定方法,并将它应用于目标识别的信息融合系统中。最后通过对比和分析5组训练样本在单特征、多特征DS融合和改进的多特征E-DS融合的识别结果,结果表明改进的多特征E-DS融合识别方法的有效性和可行性。
[1]李卫华.数字图像预处理与融合方法研究[D].西安:西北工业大学,2006.18-23.LI Weihua.Study on Digital Image Pre-processing and Fu⁃sion Methods[D].Xi'an:Northwestern Polytechnical Uni⁃versity,2006.18-23.
[2]何春华,张雪飞,胡迎春.基于改进Sobel算子的边缘检测算法的研究[J].光学技术,2012,38(3):323-327.HE Chunhua,ZHANG Xuefei,HU Yingchun.A study on the improved algorithm for Sobel on image edge detection[J].OPTICAL TECHNIQUE,2012,38(3):323-327.
[3]黎曦,郑宏,刘操.利用HSI色彩空间的PCNN人脸识别方法[J].武汉大学学报(信息科学版),2014,39(12):1499-1503.LI Xi,ZHENG Hong,LIU Cao.A Method of Face Recogni⁃tion Based on HSI-PCNN[J].Gcomatics and Information Science of Wuhan University,2014,39(12):1499-1503.
[4]孙红岩.基于多特征融合的遥感图像特征提取方法[J].计算机仿真,2016,33(10):334-337.SUN Hongyan.Based on Multiple Features Fusion Method of Remote Sensing Image Feature Extraction[J].Comput⁃er Simulation,2016,33(10):334-337.
[5]王欢,王江涛,任明武,等.一种鲁棒的多特征融合目标跟踪新算法[J].中国图象图形学报,2009,14(3):489-498.WANG Huan,WANG Jiangtao,REN Mingwu,et al.A New RobustObjectTracking Algorithm by Fusing Multi-features[J].Journal of Image and Graphics,2009,14(3):489-498.
[6]何兵,胡红丽.一种修正的DS证据融合策略[J].航空学报,2003,24(6):559-562.HE Bing,HU Hongli.A Modified DS Evidence Combina⁃tion Strategy[J].Acta Aeronautica Et Astronautica Sini⁃ca,2003,24(6):559-562.
[7]何东健,乔永亮,李攀,等.基于SVM-DS多特征融合的杂草识别[J].农业机械学报,2013,44(2):182-187.HE Dongjian,QIAO Yongliang,LI Pan,et al.Weed Recog⁃nition Based on SVM-DS Multi-feature Fusion[J].Trans⁃actions of the Chinese Society for Agricultural Machinery,2013,44(2):182-187.
[8]车红昆,吕福在,项占琴.多特征SVM-DS融合决策的缺陷识别[J].机械工程学报,2010,46(16):101-105.CHE Hongkun,LV Fuzai,XIANG Zhanqin.Defects Identi⁃fication by SVM-DS Fusion Decision-making with Multi⁃ple Features[J].Journal of Mechanical Engineering,2010,46(16):101-105.
[9]Li H.Limited magnitude calculation method and optics de⁃tection performance in a photoelectric tracking system[J].Applied Optics,2015,54(7):1612-1617.
[10]Li H,Chen S.Detection Ability Mathematical Model and Performance Evaluation Method in Visible-light Photo⁃electric Detection System[J].IEEE Sensors Journal,2017,17(6):1649-1655.
[11]王珏.粗糙集理论及其应用研究[D].西安:西安电子科技大学,2005.31-36.WANG Jue.Study on Rough Sets Theory and its Applica⁃tions[D].Xi'an:Xidian University,2005.31-36.
Research on Multi-feature Fusion Recognition Algorithm Based on Minimum Euclidean Distance Between Samples
LIU Rusong
(Aeronautical Computing Technique Research Institute,Xi'an 710068)
In the process of the target tracking,to improve the accuracy and real-time performance of target image recognition,this paper proposes a multi-feature fusion recognition method based on DS evidence theory and minimum Euclidean distance be⁃tween samples(E-DS).By image preprocessing and Sobel edge detection to target image,two types of visual features such as the tar⁃get color and geometry are extracted and normalized to form the target image feature vector;according to DS fusion theory,the mini⁃mum Euclidean distances between single samples are calculated and the results are used as evidences to construct the basic proba⁃bility assignment function,combined with DS combination rule,the final recognition results are given.The multi-feature E-DS fu⁃sion recognition method is applied to the target recognition test,the calculation results show that the average correct recognition rate of E-DS method reaches 95.49%,the highest recognition rate is 97.16%,and the variance of recognition rate between groups is mini⁃mum,which verifies the applicability of E-DS method.
multi-feature fusion recognition,minimum Euclidean distance,DS evidence fusion theory
Class Number TP301
TP301
10.3969/j.issn.1672-9722.2017.12.011
2017年6月5日,
2017年7月29日
国家自然科学基金项目(编号:61575155)资助。
刘如松,男,工程师,研究方向:计算机软件及测试。