APP下载

基于光谱信息的空间目标模式识别算法研究

2016-06-05李庆波吴科江高琦硕

光谱学与光谱分析 2016年12期
关键词:超平面模式识别类别

李庆波、吴科江,高琦硕

北京航空航天大学仪器科学与光电工程学院、精密光机电一体化技术教育部重点实验室、北京 100191

基于光谱信息的空间目标模式识别算法研究

李庆波、吴科江,高琦硕

北京航空航天大学仪器科学与光电工程学院、精密光机电一体化技术教育部重点实验室、北京 100191

在观测空间目标时、往往会受到地基观测仪器等因素的制约、导致无法利用目标图像信息从外形上进行识别。根据不同空间目标表面组成材料不同、其产生的反射光谱会存在差异这一特性、可利用空间目标特有的光谱信息进行识别分类。基于此、从光谱学角度对空间目标识别算法进行研究、在K最近邻算法(KNN)的基础上、采用了一种自适应权重局部超平面方法(AWKH)、算法主要在计算预测样本与超平面距离时加入对特征权重的考虑、构建了以样本特征组间差与组内差的比值作为特征权重值的超平面模型、从而提高了分类效果和分类效率。为验证算法的分类效果、本文进行了四组验证实验、第一组实验将美国地质勘探局数据库中提取出的九种常用材料光谱随机选出三种混合成多类进行识别; 第二、三组实验将四种常用空间目标材料的光谱作为纯物质光谱、分别从可见光和近红外波段对其混合物质进行分类; 第四组实验通过实测四个方形模型样本六个面的光谱对其进行识别分类。实验过程中将实验结果与目前常用的支持向量机(SVM)进行对比、对比结果表明改进后的AWKH算法在识别精度和样本适用范围上具有更高的优越性。

空间目标; 模式识别; 光谱信息; AWKH算法

引 言

空间目标在航天领域通常是指在大气层外绕地球飞行的各种人造飞行器和空间碎片[1]。自从1957年苏联发射了世界上第1颗人造地球卫星以来、发射进入外层空间的飞行器不断增加、也制造了大量的空间碎片[2]、成为太空垃圾。这些空间碎片会对在轨飞行器构成严重的威胁、故而有效识别空间目标对防止碰撞、保证飞行器安全具有重要意义。

对空间目标的观测主要分为成像观测和非成像观测、目前通常采用地基光学望远镜获取空间目标图像数据、从外形尺寸上进行识别。但是由于受到地基观测仪器空间分辨率、衍射极限、大气湍流等因素的限制、空间目标在观测时往往会成点目标或者占据极少像元。在这种情况下无法利用图像从外形上进行目标识别。光谱特征是空间目标的重要光学特性之一[3-4]。由于不同空间目标表面组成材料不同、其反射光谱曲线存在差异、所以可以根据空间目标的光谱信息进行模式识别。目标的光谱特性包括其可见光、红外和紫外特性等、随着光谱波段的增加、其目标信息越多、目标探测与识别越准确。首先通过模式识别方法对不同空间目标不同角度获取的光谱数据进行模型训练、然后再对实测的未知空间目标光谱进行识别[5-6]。

目前模式识别算法通常包括支持向量机(SVM)[7]、K最近邻算法、神经网络方法等机器学习方法、支持向量机算法主要是求解存在约束条件的二次规划 (quadraticprogramming、QP)问题,对于小规模的二次优化问题、SVM能够很好的解决、但是随着样本复杂程度增大、就会出现精度下降、效率低下等问题[9]。而KNN算法和支持向量机SVM算法一样、相较于其他的如贝叶斯、决策树等分类方法有更好的分类精度、但当样本类别数增加、复杂程度增大时、也会出现准确率下降的情况。神经网络算法[10]特别适用于多因素、不精确的信息处理问题、但也存在着学习过程收敛速度慢、训练易陷入瘫痪、训练过程中易陷入局部极小值等问题。因此、针对KNN算法中存在的分类效果以及分类效率不足的问题、本文采用了一种自适应权重局部超平面算法[8](adaptive weight k-local hyperplane,AWKH)、使改进后的AWKH算法在识别精度以及效率上能有显著提高。

1 原理与算法

AWKH算法是在K最近邻算法(K-nearest neighbor algorithm,KNN)上进行改进、在计算预测样本与超平面距离时加入对特征权重的考虑、构建了以样本特征组间差与组内差的比值作为特征权重值的超平面模型、这种特征权重值的添加克服了KNN算法的不足、提高了分类精度。

AWKH算法的过程如下:首先通过自适应最近邻搜索从训练集中筛选出K个最近邻样本。与最近邻搜索不同、自适应最近邻搜索主要考虑了特征权重并利用了权重欧式距离来筛选最近邻、将最具区分度的样本属性作为筛选的参考主特征。得到最近邻后、通过这些最近邻建立一个局部超平面。最后通过样本与超平面的权重欧式距离来确定样本的类别。

假设一个训练集、包含L个样本、J个类别。每个样本包含d个特征、记为:xi(xi1,…,xid)T、其所属类别为yi=c(i=1,…,L;c=1,…,J)。预测样本为向量q=(q1,…,qd)T。(1)计算训练样本的特征权重w

计算公式为

(1)

(2)计算预测样本q与训练样本的权重欧氏距离D

(2)

(3)根据欧氏距离D、寻找类c样本中与q最近的nc个训练样本pc=(pc1,…,pcnc)、根据训练样本pc构造超平面

(3)

V·i=pci-mc

α=(α1,…,αnc)T

(4) 计算预测样本q到类c超平面的最小距离

(4)

W=diag(w1、…、wd)

其中λ是一个用于控制α值可能过大的参数。

α=(UTV+λInc)/(UT(q-mc))

(5)

其中UT=VTW。

(5) 分类判别:计算预测样本q到不同类别的超平面距离、将样本q判别为距离最小的类别中、即

label(q)=argmincJc(q)

(6)

2 实验部分

本文对改进后的AWKH算法共进行了四组仿真实验、并将每组实验结果与目前较为流行的支持向量机(Lib-SVM)进行比对、具体实验过程如下所述:

第一组仿真实验:

从美国地质勘探局(UnitedStateGeologicalSurvey、简称USGS)数据库中选取出9种常用材料的光谱作为纯物质光谱、其中包括铝合金、铝粉漆、有机白漆、二氧化硅等材料的光谱曲线、光谱波段范围为400~2 000nm、在这9种材料中随机选择3种材料线性混合成一组仿真混合光谱、共混合成84类样本、样本均叠加信噪比为30db的高斯白噪声、再将84类样本抽样选出3类、4类、7类、10类和15类进行模式识别分类。

第二组仿真实验:

第二组仿真实验中、将实验室测得的四种常用空间目标材料的光谱曲线作为纯物质光谱、常用材料分别为:有机黄底漆、环氧铝粉漆、有机灰漆与有机白漆。将这4种材料中随机选出2种材料线性混合成一组仿真混合光谱共6类、随机选出3种材料线性混合成4类、并叠加信噪比为40db的高斯白噪声、将4和6类混合光谱分别进行模式识别分类、实验采用美国海洋QE65000科研级光谱仪、光谱仪波段范围400~900nm、使用LS-1型卤钨灯以及QR400-7-VIS-BX型光纤探头进行实验。

第三组仿真实验:

为了验证AWKH算法多波段的广泛适用性、第三组实验将对空间目标材料的近红外光谱信号进行模式识别。实验样本依次为实验室测得的有机白漆、黄底漆、有机灰漆和铝粉漆的光谱信号。实验仍将这4种材料随机选出3种或2种材料线性混合成一组仿真混合光谱、并叠加信噪比为40db的高斯白噪声、光谱仪采用瑞典Perten公司的DA7200光谱仪。光谱仪波段范围950~1 650nm、光谱分辨率2nm。

第四组仿真实验:

在实验室制作四个长方体样品、每个样品的6个面分别由三种材料按照不同比例混合而成、为了增加分类难度、每两个样品中有一种材料相同。使用美国HeadwallPhotonics公司的成像光谱仪HyperspcVNIR-Nseries、波段范围为400~1 000nm、光谱分辨率为2~3nm、单像素色散值为0.89nm。实验平台如图1所示。

实验平台是在一个标准光学平台上搭建、在光学平台一端设置标准白板、在标准白板前方设计一个可以带动目标模型做三维位移和二维旋转的移动框架。在平台另一端放置成像光谱仪、在成像光谱仪的下方增设一个转台、使成像光谱仪可以对目标进行扫描成像、以便同时获得目标的光谱信息和图像信息。放置两个照明光源用于为目标提供足够光强的照明。控制柜由计算机和实时控制系统组成、控制系统控制目标模型做相应的运动、计算机用于采集成像光谱仪的图像和光谱数据。

图1 第四组模式识别实验仿真平台示意图

3 结果与讨论

分别采用AWKH算法和Lib-SVM算法对上述仿真实验数据进行模式识别、各组实验结果如下:

第一组仿真实验:

由USGS数据库中的9种常用材料光谱合成仿真数据、每条仿真光谱分别由三种材料光谱线性混合而成、将混合的84种类别随机选出3类、4类、7类、10类和15类进行模式识别分类。每一类建模样本为100个、预测样本50个、对每组进行分类、分别采用课题组提出的AWKH算法和目前较为流行的Lib-SVM算法对其进行识别、将识别正确的样本个数除以样本总数、得到识别精度。识别结果如表1所示。

表1 第一组实验模式识别精度

第二组仿真实验:

选择响应波长范围为400~900 nm的光谱信号。共混合成4类、6类进行模式识别、模式识别过程与第一组仿真实验相同。其中每一类建模样本为200个、预测样本为100个、识别结果如表2所示。

表2 第二组实验模式识别精度

第三组仿真实验:

选择响应波长范围为900~1 600 nm的近红外光谱信号、共混合成4类、6类进行模式识别、实验过程同上。其中每一类建模样本为200个、预测样本为100个、识别结果如表3所示。

表3 第三组实验模式识别精度

第四组仿真实验:

将每个样品每一个面测得的成像光谱数据进行光谱加和平均、获得一条光谱、图2所示为第四组实验中四个样品6个面的光谱。

由图2可知、四种样品的光谱在400~1 000 nm波段范围光谱形状相近、肉眼难以分辨、由于样品个数限制、实验只能通过AWKH采用交互验证方法进行识别。正确率如表4所示。

图2 四类样品不同角度的光谱曲线

表4 第四组实验模式识别精度

通过上述四组实验可以看出:当类别数较少时、两种方法模式识别精度均较高、当类别数上升时、Lib-SVM识别精度下降、而AWKH方法仍然保持较高精度、当类别数上升较多超过10类时、两种方法精度均下降、但是AWKH精度相对较高。

实验结果表明、与目前常用的支持向量机(SVM)算法相比、AWKH算法具有更大的优越性:

(1)随着样本类别数的增加、SVM表现出其局限性、这是因为随着类别数的增多、混合样本中重复光谱的比例会增大、使得SVM在建模过程中选择的“支持向量”代表性降低、模型精度下降。

(2)AWKH在分类过程中、每个样本都与所有训练样本进行权重欧式距离的计算、选择出与之距离最近的样本构建权重超平面、通过距离样本超平面的距离来判定其所属类别、考虑到了样本之间的相似度大小、突出了不同类别样本之间的特征、使得结果更具有合理性、达到较高的分类精度。

(3)在近红外波段范围内、模式识别精度大于可见光波段、说明近红外波段更能反映材料结构信息、材料的光谱特征差异更大、可以进而指导地基观测仪器的设计。

综上所述、AWKH在样本类别数少的情况下相较SVM具有更高的精度、在样本类别较多时也能保持较高的稳定性。

4 结 论

采用了一种AWKH算法、对空间目标进行了光谱模式识别仿真实验研究、通过四组仿真实验的比对、AWKH算法相比SVM算法具有更高的识别精度和更好的多类别样本适用性。可见、用AWKH算法进行空间目标光谱信息的模式识别具有一定可靠性和实用性、而且算法并不局限于空间目标光谱模式识别、对于一般情况下的模式识别也具有适用性。因此、AWKH算法能够极大提高空间目标光谱模式识别的可行性和精度、算法在模式识别领域具有广阔的前景。

致谢:感谢中国农业科学院饲料研究所石冬冬博士和北京航空航天大学仪器科学与光电工程学院屈玉福副教授在实验环节上为本研究提供的支持与帮助。

[1] LI Shao-min,NIU Wei,MA Xin,et al(李少敏,牛 威,马 鑫,等). National Defense Science & Technology(国防科技),2009,30(3): 6.

[2] SUN Cheng-ming,YUAN Yan,HUANG Feng-zhen,et al(孙成明,袁 艳,黄锋振,等). Infrared and Laser Engineering(红外与激光工程),2012,41(3): 563.

[3] Chang C I,Wang S. IEEE Transactions on Geosicence and Remote Sensing,2006,44(6): 1575.

[4] Zong Yingwei,Kevin W Kelly. Proc. of SPIE,2004,5542: 311.

[5] JIN Xiao-long,TANG Yi-jun,SUI Cheng-hua(金小龙,唐轶峻,隋成华). Chinese Journal of Space Science(空间科学学报),2014,34(1): 95.

[6] Oz C,Leu M C. Engineering Applications of Artificial Intelligence,2011,24(7): 1204.

[7] DENG Nai-yang,TIAN Ying-jie(邓乃扬,田英杰). Data Mining: A New Method of Support Vector Machine(数据挖掘中的新方法:支持向量机). Beijing: Tsinghua University Press(北京:清华大学出版社),2006. 58.

[8] Li Qingbo,Gao Qishuo,Zhang Guangjun. Biomedical Optics Express,2014,5(7): 2435.

[9] XU Lu,SHAO Xue-guang(许 禄,邵学广). Methods of Chemometrics(化学计量学方法). Beijing: Science Press(北京: 科学出版社),2004. 279.

[10] ZHANG Guo-liang,YANG Chun-ling,WANG Jian-lai(张国亮,杨春玲,王暕来). Journal of Electronics & Information Technology(电子与信息学报),2014,36(4): 896.

[11] Wei Z,Kelly K W. Optical Science and Technology,the SPIE 49th Annual Meeting. International Society for Optics and Photonics,2004. 311.

Research on Space Target Recognition Algorithm Based on Spectral Information

LI Qing-bo,WU Ke-jiang、GAO Qi-shuo

Key Laboratory of Precision Opto-Mechatronics Technology,Ministry of Education,School of Instrument Science and Opto-Electronics Engineering,Beihang University,Beijing 100191,China

Because of ground observation instruments and other factors,we can not recognize the space target only from the external shape in the image. Since the reflection spectrum of the space target is determined by the surface material of space object,spectral analysis technique can be used for classifying the space objects. Based on the K-nearest neighbor algorithm (KNN),a method called adaptive weight k-local hyperplane (AWKH) is proposed in this paper. The main improvement of the algorithm is that weight discrimination is added in the processes of calculating the hyperplane distance between predicted samples. The algorithm constructs a hyperplane model by using the difference between the groups and within group ratio for the weights of features. In order to verify the classification effectiveness and efficiency of the algorithm,this paper carried out four sets of verification experiments. In the first set of experiments,9 kinds of common materials were extracted from the database of United State Geological Survey. Then 3 kinds of these materials were mixed into multi-class objections. In the second and third sets of experiments,the spectra of four normal space target materials were mixed in different classes. Then these classes were identified from the visible and near-infrared wave bands. In the fourth set of experiments、four square models of hexahedron were classified by the spectra of their surface material. The experimental results indicate that the AWKH algorithm has more advantages in identification accuracy and effectiveness of the complex samples by comparing with the support vector machine (SVM) method.

Space target; Pattern recognition; Spectral information; AWKH algorithm

Jul. 3,2015; accepted Nov. 12,2015)

2015-07-03、

2015-11-12

国家自然科学基金项目(61575015)资助

李庆波、女、1975年生、北京航空航天大学仪器科学与光电工程学院副教授 e-mail:qbleebuaa@buaa.edu.cn

O657.3

A

10.3964/j.issn.1000-0593(2016)12-4067-05

猜你喜欢

超平面模式识别类别
全纯曲线的例外超平面
涉及分担超平面的正规定则
以较低截断重数分担超平面的亚纯映射的唯一性问题
涉及周期移动超平面的全纯曲线差分形式的第二基本定理
壮字喃字同形字的三种类别及简要分析
UPLC-MS/MS法结合模式识别同时测定芪参益气滴丸中11种成分
第四届亚洲模式识别会议
服务类别
可拓模式识别算法中经典域的确定方法
多类别复合资源的空间匹配