检测海面弱目标的神经网络集成方法*
2015-12-25刘允峰索继东柳晓鸣苏晓宏
刘允峰,索继东,柳晓鸣,苏晓宏
(1.大连海事大学 信息科学技术学院,辽宁 大连 116026;2.大连海事大学 图书馆,辽宁 大连 116026)
1 引言
海杂波中的弱小目标检测在军事领域以及民用领域都有着重要的应用价值,然而海杂波严重制约了海面弱小目标的可检测性,检测海面弱目标的方法包括多重分形分析技术[1]、时频分析技术[2]和神经网络方法[3-5]等。
目前,对海杂波性质的研究主要有基于统计理论和混沌理论的两种分析方法。基于统计理论的海杂波分析方法将海杂波作为一种完全随机的信号,通过用适当的概率统计分布模型来描述,如Log-Normal 分布、Weibull 分布和K 分布[6]等对海杂波建模分析。基于混沌理论的海杂波分析方法认为,海杂波包含有很大程度上的确定性因素[7]。文献[3]使用遗传算法优化了径向基函数神经网络(Radical Basis Function Neural Network,RBFNN)的数据中心、方差、隐节点数目和输出权值等参数,提高了目标检测能力。文献[4]利用广义回归神经网络(Generalized Regression Neural Network,GRNN)预测对消检测海杂波中的小目标,得到了较好的效果。但上述文献没有就神经网络训练样本的选择对目标检测效果给出相应结论。径向基函数神经网络在函数逼近方面具有优势,但存在泛化能力弱的缺点,会导致检测性能下降,而神经网络集成提高了泛化能力[8]。
神经网络集成的研究开始于1990 年。理论提出后,神经网络集成成为神经计算领域的研究热点,在手写数字识别[9]、人脸识别[10]多个领域得到了应用。
本文提出基于神经网络集成的海面弱小目标检测方法,通过神经网络集成预测海杂波,检测海面漂浮的小目标。分别利用径向基函数神经网络和广义回归神经网络作为神经网络集成的子网络,在不同海况下的实测海杂波数据中检测海面小目标。实验结果验证了本文方法的有效性,减弱了训练样本对检测效果的影响,提高了目标检测能力。
2 基于RBFNN 的目标检测
2.1 二元检测模型
假设存在海杂波的目标回波可由以下模型描述:
式中,x(t)是雷达接收信号,s(t)是海杂波中的目标信号,c(t)是海杂波信号,H0表示只存在海杂波的情况,H1表示目标和海杂波都存在的情况。
当雷达接收信号x(t)通过RBFNN 预测器时,产生预测绝对误差
式中,η 是门限阈值。
2.2 RBF 神经网络
RBF 神经网络是一种三层前向网络,由输入层、隐含层和输出层组成,如图1 所示。
图1 RBF 神经网络结构Fig.1 Architecture of RBF neural network
选用高斯函数作为基函数,得到输出的数学表达式:
式中,μi是数据中心,σ 是基函数距离数据中心的宽度,‖·‖表示范数,ωi是隐含层到输出层的权系数。
基于RBF 神经网络预测的目标检测原理框图如图2 所示。实现步骤如下:首先,确定训练样本集合,训练得到神经网络的参数;其次,采用单步预测方法[5]预测下一时刻点的海杂波状态,得到预测绝对误差序列;最后,按恒虚警率方法得到阈值门限,与绝对误差比较,通过阈值比较,得出检测目标结果。
图2 目标检测原理框图Fig.2 Block diagram of target detection
3 神经网络集成
3.1 定义
Hansen 和Salamon 于1990 年提出了神经网络集成[11]。1996 年,Sollich 和Krogh 给出了神经网络集成的定义:神经网络集成是用有限个神经网络对同一个问题进行学习,集成在输入示例下的输出由构成神经网络集成的各神经网络在此示例的输出共同决定。由于该方法易于使用且效果明显,即便缺乏神经计算经验的工程技术人员也可以直接使用,因此它被视为一种非常有效的工程化神经计算方法。Hansen 和Salamon 证明,可以简单地通过训练多个神经网络并将其结果进行合成,显著地提高神经网络系统的泛化能力。
假设神经网络集成的学习目的是逼近函数f:RN→R。神经网络集成由N个神经网络f1,f2,…,fN组成,各网络分别被赋予权值θi(i=1,2,…,N),满足θi≥0 且
设x∈RN满足p(x)分布,若在输入目标下输出为V(x),第i个成员网络fi的输出为fi(x),则神经网络集成在输入x 下输出为
3.2 神经网络集成的泛化误差
神经网络集成的泛化误差和第i个成员网络fi的泛化误差分别为[12]
各神经网络泛化误差的加权平均为
神经网络fi的差异度和神经网络集成的差异度分别为
则神经网络集成的泛化误差为
4 基于神经网络集成的海面目标检测
由于RBF 神经网络具有收敛速度快、网络结构简单和不存在局部极小等优点,所以集成中的子网络选择RBF 神经网络。利用在神经网络集成预测中海杂波和目标的误差表现的不同,可检测海杂波中目标。
4.1 子网络权值的确定
神经网络集成的关键在于子网络权值的确定。在得到子网络后,各子网络对验证集数据做预测,对输出结果使用模糊C 均值聚类进行聚类分析。在相同输入下子网络输出值相似度越大,证明模型差异度越小,反之模型差异度越大。对聚类结果排序,聚类结果小的子网络赋给大的权值,聚类结果大的子网络赋给小的权值,据此得到神经网络集成中子网络的权值θi。
4.2 阈值门限的确定
使用核估计的方法对RBF 神经网络预测误差求得概率密度函数pn:
式中,H(·)表示正态核函数,h 表示窗宽,n 是样本数。
由虚警概率公式
由式(14)求出门限η,可以得出不同的概率密度函数对应的门限能得到恒定的虚警概率,即随着概率密度函数变换有对应的自适应门限。有序统计恒虚警率检测器原理参见文献[5]。
4.3 神经网络集成的检测步骤
步骤1:采用RBF 神经网络作为神经网络集成中的子网络,得到个体神经网络参数;
步骤2:产生预测绝对误差的均值序列,得到子神经网络的绝对误差均值输出;
步骤3:利用模糊C 均值聚类产生子网络在集成中的加权系数θi,生成神经网络集成输出;
5 实验及结果
5.1 IPIX 实测数据的描述
海杂波实测数据来源于加拿大McMaster 大学的IPIX17#数据(19931107_135603)。1993 年11 月IPIX 雷达放置在加拿大东海岸的一处悬崖上,采集了大西洋的海杂波数据[4]。雷达脉冲重复频率为1000 Hz,有效浪高2.1 m,HH 极化方式。雷达工作期间,天线指向一个固定方向,对一片海域照射2 min。海面上的目标是一个直径1 m、包裹着金属网的沙滩球,距离岸边约2.6 km。雷达照射区域由近及远分成1~14个单元,主目标单元在9 单元,次目标单元在8~11 单元,其余单元是海杂波区。每个单元有131 072个数据点。本文将前10 000个数据点作为训练样本的选取范围,从中选取每组500个点来训练神经网络,之后120 000个数据点用于海杂波预测。雷达数据有同相I 和正交Q 两路数据,采用幅度R 用于计算:
5.2 实验过程
根据海杂波的幅度不能直接区分海杂波和目标,如图3 所示。
图3 单元9 的波形图Fig.3 Waveform of range 9
软件平台是Matlab2009。利用Takens 嵌入定理得到延迟时间τ 和嵌入维数d[5]。实验得到径向基函数网络:初始化网络的训练参数(使用newrb 函数),误差值为0.001,扩展速度为10,隐含层的最大神经元数目为20,显示频率为1。在网络训练前,对输入数据进行归一化处理。RBF 神经网络的训练样本从杂波区(选用第3 单元)共选取5个样本区间:[1001,1500],[3001,3500],[5001,5500],[7001,7500],[9001,9500]。每个区间有500个样本点,训练得到5个神经网络net 1、net 2、net 3、net 4、net 5。对[10 000,129 999]区间共120 000个数据进行预测,得到预测误差均值序列,并利用恒虚警率的方法得到阈值进行目标检测。基于RBF 神经网络的目标检测结果和利用上述5个样本区间共同训练的神经网络所得到的检测结果以及基于RBF 神经网络集成的目标检测结果如图4 所示,训练时间分别是2.19 s、3.05 s和7.50 s(包含样本等待时间0.95 s)。
图4 目标检测结果(IPIX17#数据)Fig.4 Result of target detection(IPIX17# data)
在得到5个子神经网络基础上,将子网络得到的误差均值归一化,再采用加权平均,得到神经网络集成的输出(ensembles),利用恒虚警率的方法得到阈值进行目标检测。这里不妨选取第3 单元的样本区间[1001,10 000]作为集成中子网络权值的验证集,利用5个子网络分别预测验证集,得到预测绝对误差,再利用模糊C 均值聚类得到5个聚类中心ci和相应权值ki:
对5个聚类中心排序,将相应权值ki按排序结果赋给神经网络集成中的对应权值θi。
IPIX54#数据的海杂波条件不同于17#数据,浪高0.7 m,主目标单元在8 单元,次目标单元在7~10单元,其余单元是海杂波区。基于广义回归神经网络集成的目标检测结果如图5 所示。
图5 目标检测结果(IPIX54#数据)Fig.5 Result of target detection(IPIX54# data)
从图4 可以看出,基于神经网络的目标检测方法受到训练样本的影响,检测效果有较大差别。利用5个子网络共同训练一个神经网络得到的检测效果反而下降。在训练神经网络所用时间上,单个神经网络用时最少,共同训练的神经网络次之,神经网络集成用时最长。神经网络集成采用相同子网络,利用模糊C 均值聚类得到子网络权值进行加权平均,得到集成的输出。神经网络集成将差异度大的模型赋予较大权值,降低泛化误差,所以,基于神经网络集成的目标检测效果优于大部分子网络的检测效果。不同的海杂波数据中,图5 显示了同样的效果。
6 结束语
利用神经网络预测可以检测海杂波中的小目标,但是训练样本的选择直接影响检测效果,不同神经网络的检测效果会有较大差别。即使扩大训练样本范围,使用子网络组成新的神经网络未必会提高检测效果。针对这种情况,采用IPIX 雷达数据利用子网络在验证集上的表现,赋给子网络不同的权值,通过神经网络集成预测海杂波,减小训练样本对检测的影响,提高目标检测能力。下一步将对如下问题进行研究:一是子网络的选择,选择差异度大的神经网络作为参与集成的子网络,但对神经网络取舍的确定方法亟待进一步研究;二是子网络的数量,避免神经网络集成中训练过多的子网络,这样会增加系统资源的负担。
[1]Li D C,Shui P L.Floating small target detection in sea clutter via normalised Hurst exponent[J].Electronics Letters,2014,50(17):1240-1242.
[2]Chen X L,Guan J,Bao Z H,et al.Detection and Extraction of Target With Micromotion in Spiky Sea Clutter Via Short- Time Fractional Fourier Transform[J].IEEE Transactions on Geoscience and Remote Sensing,2014,52(2):1002-1018.
[3]Leung H,Dubash N,Xie N.Detection of small objects in clutter using a GA- RBF neural network[J].IEEE Transactions on Aerospace and Electronic Systems,2002,38(1):98-118.
[4]毕井章,刘溶,周希辰,等.基于GRNN 和时间窗方差滤波的海杂波抑制[J].电讯技术,2014,54(7):932-936.BI Jingzhang,LIU Rong,ZHOU Xichen,et al.Sea clutter suppression based on GRNN and time-window variance filtering[J].Telecommunication Enginnering,2014,54(7):932-936.(in Chinese)
[5]赵福立.基于RBF 海杂波微弱目标的检测与提取[D].长春:吉林大学,2013.ZHAO Fuli.Detection and extraction of weak target in sea clutter based on RBF[D].Changchun:Jilin University,2013.(in Chinese)
[6]姚元飞,何奎,钱延军,等.降低船用连续波雷达虚警概率的海杂波抑制方法[J].电讯技术,2013,53(5):592-596.YAO Yuanfei,HE Kui,QIAN Yanjun,et al.A sea clutter suppression method for reducing marine CW radar false alarm probability[J].Telecommunication Enginnering,2013,53(5):592-596.(in Chinese)
[7]Simon H,Puthusserypady S.Chaotic dynamics of sea clutter:An experimental study[C]//Proceedings of 1997 Radar Conference.Edinburgh:IEEE,1997:75-79.
[8]DeWeber J T,Wagner T.A regional neural network ensemble for predicting mean daily river water temperature[J].Journal of Hydrology,2014,517(2):187-200.
[9]Singh P,Verma A.Chaudhari N S.An experimental evaluation of feature selection based classifier ensemble for handwritten numeral recognition[C]//Proceedings of 2014 International Conference on Electronics and Communication Systems.Coimbatore:IEEE,2014:1-8.
[10]Dong J W,Zhao L,Zhang L.Face recognition based on neural network ensemble and feature fusion[C]//Proceedings of 2013 International Conference on Information Science and Technology.Yangzhou:IEEE,2013:59-62.
[11]LI K W,Zhao K,Liu W Y.Neural network ensemble based on K-Means clustering individual selection and application for software reliability prediction[C]//Proceedings of 2013 Fourth World Congress on Software Engineering.Hong Kong:IEEE,2013:131-135.
[12]王正群,陈世福,陈兆乾.并行学习神经网络集成方法[J].计算机学报,2005,28(3):402-408.WANG Zhengqun,CHEN Shifu,CHEN Zhaoqian.A parallel learning approach for neural network ensemble[J].Chinese Journal of Computers,2005,28(3):402-408.(in Chinese)