集成学习技术在声目标识别中的应用研究
2019-09-10王璐
王璐
摘要:多源信息技术的进一步发展给精准化的目标分类识别提出了更高的挑战。本文以声目标的特征提取和分类识别为出发点,探讨了当前主流的几种机器学习技术,分析了集成学习技术及其决策融合方法,并在此基础上,提出了基于集成学习的声目标识别框架,从而为复杂环境下的声目标识别问题提供一些技术参考。
关键词:集成学习;目标识别;机器学习;特征提取;决策融合
在当前的图像处理、模式识别、自动控制等诸多领域,目标识别已经成为一个重要的发展方向,而完善和改进实时目标识别技术也是提高对复杂的多源信息甄别的有效途径。目标的精准识别依赖于对所识别信息的获取,随着应用环境的逐渐多元化和复杂化以及声目标信号逐渐出现的信息多源化等诸多特点[1],在这样的一个新的复杂环境下,目标分类识别过程中所提取的特征量和特征参数存在一定的不确定性和动态可变性,这就增加了目标信息在一定程度上的不确定性,使得目标特征的提取以及目标识别结果的精准性仍然存在一定的困难。因而,结合声目标识别技术对目标识别实时性和准确性的实际应用需求以及公安工作复杂的特殊环境,如何使用更为先进的技术手段从噪声干扰大以及价值密度低的非单一多源未知声目标信号中提取并识别出有用的声音目标,成为了科技强警战略下提升战斗力的一个亟待解决的研究热点和研究方向。
1. 声目标识别技术现状
在声目标的识别方面,美国斯坦福大学提出和研制的声识别预警专家系统,并经过多个版本的改进,通过建立相关的声目标特征模型,在一定程度上实现了多传感器监测下的声目标的分类处理,从而证明了人工智能技术能够用于声信号的处理。加拿大相关科研人员开发了能够用于分析辐射噪声的信号分析专家系统,该系统对相关知识的表示、推理机制、声谱的检测和提取方面都进行了深入细致的研究。印度科研人员提出了能够用于被动声目标识别的专家系统,并将专家系统与统计模式识别、神经网络等方法结合,进一步提高了声目标的识别概率。随着以神经网络为代表的机器学习技术的逐步发展,神经网络技术逐渐应用到了传统的声目标分类识别系统之中,英国科研人员通过在声目标识别中使用神经网络技术,使其与窄带分析、宽带分析、解调制谱分析以及瞬态分析等诸多分析技术相结合,从而提高了系统的整体容错性能,并使得系统在训练样本不平衡时也能够具备很好的分类识别性能。国内对声目标信号的特征提取及识别研究相对较晚,主要的研究开始于二十世纪八十年代,并通过近些年在目标特性、特征提取技术、无线传感技术、人工神经网络应用等方面的研究,在声目标识别方面取得了一些研究成果,如文献[1]通过模拟人耳声信号处理过程的滤波器组模型,研究了听觉机理特征基础上的声目标识别方法,文献[2]在进行声波结构分析以及信号特征向量提取的研究基础上,使用基于径向基函数的SVM分类算法对声目标数据进行了分类识别,文献[3]在提出粒子群优化算法的基础上,开展了粒子群神经网络声目标识别系统的设计和研究。以上诸多方法在声目标的识别方面虽然都取得了很好的效果,但随着应用环境的逐渐多元化和复杂化,声目标信号也出现了信息多源化等许多新的特点,在这样的一个新的复杂环境下,目标分类识别过程中所提取的特征量和特征参数存在一定的不确定性和动态可变性,使得目标特征的提取以及目标识别结果的精准性仍然存在一定的困难。
2. 当前主流的机器学习技术
在处理目标分类问题上,由于人工智能和机器学习技术的进一步发展,以K近邻、支持向量机、神经网络等学习方法为典型代表的机器学习技术以其优越的性能优势被广泛的应用。
K近邻分类法是一种非参数化的目标分类方法,在KNN的目标分类算法中,不需要先验统计知识和高复杂度的目标判别函数,样本数据在进行分类时,只观察和计算其在特征空间中的K个最近邻样本的类别属性,并将所包含样本数最多的类别作为该样本数据的目标类别,虽然相关文献提出了改进的KNN算法,如可调整权重的WA-KNN、基于信任的BK-NN等,但KNN算法的对存储空间的要求以及样本间较高的欧式距离计算复杂度问题难以有效的解决。
支持向量机以较为完备的理论依据能够有效地处理小樣本高维数据的分类问题,针对线性可分问题,SVM可以表示为凸二次优化问题,并利用已知的有效算法求解目标函数的极值,从而获取到线性可分问题的最有分类,而针对线性不可分问题(即非线性分类问题),SVM使用核函数映射将输入的低维样本空间特征向量映射到高维的特征空间中,以升维和线性化的技术方法将原有低维样本空间的线性不可分问题转化为高维特征空间的线性可分问题,而作为有监督学习的机器学习方法,SVM在进行训练学习时需要标签样本,因而其性能将会受到样本数据不平衡问题的制约,同时,SVM在核函数及其相关参数的选择上也具有一定的随意性。
神经网络是以非线性节点单元相互连接的形式所组成的复杂网络结构,具有良好的自学习、自适应和容错性能,神经网络分类算法模拟复杂的非线性模型,通过函数逼近机制进行知识的学习训练,并使用训练好的网络对目标样本进行分类。而由于神经网络采用的是逐层反向传播修正权值的方式,因而,由于网络训练机制以及计算复杂度的限制,隐层数目较多时,网络权值也将难以进行更好地优化。
3. 集成学习技术
集成学习在基学习器的基础上,使用相关的决策融合规则将各个不同的基学习器的判决结果进行融合,从而得到比基学习器效果更好且识别准确率更为精准的结果。集成学习技术包含两种形式,第一种是所有基学习器都属于同一类型的集成学习器,第二种是各个基学习器属于多种类型的集成学习器。通常情况下,具有不同类型的基学习器所组成的集成学习器在处理目标的分类识别任务是有着相对更好地识别效果。
集成学习算法常用的决策融合方法主要有投票法和回归法两种。
(1)投票法。该方法是针对分类预测而言的,主要包括简单投票、加权投票和概率投票三种。简单投票法是每个基学习器的预测结果具有相同的权重值,按照“少数服从多数”的原则,所预测的某一类别数超过某一阈值的作为集成分类器的预测结果;加权投票是给每个基学习器的预测结果赋予不同的权重值;概率投票是指将某些基学习器的分类输出是具有相关概率信息的,将该概率信息也作为集成学习器判决结果的一个度量。
(2)平均法,该方法是针对回归预测而言的,主要包括简单平均和加权平均两种。简单平均即是对各个基学习器的预测结果直接取平均值;而加权平均是在给各个基学习器的预测结果赋予不同权值的基础上,再对其进行加权求和取平均。
可以看出,加权投票和加权平均两种方法,其相同点都是对各个基学习器的预测结果赋予不同的权值,而其不同点是投票法的使用对象是不同的离散型类别,而平均法的使用对象则是不同的连续型数值。
4. 基于集成学习的声目标识别框架
根据神经网络和集成学习方法的特点及其所具备的优势,并结合实际的目标识别过程以及目标识别方法,这里给出了基于集成学习的声目标识别模型,如图1所示。
由图1所示的目标识别框架可以看出,基于集成学习的声目标识别过程可以分为以下几个步骤:
(1)信息采集:使用相关的信息采集设备(如传感器)对所需要的信息进行采集,并将所采集到的信息汇集到一个多维的原始数据空间中,形成与所采集信息具有相关性的目标信息状态空间集合,此集合包含了待识别目标的所有数据信息的属性,以多维原始数据的信息形式组成了待识别目标信息的原始数据集,以供后续的目标识别处理过程予以使用。
(2)特征提取:不同的待识别目标都具有着不同的特征性质,根据相关信息采集过程中的不确定性以及这些不同种类特征性质的特点,可以使用诸如主元分析(PCA)、偏最小二乘(PLS)、卡尔曼滤波(KF)等各种数学方法对所采集到原始数据信息进行特征信息的提取,从而使待识别目标以相关特征属性的数学表达形式为下一步的目标分类和识别提供具有特征信息的数据基础。
(3)神经网络初步分类:使用带有特征信息的训练数据对神经网络进行训练,采用具有相同网络结构的多个神经网络的结构形式,并遵循梯度下降的原则,分别训练出具有初步目标分类功能的两个神经网络。然后带有特征信息的特征数据通过各个神经网络的输入端进入神经网络,经过神经网络的计算,在输出端分别得到初步的分类结果,也就是从特征数据中所获得的分类识别的得分,以供后续集成学习融合过程的使用。
(4)初步分类结果的融合:每个神经网络的输出就相当于集成学习融合过程中的分类得分,根据集成学习的相关决策融合规则,对经过神经网络初步计算输出所获取到的分类得分进行相关的决策融合,从而得到融合后的分类得分。该融合后的数据信息表征着使用集成学习方法所获取到的具有较高识别准确率的相关识别信息,为下一步的目标识别判定提供了更为精准的决策依据。
(5)判定决策:根据待识别目标的相关分类识别的规则,并基于集成学习方法所融合获取到的分类得分,对待识别目标的类别给予定量的描述与判定,以此得到待识别目标的相关类别属性和信息,依据该相关属性信息的性质,对待识别目标的类别进行定性地判决,进而识别出待识别目标的相关类别结果,从而完成了对待识别目标的分类识别过程。
从以上步骤中可以看出,对于待识别目标的识别,其实经历了两次识别过程,即:一是神经网络的初步识别,二是集成学习的进一步融合式识别,而神经网络的分类识别过程采用神经网络的结构形式,以对同一识别目标进行并行数据处理的模式架构,在各自的输出端输出初步识别结果,而这一识别结果又作为集成学习模型的融合的数据输入,进入进一步的分类识别过程。这即是本文所给出的一种基于集成的声目标识别方法,其有效地综合了神经网络自学习、自适应、容错性好的特点以及集成学习在解决诸多不确定性问题方面的优势,从而使二者结合起来应用于声目标的分类识别方面,能够进一步地提高对待识别声目标的分类识别能力。
5. 结语
随着应用环境的逐渐多元化和复杂化,声目标也逐渐出现了信息多元化等特点。因而,复杂环境下的声目标识别也成为了一个亟待解决的问题。针对声目标识别问题中所存在的这一难点问题,结合当前先进的相关技术成果,本文在分析探讨相关主流的机器学习技术和集成学习技术及其决策融合规则的基础上,进一步提出了基于集成学习的声目标识别框架,通过该框架模型的构建,对复杂环境下的多源未知聲目标进行潜在特征的提取,并使用预测识别精度较高的集成学习融合模型,以进一步提升声目标的识别预测准确率,从而为公安机关快速地侦破案件、有效地预防犯罪、提高公安工作效率和水平提供技术支持,为公安机关的“打防管控”一体化新型警务模式发挥了重要的作用。
参考文献:
[1] 马元锋, 陈克安, 王娜,等. 听觉模型输出谱特征在声目标识别中的应用[J]. 声学学报, 2009, 34(2):142-150.
[2] 侯铁双. 听基于RBF神经网络的水声目标分类[J]. 电子技术与软件工程, 2018(19):116-117.
[3] 刘亚雷, 于艳美, 孟春宁. 基于粒子群神经网络的声目标识别系统设计研究[J]. 电气自动化, 2016, 38(2):115-118.