基于神经网络集成学习模型的目标识别方法研究

2018-01-07王璐

科学与技术 2018年6期

摘要：随着人工智能技术的进一步发展及其在诸多领域的广泛应用，以模式识别为应用需求的目标识别也成为了当前的研究热点。本文首先探讨了机器学习中主流的神经网络结构模型，并以BP神经网络为基础，将其作为基学习器，分析研究了集成学习模型，提出了基于BP神经网络集成学习模型的目标识别方法，从而为复杂环境下更为精准化的目标模式识别提供了一定的参考依据。

关键词：BP神经网络；基学习器；迭代学习；集成模型；目标识别

随着多源信息技术的进一步发展，目标识别技术也已成为当前模式识别领域的一个重要研究方向[1]。而目标信息所呈现出的多样化和海量化的特点，也给精准化的目标识别带来了挑战[2]。在基于数据驱动的诸多目标识别方法中，基于统计分析的方法有着广泛的应用领域。而传统的基于统计分析的方法主要有主成分分析方法[3]（Principal Component Analysis），又称为主元分析，简称为PCA，该方法统计分析方法中的一种常用的数据分析方法。PCA也是一种常用的数据降维方法，其基本思想是，按照重要性的不同，从一组数据特征中计算得到新的维度空间的新的数据特征，并将其按从大到小的顺序进行排列，所得到的新的特征作为原有维度空间数据的线性组合，表征着彼此不相关的特性。而原有数据样本在新的维度空间上的特征映射也即为降维后的新的数据样本。可以看出，PCA就是用一组正交向量对原维度空间的数据特征进行空间变换从而得到新的维度空间的数据特征。原始数据通过PCA的这种线性变换，可以提取出数据的主要特征，而新的维度空间的数据要在数据降维需求的基础上，还要尽可能的保留原有空间数据的信息，因而，就需要在新的维度特征中选取出其前n个能够表征原空间数据信息的最大主元。PCA方法可以有效的消除原始数据之间的冗余性，降低数据处理的复杂性，但由于其空间降维的特点，也使得PCA在某些情况下会造成某些重要的数据信息丢失的情况。

而随着人工智能技术的发展，各种人工智能技术的目标识别方法也相继提出，基于机器学习的目标识别方法也逐渐展现出其在各个应用领域中的优势。常用的机器学习方法有K近邻、支持向量机、随机森林和神经网络等。本文就是使用当前较为主流的神经网络技术，研究探讨基于神经网络集成学习的目标识别方法。

1 目标识别

目标识别是相对于目标跟踪而言的一个更为广泛的概念，是指在基于多个目标传感器所获取的目标属性数据信息的基础上，使用相关的数据组合方法，所得到的关于目标身份信息的属性识别。由于所涉及的目标传感器的种类繁多，因而所获取到的目标属性数据在某些情况下也会很多，因而在目标识别中，将会出现维度较高的特征变量及特征数据。而随着当前人工智能技术的进一步发展，目标识别过程中所涉及到相关数据组合方法，主要是多源数据融合式的模式识别方法。模式作为所识别目标在时间和空间中所展现出的一种属性分布信息，使用计算机能够对其进行模式的分类，即模式识别就是将目标根据其模式属性的不同划分到所对应的类别中。

2 神经网络及其结构形式

2.1 神经网络

作为人工智能领域的一个研究热点，神经网络（Neural Network，NN）从其产生之时就得到了国内外的广泛关注，而神经网络也以其独特的性能优势在诸多行業领域有着广泛的应用。准确的说，本文所指的神经网络，也就是人工神经网络，即是在生物神经网络的基础上，模仿生物神经网络的结构和思维、记忆等相关功能，从而设计出的用以进行数据信息处理的一种数学运算模型。通过该数学运算模型对数据信息进行相关的非线性处理，能够实现相关功能。类似于生物神经网络，人工神经网络也是有大量的被称为神经元的节点逐层地相互连接而构成的，神经元节点负责数据信息的保存和更新，而不同层的神经元节点与节点之间的连接也对应有一个称为权重的参数。可以看出，神经元是神经网络处理数据信息的基本单元。为了是神经网络更符合现实世界的信息表达特性，在不同网络层所连接的节点之间增加激励函数（activation function），将线性输入转换为非线性的函数关系，通过这种非线性因素的引入从而给神经网络增加了更为丰富的数据表达能力。神经网络中常用的非线性激励函数有sigmoid函数、tanh函数以及relu函数等。

2.2 神经网络的结构

神经网络在其结构形式上采用多层的结构形式，即神经元按其功能的不同分为输入层、隐藏层和输出层[4]。其中神经网络的输入层和输出层都仅为一层，而隐藏层可以有多层。由此可以看出，神经网络最简单的结构形式就是三层神经网络结构，即仅有一个隐藏层的结构。同一层中的各个神经元节点彼此不相连，而相邻层间的神经元节点则彼此相连。在神经网络的各层中，输入层的神经元节点根据其设计功能，是用来接收外部的输入数据的，通过输入层所接收到输数据，进而传输到神经网络中间隐藏层的各神经元节点进行处理，经过所有隐藏层处理后的数据传输到网络输出层进行输出显示。这里作为数据处理单元的中间隐藏层，只负责数据的运算处理和网络内部的传输，而与网络结构外部的输入和输出并不存在直接的连接关系。

2.3 BP神经网络

神经网络中使用最为广泛的一种网络形式就是反向传播神经网络（Back-Propagation），即BP神经网络[5]。BP神经网络在其设计和实现上以通用逼近定理为基础，即通过在数据样本下的迭代式学习，进而训练出能够逼近任意函数的网络。在具体实现上，BP神经网络采用反向传播算法，能够用于神经网络的参数更新以及调节神经网络内部各个不同层间节点间的连接关系，从而得到整个网络的数据输入与数据输出之间的函数映射关系。也正因为BP神经网络的这种反向传播特性，使得神经网络具备了自组织学习和自适应的能力。

BP神经网络的自学习和自适应可分为工作信号的前向传播以及误差信号的反向传播两个过程。其中，工作信号的前向传播过程即为数据信号通过输入层进入神经网络，在神经网络中经过单个隐藏层或者多个隐藏层的数据处理并到达输出层，在输出层输出经过处理的输出信号，在数据的这一前向传播过程中，神经网络的网络权值保持不变，而每个神经元所储存的数据信息只受到其上层连接神经元所传送的数据与所对应的网络权值的影响，并将其所更新后的数据信息传送到下层神经元，以这样的前向传播方式在输出层所得到的输出数据如果满足条件，则学习训练过程结束，而如果输出数据与期望输出之间存在较大的误差，则进行误差信号的反向传播过程。所谓误差信号，就是神经网络的实际输出与期望输出之间的误差值，而该误差值如果大于某一预先设定的网络阈值时，则需要进行误差信号的反向传播。在反向传播时，误差信号从输出层开始反向地逐层向前进行数据的传输，而在逐层前向传播过程中，各层的网络权值也将会根据误差信号的反馈信息进行自适应的调整，以满足误差逐渐降低的需求，亦即通过网络权值不断的自适应调整，使整个神经网络的实际输出与期望输出之间的误差逐渐减小，实际输出也逐渐接近期望输出。

可以看出，BP神经网络的前向传播和反向传播是一个反复交替的迭代式的自学习过程，通过这个学习过程的反复迭代，从而获取到能够满足实际需求的网络权值参数，并使得网络的实际输出和期望输出之间的误差处于允许范围之内。

3 神经网络集成学习模型

单一的学习模型（即基学习器）只能在其一种模型下预测出识别结果，而与基学习器相比，集成学习模型能够将多个不同的基学习器的多个预测识别结果通过相关的决策融合规则进行有机地结合，从而通过所融合的集成学习模型获取到比基学习器更为准确的识别结果。可以看出，集成学习其本身并不是单独的机器学习算法，而是集成了多个基学习器，并且其效果和性能也要优于各个不同的基学习器。集成学习模型的设计能够有效地提升学习模型的预测识别准确率，同时还能够通过不同基学习器所存在的差异性从而避免网络学习模型的过拟合。而随着近年来集成学习技术的进一步发展，各种不同的性能优越的集成学习模型也随之出现，使得目标的识别准确率有了一定的提升。

本文在基于BP神经网络的基础上，以具有相同网络结构的两个BP神经网络为基学习器，提出一种基于双BP神经网络的集成学习模型，如图1所示。

从图1 中可以看出，本文所构建的BP神经网络集成学习模型由两个BP神经网络基学习器所组成，通过分别对两个BP神经网络基学习器进行迭代式的学习训练，得到不同的具有差异性的两个基学习器模型，并在此基础上，进一步构建BP神经网络集成学习模型。在具体实现上，首先将待识别目标的主要识别特征信息作为输入数据样本，分别输入到BP神经网络基学习器1和BP神经网络基学习器2中，采用随机化的初始权重值和阈值等网络参数以及非线性激励函数对两个BP神经网络进行并行的迭代式学习训练，以获取到收敛的网络状态及相关的权值参数。而又由于网络参数初始化的随机性，使得所训练好的两个BP神经网络参数集并不相同，因而其作为基学习器，分类识别的预测结果可能并不相同。这时，将两个BP神经网络基学习器进行集成，通过对具有不同差异性的两个BP神经网络基学习器所输出的结果进行融合，从而构建了集成学习模型。

在集成学习模型的决策融合方法中，常用的有投票法和平均法，这两种方法是分别针对分类预测和回归预测而言的。其中投票法又分为简单投票法、加权投票法以及概率投票法等三种方法，而平均法则又分为简单平均法和加权平均法两种方法。而考虑到目标识别是对目标的类型进行识别预测的，而目标类型属于分类预测，因而使用集成学习决策融合方法中的投票法对集成学习模型的识别结果进行分类预测。同时，考虑到本文所提出双BP神经网络集成模型的特殊性，使用简单投票法并不能对分类识别结果做出很好的预测，因而可以采用加权投票法和概率投票法两种方法，即以适当的投票权值或是概率来预测集成学习模型的识别结果。

4 结语

随着多源信息技術和人工智能技术的发展，精准化的目标识别在当前的诸多前沿应用领域成为了一个重要的研究方向。而面对日益复杂化和多元化的不同的应用环境，如何提高对多源复杂信息的甄别能力以及对目标识别的准确率，也成为了目标识别问题中的一个挑战。本文以当前人工智能领域中主流的机器学习为技术背景，将机器学习中的BP神经网络作为研究出发点，在分析BP神经网络结构的基础上，探讨了BP神经网络的迭代式学习过程，并以提高目标识别的准确率为需求，将BP神经网络作为基学习器，提出了基于神经网络集成模型的目标识别方法，通过该方法及相关模型的构建，能够在一定程度上改善和提升目标识别模型的性能，同时也为复杂环境下的精准化目标识别提供了参考。

参考文献

[1]宫法明，李翛然，马玉辉.复杂场景下的运动目标识别算法[J].计算机系统应用，2018，27（08）：193-197.

[2]王璐.一种基于模糊控制的多传感器管理算法的研究[J].电子设计工程，2018，26（21）：47-51.

[3]张秀琴，陈立潮，潘理虎. 基于DCT和分块2D2PCA的人脸识别[J]. 太原科技大学学报， 2014（5）：333-338.

[4]李隽，王伟.遗传算法优化神经网络在图像目标识别中的应用研究[J].现代电子技术，2017，40（20）：111-113.

[5]龚晗义，苏赋文，高汉军.基于改进遗传算法和BP神经网络的人脸识别方法[J].武汉理工大学学报（信息与管理工程版），2018，40（05）：498-502.