基于神经网络控制的飞机导航系统应用
2017-01-19冯昊
冯昊
(北京飞机维修工程有限公司,北京 100621)
基于神经网络控制的飞机导航系统应用
冯昊
(北京飞机维修工程有限公司,北京 100621)
在飞机导航系统的运行过程中,经常做一些路径规划的工作,通过一种算法对其进行优化计算是极为重要的。本文采用神经网络技术,对于飞机导航系统的相关问题进行优化与决策,力求得到最优的方案,同时,为导航算法的进一步发展指明了方向。
神经网络;飞机导航;应用
飞机的导航是引导飞机航行使之能够按照预定的航线,在准确的时间内到达目的地,完成预定的航行任务。在飞机导航中,所要解决的主要问题是确定飞机在飞行过程中的瞬时位置。这是因为,要使飞机完成预定的航行任务,除了必须知道起始位置和目标位置外, 更主要的是必须知道瞬时位置,这样才能对下一步如何飞行进行决策,从而把飞机引导到目标位置。可见飞机的导航是极为重要的。根据不同的使用要求,把各种导航组合在一起,相互取长补短以达到更好解决导航问题之目的。不同导航的组合就得到不同的组合导航方案。但目前采用的组合导航大多是把惯性导航与其它导航组合在一起。这是因为惯性导航比起其它任何导航来说具有无可比拟的许多优点,所以把它作为组合导航的基础;另一方面,利用其它导航所提供的精确的速度或位置信息来修正它随时间增长而积累的误差,这就弥补了惯性导航所固有的不足。所以,综合多种导航技术,同时采用神经网络技术来实现导航技术的优化是极为关键的。
1 神经网络技术探究
1.1 人工神经网络技术概述
人工神经网络是一种通过模仿人类的思考方式来进行计算的数学模型,它们的结构是极为复杂的,可以通过节点之间的相互连接来进行信息的处理与传递,人工神经网络对于新事物可以进行学习和自适应,通过之前的训练数据,来对于新事物进行分类识别,对于被训练的对象以及需要计算的对象进行分析,判断两者之间的差距,同时,根据权值来对于输出结果进行计算,神经网络是一种极为重要的运算模型,主要有非常多的神经元来进行构成的,每个输出函数都和一个节点相连接,叫做激励函数,两个节点间的连接权值反映了信号的传输强度,这和人类自身的细胞是类似的,同时网络的输出和连接方式有着极为重要的关系,并且也会受到激励函数和权重的影响,网络自身的计算和逼近方法可以对于最优策略进行有效的计算和表达。人脑的运行处理机制是极为复杂的,它主要是通过140亿个神经细胞来进行分析和运算的,每一个神经细胞的工作效能是有限的,但是它通过并行处理就可以让人脑进行大规模信息的处理,同时对于人脑进行研究,有利于改善我国现在的飞机导航技术情况,我们应当对人脑进行研究,让智能化思维在计算机中大量的使用,这也是人工智能的意义,人脑主要是靠神经细胞来进行工作的,它可以有效的对神经信号进行处理和传递,每个神经元主要是由细胞体和轴突树突组成的,轴突和树突进行信号的传递,细胞体可以对于这些信号进行处理,每个神经细胞都可以传送兴奋或者抑制的信息,在计算机中可以将其抽象为0和1的信号。在神经细胞之间,可以由突触相连接,在信息的传递过程中,一个细胞的树突,可以接受其他细胞的信号来传输相应的兴奋或者抑制功能,细胞体可以对这些信号进行处理,如果在某些时间段内,细胞中的兴奋信号足够大,这个细胞就可能会产生一个相应的脉冲,来把这个信号传输出去,这样就形成了神经网络的结构。
1.2 人工神经网络运行方式
人们可以通过人脑神经系统的结构来进行人工智能方面的训练与学习,将人类的思维赋予电脑,让电脑来模拟人的思维方式来进行计算,这样可以提升计算机的性能,也能够对大脑的信息处理方式进行一定的了解,人工智能已经发展了非常长的时间,得到了很多数学模型,也有了不错的理论成果,它们的网络结构是不相同的,但是都是模仿人类的基本结构来进行运行的,它们主要是采用对生物神经元的一些仿真来进行数据的处理,所以很多时候被称为人工神经元,它们通过对于人类大脑细胞中最基本的特征来进行模拟,这样就可以使得人工神经元像人类细胞处理信息一样,进行相应的数据表达,人工神经元主要可以进行信号的输入处理和输出,如果把这些人工神经元进行连接,就形成了人工神经网络,通过不同的连接方式可以形成不同类型的神经网络,但是其核心思想是通过神经网络的思维方式进行计算,它们可以通过修改使用权值的方式,来对于信息的处理与传输能力进行提升与改变,在人工神经网络内神经元可以处理非常多的实际物体,例如文字、字母或者一些其它的事物,在网络中处理的单元组合有三种输入、输出和隐单元。输入信号,主要可以通过接收外部信号来进行计算,输出单元主要实现计算结果的输出,隐单元就是在系统外部无法观察的单元,但是其可以有效的进行数据的处理,神经单元之间的连接权值大小可以反映每个单元的连接强度,同时对于信息的处理能力也可以进行表现,人工神经网络的处理方式和大脑是相互类似的,同时这些也是无法通过具体的方式来进行编程的,对于学习和训练的对象需要经过认真的挑选,否则可能会对于资源进行浪费,这个系统可能会无法工作,所以这样做的缺点主要在于它必须有相应的学习模型才能进行有效的工作,如果直接拿来工作,它们的运行结果是无法预测的。
2 基于神经网络技术的飞机导航系统应用
飞机导航算法是一种典型的自适应方法,其可以有效的应用于智能环境系统中。早先,在文献中,考虑用基于时间的飞机导航算法(time-based Q-learning,TBQL)来获得对路径的最优控制,在早先的TBQL算法中要求时间变量t趋近于正无穷来获得最优Q函数,这意味着最优函数和最优控制规律在t→∞范围内是时不变函数,然而路径是一个时变函数,也就是说最优控制规律以及飞机导航算法的最优函数也必须随着时间改变,另外TBQL算法也不能分析某些系统指标,例如系统性能。所以发展新的基于迭代法的飞机导航算法并且建立相应的性能分析是势在必行的。
增强学习的方案主要是通过环境方面的感知与计算来实现最优化控制。通俗的解释:我们可以将飞机想象成一个机器人,机器人能够通过经验进行学习。也可以把找到最优控制的过程,想象成把机器人放到一个建筑物中任意一间房间,现在想让它自己走出这个建筑。我们可以称每一个房间为一个状态,而机器人从某个房间移动到另一个房间即从一个状态过渡到下一个状态的过程称为行为。起初,机器人并不知道该选择哪条路,它可以从一个房间走到另一个房间,但是不知道哪扇门可以最终走出建筑。为此,我们引入了一个“奖励”值赋给每条路,越正确的路奖励值大,而错误的路奖励值为零甚至为负,对于直接可以走出建筑的路“奖励”值赋予100。飞机导航算法的目标也是达到奖励值最大的状态,因此,当机器人达到目标房间后将永远停留在哪里,这种目标也成为“吸收目标”。机器人从经验中进行自学习,每一个自学习探索的过程就相当于一次训练,在训练中,机器人探索外界环境,并接受外界环境带来的奖励,直到达到目标状态。训练的目的是要强化机器人的“大脑”(就用Q来表示),训练的次数越多,则Q就可以被优化的更好。我们可以构建一个以状态为行,行为为列的关于“奖励”的矩阵R。类似地,也同时构建一个矩阵Q,用来表示机器人已经从经验中学到的知识,Q与R是同阶的,其行表示状态,列表示行为。由于刚开始时机器人对外界环境一无所知,因此矩阵Q应初始化为零矩阵,后采用飞机导航算法的转移规则,逐步完成矩阵。当Q被训练强化后,机器人便很容易找到达到目标状态的最快路径了。但是我们并没有对每个阶段进行修正,而是从另一个初始值开始不断的迭代进行修正与优化的,由于我们通过网络的相关训练,可以使得总误差进行递减,经过规范化、数据归一处理后,我们可以尽量的减少系统产生的误差,得到准确的结果。
3 结语
飞机智能导航系统的使用对于现代科技发展运行意义重大,需要结合新技术、新思路对其进行完善与创新,对于设备的常见问题做到及时的排查与解决,通过现代化的方法,结合实际的经验,保证工作的质量,使得设备使用更加有保障。
[1]王尔申,佟刚,庞涛. 低空空域通用航空飞机机载导航监视终端设计[J]. 电讯技术,2015,55(05):522-526.
[2]韩春永,井哲. 飞机导航系统接收卫星信号断续问题分析与排查[J]. 电子测试,2015,(07):109-112.
[3]张勇. 非法广播惹祸端 导航通信受干扰[J]. 中国无线电,2015,(01):71.
[4]尚琳. 基于GIS与GPS飞机故障在线检修技术[J]. 科技经济市场,2014,(12):9.
V249.3
:A
:1671-0711(2017)12(下)-0147-02