APP下载

基于径向基函数神经网络的铁路路径规划

2018-03-22周睿

电子技术与软件工程 2018年1期
关键词:神经网络

周睿

通过合理路径规划实现高速铁路能量效率的优化是铁路运行中的重要研究内容。本文引入资格迹(eligibility trace)改进径向基函数(RBF)神经网络。在此基础上,使用改良的径向基函数(RBF)神经网络实现列车在复杂情况下的路径规划。

【关键词】铁路路径规划 径向基函数 神经网络

1 引言

地铁和高铁的广泛使用使得铁路在现代社会的日常生活中扮演着越来越重要的角色。与飞机、汽车相比,铁路能耗较少,更加清洁环保。但不合理的轨迹规划仍然会造成大量不必要的能量损耗。所以优化列车轨迹规划,提高能量使用效率一直是重要的研究方向之一。

Pengling Wang[1] 通过遗传算法分析列车变速过程,从而提高列车运行能量效率。Bart De Schutter[2]提出了分别关于非线性连续时间列车运行模型和连续空间列车运行模型的优化方法。XU Yanping[3]使用多尺度动态规划改进列车自动驾驶系统,实现列车能量效率优化。

本文使用资格迹(eligibility trace)改良径向基函数(RBF)神经网络。在此基础上提出关于连续状态空间列车运行模型的轨迹优化方案。

2 问题定义与建模

2.1 火车运动模型

为简化列车运动状态,列车可视为仅受牵引力和摩擦力影响,由此列车的运动模型可由以下公式表示:

基础阻力主要由空气阻力和摩擦力引起,通常可视为关于速度的二次函数。附加阻力是关于列车所在位置的函数,与轨道性质相关。

输出力 f 既可表示列车运行的牵引力也表示列车的制动力。当输出力 f 为正数时,输出力 f 表示牵引力。当输出力 f 为负数时,输出力 f 表示制动力。當输出力 f 等于零时,输出力 f 表示列车处于惰性运转状态。输出力 f 的范围可由下式表示:

2.2 运行数据评判标准

本文主要研究列车运行中的能量损耗问题。与此同时,列车的运行时间也是评判列车轨迹规划合理性的一个重要标准。且列车的运行时间和能量损耗存在直接的影响关系,列车准时性可由下式评判:

2.3 马尔科夫决策过程建模

由上述条件,本文涉及火车轨迹规划问题可视为马尔科夫过过程(MDP) 。马尔科夫过程可由数组 < S, A, T, R > 表示:S 是一个无限的状态空间,本文中 S 表示列车的运行状态。A 是一个有限的动作空间。T 是一个未知的状态转移函数,定义为:

在本文中,状态是一个二维向量,两个分量分别代表列车的运行速度和运行位移。动作 A 代表列车的单位质量输出力。本例中奖励函数 R 的定义是问题解决的关键。R 函数首先包括上文所述的评价标准。此外为了防止列车模型在运行途中(未到终点前)停车,R 函数需要设置一定惩罚,如果列车速度,在初始位置或者终点位置以外的地方等于零。

3 RBF神经网络

人工神经网络因其良好的学习能力,在非线性系统的预测中有广阔的运用。基于径向基函数(RBF)的神经网络是一种局部收敛的神经网络,它包含了两层结构,即只含一层隐含层。它的输入量是状态 S,输出量是 Q(动作值函数)。它的第一层结构为非线性结构:

4 仿真模拟

为了验证算法算法的合理性,本文引入一段虚拟轨道。具体参数设置如表1。

基础阻力由下式表示:

通过运算,可得图 3 函数的收敛过程。由图3可得,通过此算法可以得到稳定的规划轨迹(本文算法中根据奖励函数的较小值选取相应动作)。

5 结论

本文将资格迹和径向基函数神经网络结合,提出了一种用于提高列车运行能量效率的算法。仿真表明,此算法可以有效解决问题。

参考文献

[1]Wang Y,Ning B,Cao F,et al.A survey on optimal trajectory planning for train operations[C].Service Operations,Logistics, and Informatics (SOLI),2011 IEEE International Conference on.IEEE,2011:589-594.

[2]Xu Y,Zhao X,Wang L,et al.Optimal control of automatic train operation based on multi-scale dynamic programming[C]//Control Conference (CCC),2014 33rd Chinese. IEEE,2014:3429-3433.

[3]Wang P,Lin X,Li Y.Optimization analysis on the energy saving control for trains with adaptive genetic algorithm[C]//Systems and Informatics (ICSAI),2012 International Conference on.IEEE,2012:439-443.

[4]Pakizeh E,Pedram M M,Palhang M.Multi-criteria expertness based cooperative method for SARSA and eligibility trace algorithms[J].Applied Intelligence,2015,43(03):487-498.

[5]王学雷,邵惠鹤,李亚芬.一种径向基函数神经网络在线训练算法及其在非线性控制中的应用[J].信息与控制,2001,30(03):249-253.

作者单位

法国里尔第一大学 法国 59650

猜你喜欢

神经网络
基于递归模糊神经网络的风电平滑控制策略
BP神经网络在路标识别上的应用研究
神经网络抑制无线通信干扰探究
基于Alexnet神经网络的物体识别研究
基于BP神经网络的旋转血泵生理控制
基于神经网络MRAS的速度辨识仿真研究
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
基于神经网络分数阶控制的逆变电源