ATO系统速度控制的BP-FIPID算法
2020-11-18楚彭子袁建军
楚彭子,虞 翊,林 辉,袁建军,姜 西
1.同济大学 道路与交通工程教育部重点实验室,上海201804
2.同济大学 磁浮交通工程技术研究中心,上海201804
3.同济大学 上海市磁浮与轨道交通协同创新中心,上海201804
4.中铁第四勘察设计院集团有限公司,武汉430063
1 引言
列车的运行控制属于闭环控制。作为列车运行自动控制系统(Automatic Train Control,ATC)的关键子系统,列车自动运行(Automatic Train Operation,ATO)系统不间断地接收来自列车自动防护(Automatic Train Protection,ATP)系统以及列车自动监控(Automatic Train Supervision,ATS)系统的信息,实施列车自动运行。ATO系统是实现列车无人驾驶及全自动运行的关键,对于ATO系统速度控制算法的研究逐步丰富。
传统PID 控制算法用于ATO 系统存在着响应速度慢、适应性差、能耗大等缺点[1-4]。PID 算法对控制参数的依赖性强,当控制对象出现偏差或者控制过程受到干扰,容易导致振荡甚至失稳。由于智能算法能够通过增强PID算法自适应能力达到更好的控制效果,此类智能控制技术被广泛讨论。针对列车速度控制,刘浩[2]和Utomo[5]等探讨了模糊自适应PID 控制算法的适用性。借助遗传算法对控制参数的优化,任林杰等[3]分析了模糊PID 控制算法的应用效果。基于列车运行目标曲线的跟踪测试,孟建军等[4]讨论了模糊预测PID 控制算法的可行性。张驰等[6]将分数阶PID算法用于ATO系统速度控制,显示出比传统PID 控制算法更好的控制效果。马晓娜等[7]研究了一种结合灰色预测和模糊PID的控制算法。Chen 等[8]检验了单神经元PID 算法在ATO 系统中的应用效果。针对ATO 系统的智能控制,Fu[9]设计了一种基于B 样条神经网络和粒子群(Particle Swarm Optimization,PSO)算法的PSO-B-BP-PID 控制算法。此外,部分研究还关注了其他控制算法和控制策略。陆小红等[1]基于模型预测控制技术提出了预测型灰色控制的列车运行速度控制算法。冷勇林等[10]结合优秀司机驾驶经验,探讨了应用数据驱动推理控制算法的可行性。胡震等[11]研究了随机驱动的全局粒子群(Randomnessdriven Global Particle Swarm Optimization,R-dPSO)算法在列车控制策略中的应用。
PID算法的优化途径多样,采用模糊数学理论优化是一种可靠的途径[2-3,5,7],但常规的模糊PID算法依赖专家经验且模糊规则较多。相比之下,模糊免疫PID(Fuzzy Immune PID,FIPID)算法能够基于少量模糊规则达到可观的控制效果[12-14],且该算法在ATO系统中的应用尚未得到充分讨论。同时,采用固定的控制参数通常难以应对复杂情形[3-4],而FIPID有多个固定的控制参数。基于此,本文探讨了FIPID算法应用于ATO系统速度控制的可行性,并将BP 神经网络算法用于FIPID 算法控制参数的在线自整定,对比了原始算法与拓展算法的控制效果。
2 方法
2.1 模糊免疫PID算法
当抗原侵入机体时,淋巴细胞中的辅助细胞TH、抑制细胞Ts以及B 细胞相互协作,使得免疫反馈系统趋于平衡。基于该机理,令ε(k)代表第k 代抗原数量,p1代表TH细胞的促进因子,p2代表Ts细胞的抑制因子,f(·)为细胞抑制刺激能力的非线性函数,则TH细胞的输出TH(k)为p1ε(k),Ts细胞对B 细胞的影响Ts(k)为p2f(S(k)-ΔS(k))ε(k),B 细胞接受的总刺激为S(k)=TH(k)-Ts(k)[14]。进一步将抗原数量ε(k) 抽象为误差e(k),将系数p1视为控制反应速度K ,作为控制稳定效果η,S(k)抽象为控制输入u(k),进一步结合增量式PID 算法和模糊数学原理,形成了模糊免疫PID 控制算法[12-14]。模糊免疫PID控制器结构如图1所示,其反馈控制律u(k)为:
其中,f(·)为模糊逻辑函数,ki′ 和kd′ 分别为积分和微分系数。
图1 模糊免疫PID控制器结构
对于模糊逻辑函数,将输入变量模糊化为“正”(P)和“负”(N),输出变量模糊化为“正”(P)、“零”(Z)和“负”(N),并将隶属度函数定义在整个(-∞,+∞)区间。其中,f(u,Δu)所采用的规则为:如果u 为正,且Δu 为正,则f(·)为负;如果u 为正,且Δu 为负,则f(·)为零;如果u 为负,且Δu 为正,则f(·)为零;如果u 为负,且Δu 为负,则f(·)为正。此时,对各规则使用Zadeh的模糊逻辑AND操作,进一步采用mon反模糊化方法即可得到f(·)[12,14]。
2.2 BP-FIPID算法
模糊免疫PID 控制算法的四个主要控制参数为反应速度K ,稳定效果η,积分和微分系数ki′ 和kd′ 。其中K 和η 是实施控制的关键参数,且ki′和kd′在控制律中与这两项参数相互耦合。基于预实验发现同时在线整定这四项参数的效果并不理想。对此,以免疫参数促进因子p1和抑制因子p2为着眼点,对这两项参数的自适应调整进行研究。
BP 神经网络是一种应用广泛的人工神经网络,具有任意非线性表达能力,对于处理因果关系复杂的非确定性推理、判断、识别及分类等问题有着较强的适用性。基于此,本文借助BP 神经网络实时调整FIPID 中的p1和p2,记为BP-FIPID。
参考文献[12,15],设置BP 神经网络结构如图2 所示,即4个输入、2个输出和5个隐含层节点的网络。同时,引入输入x=[r,y,e,1]、权重,并令j 取1至4,i 取1 至5,l 取1 至2,令上标(1)、(2)、(3)分别代表网络的输入层、隐含层与输出层,则有网络输入为:
隐含层的输入与输出为:
隐含层神经元的活化函数取:
同时,输出层的输入与输出为:
图2 BP神经网络结构
网络权重的优化是获取理想控制参数的前提,取性能指标函数为:
根据梯度下降法优化网络的权重,即根据E(k)对权重系数的负梯度方向搜索调整。为使搜索快速收敛全局极小,引入学习速率β 和惯性系数α。
采用BP神经网络拓展FIPID算法时,根据式(2)和式(5)有:
同理,网络隐含层权重系数的学习算法可表示为:
结合图1 所示的模糊免疫PID 控制器和BP 神经网络可知,BP-FIPID 控制器包括增量式PID 控制器、免疫控制器、模糊控制器、BP 神经网络控制器以及数据单元,如图3 所示。其中K、η 由BP 神经网络在线输出的p1和p2整定,而ki′ 和kd′ 与原始模糊免疫PID 控制器一样,并非在线整定。
图3 BP-FIPID控制器结构
此时,BP-FIPID算法的流程可概述为:
步骤1 初始化。设置初始误差、输入、输出与控制律(均取0)、模糊规则,以及BP 神经网络的层数、节点数、初始权重、学习速率和惯性系数等。
步骤2 采样得到输入、输出以及误差。计算该时刻的输入输出偏差,得到误差数据。
步骤3 执行神经网络的计算。根据输入、输出、误差、权重等,计算隐含层的输入输出以及输出层的输入输出,得到所需的两个免疫参数。
步骤4 计算当前控制律。
步骤5 执行神经网络的学习。在线调整神经网络的权重系数。
步骤6 判断是否结束。若是任务结束,则停止。否则,更新各个参数,返回步骤2。
2.3 控制对象与评价指标
为了检验所设计算法的可行性,将列车运行控制模型作为控制对象,将阶跃信号和列车运行速度-时间曲线分别作为输入信号,分析与对比传统FIPID控制算法及BP-FIPID控制算法的输出效果。列车运行控制模型采用已辨识的具有延迟特性的传递函数模型[3]:
其中,σ 为传输延时,牵引工况取1,制动工况取0.8。
在控制性能指标方面,对于阶跃信号,分析不同控制算法输出的上升时间、调节时间、峰值时间以及超调量。同时,涉及的评价指标还包括一系列误差性能指标:平方误差积分性能指标(Integral of Square Error,ISE)、绝对误差积分性能指标(Integral of Absolute Error,IAE)、时间乘平方误差积分性能指标(Integral of Time Multiplied by Squared Error,ITSE)以及时间与绝对误差乘积的积分性能指标(Integral of Time Multiplied by Absolute Error,ITAE)[6,16]。
对于ATO 系统性能指标,现有研究多从运行速度不超过紧急制动防护曲线、运行准点率、停车精准度、运行舒适度、节能性、牵引及制动切换频繁度、追溯性等方面进行讨论[2,17-19]。
运行速度不超过紧急制动防护曲线的要求与ATO系统控制器关联较大。列车运行的目标速度曲线位于紧急制动防护曲线之下,但列车实际运行曲线的波动范围可能会超出紧急制动防护曲线而触发ATP 紧急制动。这种性能决定着目标速度曲线的冗余空间和列车运行效率,对ATO 系统控制器的目标速度曲线跟踪性能要求较高。实质上是要求列车实际运行速度尽可能贴近目标速度,即良好的追溯性[2,19]。两者内涵接近,均可由误差指标进行度量。追溯性反映出的复杂工况适应能力与抗干扰特性,也是列车速度控制算法稳定性与智能性的体现。
牵引及制动切换频繁度、运行准点率与停车精准度由目标速度曲线与ATO系统控制器共同决定。节能性与运行舒适度也同样由目标速度曲线与ATO系统共同决定。可由能耗指标Ke[17]和最大冲击率Kj分别评估。冲击率代表加速度的变化率,应小于0.75 m/s3[18]。
其中,v 和a 分别为速度和加速度,S~ 代表列车运行距离。
3 仿真测试
3.1 阶跃响应仿真
仿真中,使用Win10 系统、Intel i7 处理器和16 GB内存的笔记本电脑,以Matlab 为仿真平台,以阶跃信号为输入,将式(12)列车运行控制模型作为被控对象,取列车运行控制传输延时σ 为1。采样时间为0.2 s,仿真时间为40 s,即200 个采样周期,并在第100 个和第110个周期设置干扰(对控制律u(k)加0.1)以观察不同控制算法的抗干扰能力。在控制参数设置方面,FIPID中ki′和kd′ 均取0.3,K 取0.3,η 取0.8[12],即p1和p2分别取0.3和0.24。BP-FIPID中ki′和kd′与FIPID取值一致,学习速率β 和惯性系数α 均取0.001,大小为5×4 的隐含层初始权重和大小为5×2 的输出层初始权重均于[-0.5,0.5]之间[12,15],取值见表1。
表1 初始权重
FIPID 和BP-FIPID 的阶跃响应曲线如图4 所示。可见,FIPID和BP-FIPID均能取得较好的响应结果。其中,BP-FIPID 的超调量较大,FIPID 相对更小。在上升时间与峰值时间方面,FIPID 较长,BP-FIPID 则相对更短。两者的调节时间较为接近。同时,在抗干扰方面,BP-FIPID能更好更快地应对干扰,而FIPID的抗干扰能力相对较弱。
图4 过程中的误差性能指标ISE、IAE、ITSE 以及ITAE如表2所示。FIPID的四项指标均大于BP-FIPID,BP-FIPID 的各项指标均较优,即该算法在整体上能够较好地跟踪阶跃信号,抵抗干扰信号。
图4 阶跃信号响应和抗干扰情况
表2 阶跃信号跟踪性能指标
3.2 目标速度曲线跟踪
在具有先进ATC系统功能的列车运行控制系统中,ATO系统能够根据目标速度曲线不断地执行牵引、惰行与制动等任务[2-4,7]。以目标速度曲线为输入的仿真测试相对于阶跃响应更为复杂,面临的工况更多,对控制算法的鲁棒性要求更高。借鉴文献[4,7],同样采用跟踪测试的方式分析上述两种控制算法在ATO系统中的应用效果。
在目标曲线跟踪的仿真过程中,采用与阶跃响应测试中相同的控制参数,输入为具有2 175 个采样周期的速度-时间曲线(采样时间为0.2 s)。在1 470~1 560 和1 810及其之后的采样时段内,列车运行控制传输延时σ取0.8,其他时段均统一取1。将FIPID和BP-FIPID分别作为列车运行控制模型的控制算法,从追溯性、舒适性和节能性三方面进行性能分析。运用同样的仿真环境,FIPID 和BP-FIPID 的仿真时间消耗分别为33.571 s 和36.017 s,这与BP-FIPID相比FIPID增设了BP神经网络控制器有关。
(1)追溯性
仿真输出的速度-时间曲线如图5所示。可见,FIPID算法和BP-FIPID算法均能较好地跟踪目标曲线。根据图5 中的子图,在初始阶段和工况切换阶段,FIPID 和BP-FIPID 的跟踪效果较为接近,但BP-FIPID 较FIPID的响应速度更快,且更贴近目标速度曲线。
表3 进一步展示了误差性能指标,以及最大误差、最小误差与相应的采样周期k。可见,不同控制算法输出的最大跟踪偏差集中在起始阶段和临近终止阶段,表现为起始阶段的输出小于输入,终止阶段的输出大于输入,这与被控对象本身为延迟系统有关。同时,与FIPID相比,BP-FIPID的误差性能指标均相对更小。这表明,针对更复杂的输入信号,BP-FIPID 算法的跟踪性能在整体上明显更优,即追溯性更好。
图5 目标曲线的跟踪情况
表3 速度-时间曲线追溯性指标
(2)舒适性与节能性
图6 展示了控制算法跟踪曲线及目标曲线的最大冲击率和能耗指标。结果显示,不同曲线的冲击率均小于0.75 m/s3,满足轨道交通列车运行的舒适性要求。其中,基于FIPID输出的最大冲击率相对更小(0.065 62 m/s3),但该数值与目标曲线的最大冲击率(0.091 82 m/s3)偏差较大,而BP-FIPID 的偏差更小。尽管冲击率越小代表舒适性越好,但与目标曲线的偏差也反映了跟踪性能的优良程度。同时,在能耗方面,目标能耗指标为0.074 73,BP-FIPID 能耗指标为0.077 96,FIPID 能耗指标为0.068 96。即BP-FIPID能耗指标相对较大,但该数据与目标值的偏差为0.003 23,而FIPID 能耗数值与目标值的偏差为0.005 77。需要说明的是,尽管不同控制算法输出的舒适性与节能性指标存在差异,但均较为接近。这两项性能指标与不同算法较好的追溯性和目标曲线自身的平稳性有关。
图6 舒适性和节能性指标
3.3 仿真结果分析
采用阶跃信号和速度-时间曲线对两种控制算法进行仿真测试,结果显示FIPID和BP-FIPID均能够有效地跟踪目标曲线,BP-FIPID在FIPID的基础上表现出更好的跟踪性能,反应速度相对较快,抗干扰性能也相对较好。需要说明的是,BP 神经网络对于初始权重较为敏感[9],但其抗干扰能力和良好的跟踪性能也是BP-FIPID的优点。免疫参数的自适应变化有助于提高FIPID 的鲁棒性。
FIPID 和BP-FIPID 算法均可用于列车ATO 系统的运行测试。FIPID 和BP-FIPID 在追溯性和舒适性等方面均十分理想,且BP-FIPID 的大部分指标显著优于FIPID,尤其在追溯性方面有明显的改进。基于此,列车的运行准点率与停车精度有了更大的保障。同时,追溯性的提高也使得列车运行的目标速度曲线与防护曲线之间的冗余需求进一步降低,这有助于提高列车的运行效率。此外,在控制算法方面,BP-FIPID的初始权重与学习算法的优化也有待进一步分析。
4 结束语
为了分析传统模糊免疫PID算法以及基于BP神经网络自适应调整免疫参数的模糊免疫PID 拓展算法(BP-FIPID)在ATO 系统速度控制中的适用性,结合列车运行控制模型、阶跃信号和目标速度曲线进行了仿真测试,对比分析了不同算法的稳态特性、抗干扰特性、追溯性与舒适性等性能。基于BP神经网络自适应调整免疫参数是优化模糊免疫PID 的一种有效方法,能够为ATO系统速度控制提供参考。