基于粒子群的反应堆控制系统优化
2020-06-24孙剑,俞赟,张瑞
孙 剑,俞 赟,张 瑞
(中国核动力研究设计院 核反应堆系统设计技术重点实验室,四川 成都 610041)
反应堆控制系统(Reactor Control System,RRC)的作用是控制反应堆安全、有效地运行,使得核蒸汽供应系统生产出合格、适量的蒸汽,以实现核能向机械能、电能的转化。在整个反应堆仪表与控制系统(I&C)中,RRC处于核心地位,是反应堆设计的重要技术领域之一。现有的主流压水堆堆型,RRC系统都是基于经典控制理论进行设计,从结构到参数都大同小异。控制通道基于反馈、单回路、串级、前馈等经典控制理论进行设计,系统优化使用线性系统稳定性分析理论,用频域指标界定系统的瞬态性能,从而寻找最优化控制系统参数。
本文针对反应堆控制系统参数优化问题,提出了一种新的优化设计方法,从优化结果和操作的简易性上都要优于现有的工程方法,并且使用时不用完全替代老方法,方便在工程上使用。为了说明该方法的操作流程和效果,以稳压器压力控制为实例,编制了完整的程序,对比了两种方法的优化过程及结果。
1 总体结构反应堆控制系统参数优化
问题
控制系统参数是通过对单个系统进行仿真优化得出,现有的工程优化方法具体操作流程如下:通过选定几组可能的控制器参数及控制通道整定值,分别分析其经典控制理论频域指标(如Nichols曲线所揭示的幅值增益、相位增益等),以判断不同参数组合下线性系统的时域性能(超调量、调节时间等),通过分析和比对,找出优化后的各控制系统整定值。
在使用频域指标考察控制系统的时域性能时,主要考虑幅值增益和相位增益指标。简单的来说,幅值增益小于0 dB,则系统不稳定;相位增益小于0°,则系统不稳定。RRC系统的分析不仅要求系统稳定,更要求系统具有一定的稳定程度,即考虑系统参数不确定性情况下,系统仍然是稳定的,时域指标也是接近最优的。这就要求RRC系统的参数设置要使幅值增益和相位增益合适,因为幅值增益越大,系统的响应越迟缓;相位增益越大,系统越震荡、调节时间越长;相位增益越小,超调量越大。
进一步分析,幅值增益揭示了RRC系统的闭环增益增大多少倍,系统开始变到临界稳定和不稳定状态。一般来说,幅值增益应大于6 dB。对于如式(1)所示的典型二阶系统,其相位增益可以表达为式(2)。
(1)
式中:ωn——无阻尼震荡角频率;
ξ——阻尼系数。
(2)
式中:φ——相位增益。
对于2阶系统,超调量可以表示为式(3):
(3)
因此,可以通过相位增益φ求出阻尼系数ξ,进而求出超调量σ。为了折中考虑超调量和调节时间性能,应尽量使相位增益φ在30°~60°。
当RRC各控制系统整定值均已优化完成之后,需要对RRC所有控制系统进行联合仿真分析(反应堆对象使用数字化仿真模型),以确定各控制系统在相互配合时,整个反应堆控制系统性能指标得到了满足,并且验证RRC系统能够应对电厂正常运行瞬态(阶跃变化10%FP的瞬态、线性变化5%FP/min的瞬态、汽机甩负荷到厂用电瞬态和紧急停堆瞬态),不会触发保护系统动作。
2 设计特点传统参数优化方法的不足及最优化改进
传统参数优化方法在解决反应堆控制系统参数优化问题时,需要解决频域指标和时域指标的复杂对应关系,操作起来较为复杂,且参数组合的选取采用人为试凑方式,不能涵盖所有可能的控制系统参数组合。RRC控制系统优化的结果是一组相对优化的参数组合,并非最优化参数,这也是传统参数优化方法的不足之处。
这是由两方面原因引起。一方面,20世纪60年代,计算机还不够普及,计算性能也不够强大,还无法通过高效地计算控制系统动态响应的方式进行参数优化,只能使用频域计算间接推断控制系统的时域性能。在最初的频域分析时甚至只能通过手绘方式计算Nichols曲线,而以这种方式完成RRC系统的优化将是十分庞大的工作量。再者,当时情况下,工业领域可选择的控制领域的理论工具十分有限。对于反应堆控制系统参数优化问题,研究使用群体智能算法来求解将是一个很好和可行的尝试。这样做优点是显而易见的,首先是可以对一个大的参数范围进行搜索,其次充分利用计算机的能力,直接用时域响应作为评判指标,从而得到一组最优化的控制系统参数。
3 基于粒子群算法的反应堆控制系统最优化
3.1 粒子群优化算法简介
粒子群优化算法是基于群智能方法的演化算法,由美国社会心理学家Kenndy和电气工程师Eberhar于1995年提出。基本概念源于对鸟群捕食行为的研究,鸟群在飞行过程中经常会突然改变方向、散开、聚集,其行为不可预测,但整体总保持一致性,个体与个体之间也保持着最适宜的距离。研究发现,鸟仅仅追踪它有限数量的邻居,但最终的整体结果是整个鸟群好像在一个中心的控制之下,即复杂的全局行为是由简单规则的相互作用引起的,生物群体之间存在着一种社会信息共享机制,为群体的进化提供了一种优势。使用计算机模拟鸟群的觅食行为,可用于解决优化问题。基本原理如下:问题的解对应于搜索空间中粒子的位置。每个粒子有自己的位置和速度(决定飞行的方向和距离),还有一个由被优化函数决定的适应值。各个粒子记忆、追随当前的最优粒子,在解空间中搜索。每次迭代的过程不是完全随机的,如果找到较好解,将会以此为依据寻找下一个解。
算法描述如下:随机初始化一群粒子,其中第i个粒子在D维解空间的位置表示为xi=(xi1,xi2,…,xiD)。每一次迭代,粒子通过动态跟踪两个极值来更新其速度和位置。第一个是粒子从初始到当前迭代次数搜索产生的最优解:个体极值pBesti=(pi1,pi2,…,piD);第二个是粒子种群目前的最优解:全局极值gBest=(g1,g2,…,gD)。第i个粒子根据以下公式来更新其第d维(1≤d≤D)速度和位置:
vid=wvid+c1r(pid-xid)+c2R(gd-xid)
(4)
xid=xid+vid
(5)
式中:v——粒子速度;
x——粒子位置;
w——为避免粒子在全局最优解附近震荡的可变惯性系数;
r,R——均匀分布在(0,1)区间的随机数;
c1,c2——学习因子。
粒子在解空间内不断跟踪个体极值和全局极值进行搜索,直至达到规定的迭代次数或满足规定的性能指标为止。算法流程如图1所示。
图1 粒子群优化算法计算流程Fig.1 Calculation flow of particle swarm optimization algorithm
3.2 适应度函数
利用粒子群算法进行RRC系统参数优化时需要计算某种参数组合情况下系统的适应度值,即系统在给定控制通道参数作用下的响应性能评价。对于一般的最小相位系统,阶跃响应中包含的上升时间、超调量、稳态偏差等指标足以用于评价系统的性能。为了便于计算机编程,设计如式(6)所示的指标,用于表征系统的时域性能。
(6)
式中:e(t)——控制偏差;
t——时刻;
J——适应度函数值。
该指标对初始误差考虑较少,而主要限制过渡过程后期出现的误差,即控制系统评价考虑的是对误差的消除能力再加上时间的惩罚项。该指标综合了上升时间、超调量、稳态偏差等指标,J值最小的控制系统参数可被看作是最优化的控制系统参数,而控制参数最优化的迭代过程则由粒子群算法解决。
3.3 控制通道的高速计算机仿真
使用粒子群优化控制系统参数时,计算量大,粗略估算总耗时为:每一次控制参数性能评价时间、粒子群种群规模和最大学习代数三者的乘积。对于每一次控制参数性能评价,需要计算控制通道的阶跃响应,而对反应堆控制系统涉及的大部分对象,至少需要计算600~1 000 s范围内系统的响应才有意义。由此可见,使用粒子群算法进行反应堆控制系统参数优化的计算量十分庞大,若算法设置不合理,将导致整个优化过程漫长。
本文在进行控制通道阶跃响应计算时,没有直接利用连续系统离散化的现成软件包,而是采用对复杂传递函数进行技巧性拆分,分成基本环节的组合,然后利用离散相似法计算得出快速运算的差分方程。这样做的优点是便于编制计算机迭代程序,提高运算速度。
例如,图2所示的复杂传递函数:
图2 复杂传递函数的拆分Fig.2 Splitting of complex transfer functions
对于积分环节有式(7),其中ts是采样周期。
x2(k+1)=x2(k)+k·x1(k)×ts
(7)
(8)
根据离散相似法公式:
x(k+1)=eAts·u(k)+
(9)
当采用零阶保持器时,惯性环节的差分方程可以写为:
(10)
(11)
利用上述,图2的控制通道就能在计算机上进行高速仿真。
4 实例分析
4.1 稳压器压力控制系统优化问题描述
下面以国内典型三环路M310机组的稳压器压力控制系统优化为例,说明控制系统参数优化的过程。简化的控制逻辑如图3所示,控制目标是在正常运行瞬态将稳压器压力控制在15.5 MPa abs,而不引起停堆或稳压器安全阀开启。控制手段有两个,2组比例式电加热器通过增加水的闪蒸来提高稳压器压力,两条喷淋管线通过控制冷水喷淋流量来降低压力。两个非线性环节用来使得电加热器和喷淋流量按顺序投入运行。
图3 稳压器压力控制简化逻辑图Fig.3 Simplified logic of pressure control for the pressurizer
图4 稳压器压力控制参数优化完整框图Fig.4 Complete block diagram of pressure control parameter optimization of the pressurizer
4.2 基于古典控制理论的参数优化
使用电加热器改变稳压器压力是一个缓慢的过程,而喷淋相对而言快速得多。因此,可以大致将优化过程分成两步进行。首先不考虑微分作用(即微分项置为0),只考虑电加热器的动作来优化积分项,主要考察控制系统消除压力稳态偏差的能力。人为选取三组积分常数值(100 s,600 s,1 000 s),绘制控制通道Nichols曲线如图5。
图5 积分项优化Fig.5 Integral term optimization
表1 控制器积分项幅值、相位增益表
可见,积分项的选取不会显著改变幅值增益,但会显著影响相位增益。积分项的目的是消除稳态偏差,压力控制并不需要大的积分项,以便开关式电加热器不会频繁开启,且控制通道应避免阻尼震荡,因此选取600 s较为合适。
在积分项确定之后,第二步优化PID控制器的微分项,这主要通过对喷淋系统的分析,确定控制系统具有良好快速性的微分时间。限于篇幅,这里不再论述,优化的结果是λ=1.25,τ22=5 s。
4.3 基于粒子群算法的智能参数优化及对比分析
使用智能参数优化时,不需要针对电加热器控制通道和喷淋控制通道单独优化,因为这两个通道的特性已经包含在他们的对象模型中,再者分开优化也不好界定两个通道之间的影响程度,这也是相对于古典控制理论优化更合理的地方。
学习代数设定为最大30代,学习系数设定为典型值2.05,惯性权重设定为0.729。迭代过程适应度的变化过程如图6,优化结果为τ21=867 s,λ=2.6,τ22=6.8 s。
图6 迭代过程适应度变化Fig.6 Change of fitness in iterative process
为了比较两组参数的优劣,分别仿真压力设定值阶跃+0.2 MPa和-0.2 MPa时两组控制参数的控制系统响应效果,对比曲线见图7和图8。其中,压力阶跃-0.2 MPa时,喷淋和电加热器同时起作用。从图中可以看出,根据古典控制理论优化出来的PID参数效果良好,但不是最优参数,粒子群算法优化的参数在超调量指标上有明显改进,优于现有工程方法的优化结果。
对于实际工程来说,优选出来的PID参数还应考虑开关式电加热器的动作,而这可以通过控制系统联调来测试其性能。限于篇幅,这里不再论述。
图7 两组PID参数控制效果对比Fig.7 Comparison of control effects of two groups of PID parameters
图8 两组PID参数控制效果对比Fig.8 Comparison of control effects of two groups of PID parameters
5 结论
随着计算机的出现和处理能力的提升,几乎所有工业领域都产生了革命性发展。反应堆控制系统设计也应紧跟潮流,一方面利用计算机的能力提升设计水平,另一方面在过程控制中改进整个系统的性能。
本文论述了反应堆控制系统参数优化的过程和理论,阐明了现有的工程优化方法及其不足之处,提出了基于粒子群优化的新方法。该方法利用现代计算机高速计算的能力,对反应堆控制系统的参数进行最优化搜索。相对于目前工程中使用的方法,新方法能够做到最优化设计,且优化过程更为直接、直观,并且以稳压器压力控制系统的优化为例,测试了新方法的有效性,为工程使用打下了基础。