基于粒子群的反应堆控制系统优化

2020-06-24孙剑，俞赟，张瑞

中国核电 2020年2期

孙剑，俞赟，张瑞

(中国核动力研究设计院核反应堆系统设计技术重点实验室，四川成都 610041)

反应堆控制系统(Reactor Control System，RRC)的作用是控制反应堆安全、有效地运行，使得核蒸汽供应系统生产出合格、适量的蒸汽，以实现核能向机械能、电能的转化。在整个反应堆仪表与控制系统(I&C)中，RRC处于核心地位，是反应堆设计的重要技术领域之一。现有的主流压水堆堆型，RRC系统都是基于经典控制理论进行设计，从结构到参数都大同小异。控制通道基于反馈、单回路、串级、前馈等经典控制理论进行设计，系统优化使用线性系统稳定性分析理论，用频域指标界定系统的瞬态性能，从而寻找最优化控制系统参数。

本文针对反应堆控制系统参数优化问题，提出了一种新的优化设计方法，从优化结果和操作的简易性上都要优于现有的工程方法，并且使用时不用完全替代老方法，方便在工程上使用。为了说明该方法的操作流程和效果，以稳压器压力控制为实例，编制了完整的程序，对比了两种方法的优化过程及结果。

1 总体结构反应堆控制系统参数优化

问题

控制系统参数是通过对单个系统进行仿真优化得出，现有的工程优化方法具体操作流程如下：通过选定几组可能的控制器参数及控制通道整定值，分别分析其经典控制理论频域指标(如Nichols曲线所揭示的幅值增益、相位增益等)，以判断不同参数组合下线性系统的时域性能(超调量、调节时间等)，通过分析和比对，找出优化后的各控制系统整定值。

在使用频域指标考察控制系统的时域性能时，主要考虑幅值增益和相位增益指标。简单的来说，幅值增益小于0 dB，则系统不稳定；相位增益小于0°，则系统不稳定。RRC系统的分析不仅要求系统稳定，更要求系统具有一定的稳定程度，即考虑系统参数不确定性情况下，系统仍然是稳定的，时域指标也是接近最优的。这就要求RRC系统的参数设置要使幅值增益和相位增益合适，因为幅值增益越大，系统的响应越迟缓；相位增益越大，系统越震荡、调节时间越长；相位增益越小，超调量越大。

进一步分析，幅值增益揭示了RRC系统的闭环增益增大多少倍，系统开始变到临界稳定和不稳定状态。一般来说，幅值增益应大于6 dB。对于如式(1)所示的典型二阶系统，其相位增益可以表达为式(2)。

(1)

式中:ωn——无阻尼震荡角频率;

ξ——阻尼系数。

(2)

式中:φ——相位增益。

对于2阶系统，超调量可以表示为式(3)：

(3)

因此，可以通过相位增益φ求出阻尼系数ξ，进而求出超调量σ。为了折中考虑超调量和调节时间性能，应尽量使相位增益φ在30°～60°。

当RRC各控制系统整定值均已优化完成之后，需要对RRC所有控制系统进行联合仿真分析(反应堆对象使用数字化仿真模型)，以确定各控制系统在相互配合时，整个反应堆控制系统性能指标得到了满足，并且验证RRC系统能够应对电厂正常运行瞬态(阶跃变化10%FP的瞬态、线性变化5%FP/min的瞬态、汽机甩负荷到厂用电瞬态和紧急停堆瞬态)，不会触发保护系统动作。

2 设计特点传统参数优化方法的不足及最优化改进

传统参数优化方法在解决反应堆控制系统参数优化问题时，需要解决频域指标和时域指标的复杂对应关系，操作起来较为复杂，且参数组合的选取采用人为试凑方式，不能涵盖所有可能的控制系统参数组合。RRC控制系统优化的结果是一组相对优化的参数组合，并非最优化参数，这也是传统参数优化方法的不足之处。

这是由两方面原因引起。一方面，20世纪60年代，计算机还不够普及，计算性能也不够强大，还无法通过高效地计算控制系统动态响应的方式进行参数优化，只能使用频域计算间接推断控制系统的时域性能。在最初的频域分析时甚至只能通过手绘方式计算Nichols曲线，而以这种方式完成RRC系统的优化将是十分庞大的工作量。再者，当时情况下，工业领域可选择的控制领域的理论工具十分有限。对于反应堆控制系统参数优化问题，研究使用群体智能算法来求解将是一个很好和可行的尝试。这样做优点是显而易见的，首先是可以对一个大的参数范围进行搜索，其次充分利用计算机的能力，直接用时域响应作为评判指标，从而得到一组最优化的控制系统参数。

3 基于粒子群算法的反应堆控制系统最优化

3.1 粒子群优化算法简介

粒子群优化算法是基于群智能方法的演化算法，由美国社会心理学家Kenndy和电气工程师Eberhar于1995年提出。基本概念源于对鸟群捕食行为的研究，鸟群在飞行过程中经常会突然改变方向、散开、聚集，其行为不可预测，但整体总保持一致性，个体与个体之间也保持着最适宜的距离。研究发现，鸟仅仅追踪它有限数量的邻居，但最终的整体结果是整个鸟群好像在一个中心的控制之下，即复杂的全局行为是由简单规则的相互作用引起的，生物群体之间存在着一种社会信息共享机制，为群体的进化提供了一种优势。使用计算机模拟鸟群的觅食行为，可用于解决优化问题。基本原理如下：问题的解对应于搜索空间中粒子的位置。每个粒子有自己的位置和速度(决定飞行的方向和距离)，还有一个由被优化函数决定的适应值。各个粒子记忆、追随当前的最优粒子，在解空间中搜索。每次迭代的过程不是完全随机的，如果找到较好解，将会以此为依据寻找下一个解。

算法描述如下：随机初始化一群粒子，其中第i个粒子在D维解空间的位置表示为xi=(xi1,xi2,…,xiD)。每一次迭代，粒子通过动态跟踪两个极值来更新其速度和位置。第一个是粒子从初始到当前迭代次数搜索产生的最优解：个体极值pBesti=(pi1,pi2,…,piD)；第二个是粒子种群目前的最优解：全局极值gBest=(g1,g2,…,gD)。第i个粒子根据以下公式来更新其第d维(1≤d≤D)速度和位置：

vid=wvid+c1r(pid-xid)+c2R(gd-xid)

(4)

xid=xid+vid

(5)

式中:v——粒子速度;

x——粒子位置;

w——为避免粒子在全局最优解附近震荡的可变惯性系数;

r,R——均匀分布在(0，1)区间的随机数;

c1,c2——学习因子。

粒子在解空间内不断跟踪个体极值和全局极值进行搜索，直至达到规定的迭代次数或满足规定的性能指标为止。算法流程如图1所示。

图1 粒子群优化算法计算流程Fig.1 Calculation flow of particle swarm optimization algorithm

3.2 适应度函数

利用粒子群算法进行RRC系统参数优化时需要计算某种参数组合情况下系统的适应度值，即系统在给定控制通道参数作用下的响应性能评价。对于一般的最小相位系统，阶跃响应中包含的上升时间、超调量、稳态偏差等指标足以用于评价系统的性能。为了便于计算机编程，设计如式(6)所示的指标，用于表征系统的时域性能。

(6)

式中：e(t)——控制偏差;

t——时刻;

J——适应度函数值。

该指标对初始误差考虑较少，而主要限制过渡过程后期出现的误差，即控制系统评价考虑的是对误差的消除能力再加上时间的惩罚项。该指标综合了上升时间、超调量、稳态偏差等指标，J值最小的控制系统参数可被看作是最优化的控制系统参数，而控制参数最优化的迭代过程则由粒子群算法解决。

3.3 控制通道的高速计算机仿真

使用粒子群优化控制系统参数时，计算量大，粗略估算总耗时为：每一次控制参数性能评价时间、粒子群种群规模和最大学习代数三者的乘积。对于每一次控制参数性能评价，需要计算控制通道的阶跃响应，而对反应堆控制系统涉及的大部分对象，至少需要计算600～1 000 s范围内系统的响应才有意义。由此可见，使用粒子群算法进行反应堆控制系统参数优化的计算量十分庞大，若算法设置不合理，将导致整个优化过程漫长。

本文在进行控制通道阶跃响应计算时，没有直接利用连续系统离散化的现成软件包，而是采用对复杂传递函数进行技巧性拆分，分成基本环节的组合，然后利用离散相似法计算得出快速运算的差分方程。这样做的优点是便于编制计算机迭代程序，提高运算速度。

例如，图2所示的复杂传递函数：

图2 复杂传递函数的拆分Fig.2 Splitting of complex transfer functions

对于积分环节有式(7)，其中ts是采样周期。

x2(k+1)=x2(k)+k·x1(k)×ts

(7)

(8)

根据离散相似法公式：

x(k+1)=eAts·u(k)+

(9)

当采用零阶保持器时，惯性环节的差分方程可以写为:

(10)

(11)

利用上述，图2的控制通道就能在计算机上进行高速仿真。

4 实例分析

4.1 稳压器压力控制系统优化问题描述

下面以国内典型三环路M310机组的稳压器压力控制系统优化为例，说明控制系统参数优化的过程。简化的控制逻辑如图3所示，控制目标是在正常运行瞬态将稳压器压力控制在15.5 MPa abs，而不引起停堆或稳压器安全阀开启。控制手段有两个，2组比例式电加热器通过增加水的闪蒸来提高稳压器压力，两条喷淋管线通过控制冷水喷淋流量来降低压力。两个非线性环节用来使得电加热器和喷淋流量按顺序投入运行。

图3 稳压器压力控制简化逻辑图Fig.3 Simplified logic of pressure control for the pressurizer

图4 稳压器压力控制参数优化完整框图Fig.4 Complete block diagram of pressure control parameter optimization of the pressurizer

4.2 基于古典控制理论的参数优化

使用电加热器改变稳压器压力是一个缓慢的过程，而喷淋相对而言快速得多。因此，可以大致将优化过程分成两步进行。首先不考虑微分作用(即微分项置为0)，只考虑电加热器的动作来优化积分项，主要考察控制系统消除压力稳态偏差的能力。人为选取三组积分常数值(100 s，600 s，1 000 s)，绘制控制通道Nichols曲线如图5。

图5 积分项优化Fig.5 Integral term optimization

表1 控制器积分项幅值、相位增益表

可见，积分项的选取不会显著改变幅值增益，但会显著影响相位增益。积分项的目的是消除稳态偏差，压力控制并不需要大的积分项，以便开关式电加热器不会频繁开启，且控制通道应避免阻尼震荡，因此选取600 s较为合适。

在积分项确定之后，第二步优化PID控制器的微分项，这主要通过对喷淋系统的分析，确定控制系统具有良好快速性的微分时间。限于篇幅，这里不再论述，优化的结果是λ=1.25，τ22=5 s。

4.3 基于粒子群算法的智能参数优化及对比分析

使用智能参数优化时，不需要针对电加热器控制通道和喷淋控制通道单独优化，因为这两个通道的特性已经包含在他们的对象模型中，再者分开优化也不好界定两个通道之间的影响程度，这也是相对于古典控制理论优化更合理的地方。

学习代数设定为最大30代，学习系数设定为典型值2.05，惯性权重设定为0.729。迭代过程适应度的变化过程如图6，优化结果为τ21=867 s，λ=2.6，τ22=6.8 s。

图6 迭代过程适应度变化Fig.6 Change of fitness in iterative process

为了比较两组参数的优劣，分别仿真压力设定值阶跃+0.2 MPa和-0.2 MPa时两组控制参数的控制系统响应效果，对比曲线见图7和图8。其中，压力阶跃-0.2 MPa时，喷淋和电加热器同时起作用。从图中可以看出，根据古典控制理论优化出来的PID参数效果良好，但不是最优参数，粒子群算法优化的参数在超调量指标上有明显改进，优于现有工程方法的优化结果。

对于实际工程来说，优选出来的PID参数还应考虑开关式电加热器的动作，而这可以通过控制系统联调来测试其性能。限于篇幅，这里不再论述。

图7 两组PID参数控制效果对比Fig.7 Comparison of control effects of two groups of PID parameters

图8 两组PID参数控制效果对比Fig.8 Comparison of control effects of two groups of PID parameters

5 结论

随着计算机的出现和处理能力的提升，几乎所有工业领域都产生了革命性发展。反应堆控制系统设计也应紧跟潮流，一方面利用计算机的能力提升设计水平，另一方面在过程控制中改进整个系统的性能。

本文论述了反应堆控制系统参数优化的过程和理论，阐明了现有的工程优化方法及其不足之处，提出了基于粒子群优化的新方法。该方法利用现代计算机高速计算的能力，对反应堆控制系统的参数进行最优化搜索。相对于目前工程中使用的方法，新方法能够做到最优化设计，且优化过程更为直接、直观，并且以稳压器压力控制系统的优化为例，测试了新方法的有效性，为工程使用打下了基础。