基于RLS在线学习算法的DeepESN动态软测量建模方法及应用
2021-09-24岳文琦
岳文琦
(甘肃兰晶光电科技有限公司)
对化工过程中难以直接测量的重要变量进行实时监控,一直是企业提高生产效率和控制产品质量的重要策略。 传统的硬件传感器,例如气相色谱仪,不仅价格昂贵,维修保养不易,而且存在数据采集时间滞后等问题。 软测量技术的提出[1~4],给出了一种通过数据驱动建模来估计重要变量的新思路[5~7],即通过对工业过程中易测辅变量和难检主变量进行建模,得到输入与输出间的数学关系,来估算难以直接测量的主变量。
随着神经网络的出现和发展, 基于神经网络的软测量建模方法在工业应用中取得了很好的应用效果[6~11],尤其是具有动态记忆能力和时间延迟特性的递归神经网络, 有效实现了动态非线性映射,进一步提升了软测量建模的预测精度[12,13]。 回声 状 态 网 络(Echo State Network,ESN)[14,15]的 提出, 使得蓄水池计算的概念成为热门研究方向,这种计算方法简单有效,只需通过输入输出数据和网络的内部状态来训练网络输出权值,不仅避免了因神经网络参数求导而造成的计算量增大的问题,也容易实现在线学习。 ESN 的最大特点是网络隐层由一种状态蓄水池(State Reservoir,SR)单元组成,SR 内部则由稀疏连接的内部神经元组成, 神经元的数量可根据实际情况择优选择。SR 具有的回声状态特性(Echo State Property,ESP)[15]是保证ESN 稳定性的充分条件。ESP 表征了有效的ESN 动态特性,本质上说,蓄水池内部状态必须呈现出阻尼特性,且仅取决于网络的输入信号,在受初始条件影响后,应随着时间逐渐消失,以保证网络输出的稳定性。 此外,当内部神经元选择为泄漏积分型神经元时,可以有效增强网络的短期记忆能力。 深度回声状态网络(DeepESN)是ESN 在深度学习领域的扩展,即利用ESN 的高效蓄水池计算方法,通过增加串联的SR 层数,开发和增强深层循环体系结构中的动态层次, 并从多个时间尺度丰富网络内部的动力学特性,进一步增加网络的短期记忆容量、增强动态特性的学习能力。 DeepESN 作为一种新型深度递归神经网络,已经成功应用到诸多领域[16~19],现有文献中只给出了DeepESN 岭回归离线学习算法,即通过Tikhonov 正则化方法求解网络输出权值,但是当DeepESN 中各SR 具有成千上万个神经元且训练数据集较大时,岭回归离线学习无疑面临较大的计算成本,无法满足工业过程中软测量建模对被估计变量的实时监测要求。
由于DeepESN 具有多层串联的蓄水池结构,对强非线性特点的化工过程具有更好的学习能力,因此笔者提出递推最小二乘(RLS)在线学习算法[20],通过递推方式在线求解DeepESN 的输出权值矩阵, 既能适用于大数据集的在线处理,也能更好地满足化工过程动态建模的要求。 将基于RLS 在线学习算法的DeepESN 动态软测量建模方法应用于炼油厂脱丁烷塔塔底丁烷(C4)含量的预测,在相同条件下,与文献[21]基于ESN 和LiESN 的在线软测量建模方法的预测效果进行比较,以评价该方法的有效性和应用潜力。
1 DeepESN 的基本原理及其结构
Jaeger H 等提出的ESN 网络具有学习算法简单、非线性动态系统逼近能力强的特点[14,15],它的SR 结构和ESP 特性, 形成了蓄水池计算学习模式, 从一定程度上体现了大脑学习的特点,其基本结构如图1 所示。
图1 回声状态网络的基本结构
在ESN 的基础上,Gallicchio C 等提出DeepESN 结构,给出了离线学习算法。 DeepESN的最大特点是由多层蓄水池结构串联组成的深度学习网络,每个蓄水池中的神经元选择泄漏积分型神经元,其泄漏积分特性能够增强网络对历史信息的记忆能力,提高网络的学习性能,因此对强非线性特点的化工过程具有更好的学习能力。 DeepESN 通过串连形式连接,只有第1 层SR的输入为外部输入信号, 从第2 层起SR 的输入为均为前一层SR 的内部状态。 与标准ESN 不同,DeepESN 中各层之间的状态信息传输不存在时间延迟。 DeepESN 通过收集各层SR 的内部状态矩阵,合并形成一个整体内部状态矩阵,由此可见DeepESN 将输入历史嵌入到丰富的状态表示中,以深度时间方式处理每个时间步骤的时间信息,最后利用合并的内部状态矩阵来计算网络的输出权值。
DeepESN 的基本网络结构如图2 所示,网络分为输入层、隐含层和输出层,隐含层由NL个SR串连组成。 同ESN 一样,每个SR 中由一定数量相互随机连接的泄漏积分神经元组成。 网络初始化时,SR 中神经元之间的连接权值和输入输出权值随机产生,学习过程中仅需训练输出权值即可完成学习过程。
图2 深度回声状态网络的基本结构
其中Wout为输出权值。
2 DeepESN 的RLS 在线学习算法
RLS 是一种快速收敛的递归学习算法,源于递归最小二乘滤波器,以各时刻误差平方和最小为代价函数,通过给定的第n-1 次权值向量最小二乘估计,利用新数据迭代求解第n 次的权值向量,满足代价函数[20]。 DeepESN 输出权值的求解本质上可以归结为线性回归问题,因此可以引入RLS 算法作为DeepESN 输出权值的在线学习算法。 算法分3 个步骤。
第2 步,对每一个时刻n=1,2,…,t 迭代计算DeeESN 内部状态矩阵x(n),定义维数为(NU+NL×NR)的列向量q(n):q(n)=[x(n-1);u(n)],计算n时刻网络的输出y(n)为:
计算矩阵:
计算n 时刻的网络输出权值Wout(n):
第3 步,当n=t+1 时,迭代计算完成,算法终止。
3 脱丁烷塔中丁烷含量的动态软测量建模
为了验证笔者方法的有效性,将该方法应用于某精炼厂脱丁烷塔塔底丁烷含量的预测中。 为了确保所设计软仪表具有动态建模的特点,DeepESN 网络的输入采用具有非线性自回归(NARX)模型的外部输入,时间序列模型使得网络输入含有丰富的动态历史信息,因此,该软测量建模方法结合了时间序列建模和DeepESN 在线学习算法,属于动态建模方法,能够替代硬件传感器,满足企业生产对产品质量实时监测的要求。
模型性能的评价指标均方误差EMSE的计算式为:
其中,y(n)为不同时刻的估计值,T0为起始时刻,T 为终止时刻。
脱丁烷塔是精炼厂石脑油分馏过程中的重要设备,主要作用是将丙烷(C3)、丁烷(C4)和戊烷(C5)从石脑油中分离出来,具体操作流程如图3 所示。
图3 脱丁烷塔的操作流程
在分离过程中,大量的C3、C4 和少量C5 从塔顶排出,大量的C5 和少量C4 从塔底排出。脱丁烷塔的分馏过程需要满足脱丁烷塔塔顶馏出物中C5含量最大化和脱丁烷塔塔底部馏出物中C4 含量最小化的要求,以确保C5 的产品质量控制。 文献[21,22]介绍了意大利某精炼厂脱丁烷塔传感器的安装情况和数据实测情况, 所测变量包括:TI040传感器测量的塔顶温度值u1,PRC011 传感器测量的塔顶压力值u2,PRC015 传感器测量的塔顶回流量值u3,PRC018 传感器测量的塔顶流量值u4,TRC004 传感器测量的脱丁烷塔侧面温度值u5,TI036 传感器测量的塔底一侧的温度值u6,TI037传感器测量的塔底另一侧温度值u7。由于塔底C4的含量无法直接测量, 因此采用气相色谱仪进行了间接测量,得到了实际测量的C4 含量浓度值y。因采样周期的滞后问题,所测量数据集的辅助变量采样周期为12 min,主导变量采样周期为45 min,形成有2 394 组数据的数据集,对该数据集进行了归一化处理。 鉴于硬件传感器在变量采样测量过程中的延迟问题,因此需考虑NARX 模型对网络输入数据进行时间序列建模来实现动态建模,达到对丁烷含量的在线实时预测。 根据文献[21~23]的相关描述,NARX 模型如下:
其中,模型输出y(k)表示k 时刻的C4 含量,f 为DeepESN 软测量方法。 该模型共有16 维输入,1 维输出。
4 仿真验证
用文献[21]的数据集对笔者方法进行仿真验证,经过NARX 建模,使得原数据集生成了2 389组数据,将全部输入输出数据作为网络的输入。
DeepESN 网络初始化参数的设置如下:
SR 神经元个数 50
SR 的层数 5
SR 的泄漏率α 0.5
SR 中神经元连接稀疏度 5%
谱半径ρ 0.9
SR 内部矩阵W(NL)[-1,1]均匀分布
RLS 算法的参数选择如下:
正则化参数δ 1×10-6
遗忘因子λ 0.999 995
笔者方法在2 389 组数据集上的预测值与实际值的比较如图4 所示,均方误差为4.6×10-6。2 389组测试数据均在线训练时,DeepESN 的归一化均方误差(NMSE)曲线如图5 所示。 输出权值的变化曲线如图6 所示。 实验结果表明,随着数据的更新,输出权值最终趋于收敛,NMSE 趋向于不断变小。
图4 脱丁烷塔塔底丁烷含量的预测值与实际值对比
图5 训练过程基于在线学习算法的NMSE 曲线
图6 训练过程DeepESN 输出权值的变化曲线
进一步, 在同等条件下, 将笔者方法与文献[21] 的中ESN、LiESN 的RLS 在线软测量建模方法进行对比,文献[21]选择了与笔者方法一致的NARX 模型作为网络的输入, 其中基于ESN 的RLS 在线软测量建模方法的均方误差为1.07×10-4,基于LiESN 的RLS 在线软测量建模方法的均方误差值为6.0×10-5; 笔者方法的均方误差值为4.6×10-6。 可见,笔者方法的建模效果和预测精度更高。
5 结束语
针对化工过程中重要变量的实时监控问题,笔者提出了基于RLS 在线学习算法的DeepESN动态软测量建模方法,将该方法应用于脱丁烷塔C4 含量的实时在线预测,RLS 算法通过迭代求解网络输出权值,DeepESN 能够以深度学习的方式提取工业过程中的特征,时间序列建模丰富了网络输入的动态特性,使得在线学习过程具有很好的快速收敛特性和数值稳定性。 仿真结果显示,笔者方法具有较好的建模效果,能够有效替代硬件传感器来实现生产过程中实时监控产品质量的实际生产需要,具有很好的建模有效性和实际应用潜力。