非平稳工况下迟延状态空间模型的建模分析
2022-03-19陈瑞阳
张 勇, 陈瑞阳, 顾 亚, 杨 溢
(1.内蒙古科技大学信息工程学院,内蒙古 包头 014010; 2.常熟理工学院电气与自动化工程学院,江苏 苏州 215100)
0 引 言
建模是控制系统设计与研究中很重要的一个环节[1-2]。一般来说,在根据复杂工业现场的实际操作变量与可测量数据建立数学模型的方法分为两类:基于模型参数估计的系统辨识和无模型的神经网络。系统辨识是一种灰箱建模方法,需要在机理分析的基础上给出系统模型的结构和阶次,进而借着过程数据辨识相应的模型参数。BP神经网络建模方法则不然,这种方法不需要了解系统太多的先验知识,只需要获知系统的输入输出数据就可以对复杂系统进行模型构建。
对于复杂时滞控制系统的辨识问题,Ding和Chen[3]提出了一种基于辅助模型的双速率采样数据系统递推最小二乘算法;Chen等[4]提出了基于辅助模型的多新息多变量非线性系统的算法;Han等[5]讨论了基于最小二乘法的多速率多输入系统的辅助模型辨识方法;顾亚[6]针对单步迟延状态空间模型提出了一种处理未知中间变量的辅助模型递推最小二辨识算法。
近年来,学者们对神经网络的研究主要有以下几个方面:通过对附加动量因子和自适应学习率的改进来改善神经网络;Elman神经网络结合粒子群优化算法分析神经网络稳定性;随机神经网络的指数稳定性的问题。
上述研究成果都是假设系统输入是平稳的,然而在实际的工业过程监控与优化中,工况变化时有发生,并体现在实际现场基于数据驱动的神经网络方法的预测结果不能如实地跟随系统工况的变化。高炉冶炼过程中,入炉矿石配比结构发生变化时,整个现场的操作环境和操作变量都会随之变化[7-8],而此时的数据驱动模型给出的炉温和高炉铁水质量等预测结果往往误差很大[9],煤化工气化炉入炉水煤浆的成分发生变化,相关操作参数也跟随变化,而此时预测的产气量也往往会有误差。
时滞是高炉冶炼、煤化工以及其他复杂工业过程的主要特征之一。在高炉冶炼和煤化工的连续实际工业生产过程中,每一位工程技术人员对于参数变量的操作不可能完全相同且无差错,这就给工业控制系统的建模分析增加了难度。因此,本文给出了时序数列的平稳性数学描述来模拟实际现场操作参数的这一变化。由于复杂工业过程变工况数据缺少真实标准,同时又难以获取,本文以单步迟延状态空间模型为复杂工业过程模拟对象,研究非平稳假设和变工况条件下,参数估计方法与神经网络方法的各自适应性。
1 问题描述
一类迟延系统可表述为:
式中:u(t)∈R1和y(t)∈R1——迟延系统的输入和输出;
x(t)∈Rn——迟延系统的状态变量;
v(t)∈R1——白噪声;
A∈ Rn×n,B∈ Rn×n,f∈ Rn×1和c∈ R1×n——迟延系统参数。
在输入输出采集数据集 {u(t),y(t)}的基础上估计迟延系统中未知参数的辨识方法,以及以迟延系统输入输出数据为训练样本,运用BP神经网络方法逼近系统输出的建模方法均可以构建系统过程模型。系统辨识和神经网络建模方法均已在工业过程建模领域得到了广泛的应用。如图1所示,针对工业现场中工况变化时有发生的问题,本文以迟延系统为研究对象,在系统输入 {u(t)}平稳状态和非平稳状态下分别研究和分析这两类方法的优劣。
图1 基于数据的复杂系统建模结构图
1.1 平稳工况的数学描述
平稳工况在数学上表示为特定时间序列的平稳性。在实际工业生产中,时间序列数据很难满足严格意义上的均值、方差以及方差函数为恒定值的平稳性要求,张勇等[10]研究了适合一般工程意义的宽平稳特征下的无偏参数估计。以本文所研究的迟延系统为例,适用于工程领域的宽平稳时间序列近似平稳的条件是时间序列的二阶平稳。
对于描述复杂工业过程的迟延系统(1),常规状态下会一直运行在平稳工况下,其输入采样序列满足如下3个条件则认为该系统运行在平稳工况下,若则:
1){u(t)}是一个有限方差过程,即当t→T,任取
2){u(t)}的均值函数E(ut)= μu(t)= μu是一个常数且当t→T时,该均值不随时间t的变化而变化。这是一个严格的平稳过程。而在实际的生产生活中,μu的 值允许有小范围的波动,即任取m≤T,有
3) {u(t)}的自相关函数 co v(s,t)=γ(s,t),只取决于|t-s|,令t=s+τ,其中 τ代表时滞或滞后;在实际的工业现场,一组时间序列的自相关函数值一般近似相等:
当迟延系统的输入满足平稳工况条件时,系统输入输出均满足平稳工况的条件,这时可以应用传统的辨识方法对迟延系统的参数进行辨识从而获取其辨识模型。
式(3)可以写成如下形式:
用e(t)替代式(4)中的 α (z)v(t)可得:
其中z-1为单位移位算子定义如下多项式:
定义参数向量 θ和信息向量 φ (t):
所以式(5)可以写成:
将上式展开并作移项处理可以写成向量的形式:
所以可以得到迟延系统的辨识表达式:
由式(12)系统辨识表达式定义并极小化准则函数:
其中为t时刻的LS估计,ARX模型LS估计的已被证明的收敛条件为模型中的噪声项为白噪声时间序列,若不满足该条件,则最小二乘参数估计是有偏的。很明显,式(14)中的噪声项e(t)不满足该收敛条件。
由上文可知,由于噪声项e(t)中含有多项式 α (z),因此要获得该单步迟延状态空间模型的最小二乘估计表达式需要定义一个新的噪声向量 φv(t)和参数向量:
根据辨识模型对该迟延系统进行参数估计,参数向量 θ为需要辨识的目标,由迟延系统的辨识模型表达式可知,噪声项不满足收敛条件中噪声项为白噪声序列的要求。由最小二乘表达式(18)可知,该迟延系统的递推最小二乘参数估计是有偏的,所以很难获得系统精度很高的辨识模型。
1.2 非平稳工况的数学描述
在实际工业过程中,操作条件和操作环境的变换时有发生,系统工况随之发生变化。这种变化在数学上表述为系统的输入 {u(t)}随着时间的推移而发生跳变,因而就会产生不满足平稳工况要求的现象。
当系统的输入数据发生变化,输入数据时间序列的统计特性将随之发生变化,将不再满足平稳时间序列的要求。输入数据时间序列的统计特性(均值、方差、协方差)中的一个或者多个会随着时间的变化而变化。假设 ,若H>T非平稳时间序列的统计特性有如下特征:
1)对 于 {u(h)}的方 差 函数 ,任取m≤H,有
2) {u(h)}的均值函数E(uh)= μu(h)= μu, μu是一个常数,且当h→H时 μu随着时间h的变化而变化,任取
3) {u(h)}的自相关函数cov(s,h)≠ γ(s,h)。
当一组时间序列满足以上一个或者多个统计特征时,该时间序列是非平稳的,其可以表征实际工业现场的工况变化现象。
在文献[10]中,张勇给出了输出误差系统最小二乘估计协方差矩阵在平稳信号和非平稳信号下应该满足的要求,仿真结果证明了平稳信号下最小二乘参数估计的精度高于非平稳信号下的参数估计,该论文研究了非平稳信号宽平稳情况下的参数估计问题。本文的输入数据信号集会发生比较大的跳变,比文献[10]所要研究的问题更为复杂,且更具有现实的工程意义。
对于常规的参数辨识来说,通常都是研究在某一种特定工况下参数辨识的精度问题或者是改变系统噪声方差以获得不同随机噪声来对特定方法的辨识精度作对比分析;神经网络建模一般也是基于某种特定工况下相关数据的建模分析。
本文利用迟延系统平稳工况和非平稳工况下的辨识模型输出与神经网络模型输出作对比。研究最小二乘方法、辅助模型最小二乘方法和神经网络建模方法在变工况条件对于单步迟延状态空间模型建模的优劣。
2 辅助模型最小二乘辨识算法
式(1)的辅助模型最小二乘参数估计,首先定义一个中间变量:
定义参数向量φ(t):
综合式(6)~式(8)和式(20)可得:
所以,可得迟延系统的辨识模型:
给出如下准则函数并极小化:
所以有
辅助模型算法原理结构图如图2所示。
图2 辅助模型算法原理结构图
因此式(1)参数向量θ的辅助模型递推最小二乘辨识算法如下:
通过移位算子的性质,将具有时滞的状态空间模型转换为输入输出表示,然后基于辅助模型识别技术识别输入输出表示的参数。该方法具有处理信息向量中未测量变量的优点。
3 BP神经网络算法
BP(back propagation)神经网络算法是构建复杂系统的一类典型方法[11-13],它可以有效解决连续有界非线性函数的逼近问题,尤其是经典的三层BP神经网络结构对于任意精度的非线性函数逼近效果显著。
应用BP神经网络算法逼近单步迟延状态空间模型,网络结构为多输入单输出结构。在允许误差范围内通过对隐含层节点数和学习训练函数等参数的合理设置可以得到合适的网络模型。由于输入输出变量间的强关联性,为了更好地反映迟延系统的动态特性并将输入输出变量时序数据的时滞关系考虑在神经网络模型中,将单步迟延状态空间模型式(1)的BP神经网络逼近模型表示为:
对于单隐层的BP神经网络结构,假设该系统模型有M组样本数据(ui,yi):
隐含层的节点数为P,激活函数为f(x)的单隐层神经网络表达式为:
神经网络期望输出Y与神经网络输出O的误差表达式为:
BP神经网络权值的迭代修正公式设计方法即神经网络的训练调优方法选择负梯度下降方法。隐含层节点数的选取以神经网络模型获得的命中率最高为最优。隐含层节点数选取的经验公式如下:
式中:N——隐含层节点数;
n——输入层节点数;
m——输出层节点数。
其中,a一 般选取 [0 ,10]内的整数。
较高的命中率和最小的平均相对误差是隐含层节点数选取的前提。依据公式(35)确定隐含层节点数的理想范围是 [2 .2,12.2]。
设定迭代误差即迭代终止条件:ΔJ(e)=J(e)t+1-所以可以将隐含层的节点数范围扩大到 [2 ,13]。经过不断调试,最终隐含层节点数确定为13。BP神经网络结构图如图3所示。
图3 BP神经网络结构图
4 仿真实例
例1:神经网络逼近抛物函数
设抛物线系统:
抛物线系统递推最小二乘方法辨识模型参数θ1=[0.88,1.85,2.80]T,辅助模型最小二乘方法辨识模型参数θ2=[0.95,1.98,2.96]T。抛物线系统辨识模型输出曲线如图4所示。
图4 模型输出y 随时间t变化曲线(例1)
以0.1为步长,将抛物线系统在集合[ 0 ,7]和[-2,9]之间的输入输出数据集分别作为BP神经网络训练集和测试集,抛物线系统BP神经网络建模输出曲线如图4所示。
取数据长度t=23,3种方法模型输出误差如图5所示。
图5 模型输出误差随时间t变化曲线(例1)
由仿真曲线可以得出:当测试数据超出训练数据的界限范围,抛物线系统神经网络模型的输出结果跟随性很差,对输入变化的适应性很差,输出会发生震荡。根据误差曲线的变化,可以得出抛物线系统辅助模型最小二乘辨识模型比递推最小二乘辨识模型和神经网络模型的输出误差要小。
例2:单步迟延二阶仿真系统:
对该二阶仿真系统运用辅助模型递推最小二乘辨识算法估计系统的参数。当噪声方差 σ2=0.12,遗忘因子 F F=1.0时,系统的噪信比 δns=5.62%。
由仿真结果可得出该系统的输入输出函数为:
选取单步迟延状态空间模型式(1)噪声方差为0.1时的2 950组数据作为训练集,50组数据作为测试集。
1)两次改变输入数据的边界条件来模拟工况的变化,并分别选取原模型50组数据作为测试集。
2)选取一组理想的最小二乘辨识参数作为模型参数,获得相应输入数据下的最小二乘辨识模型输出。
3)选取一组理想辅助模型最小二乘辨识参数作为模型参数,获得相应输入数据下的辅助模型最小二乘辨识模型输出,仿真曲线如图6~图7所示。
图6 模型输出y 随时间t变化曲线(例2)
图7 模型输出误差随时间t变化曲线(例2)
由仿真曲线可以得出:就输出误差来看,运用辅助模型最小二乘方法获得的模型输出误差最小,误差范围为 [- 1,1]。当工况发生变化时,运用辅助模型最小二乘方法获得的模型输出误差最平稳,对系统工况变化的适应性最好,而神经网络建模方法获得的模型输出误差越来越大,对系统工况变化的适应性最差。
5 结束语
3 种经典方法均可以对模型结构和阶次已知的系统来进行建模分析。对于迟延系统的建模而言,在平稳工况下,神经网络建模因其强大的非线性函数逼近能力可以获得较好的模型输出和较小的输出误差。当工况发生变化时,迟延状态空间系统辅助模型最小二乘辨识模型输出误差最小,对系统工况变化的适应性最好,而神经网络由于进入再学习状态,其模型的输出误差相对较大,对系统工况变化的适应性相对较差。