APP下载

基于Sigma-point设备可靠性抽样检测技术研究

2018-06-03韦朝奥陈绍辉张爱辉

机电工程技术 2018年5期
关键词:协方差表达式矩阵

姜 勇,韦朝奥,陈绍辉,陈 亮,张爱辉,陈 余

(云南电网有限责任公司大理供电局,云南大理 671000)

0 引言

在许多研究领域中,数学模型是对复杂系统进行合理分析的最常用方法。而且知道模型开发过程中的一个重要步骤是参数识别(PI),即通过分析最小化模拟结果和测量值之间的差异来确定未知模型参数。但是需要注意的是即使是在确定性条件下进行测量,也很难获得精确有效的参数,如最大生长速率和底物亲和常数[1]的确定。况且在实际测量过程中常常伴随着噪声干扰,因此测量所得的估计参数具有明显的不确定性[2],这一现象的存在使得模型质量难以得到保证,但是研究发现具有较小方差的参数可以保证模拟结果具有高精度的预测能力。基于此,参数识别(PI)在保证预测结果有效合理这一方面便显得至关重要,同时针对PI所进行的适当实验设计也被称为优化实验设计(OED)。

OED作为系统生物学领域中的一个重要方法,其主要由两个步骤组成:(1)通过可用的实验数据确定来自PI的参数变化;(2)通过在新的实验中对系统进行“最佳地”刺激来使参数变化实现最小化。当然,这些步骤可以重复进行,直到参数满足合适的准确度。在此过程中常利用基于费舍尔信息矩阵(FIM)的逆矩阵[3]来获取有关估计参数的统计信息。但是如果模型参数是非线性的,那么FIM便有可能导致最终的方差与实际值具有偏差。为了克服这个问题,目前已经开发出多种改进参数不确定性的计算方法,而这些计算方法大多是基于Bootstrap方法[4]的。

基于对目前OED研究现状以及所面临问题的掌握,将在本文中验证基于SP方法的应用对于参数统计量近似值的获取是有利的。而且将给出PI和OED的基础知识,此外,也将对FIM、基于Bootstrap和SP的方法进行介绍,并对它们在OED中的应用进行评估,同时通过一个简单的生物反应器模型来对基于SP方法的OED进行说明分析。

1 PI的基础知识介绍

参数识别(PI)是模型开发过程中的一项步骤,其对于数学模型的建立以及结果的可靠性获取有着至关重要的作用。PI的有效进行主要依赖于常微分方程的建立与计算,具体表达式如下:

在表达式(1-3)中,x(t)表示动态状态,u(t)表示系统输入量,w(t)表示测量过程中的噪声干扰量,t为具体测量时间,其中参数u的大小将决定数学模型的预测能力,同时也可对仿真结果的加权区进行表达。

但是在具体计算过程中,需要将成本函数表达式(3)最小化,进而通过表达式(2)得到预先定义的输入量u(t),其中u为模型参数的估计值。此外,由于非线性模型可能导致结果产生偏差,所以在计算过程中需要增加平均值与矩阵,以此来保证模型的计算精度。而且如果已确定参数的协方差太大,则可以另外选择更加合理的实验条件来降低协方差的值,从而使其一直保持在合理稳定的范围内。换言之,就是利用输入量来给模型提供额外自由度,当然,这种方法也是OED的主要思想。

2 最优实验设计(OED)

目前,OED作为一种数值优化方法,主要通过对变量进行调整来降低参数的不确定性,而如果要将这个优化过程程式化,则需要定义一个基于参数偏差和协方差矩阵的标量成本函数,将具体的优化准则定义如下:

公式(7-8)中,λ作为特征根,在计算过程中主要依赖模型和设计参数来求得,因此可以知道,目前并没有通用的方法来对Co进行预测。

研究发现,OED在数值优化过程中可以通过改变设计参数来降低参数的不确定性,而在参数改善过程中,由于参数之间没有相关性,所以需要在保证原有参数估计范围不再增大的前提下引入入口流的概念。入口流在数据测量过程中可以快速找到参数测量的最优轨迹,从而将测量信息内容最大化,继而降低参数方差。将入口流定义为以下线性函数:

此线性函数可以构建高效合理的入口轮廓,并将其用于改进这种简单的非结构化增长模型的参数精度[5]过程中。基于此,OED数据预测过程中目标函数值不能有效降低的问题得到了有效解决。但是目前OED使用过程中仍面临着两个关键性问题,即如何获得参数协方差矩阵和均值。

3 方法介绍

在本节中将在对PI和OED基础知识了解的前提下具体讨论FIM、基于Bootstrap和SP的方法,同时选择合适的方法来对OED所面临的两个关键性问题(如何获得参数协方差矩阵和均值)进行解决。

对于FIM,在考虑测量噪声存在的基础上将其定义为:

同时将公式(10)内的参数灵敏度矩阵Stn定义如下:

本式中,tn为测量时间。但是由于测量时间的确定依赖于动态状态,所以在求解过程中需要结合公式(2)、(7),计算结果可得:

虽然最后所得C0就OED来说具有一定的有利影响,但是研究发现,FIM-1在某些复杂模型中可能会对实际协方差造成估计失误。所以基于FIM的OED在非线性模型中并不适用。

接下来,对基于Bootstrap的方法进行简要介绍。Boot⁃strap的根计算主要依赖于蒙特卡罗方法[6],此方法通过随机创建的虚拟测量向量来使得样本的均值、协方差与实际分布保持一致,具体表达式如下:

但是运算后可以发现,在基于Bootstrap的方法中,只有当重复样本数量B趋于无穷的时候才可以对Cy进行有效计算,同时在OED进行预测计算的过程中也需要保证精度和计算量之间是处于平衡状态的。

然后,对基于SP的方法进行论述。SP的基本思想是通过非线性映射来对高维空间随机向量的期望和方差进行确定[7],具体参照表达式为:

在公式(16)中,ξ为测量值,η为模型估计参数。其在对随机向量的方差的确定过程中首先会生成一个高维空间样本yn:

高维空间样本生成后,利用样本yn便可对随机向量方差进行确定,进而确定参数向量、协方差矩阵以及均值,计算公式如下:

如上所述,对FIM、基于Bootstrap和SP方法的参数计算过程进行了叙述,并且利用基于SP方法解决了OED执行过程中所面临的两个关键性问题。同时发现与FIM和基于Bootstrap方法相比,基于SP的方法在OED执行过程中有以下五项优点:(1)与FIM方法相比,SP方法不仅可以得到协方差矩阵的下限,而且可以在测量参数噪声不大的情况下得到更精确的参数估计量;(2)SP方法不需对参数识别过程进行假设,只需通过一些数值计算的方法就可以对参数进行识别;(3)SP方法不需计算梯度或雅克比行列式。这样就适用于更多的模型,例如Monte carlo模型;(4)SP模型的计算方法比较简单,直观;(5)SP方法对样本的选择是随机但合理的,而所需样本的数量也比Bootstrap小很多。结合以上SP方法的优点,可以知道SP方法的应用对于参数统计量近似值的获取是有利的。

4 模型应用

在第三节中,对FIM、基于Bootstrap和SP方法进行了论述,同时解决了OED执行过程中面临的两个关键性问题。而在本节中,将通过一个广泛使用的生物模型来对基于SP方法的OED进行说明分析,并由此验证之前对于相关问题的解决是科学合理的。

对于所构建的生物模型,假设其反应器的出口流量和入口流量相等,其他诸如稀释率、生物质浓度以及反应物浓度等影响因素可以利用表达式表示为:

公式(23-24)中的待定生长速率μ可由公式(25)确定:

在对此生物模型进行构建的过程中发现其并不能让对生物学机制具有更深层次的理解,但是它却可以证明SP方法对于非线性模型的建立以及最小化参数协方差矩阵的确定是可行的。通过表达式可以发现该生物模型有三个参数:(1)Yx|s,此产量因子描述了生成物数量主要与底物的吸收量有关;(2)μm,该自变量表示生长速率;(3)Ks的上限。同时为了使生物模型得到最大限度的简化,假设Yx|s在相关文献中已知。基于此,将在二维的参数空间进行生物模型的构建以及证明分析。

在生物模型构建完成后,将对参数可识别性、估计参数的置信区间以及参数不确定性的确定依次展开叙述,从而对基于SP方法的OED进行具体的说明分析。

在对参数进行识别之前,需要检查未知参数在原则上是否可用。但是这一过程却意味着测量数据的取用将会受到时间间隔长短的影响。为了避免这种影响,假设初始底物浓度是已知的。

于是可以得到:

根据K与μm可知,SP在理论上是完全可行的。

其次,将从包括FIM、基于Bootstrap和SP方法在内的三个方法对估计参数的置信区间进行介绍:(1)基于Bootstrap方法的有效应用关键在于样本数目的正确选择,即样本的数量是否足够。如果样本数量满足模型构建要求,那么便可以快速获得估计参数的平均值以及其所对应的协方差矩阵;(2)对基于SP的方法进行测试。测试表明如果在OED运行过程中增加一个测量标量和三个测量时间点,那么便可以适当减少计算工作量,而且预期的运行检测结果仍可以被保证。由此表明基于SP的方法对复杂模型的构建分析将是重要的;(3)由于FIM是基于无偏差参数估计的,所以它只能提供有关协方差的信息,而不提供估计值的平均值。由于合适范围内的估计值平均值对于参数不确定性的降低有作用,所以据此可知FIM并不适用于OED的运行检测。

根据以上三种方法在估计参数的置信区间内的应用合理性分析,知道基于SP的方法较其他两种方法来说有着便于模型构建以及减少运行工作量的优点。

最后,将对生物模型的参数不确定性进行论述。基于以上分析可以发现FIM和基于SP的方法适用于扩展模型的构建,但是由于其所对应的置信区域不一致,所以FIM和基于SP的方法计算所得的协方差矩阵也并不相同。在生物模型构建过程中提到了入口流量这一概念,而在应用过程中可以发现,基于SP的方法可以将入口流量定义为设计变量,从而有效降低参数不确定性。

换言之,基于SP的方法可以利用优化设计标准成为设计变量的最优选择,同时也可以发现,基于SP的方法在进行优化设计实验后,能够快速对参数协方差矩阵进行确定[8-9]。也就是说基于SP的方法可以在最短的时间内对参数进行准确性预测,而且之前对于相关问题的解决也是科学合理的。

5 结论

综上所述,在本文中对FIM、基于Bootstrap和SP的方法分别进行了介绍,并对它们在OED中的应用进行了评估,评估结果表明传统的FIM方法并不能完全适用于OED,而基于SP的方法却可以有效解决OED在检测过程中所遇到的问题。同时通过一个简单的生物反应器模型对基于SP方法的OED进行说明分析。且从分析结果中可以发现基于SP方法的应用对于参数统计量近似值的获取是有利的,也就是说基于SP的方法可以有效提高OED的执行能力以及检测速度。

[1]HOLMBERG A..On the practical identifiability of micro⁃bial growth models incorporating Michaelis–Menten type nonlinearities[J] .Mathe.Biosci.,1982,62:23-43.

[2] WALTER P.L..Identification of parametric models(Springer,1997).

[3] KAY S.M..Fundamentals of statistical signal process⁃ing: estimation theory(Prentice Hall PTR,1993).

[4] EFRON B., TIBSHIRANI R.J..An introduction to the bootstrap(Chapman&Hall,1993).

[5]BALTES M.,SCHEIDER R.,STURM C.,et al.Opti⁃mal experimental design for parameter estimation in un⁃structured growth models [J] .Biotechnol.Prog.,1994(10):480-488.

[6] EMERY A.F.,NENAROKOMOV A.V..Optimal exper⁃iment design [J].Meas.Sci.Technol.,1998 (9):864-876.

[7] JULIER S.,UHLMANN J..A general method for ap⁃proximating nonlinear transformation of probability distri⁃butions,1996.

[8]董炜,沈金荣,惠杰,等.基于全生命周期管理的微电网设备管理系统[J].机电工程,2017(11):1330-1333.

[9] GUTENKUNST R.N.,WATERFALL J.J.,CASEY F.P.,et al.Universally sloppy parameter sensitivities in systems.biology models’,PLoS Comput.Biol.,2007,3:1871-1878.

猜你喜欢

协方差表达式矩阵
一个混合核Hilbert型积分不等式及其算子范数表达式
表达式转换及求值探析
浅析C语言运算符及表达式的教学误区
用于检验散斑协方差矩阵估计性能的白化度评价方法
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
二维随机变量边缘分布函数的教学探索
初等行变换与初等列变换并用求逆矩阵
不确定系统改进的鲁棒协方差交叉融合稳态Kalman预报器
矩阵
矩阵