线性系统状态估计及传感器选择方法

2019-11-07郑瑛

探测与控制学报 2019年5期

郑瑛

(内蒙古民族大学，内蒙古通辽 028043)

0 引言

在20世纪的最后10年，传感器技术在全球范围内取得革命性发展和进步，现今，已在国家安全防卫、工业生产、道路交通等领域取得广泛应用。与之同时，随着传感器种类、数目的增多，针对特定应用环境和任务需求等条件选择合适的传感器，成为被全球学者广泛研究的课题[1-4]。在传感器选择过程中，首先应建立目标函数，或者是确定选择传感器的原则，其次是根据这些函数或原则确定被选择的传感器，按照传感器选择过程中目标函数的不同进行分类，传感器选择方法分为短时(Myopic Selecting)选择方法和长时选择(Non-Myopic Selecting)方法两种。短时选择方法是指在建立目标函数时仅向后考虑一步收益，以此收益最大化为原则选择传感器，在短时选择方法方面，文献[5]基于多伯努利滤波器并以误差损失函数最小化为目标函数，以此作为标准选择传感器。文献[6]以信息论为基础建立目标函数并进行传感器选择。文献[7]根据网络变化规律提出了一种基于马尔科夫决策模型的网络节点切换选择算法，该方法能够有效降低网络阻塞率并提高传感器资源利用率。文献[8]针对状态监测问题以误差协方差的迹最小为目标函数，提出一种贪婪算法，但仅通过实验证明了算法有效性，缺乏对算法的理论分析。文献[9]研究目标跟踪问题，讨论如何选择传感器量测值使融合结果最优，提出一种基于贝叶斯理论框架的传感器选择算法。长时选择方法是指在建立目标函数时向后考虑多步收益，以多步收益最大化为原则选择传感器，在长时选择方法方面，文献[10]采用分枝限界法求解传感器选择方案。文献[11]在目标跟踪过程中采用维特比算法进行传感器选择。文献[12]将长时调度方法归结为传感器滚动时域选择问题，设计了向前-向后搜索算法求解传感器选择方案，算法较为复杂。文献[13]以雷达辐射风险最小化为目标函数，并用改进分枝限界法求解，文献[14]在此基础上作了进一步研究。两种方法相比，短时选择方法求解速度快，长时选择方法求解时间呈指数型增长，求解速度慢，但从长期收益来看，长时选择方法优于短时选择方法[15]。此外，长时调度方法中的最优周期是影响方法性能的重要因素，但尚未有论文给出确定最优周期的方法，这也是长时选择方法研究进展缓慢的原因之一。

通过以往研究可以发现，在对系统进行状态估计时通常采用卡尔曼滤波、粒子滤波、容积卡尔曼滤波等手段[16-17]，但极少对滤波收敛条件和误差协方差矩阵一致收敛条件讨论。本文针对此问题，提出了线性时不变系统状态估计及传感器选择方法。首先给出了系统和观测序列的一致可探测性定义，其次给出误差协方差矩阵收敛的条件，接着指出了一致可探测性序列存在条件并根据定义进行了证明，然后在一致可探测序列存在的条件下及传感器短时选择方法框架下提出了一种贪婪算法以此确定传感器选择方案并生成一致可探测序列，分析了该算法的完全性和复杂度。仿真结果表明，本文方法能够选择出最佳传感器组合。

1 问题分析及模型建立

1.1 系统可观测性及可探测性

假定传感器网络中共有m个传感器，传感器网络如图1所示。

图1 传感器网络示意图Fig.1 Demonstration of sensor networks

传感器网络监测的n维离散时间线性时不变系统(Linear Time Invariant Systems，LTI)为：

(1)

式(1)中，A∈Rn×n为状态转移矩阵，C∈Rm×n为观测矩阵，过程噪声和观测噪声wt、vt为零均值高斯噪声，且噪声协方差矩阵分别为W∈Rn×n、V∈Rn×n，xt、xt+1分别为系统在t、t+1时刻的状态向量，yt为状态观测向量。

定义1 当判别矩阵Q=col(C,CA,…,CAn-1)的秩rank(Q)=n时，该系统(A,C)具有完全可观测性。

当rank(Q)

1) 变换矩阵为：

(2)

2) 利用变换矩阵T对原系统进行变化，有：

(3)

1.2 观测序列一致可探测性及一致可观测性

本文研究传感器选择问题，设时间窗口为tk。在t+tk时刻，从传感器网络中的m个传感器选择Mt+tk个传感器，则观测矩阵为Ct+tk，Ct+tk为矩阵C行的子集，从t时刻到t+tk时刻传感器网络对该系统的观测矩阵集合为(Ct,…,Ct+tk)，对应的观测序列集合为Y=(yt,…,yt+tk)，观测矩阵序列为H(t,t+tk)=col(CtA,…,Ct+tkAt+tk)。

定义2 对于如式(1)中的系统，观测序列H满足下列条件时，H具有一致可探测性[18]。

1)a、b为非负整数；

2)c∈(0,1)，d>0，{η∈Rn|‖η‖=1}；

3) ∃t，若‖Abη‖≥c，则‖H(t,t+a)η‖≥d>0。

若对于上述系统，存在正常数，若0

1.3 问题分析

在状态估计过程中，当在t时刻选择Mt(Mt≤m)个传感器时，观测矩阵为Ct，对应的观测噪声协方差矩阵为Vt，Vt为V中与被选择传感器对应的行，用卡尔曼滤波对系统状态进行估计，有：

(4)

本文研究多传感器同时对一个系统估计得情形，多个传感器对1个系统状态估计时，采用序贯卡尔曼滤波进行信息融合。

根据文献[18—19]，卡尔曼滤波在满足如下条件时具有稳定性。

1.4 协方差矩阵收敛性分析

在此部分中，首先分析一致可探测性观测序列H的存在条件，给出以下引理。

引理2 当系统(A,C)完全可观测且rank(A)=n时，矩阵[C,CA,…,CAn-1,CAn,…,CAmn-1]的秩为n，且仅当系统(A,C)具有可探测性时，对该系统存在一致可探测性观测序列。

证明：根据Cayley-Hamilton定理[20]，矩阵A在变换后，依然可以组成该矩阵对应的线性空间，故变化后的矩阵组合的秩依然为满秩，且为n。

设a1、a2分别为Ao的零特征值和稳定特征值个数，Ao为d×d矩阵。进行如下变换：

(5)

式(5)中，V为Ao的特征向量；A1、A2由约当块组成，且满秩，分别对应Ao的稳定和不稳定特征值；A3为约当块，对应Ao的零特征值。通过系统可探测性定义可知，Ao具有稳定性。

(6)

式(6)中，均有Bσ(t,t+s)包含所有BσAp的行向量。

证明完毕。

2 传感器选择策略

在此部分中，在一致可观性观测序列存在的条件下，研究如何找到该序列的问题。

定义3 对于一个线性时不变系统(A,C)，当通过一个算法确定传感器对系统观测的切换序列时，得到的卡尔曼误差协方差矩阵对于所有时刻均是一致有界时，该算法称为完全调度算法[19]。

在进行算法设计时，首先进行如下定义：

(7)

设置矩阵参考矩阵Ψ，在算法迭代过程中，选择使矩阵Ψ的秩增加的传感器作为有效传感器，然后再在有效传感器当中选择传感器对系统进行观测，Ψ(i,j)指在时刻i到时刻j时间段内的量测，令p=rank(A4)，在p步计算后，矩阵Ψ的秩将会增加。

在此，计算满足条件的传感器调度集合算法流程如图2所示。

图2 算法流程图Fig.2 The flow chart

引理3 该算法为完全调度算法且能够生成一致可探测性观测矩阵。

证明完毕。

引理4 本文算法的复杂度为O(mn2Mk+ekM)。

证明：通过算法流程可以发现，本文算法共分为两步，即确定使矩阵Ψ的秩增加的传感器(步骤1)，记为有效传感器，及在有效传感器当中选择M个传感器对系统进行观测。在确定长时调度序列长度为k以后，算法发生mk次迭代，每次迭代过程中需从m个传感器中选择M个进行观测。从文献[21]可知，基本贪婪算法的复杂度为O(mn2M)(仅包括步骤2，且为短时调度)，本文算法在不考虑步骤1的条件下，复杂度变为O(mn2Mk)。设矩阵Ψ的行数为e，每次迭代过程中，需要比较e次才能确定使矩阵Ψ的秩增加的传感器，故步骤1的复杂度为O(ekM)。故本文算法的复杂度为O(mn2Mk+ekM)。

3 仿真验证

在仿真过程中，将本文算法(Detectable Greedy Algorithm，DGA，考虑协方差矩阵是否有界)与文献[21]中的算法(Basic Greedy Algorithm，BGA，未考虑协方差矩阵是否一致有界)、文献[9]中的滚动时域长时调度算法(Non-myopic Greedy Algorithm， NGA，在文献[21]基本贪婪算法基础上，选取一个时间窗口作为调度周期，以该时间周期内所有时刻函数的均值作为目标函数)作对比。仿真过程中，NAG算法在计算过程中，长时调度周期为5。与其它两种算法相比，此种算法计算量和计算时间呈指数式增长，但目标函数值最优，此结论通过文献[12]等论文可以得到证实。

3.1 仿真情形1

仿真在二维环境中进行，仿真场景与文献[21]相似，一个系统由n个节点构成，用m个传感器温度传感器对该n个节点的温度进行监控，系统节点及传感器位置分布如图3所示。仿真过程中，设m=n，A=C=I，此时，易证该系统具有可探测性，W中的元素值取值范围为[0,6]，V中的元素值取值范围为[0.2,3]。

为确保对系统状态估计值的稳定性，取观测时间窗口k=200。

当m=n=10，M=1时，固定W、V，F(σt)随时间的变化曲线如图4(a)所示；m=n=10，M=1时，分别设置不同的W、V进行50次重复试验，F(σ)随时间的变化曲线如图4(b)所示。如图4(b)所示，在50次实验中，经过统计后，NGA算法结果为最优的实验次数为37次，占总实验次数的74%，DGA算法结果为最优的实验次数为13次，占总实验次数的26%。但通过统计算法运行时间发现，NTGA算法平均每次运行时间为41 s，而BGA算法平均每次运行时间为0.52 s，DGA算法平均每次运行时间为0.68 s，算法平均每次运行时间为每个时刻通过运行算法给出传感器选择方案的计算时间。此外，通过图4(a)和图4(b)可以发现，在系统维数较低的情况下，三种算法计算出的结果目标函数函数值相差不大。尤其是NGA和DGA算法，两种算法的结果目标函数值几乎相同，有时DGA算法性能甚至超过NGA算法。从计算结果和运行时间两方面综合考虑，DGA算法性能较优越。分别改变m=n及M的取值，做控制变量实验，经过50次蒙特卡洛实验，结果如表1所示。