应用赤池信息量准则优选惯性元器件的随机误差模型
2024-03-20祝元浩常国宾杨木森
祝元浩,常国宾,杨木森
(中国矿业大学 环境与测绘学院,徐州 221116)
惯性导航系统(Inertial Navigation System,INS)以自主性、抗干扰性和能够提供短时高精度的姿态、速度和位置信息而广泛应用于各个领域,但INS 的误差会随时间的累积快速增大,精度也会快速降低[1,2]。INS 的误差主要来自惯性元器件的误差。惯性元器件的误差可分为确定性误差和随机性误差,确定性误差可在实验室进行标定补偿[3,4],而随机性误差则需要建立随机误差模型进行分析。惯性元器件的随机误差类别众多,例如量化噪声、角度随机游走、马尔可夫噪声、正弦噪声、零偏不稳定性、角速率随机游走和速率斜坡等。由于并非所有的随机误差都具有较大的影响,通常会忽略影响微弱的随机误差。
在惯性元器件随机误差建模中,通常选择不同的随机噪声成分组合构建模型,比如有将随机误差建模为白噪声与随机游走的结合[5],或直接以常见的角度随机游走、零偏不稳定性和角速率随机游走构建随机误差模型进行分析[6],这样根据惯性元器件特性构建随机误差模型的经验假设方法具有一定的局限性。自相关性分析法和功率谱密度分析法可以得到随机误差在时域和频域的统计特性,进而判断随机误差类型,从而构建随机误差模型,但是这种传统的时序分析法很难将不同类别的随机误差分离。1966 年,Allan[7]提出了Allan 方差分析技术用于分析振荡器的相位和频率不稳定性,由于惯性传感器本身也具备振荡器的特征,随后被广泛地应用在惯性传感器随机误差识别中,并被IEEE 标准所采纳[8]。根据不同类别随机误差的Allan 方差在不同相关时间的双对数图上表现的斜率不同,来判断随机误差类别,这种被广泛使用的方法也被叫做Allan 方差分析法[9]。尽管Allan 方差分析法较为简单,但是这种方法依赖视觉检查和干预,因此容易出现误判的情况。
模型选择理论已被广泛使用于统计学、机器学习以及其他领域。本文研究目的是建立合适的随机误差模型来描述惯性元器件的随机误差。因为上述方法确定的随机误差模型存在偏差,本文将运用模型选择理论,对随机误差模型中的误差类别进行选择,确定合适的随机误差模型。由于Allan 方差与各随机误差之间具有独立且明确的关系,所以本文将基于Allan 方差构建随机误差模型作为研究对象。
赤池信息量准则(Akaike Information Criterion,AIC)是模型选择领域广泛使用的模型选择方法,它能对模型的复杂度和拟合程度进行综合评价。AIC 在误差模型领域已经得到了广泛的应用,比如它被使用于GNSS 长时间噪声模型的选择[10]和模型正则化参数的选取[11];在组合导航中也常被用于AR 模型的阶次选择[12,13]。
本文将基于Allan 方差构建若干含不同随机误差类别的待选模型,使用赤池信息量准则对备选模型进行优选,确定较为合适的随机误差模型来描述惯性元器件的随机误差,并通过实测数据进行分析,从而验证所提方法的有效性。
1 Allan 方差及其随机误差
假设有一组角速率的数据为Ω:{Ω1,Ω2…ΩN},采样周期为T,将该数据分为n(n<N/2)个数据为一数据簇,组成具有k(k=N-n+1)个数据簇的集合,如图1 所示,相邻数据簇之间具有最大的重叠度。
图1 Allan 方差样本数据簇示意图Fig.1 Allan variance sample data cluster diagram
每一个数据簇的相关时间为:
每一个数据簇的平均值为:
则该相关时间τ所对应的Allan 方差可表示为:
按照上述方法,可计算得到各相关时间所对应的Allan 方差。在图解分析时,可将Allan 标准差按相关时间大小,依次绘制在双对数图中,得到Allan 标准差在对数坐标下的分布图。如图2 所示,可根据不同斜率来判断随机误差的类别。
图2 曲线斜率与随机误差类别关系Fig.2 Relationship between curve slope and stochastic error category
每个相关时间下的Allan 方差是根据每个数据簇的有限集合计算的,故Allan 方差精度取决于相关时间下数据簇的个数。数据簇所含数据量越多,误差越大。当数据量为N,每个数据簇所含数据个数为n时,百分比误差δ[14]可表示为式(4),则Allan 标准差与Allan 方差的误差可近似表达为式(5)和式(6):
Allan 方差与双面功率谱密度PSD 有如下关系,
由式(7)可知,在不同的相关时间τ下,以sin4(πfτ)/ (πfτ)2为传递函数的滤波器,Allan 方差与随机误差的总功率成正比,且 sin4(πfτ)/ (πfτ)2滤波器随着相关时间τ不断改变。因此,Allan 方差可以识别不同的随机误差。
陀螺中常见的五种随机误差分别是:量化噪声、角度随机游走、零偏不稳定性、角速率随机游走和速率斜坡[8]。由Allan 方差与双面功率谱密度的关系式(7),可以得到各随机误差所引起的Allan 方差。各随机误差的Allan 方差与功率谱密度的关系如表1 所示。
表1 各随机误差的Allan 方差与功率谱密度Tab.1 Allan variance and power spectral density of stochastic errors
2 拟合算法
由上节可知各随机误差所引起的Allan 方差大小,则总的Allan 方差可表示为各随机误差所引起的Allan方差之和,由此构建基于Allan 方差的随机误差模型。本节以量化噪声、角度随机游走、零偏不稳定性、角速率随机游走和速率斜坡五类随机误差为例,进行建模分析,即总的Allan 方差可表示为:
根据表1 将上式转换为:
也可写为通式形式:
传统的随机误差系数拟合方法是基于最小二乘原理,直接根据式(10)拟合随机误差系数。这种方法常常会出现随机误差系数为负的情况,并且未考虑不同相关时间下的Allan 方差精度差异。为了避免异常值的出现,有学者使用分段Allan方差分析法进行分析[15],即在不同的相关时间内拟合相应的随机误差项,避免了异常值的出现;有学者在分段的基础上提出了重叠分段Allan 方差方法,进一步提高了估计精度[16]。由于并非所有的随机误差都有较大的影响,直接使用最小二乘对每一段进行系数拟合的做法是不合适的[17]。一种更为常用的获取随机误差系数的方法是Allan 方差斜率法,它利用Allan 标准差的双对数曲线,按照不同的斜率提取相应的随机误差系数。本文采用加权最小二乘拟合算法,即对不同间隔的Allan 方差数据进行合理的加权,并以代替βi,来约束随机误差系数为正,将式(10)右边转换为关于α的函数f(α)。
对于式(12)可使用加权非线性最小二乘法求解,例如使用高斯牛顿或列文伯格-马夸特法[18]求解模型系数。
采集5 h 单轴陀螺静态测量数据作为实验数据,因为Allan 方差斜率法需要目视解译确定随机误差类别,所以加权最小二乘法采用与斜率法相同的随机误差类别进行拟合。经过目视解译,大致确定随机误差类别为角度随机游走、零偏不稳定性和角速率随机游走。分别使用Allan 方差斜率法和加权最小二乘拟合法求出随机误差系数。Allan 方差斜率法与加权最小二乘法所得的各随机误差大小如表2 所示。将各个误差系数带入模型中进行表达,结果如图3 所示。其中图3(a)是Allan 方差斜率法所得模型的曲线,图3(b)是加权最小二乘法所得模型的曲线。可以看出加权最小二乘法拟合的曲线更加贴合Allan 标准差的曲线。由图3(a)看出,后半段的拟合曲线整体高于Allan 标准差曲线,这是由于Allan 方差斜率法求得的零偏不稳定性偏大。其原因是在斜率处提取的随机误差系数是各随机误差在该相关时间下的总和,若在该相关时间下其他随机误差并不是小到可以忽略,则就会导致在该处提取随机误差系数偏大。故该加权最小二乘拟合法与广泛使用的Allan 方差斜率法对比,所求得随机误差系数更加准确。
表2 两种方法所求的随机误差Tab.2 The stochastic error values obtained by the two methods
图3 模型曲线对比Fig.3 Comparison of model curves
3 赤池信息量准则
赤池信息量准则(Akaike Information Criterion,AIC)是20 世纪70 年代由统计学家赤池弘次创立,它建立在信息论中熵的概念的基础上,评价模型的复杂度与拟合程度。AIC 是KL 散度(Kullback-Leibler Divergence,KLD)的无偏估计[19]。KLD 又称相对熵,是描述真实数据的概率分布与模型概率分布之间的差别,但是真实数据的概率分布是未知的,只能使用样本分布来近似总体分布。而构建AIC 的重要一环就是确立了近似的KLD 与经验似然估计的紧密联系。对近似的KLD 进行补偿,若补偿项为模型参数个数n时,则补偿后的KLD 即为AIC,AIC 计算公式如下:
其中n为参数个数,θ表示模型参数,是通过真实数据y计算得到的模型参数估计值,为对数似然函数,计算公式为:
4 实验分析
采用IMU-KVH1750 惯性测量单元内置的闭环光纤陀螺仪作为实验仪器,输出频率为200 Hz,仪器输出为角速率,其单位为rad/s。将仪器处于静止状态,记录5h 单轴陀螺观测数据作为实验数据。图4 为陀螺仪5h的观测数据(将相邻10个输出数据作平滑处理)。
图4 陀螺仪5 小时观测数据Fig.4 Gyroscope 5-hour observation data
为了实现惯性元器件随机误差优选,需要建立备选模型。根据上文中常见的随机误差类别,进行排列组合,可建立31 种不同误差类别所构成的随机误差模型。但是这其中许多随机误差组合模型是偏离实际情况的。本文根据仪器特性挑选了6 个符合实际情况的待选模型:包含角度随机游走和零偏不稳定性的NB模型;包含角度随机游走和角速率随机游走的NK 模型;包含角度随机游走、零偏不稳定性和角速率随机游走的NBK 模型;包含量化噪声、角度随机游走、零偏不稳定性的QNB 模型;包含量化噪声、角度随机游走、零偏不稳定性和角速率随机游走的QNBK 模型;包含量化噪声、角度随机游走、零偏不稳定性、角速率随机游走和速率斜坡的QNBKR 模型。
使用加权最小二乘拟合法计算上述六个备选模型的随机误差系数,再计算各模型的负对数似然函数与AIC,如表3 所示。图5 为各模型的曲线与Allan 标准差之间的对比。
表3 各模型随机误差系数与AICTab.3 Stochastic error coefficient and AIC of each model
图5 各模型拟合曲线与Allan 标准差曲线的对比Fig.5 Comparison of fitting curves of each model with Allan standard deviation curve
由表3 可知,NBK 模型的AIC 最小,即由角度随机游走、零偏不稳定性和角速度随机游走组成的随机误差模型能够较合适地描述真实的随机误差。其中NBK 模型、QNBK 模型和QNBKR 模型的AIC 的值较为接近,从图5(c)(e)(f)可看出,这三个模型的模型曲线更加贴合Allan 标准差的曲线。根据表3 数据,QNBK 模型和QNBKR 模型在τ幂次为-1、0、1 的系数值与NBK 模型基本相同,说明模型所包含角度随机游走、零偏不稳定性和角速率随机游走的随机误差数值基本相同。这两个模型还包含其他随机误差类别,但是负对数似然函数值并没有明显的变化,说明其他随机误差类别对模型贡献很小,故在本次实验中角度随机游走、零偏不稳定性和角速率随机游走具有较大的影响,而量化噪声与速率斜坡在本实验中影响较小。影响较小的随机误差不仅对模型贡献小,还增加了模型的复杂度,故QNBK 模型与QNBKR 模型的AIC 值都大于NBK 模型。其他模型的AIC 较这三个模型偏大,是因为这些模型忽略了具有较大影响的随机误差,例如NB 模型与QNB 模型都缺少了角速度随机游走。综上所述,根据AIC 可以对随机误差模型中随机误差进行选择,确定合适的随机误差模型描述真实的随机误差。表4 为NBK 模型各随机误差的数值。
表4 NBK 模型的各随机误差Tab.4 Stochastic errors of NBK model
图6 为模型的功率谱密度、模型模拟的功率谱密度和原数据的功率谱密度。从图6 中可以看出,模型模拟的功率谱密度与原数据的功率谱密度比较吻合,且黑线所代表的模型功率谱密度与原数据的功率谱密度符合较好,这也反映了NBK 模型可以较好地描述随机误差。
图6 NBK 模型模拟的功率谱密度与原数据功率谱密度的对比Fig.6 Comparison of power spectral density between NBK model simulation and original data
5 结论
本文提出了应用赤池信息量准则对惯性元器件随机误差模型优选的方法,通过实测数据分析,能够准确地对随机误差模型中随机误差项进行优选,确定合适的随机误差模型,验证了方法的有效性。与传统目视Allan 方差的方法相比,此方法不依赖于视觉检查与人工干预,且评判标准综合了模型的拟合度与复杂度。本文还提出了加权最小二乘拟合法,即对不同相关时间下的Allan 方差数据进行加权,并将随机误差系数的对数作为预估系数,避免了异常值的出现。本文所提的方法无需人为干预,支持使用Allan 方差完成惯性元器件随机误差的自动化校准。