APP下载

数据同化在空间天气学中的应用*

2022-06-20张晗可沈芳

空间科学学报 2022年3期
关键词:电离层太阳风卡尔曼滤波

张晗可 沈芳

(中国科学院国家空间科学中心 北京 100190)

(中国科学院大学 北京 100049)

0 引言

由太阳耀斑、日冕物质抛射等太阳活动引起的灾害性空间天气会损害卫星运行和通信导航,破坏地面电力系统,严重威胁人类正常生活[1]。灾害性空间天气已成为一种威胁经济社会和国防安全的非传统自然灾害,因此对空间天气的监测和预报愈发重要。在利用天基探测设备获得空间探测数据,对太阳活动建立模型的过程中,由于观测点分布不均匀以及稀疏性,需要选取合适的方法对观测数据进行预处理,由此引入数据同化方法。

数据同化是一种以自洽的方式将数据合并到模型中来提高模型准确性的技术,其目的是使用所有可用的信息,从而尽可能准确地确定真实物理过程[2]。数据同化在物理模型基础上加入了时空不规则分布的观测数据,通过同化过程将观测值与物理模型相融合,以此达到模型与观测数据相匹配,得出更精确的分析结果的目的。

数据同化概念最先在气象界提出[3],随后作为数据驱动的一种方法。数据同化广泛应用于海洋学和地质学,并建立了卡尔曼滤波、最优估计理论、变分同化等一系列算法。海洋数据同化系统能将海洋、海冰、生物与化学变量的遥感数据、现场观测数据以及通过海洋生态系统[4]与海冰–海洋通用循环模式[5]等得到的数据进行整合。地质数据同化系统将观测数据与预测模型相结合,通过同化观测数据,更新预测模型的参数,提高预测精度[6]。

数据同化技术在空间天气研究中的应用,以光球层建模为例,采用空军数据同化光球层通量传输(Air Force Data Assimilative Photospheric flux Transport,ADAPT)模型[7]。在ADAPT 模型的协助下,使用太阳表面的基于物理的时间演化磁场观测数据,光球层数据同化进一步优化了日冕模型的初始边界条件。数据同化技术在电离层应用上最为成熟,主要方法包括:三维变分算法、四维变分算法和局部集合变换卡尔曼滤波(Local Ensemble Transform Kalman Filter,LETKF)算法[8]。

近年来,作为将观测数据和模型预测紧密联系的方法,数据同化在大气、海洋领域得到充分应用和发展,同时在空间天气领域的应用也取得了一定进展。为了更好地将数据同化应用于空间天气的监测,本文分析了数据同化在电离层、磁层、太阳风和行星科学等领域的应用发展现状,明确数据同化主要方法和应用领域。此外,根据数据同化方法以及开发的数据同化框架,对未来数据同化在空间天气方面的应用进行了初步探讨和展望。

1 数据同化方法

按照算法与模型间的关联机制,数据同化分为顺序数据同化和连续数据同化[9]。顺序数据同化在更新预报场、进行初值化和模式预报整个同化过程中都伴随着观测值的不断插入[10],常见的顺序同化算法包括卡尔曼滤波、集合卡尔曼滤波和粒子滤波算法。常见的连续数据同化算法包括三维变分(Three-Dimensional Variational,3 DVAR)和四维变分(Four-Dimensional Variational,4 DVAR)[11]算法。图1 给出了数据同化方法的具体分类[12]。

图1 数据同化方法分类Fig.1 Data assimilation method classification

卡尔曼滤波作为顺序同化方法的一种,分为预估步和更新步[13]。预估步为

集合卡尔曼滤波(Ensemble Kalman Filter,EnKF)[14,15]是集合数据同化技术的另一种重要方法,其使用集合预测来估算流量下降的背景误差协方差矩阵和其他更新分析所需的量,主要基于经典卡尔曼滤波[16]的蒙特卡罗方法[17]。EnKF 状态演化由以下方程给出:

Torres[19]指出,EnKF 算法主要是利用模型状态集合表示误差统计,利用模型状态及协方差矩阵代替预测分析误差协方差。在高维系统中使用EnKF 算法,通常需要对误差协方差矩阵进行定位和膨胀[20]。该算法只需要少量包含系统及其统计信息的模型状态,易于实行。EnKF 算法已成功应用于欧洲区域海洋生态系统模型(European Regional Seas Ecosystem Model,ERSEM)[21]和长期臭氧(Long Term Ozone Simulation,LOTOS)模型[22]中。

粒子滤波是一种将先验概率密度函数表示为增量函数的集合,并使用动力学模型对其进行传播,旨在表示完整的后验概率密度函数的完全非线性数据同化方法[23]。该算法基于蒙特卡罗的统计信号处理方法,使用一组随机选择的加权样本近似贝叶斯后验概率密度函数,其中状态量的每个样本被称为一个粒子。定义后验概率密度函数的离散加权近似为

粒子滤波算法在一定程度上解决了粒子数样本匮乏问题,经常用于处理非线性高斯系统状态估计问题[25]。

与顺序估计方法只有在有观测时才更新模式状态不同,变分方法寻求在时空维度里一致的模式状态估计,即在某个特定时间的估计值会同时依赖于过去和将来的观测。在光谱空间中使用卷积公式表示的球体上经常利用3 DVAR 公式[26],3 DVAR 尝试将目标函数J最小化,即

其中,x为状态矢量,B为背景误差的协方差矩阵,xb为背景状态矢量[27]。通过求解∇J(x)=0即可计算出目标函数J的最小值及最小化状态分析值与观测值之间的差异,从而得到最优状态估计量。

4 DVAR 标准公式[28,29]的核心是通过最小化代价函数J找到解。代价函数在一个时间窗口内测量模型轨迹与观测值之间的距离以及初始时间的背景,其表达式为[30]

其中,Nt为 同化计算的总体时间,Ht为t时刻的观测算子,S为状态量随时间的变化关系矩阵[11]。

Hunt 等[31]在局部集合卡尔曼滤波(Local Ensemble Kalman Filter,LEKF)的基础上建立了LETKF 方法,该方法同时也是集合变换卡尔曼滤波(Ensemble Transform Kalman Filter,ETKF)[32]的一个扩展,其原理是在网格点上执行并行分析,仅使用该网格点局部区域内包含的观测值来更新每个网格点的状态[33]。对LETKF 方法来说,仅需要指定观测时间步长、观测算子、误差协方差矩阵以及状态向量中两点之间的距离,将算法转换为较低维整体空间,从而可以进行更有效的计算。

2 数据同化软件与已有各种数据同化方法实例

为了优化数据同化算法在天气预报方面的应用,Browne 等[34]开发了高效且易于使用的集合研究信息传递接口(Employing Message Passing Interface for Researching Ensembles,EMPIRE)数据同化系统。EMPIRE 软件包主要是对数据同化算法例如局部集合变换卡尔曼滤波、自举粒子滤波、隐式等权重粒子滤波[35]进行编码,通过少量消息传递接口(Message Passing Interface,MPI)命令链接到数据同化模型中。观测时模型将状态量传递给EMPIRE,而EMPIRE独立于模型进行数据同化,然后将分析状态量传递给模型,并等待下一个观测时间步长[33]。

数据同化研究测试平台(Data Assimilation Research Testbed,DART)作为一种开源软件,可以将不能作为子例程调用的模型与磁盘上经过特殊格式化的网络通用数据格式文件一起使用,包装模型源代码。DART 支持参数估计、灵敏度分析、观测系统设计和平滑化等应用,可简化集合方法以利于新模型和观测数据结合[36]。

并行数据同化框架(Parallel Data Assimilation Framework,PDAF)[37]修改了模型的源代码以执行数据同化。由于MPI 和子例程调用的有效使用,模型不必在每个同化步骤都写入磁盘,PDAF 提供了完全实现和优化的集合卡尔曼滤波数据同化算法。脱机模式下,磁盘文件用于在模型和数据同化系统之间传输数据,性能相对较差。在线模式下,修改源代码以插入对数据同化程序的调用,创建可执行文件并实现模型的并行性[34]。

开放数据同化(Open Data Assimilation,OpenDA)用于开发数据同化和校准算法,并用于动态模型的开源工具箱。OpenDA 来自数据同化通用工具集[38]与数据同化工具[39]的合并,定义了三个主要的模块:方法、观测和模型。用户可以对这些模块进行任意组合以建立实验,无需进行任何编程。OpenDA 的设计旨在提高速度和效率,以实现操作数据同化的可能性[40]。

3 数据同化应用

对空间天气事件的数值预报不是精确的初值问题,这在理论上奠定了进行数据同化的合理性。近年来,数据同化已被广泛应用于空间物理学的电离层、磁层、太阳、行星科学研究等领域,并取得了一定的研究进展。

3.1 在大气研究中的应用

随着科学技术的不断发展,通过雷达、卫星遥感遥测等非常规观测手段获得的数据大量增加,大气数值模式不断发展,可以充分利用观测数据的数据同化方法也得到深入研究,从而能够为数值预报模式提供精确初值场[41]。

Ott 等[42]引入了一种本地化方法来同化大气数据,即通过Lorenz-96 模型上的数值实验来确定当前大气状态的最佳预测。该方法仅需要低维矩阵运算,并且每个局部区域中的分析都是独立的。Smith 等[43]将状态增强技术和3 DVAR 数据同化结合在一起,使用简化的一维模型进行开发测试,构建了基于数据同化的形态动力学参数估计方法。Miyoshi[44]比较了LETKF 与4 DVAR 数据同化系统,研究了加性与乘性误差协方差膨胀之间的差异,提出并实现了一种用于卫星辐射观测的自适应偏差矫正方法,使LETKF具备与4 DVAR 偏差矫正相似的功能。Miyoshi 的研究结果表明,LETKF 在对流层底部特别是海洋上方显示出较大的温差,该偏差在南半球预报中起着重要作用。

在简单低维的数据同化问题中,标准卡尔曼滤波可行性较高;在复杂高维的强非线性数据同化问题中,EnKF 可行性较高。由于非常规观测技术和计算条件的提高,数据同化在大气研究中的重要性愈发显著[45]。

3.2 在电离层研究中的应用

将数据同化应用于热层电离层耦合系统,对电离层电子密度观测进行同化,热层参量例如温度、中性成分可以得到较好的矫正,进而有效提高电离层预报时长和精度。相对于基于经验的数据同化模型,基于物理的数据同化模型在预测时可以及时传播电离层/热层状态。

Durazo 等[46]使用LETKF 对2011 年9 月26 日的地磁暴进行同化电离层观测模拟,通过计算预测协方差矩阵的低秩估计得到更新预测。在每个分析步骤中,使用目标观测策略,通过5 个最佳合成垂直剖面扩展观测向量,以最佳实现目标电子密度误差最小化。利用分析后的以垂直剖面为中心、平均600 km内的电子密度均方根误差来衡量由于垂直分布剖面的同化而产生的预报改进。

格点统计插值(Gridpoint Statistical Interpolation,GSI)电离层作为针对低纬度和中纬度电离层设计的新的数据同化系统,提供了全球导航卫星系统(Global Navigation Satellite System,GNSS)无线电掩星(Radio Occultation,RO)任务对电离大气的分析和监测能力。为了评估RO 任务对电离层天气的具体影响,Hsu 等[47]利用综合RO TEC 数据进行了比较观测系统模拟实验。

FORMOSAT-7/COSMIC-2 的观测系统仿真实验表明,GSI 电离层可以将±30°地磁纬度内的电离层规格比对照组提高67%。这些结果表明,借助FORMOSAT-7/COSMIC-2 RO TEC 数据可以改善对电离层大气的监测。

A Ercha 等[48]依据中国及周边区域的地基GNSS 数据和国际参考电离层模型,利用3 DVAR 和基于物理的高斯马尔可夫卡尔曼滤波方法进行数据同化,生成覆盖中国及周边区域的电离层TEC 和全球定位系统(Global Positioning System,GPS)单频接收机定位误差的格点地图并进行准实时播报。

太阳风暴期间极大地增加了空间天气对电离层和高层大气的影响,从而导致超视距雷达、GPS 位置确定、航天器表面充电、电网过载等空间天气事件,对天基、地基技术系统产生危害,影响人类日常生活。全球电离层测量同化–高斯马尔可夫(Global Assimilation of Ionospheric Measurements-Gauss Markov,GAIM-GM)模型可用于研究太阳风暴期间中纬度电离层的风暴增强密度结构,从而对空间天气进行预报[49]。GAIM-GM 模型[50]使用基于物理的电离层预测模型[51],利用高斯马尔可夫卡尔曼滤波作为同化各种测量结果的基础。Schunk 等[52]针对电离层、等离子体层、热层和电动力学建立了7 个基于物理的数据同化模型。这些模型同化了不同的地基空基观测结果,用于创建多模型集合预报系统并对电离层–热层–电动力学系统进行集成建模。表1 列出了7 个数据同化模型。

表1 数据同化模型Table 1 Data assimilation models

热层电离层电动力学通用循环模型(Thermosphere-Ionosphere-Electrodynamics General Circulation Model,TIE-GCM)作为耦合模型的一种,通常用于解决高层大气中的中子和离子种类[53]。将EnKF和TIE-GCM 结合起来,可以提高确定电离层参数的能力[54]。

He 等[55]以美国国家大气研究中心热层电离层电动力学通用循环模型(National Center for Atmosphere Research Thermosphere-Ionosphere-Electrodynamics General Circulation Model,NCARTIEGCM)作为背景模型,将TEC 观测进行数据同化,有效校正热层中性质量密度以及积分氧氮比值,提高电离层热层的预报能力。

美国喷气动力实验室利用卡尔曼滤波和三角网格插值相结合的方法进行TEC 全面监测,掌握电离层TEC 时空分布变化信息[56]。为了提高对电离层的短期预报能力,He 等[57]将NCAR-TIEGCM 作为背景模型,把EnKF 运用到电离层和热层数据同化系统,使用稀疏矩阵方法避免与矩阵相关的计算和存储,并进行一系列观测系统仿真实验。He 等的研究结果表明,该系统可以同化电子密度协方差,优化电离层驱动,提高短期预报能力,初始条件矫正效果持续超过24 h[58]。

高级集合电子密度同化系统(Advanced Ensemble electron density (Ne) Assimilation System,AENeAS)将物理背景模型和LETKF 结合在一起,是一种新的高层大气数据同化模型。当前AENeAS 模型使用的背景模型为TIE-GCM,使用LETKF 可以从TIEGCM 集合中估计未知协方差,减少模型状态空间,有效同化GPS TEC 数据并减少TEC 误差[59]。

3.3 在磁层研究中的应用

预测地球辐射带中的相对电子通量对卫星、航天器运行安全非常重要。数据同化技术结合辐射带物理模型和航天器对电子通量的长期观测优势,为分析电子辐射带的状态和演化提供了极为有效的方法。对于辐射带模型中的数据同化技术,Godinez 等[60]在一维径向扩散模型中,对集合卡尔曼滤波采用局部自适应协方差膨胀方法,解决辐射带模型中的模型误差。

Podladchikova 等[61]通过估计联合释放和辐射效应卫星观测的模型噪声偏差和模型噪声协方差矩阵,对相空间密度动力学模型进行优化。针对1D 径向扩散,卡尔曼滤波对磁壳参数L整个范围内的电子相空间密度径向分布进行了重新分析。卡尔曼滤波算法允许从不完整的噪声观测值估计演化系统状态,提供对未知系统状态的估计。Garner 等[62]开发了一种直接插值方法,将观测到的电子通量同化到内部磁层的大尺度模型中,研究结果显示数据同化改善了提供数据的卫星以东约30°延伸范围内的电子通量规格。

Jorgensen 等[63]发展了用于模拟等离子体层的数据同化技术,使用Ober 等[64]的等离子体层模型和基于集合卡尔曼滤波的集合数据同化方法,利用Kp指数的实际间隔来模拟等离子体层并生成模拟数据,然后将其输入到数据同化方法中以恢复等离子体层的构型,提高卫星遇到的辐射环境预测准确性。

3.4 在光球层研究中的应用

准确估计太阳全球磁场对于预测影响地面通信和制导系统的空间天气事件至关重要。Schrijver等[65]开发了将SOHO/MDI 磁图同化到太阳表面通量扩散模型的算法,以6 h 的时间分辨率显示了整个太阳上不断演化的磁场,证明了声学远端场成像可以用来成功估算大型活动区域的位置和大小。

准确了解子午环流速度和剖面的时间变化是确定太阳周期特征的关键。而通过使用数据同化研究测试平台框架,在Babcock-Leighton 太阳发电机模型中实现集合卡尔曼滤波数据同化,对于重构子午环流速度非常有利,可以将其用于重构子午环流的时空模式[66]。

Jouve 等[67]使用笛卡尔几何中的线性确定性α-Ω 发电机模型,将变分数据同化技术引入到α-Ω 型太阳发电机中,使用综合数据重建α 效应。Jouve 等的研究结果表明:通过这种简单的模型,变分数据同化给出了一种通过将误差最小化到极少的观测值来约束各种输入参数。通过定期间隔观测,变分技术能够较为准确地恢复α 效应的分布,产生的磁场与真实状态极为一致。

Svedin 等[68]运用变分数据同化方法估计分层对流模型中重建系统的状态误差,使用数值模拟对变化的噪声水平生成太阳对流区外部的垂直二维切片的综合观测值,利用3 DVAR 对系统状态进行误差估计,证明了在给定一组观测结果的情况下应用数据来获取准确模型估计的重要性。

威尔逊山天文台、威尔科克斯太阳观测台、基特峰国家天文台、全球振荡监测网络绘制的卡林顿概略图的空间与时间混合,没有如较差自转的校正。Worden 等[69]提出了包含较差自转、子午环流、超米粒扩散、随机通量爆发和数据合并的WH(Worden and Harvey)磁通量传输模型。虽然WH 模型提供了任何时刻太阳通量分布的最佳估计,但与卡林顿概略图一样,该模型也是通过插值和直接平均来同化数据,对模型和数据准确性进行了简化处理,不能解释光球层的区域相关性。为了解决这些问题,基特峰国家天文台和洛斯阿拉莫斯国家实验室开发了基于WH 模型的ADAPT 模型。该模型结合了集合最小二乘和卡尔曼滤波等多种数据同化方法,合并了数据和模型的不确定性,能够很好地给出瞬时磁通量分布[7]。通用ADAPT 模型框架如图2 所示*https://nso.edu/data/nisp-data/adapt-maps。

图2 通用ADAPT 模型框架Fig.2 General ADAPT model framework

在ADAPT 数据同化方法中,集合最小二乘(Ensemble Least Squares,ENLS)估计法同时考虑了模型和数据误差,但没有考虑空间相关性。ETKF 数据同化方法是一种能够自动考虑过去光球层不同区域相关性的递归算法。LETKF 数据同化方法可以更好地处理太阳磁场观测的独特性质。Hickmann 等[70]指出,在ADAPT 通量传输模型中,由于通过小的集合样本量引入了虚假相关,ETKF 的实现有许多缺点。ADAPT 将方差过多地限制在观测之外,严重降低了ADAPT 集合方差,这会导致集合崩溃,从而有效消除观测值的同化。

就数据同化的准确性而言,ETKF 与LETKF 方差减少的效果主要决定于调整光球层集合时要考虑多少观测值。而LETKF 与ENLS 主要区别是对ADAPT 集合进行了多少调整以与观测结果一致。利用ENLS 数据同化方法时,不考虑由通量传输模型引起的ADAPT 集合的空间相关结构。ETKF 与LETKF,LETKF 与ENLS 同化效果对比分别如图3和图4 所示。

图3 ETKF 与LETKF 同化效果的比较Fig.3 Comparison of ETKF and LETKF assimilation effects

图4 ENLS 与LETKF 同化效果的比较Fig.4 Comparison of ENLS and LETFK assimilation effects

Arge 等[71]利用VSM 视向全盘磁图数据生成太阳全局光球层磁场图时,将远端数据与ADAPT 模型结合起来,利用活动区已知统计和周期特性估计极性顺序和方向[72],提高全球磁场分布的估计,增加模型方差,在观测太阳边缘时促进新通量的快速同化。

Wang-Sheeley-Arge(WSA)模型[73]是经验和物理相结合的太阳风模型,WSA 模型利用太阳表面磁场的视向观测作为输入,产生的光球层磁场图可作为磁场势场源表面模型的输入[74]。势场源表面模型输出可以作为Schatten 电流片模型[75]的输入,为其提供更真实的日冕磁场拓扑结构。利用经验关系[76],在5~30Rs的外边界处确定太阳风速度。WSA 模型可以提供外日冕边界处的径向磁场和太阳风速度,这些值可以用于太阳风模型中,对太阳磁场瞬时全球空间分布进行估计。

对通常用于驱动日冕和太阳风模型的太阳光球层磁通量的演化进行建模,这对预测影响地面通信和制导系统的近地空间天气事件至关重要。Hickmann等[77]在集合卡尔曼滤波的基础上,采用小波基下的多分辨率分析来分离模型和观测值的尺度,其研究结果证明了可以对观测到的活动区域进行精确的数据同化。

3.5 在太阳风研究中的应用

基于MHD 或半经验的太阳风预测模型大多将观测值用作边界条件或初始输入。事实上,观测值不仅可以用作模型的初始边界条件,也可用于驱动太阳风预测模型以更好地表示系统,类似于数据驱动技术。

按照算法和模型之间的关联机制,数据同化分为连续数据同化和顺序数据同化两类。对于连续数据同化中的变分算法,Lang 等[8]利用2010 年10 月至2011 年10 月STEREO 在地球的前方/后方大约80°处观测到的光球磁场日冕模型提供的初始太阳风条件,将变分数据同化方法用于一个简单的太阳风传播模型[78],在1 AU 处进行太阳风预测。STEREO 数据同化改善了非同化状态下的近地太阳风估计,均方根误差降低18.4%,可以更新和改善太阳风模型的内部边界条件(在30Rs)。变分数据同化主要目的是通过在整个时间窗口内利用所有可用数据,校正初始时刻所考虑的变量。变分数据同化方法还倾向于计算给定观测值的状态概率分布,进而可以更新和改善太阳风模型的内部边界条件。

Lang 等[8]采用Burger 径向变分数据同化(Burger Radial Variational Data Assimilation,BRaVDA)方法。图5[79]定性概述了该方法的工作原理,通过使用日球层迎风外推时间相关太阳风模型[80],对2007 年11 月1 日 至2014 年9 月30 日STEREO-B 运行期间的太阳风进行27 天预测。与没有数据同化的预测相比,使用数据同化进行的初始预测使太阳风速的均方根误差降低31.4%,可以改善2007-2014 年之间的太阳风速度预测效果,并能够消除预测的均方根误差与STEREO-B 纬度之间的显著正相关性。

图5 BRaVDA 方案工作原理。内部边界(白色圆圈)使用来自地球轨道后方位置(黄星)的观测信息更新,更新后的模型条件(紫色区域)保留在模型域中,从而影响地球位置(黑色圆圈)的预测Fig.5 A schematic of how the BRaVDA scheme works.The inner boundary (the white circle) is updated using information from observations from a position behind Earth in its orbit (the yellow star).The updated model conditions (the purple regions) persist in the model domain such that they impact forecasts at Earth’s location (the black circle)

Merka 等[81]将太阳风和ACE,Geotail,IMP8,INTERBALL-1,WIND 太阳风航天器的IMF 观测数据同化到3 D 太阳风数值模型ENLIL,计算出1 AU 处的横向太阳风剖面。图6 给出了位于模型网格中心的观测点真值、观测值和分析结果[81]。从图6可以看出,分析值通常位于观测值与真值之间,这表明了该简化实验的可行性,说明数据同化可以为磁层研究提供更为准确的输入数据,改善对瞬变地球效应的评估。

图6 位于模型网格中心的真值(红线)、观测值(黑色虚线)和分析值(蓝线)Fig.6 Comparison of the truth (red),observations (black dashed lines),and the analysis (blue) at the observation point located in the center of the model grid

对于顺序数据同化中的LETKF,Lang 等[33]通过双实验,对LETKF 在ENLIL 太阳风模型[82]中的性能进行评估,研究LETKF 集合如何偏离概率密度函数演化,推断EMPIRE 框架下的数据同化影响。边界条件由0.6 AU 处每4.5 h 生成的密度、温度和动量的合成观测值结合WSA 日冕模型提供。对于LETKF 来说,仅需要指定观测时间步长、观测算子、误差协方差矩阵以及状态向量中两点之间的距离。LETKF 可以提高观测状态量,进而提高近地空间预报技术。

Innocenti 等[83]利用L1 点ACE 观测数据,将卡尔曼滤波顺序数据同化方法用于基于冕洞和快速太阳风关系的基线模型[84],预测1 AU 处的太阳风参数(质子速度、温度、密度和磁场)。该基线模型基于冕洞与快速太阳风之间的关系,由冕洞观测推断太阳风参数(质子速度、温度、密度和磁场)的线性关系式,即

图7 预测流程Fig.7 Forecast flow chart

Meadors 等[85]利用粒子滤波的顺序数据同化方法[86]推断固定时间窗口内的最佳值,介绍了源表面和界面半径的自动优化进展,并将太阳风模型的预测结果和卫星观测数据与最新开发的协议质量预测指标进行了比较。假设模型与观测值之间的一致性度量对应于WSA 模型两个关键参数(源表面和界面半径)的概率,其中最高度量值表示最佳半径。研究发现,第1901 卡林顿周期间太阳半径的最佳粒子滤波值可以达到WSA 模型预测性能标准值的两倍,并且这些值还减少了在太阳附近磁力线中看到的非物理扭结效应。粒子滤波可以改进对太阳风速和磁场极性的预测,该方法适用于WSA 模型在源表面半径和界面半径参数的非线性依赖预测精度。

3.6 在行星研究中的应用

迄今为止,尽管可获得的观测数据能用于约束模型,但尚未尝试将数据同化方法用于火星以外的其他行星大气。一般来说,将数据同化与火星观测结合起来的方法有两种。一是通常从定期两小时观测一次得到的极地轨道遥感测量温度剖面开发新的同化方案以利用预期数据的特征;二是对数值天气预报中的火星条件进行了重新调整[87]。

Lewis 等[88]使用来自MGS 的遥感温度剖面图,利用火星大气的完整通用环流模型进行了顺序数据同化。Kass[89]使用基于最优插值OI 的同化方法,将MGS 航天器的热辐射光谱仪观测值同化到火星大气环流模型[90]。同化结果表明:MGS 飞行制动期间北极地区的较低大气层(高达10 Pa)很可能处于或接近于二氧化碳冷凝温度;波的振幅更强,可能具有较低的纬向波数;表面压强场的瞬态分量随着温度数据的同化而发生变化。此外,对热发射光谱仪观测值的同化改善了无线电掩星观测与通用环流模型分析的总体一致性,数据同化还可以表示正确的波动行为[91]。

4 结论

本文概述了数据同化方法的常用算法及其在气象学、地质学以及空间科学的应用现状。数据同化方法最初来源于数值天气预报,其将物理模型与观测数据结合在一起,使模型与当前物理条件保持一致,能够提高预测水平,为数值天气预报提供初始场的数据处理,是提高数值天气预报精度的有力工具。由于大气海洋等数据容易采集,而且观测算子及误差协方差矩阵等容易确定,因此数据同化在气象、海洋以及电离层的应用比较成熟广泛。而由于卫星所处位置、仪器灵敏度等技术的限制,采集到的数据较为稀疏,不同地域模型可能对初始条件和驱动程序的敏感性不同,因此数据同化应用于空间天气研究可能存在问题[92]。

数据同化方法的局限性不仅包括应用领域和条件,还包括应用该方法时存在不可避免的误差。数据同化过程中的误差主要来自于模型误差、观测误差和不同的数据同化方法带来的算法误差。模型误差主要包括模型结构误差、参数误差、驱动数据带来的误差和模型计算误差。观测误差包括观测算子误差、仪器误差和代表性误差。图8 给出了模型演化和误差来源流程[93]。对数据同化中的误差处理方法进行研究,可以有效减少预报中的不确定性,提高预测精度。Zupanski 等[94]将集合数据同化、状态增强、参数和模型偏差估计结合在一起,在最大似然集合滤波的框架下,提出模型误差估计方法,并对模型误差估计方法在Korteweg-de Vries-Burgers 数值模型中的应用进行了评估。Zupanski 等的研究结果表明,减少估计偏差中的自由度数量有助于防止滤波发散,使滤波性能得到改善。Trémolet[95]提出了将模型误差表示为4 DVAR 控制变量一部分的弱约束4 DVAR 增量公式,认为背景误差协方差矩阵不能用作近似模型误差协方差矩阵,提出一种基于模型趋势统计的模型误差协方差矩阵,该方法可以在分析和背景场中提高对观测值的拟合度,捕获部分观测误差。但该增量公式不是长期同化窗口的最合适公式。

图8 数据同化系统误差来源及误差表现(箭头及序号表示模型向前演进的同化流程)Fig.8 Error sources and error characteristics of data assimilation systems (Arrows and serial numbers indicate the assimilation process as the model evolves forward)

当观测与系统状态变量之间存在线性关系时,滤波问题可以通过卡尔曼滤波表示[96]。在利用磁流体力学方程组模拟行星际背景太阳风,确定模型计算区域的边界条件时,通常需要引入观测数据作为输入参数,利用卡尔曼滤波可以快速给出这些自由参数的连续预估值[97]。卡尔曼滤波具有预测和滤波两个作用,在测量方差已知的情况下能去除噪声,估计动态系统的状态。卡尔曼滤波的不同实现方法也能对观测精度产生一定的影响,因此还需要考虑同化方法的选取问题。综上所述,进一步的研究将选取合适的同化方法,降低误差估计,并将同化后的观测数据用于模型内边界条件,从而提高模型的预测精度。

猜你喜欢

电离层太阳风卡尔曼滤波
基于深度强化学习与扩展卡尔曼滤波相结合的交通信号灯配时方法
基于无迹卡尔曼滤波的室内定位系统
空间环境因素对西北地区电离层空间特征影响
脉冲星方位误差估计的两步卡尔曼滤波算法
应贺共青诗社成立(新韵)
卡尔曼滤波在雷达目标跟踪中的应用
卡尔曼滤波在雷达目标跟踪中的应用
孕育地球的风
IGS组织的全球电离层数据分析与比较
听,太空的声音