风暴尺度集合卡尔曼滤波中的采样误差订正局地化方法研究

2017-05-30闵锦忠黄欣慧陈耀登杨春

大气科学学报 2017年2期

闵锦忠黄欣慧陈耀登杨春

摘要在中尺度WRF-EnSRF系统中最新引入的采样误差订正局地化方法不仅考虑了回归系数偏差，而且计算量较小。该方法基于状态变量和对应观测值的相关系数的分布关系，根据离线蒙特卡洛技术制作的关于集合数和样本相关系数的查找表格确定局地化系数因子，进而订正由集合数选取有限造成的背景误差协方差被低估引起的采样误差。本文利用风暴过程的雷达观测资料做了一系列风暴尺度的资料同化理想试验，探讨了采样误差订正局地化方法在风暴尺度集合卡尔曼滤波同化中的技术特点和同化效果。结果表明：相比于经验局地化方法，采样误差订正局地化方法能够有效地改善集合同化的效果，对距离的敏感度更低，尤其在天气系统发展变化较快的阶段，新方法优势更大。并且，对不同观测变量以及在风暴发展的不同阶段使用不同的局地化方法，所得的结果都存在一定的差异，因此需要根据同化对象合理地选择局地化方法。

关键词 EnSRF 采样误差局地化采样误差订正局地化

集合卡尔曼滤波同化由于其简易性和可执行性（Evensen，1994），在地球物理资料同化研究中得到广泛应用（Evensen，2006；Kalnay et al.，2007）。然而集合算法存在多种误差，如采样误差（Harlim and Hunt，2007；闵锦忠等，2015）、模式误差（Dee andTodling，2000；Hansen，2002；陈杰等，2012）、代表性误差（Daley，1993）、观测系统产生的描述误差（Eyre et al.，1993）以及总观测误差（Kistler et al.，2001）等。这些误差中，有限集合成员及线性假设造成的采样误差是集合算法中独有的误差来源，他低估了分析误差协方差，导致滤波发散。因此，开展集合卡尔曼滤波同化中采样误差的相关研究，对提高滤波同化的效果具有较高的理论和实际应用价值。

通过局地化方法来订正观测和模式状态变量之间的分析误差协方差（Houtkamer and Mitchell， 2000）是订正采样误差最常用的方法之一（Hamill，2001；Houtkamer and Mitchell，2001；Harlim and Hunt，2007）。鉴于有限集合不能正确估计远距离观测和模式状态变量问的微弱相关，为抑制分析场引入的高频噪音，Houtekamer and Mitchell（1998）提出“截断方法”，选择不使用距离半径以外的观测来更新状态量，为最原始的局地化方法。Gaspari and Cohn（1999）在此基础上提出由多项式近似理论支撑的局地化方法，依据确定的距离半径调整局地化权重系数。但这两种方法不仅选择距离半径相当费时，而且权重系数完全依赖于距离半径，滤除距离半径以外所有观测量的影响，在物理机制上不符合真实大气的规律。

为避免截断方法的缺点，众多学者开展了相关研究，如Ott et al.（2004）采用局地集合变换卡尔曼滤波法（LETKF）在局地区域进行同化，通过对背景误差协方差矩阵进行特征值分解，同化过程中将模式状态向量投影到由特征向量构成的内部坐标系统上，最后再将局地分析向量投影回全球大气的模式状态向量中。Bishop and Hodyss（2007）提出自适应局地化思想，伴随背景场误差协方差的更新，及时更新权重系数，赋予局地化方法流依赖的特点。An-derson（2007）给出的自适应的分级集合滤波局地化方法，将集合分成多个小组，形成一系列的回归系数来寻找使状态变量的集合期望平均值和均方根误差最小的回归置信因子。刘硕（2012）将该方法引用到WRF-EnSRF同化系统。分级集合滤波局地化方法一定程度上克服了截断误差的缺点，但却忽略了回归系数的偏差，以及对多组集合的计算造成了计算量问题。

为解决回归系数偏差和计算量的问题，Anderson（2012）提出了采样误差订正局地化方法，不仅考虑了回归系数偏差，而且计算量较小。该方法不再只依据观测和状态变量之间的相關性而忽视集合尺度对局地化的影响来确定局地化权重系数（Bishop and Hodyss，2009a，2009b；Chen and Oliver，2009），而是根据采样误差在集合卡尔曼滤波中的特征，利用离线的蒙特卡洛（offiine Monte Carlo）技术构造出与样本相关系数和集合尺度相关的局地化函数。Anderson（2012）对采样误差订正局地化方法的研究仍停留在对Lorenz模式和大尺度模式的应用中，而本文将采样误差订正局地化方法应用到风暴尺度集合卡尔曼滤波的研究中，探讨该方法在中小尺度天气中的应用性。

1 WRF-EnSRF同化系统局地化方案介绍

1.1经验局地化方法

本文研究基于自主构建的WRF-EnSRF同化系统上（王世璋等，2009），该同化系统与预报模式相对独立，系统内部各观测类型的同化模块也相互独立，满足易于移植和扩展的要求。WRF-EnSRF原系统中采用Houterkamer and Mitchell（2005）提出的经验局地化方法，并用“schur”算子将局地相关的分段有理函数作为局地化权重系数R运用到集合协方差上：

采样误差订正局地化方法每同化一个观测量时则更新一次局地化权重系数，具有流依赖特性，且权重系数不再与距离半径相关。系数查找表格的制作并不占用同化时间，不会带来计算量过大的问题。目前采样误差订正局地化方法已被应用到Lorenz模式和大尺度天气模式中，针对各向异性的中小尺度天气系统引用采样误差订正局地化方法更加具有实际意义（Anderson，2012）。

2资料和同化方案设计

资料选取WRF自带的超级单体风暴个例（1977年5月20日发生在美国俄克拉荷马中部德尔城的一次典型超级风暴），初始环境场根据Tongand Xue（2005）提供的单点探空资料运行生成，为触发对流在水平（30，50）的格点位置上方加入一个长轴半径6 km短轴半径1.5 km且强度为3 K椭球体热泡。理想试验中使用的多普勒模拟雷达资料根据王世璋等（2013）的模拟结果，通过径向风和反射率的观测算子模拟生成，其中径向风由风场信息反演获得，并由垂直速度传递水物质的信息；而反射率算子完全由水物质量构成。其他具体的参数设置参见Tong and Xue（2005）中的设置。为检验采样误差订正局地化方法在风暴尺度集合卡尔曼滤波同化系统的效果，使用同真实场模拟（王世璋等，2013）相同的模式配置。

同化试验分为基础对比同化试验（表1）和混合同化试验（表2）两组试验。基础对比同化试验分析新局地化方法的实现性和特点，其中试验1主要对比经验局地化方法和采样误差订正局地化方法的应用结果，验证方法的可行性和实现能力，试验2仅同化径向风的同时改变与温压风场相关的局地化半径，测试局地化方法对距离的敏感度度。混合同化试验（表2）根据试验的结果以及各观测算子的特性，比较对不同观测算子以及不同风暴类型运用不同局地化方法后的结果。

两组试验均预报到第20分钟时对全场添加一组40个成员的随机扰动，扰动满足N（0，1）正态分布，风场的三个分量（u，v，w）的标准差均为4.5 m/s，位温为2 K，水汽混合比为0.005 kg/kg。加扰后进行集合预报至25 min后开始同化模拟雷达观测资料，每隔5 min同化一次至第90分钟同化结束。模式预报的水平范围均为200 km×200 km，水平分辨率2 km×2 km，垂直范围为20 km，垂直分辨率为0.5 km。径向风观测误差为2 m/s，反射率的观测误差为3 dBz；同化过程中采用协方差松弛膨胀法，分析误差协方差权重为0.5；除试验2本文所有试验的垂直局地化距离都是2 km，水物质的水平距离半径4 km，温压风场的水平距离半径6 km。

3试验结果分析

3.1基础试验结果分析

3.1.1采样误差订正局地化方法可行性验证

对比真实风暴在各个时段的演变特征（王世璋等，2013）可见，60 min前风暴处于快速发展变化的阶段，之后风暴结构相对稳定，基本以线性发展和直线移动为主。图1给出了真实风暴和试验1在三个同化时次风暴要素场的水平结构特征，第40分钟时各试验模拟出的风暴均出现了分裂，对流中心附近水平风场结构也已基本建立，试验1的两组结果对应的水平风场环流中心和上升气流中心的强度和范围都较真实风暴明显偏弱，对流云团的强度和范围也显著偏弱和偏小，采样误差局地化方法的对流云团的强度相较于经验局地化方法有所增大。第60分钟试验1的结果已和真实风暴相当近似，上升气流中心和水平环流中心的强度和范围较20 min前都有所修正，中心强度仍偏弱，而采样误差订正局地化方法的对流中心强度较强。同化结束时刻，同化模拟出的风暴形态与真实风暴更吻合，在第40分钟的风暴中心位置上出现了一个新对流，但对应在试验1的两组同化结果中都没有体现出来。分析说明引入局地化方法后能够大致模拟出风暴的形态，证明采样误差订正局地化方法能够应用于WRF-EnSRF同化系统，且在第60分钟前由采样误差订正局地化方法可以获得更好的同化结果。

3.1.2距离敏感度分析

采样误差订正局地化方法的观测对模式状态量的影响权重不同于经验局地化方法，不依赖于局地化半径，但同化过程中远距离的观测量仍易产生不可避免的虚假相关，在风暴发展的初期影响范围较小使用小距离半径能减少远距离观测的虚假相关，但随着风暴的发展风暴尺度增大，较小的局地化距离半径易忽略有用的观测信息，所以对局地化方法选取合适的局地化距离半径是有必要的，同时合适的局地化距离半径可以节约计算时间。

图2分析发现同一局地化半径应用不同的局地化方法时，除个别水物质相关的变量外采样误差订正局地化方法的NSEE都更低，而比较不同局地化条件下相同方法的均方根偏差发现采样误差订正局地化方法结果差异更小。综合以上特点说明使用采样误差订正局地化方法后的同化结果对局地化距离的敏感度小于经验局地化方法。这是因为采样误差订正局地化方法不再局限于距离半径而存在，从而能够传递更多合理的观测信息使结果对距离的敏感度降低。

3.1.3加入反射率的同化

仅同化径向风主要改善了风场信息和雷达强回波带的位置，但同化反射率能改善模式中微物理量和動力场的配置（刘寅，2011），使回波的形态接近更真实风暴。试验3中同时同化径向风和反射率以试图结合两者的优点使模拟结果更接近于真实情况。对比均方根误差（图3）发现使用采样误差订正局地化方法后的均方根误差整体上低于使用经验局地化法的均方根误差，此优势主要表现在第60分钟前，即风暴快速发展期间，其间采样误差订正局地化方法的均方根误差快速下降，随后收敛，这一现象说明新方法在风暴迅速发展时段能传递更多有效的观测信息，也可以认为offline Monte Carlo技术计算的局地化权重系数更有利于订正观测和模式状态量间的关系。

试验3中风暴要素场中各变量的结构特征得到了明显的修正。图4给出风暴要素场垂直剖面结构特征以便分析动力和热力场的配置，可以看出5 km高度上的要素场分布在加入反射率同化以后第40分钟的同化结果就已接近真实场，真实风暴已发展到有15 km高度的深对流，对流中心高度接近12.5km，采样误差订正局地化方法订正后的风暴高度接近真实高度，而经验局地化方法模拟出的对流高度偏低。真实风暴对流区域的后部对应底层辐合高层辐散的倾斜上升气流，前部则是下沉气流，形成不对称的次级环流有助于局地对流的发展；后部上升区则存在深厚的暖区中心，这种热力配置为上升运动发展提供有利条件，积蓄有效位能，和动力结构配合易形成不稳定层结，维持风暴发展。但在使用经验局地化方法时，前部的下沉气流中却也存在这样一个暖区，减弱下沉气流的趋势，一定程度上削弱垂直风场的非对称性。综合对比发现采样误差订正局地化方法得到的物理场配置更符合对流发展和维持的机理。第60分钟时采用采样误差订正局地化方法对流的强度和范围都得到相应的增大，但经验局地化方法因正反馈配置的减弱不能很好的触发对流发展，对流强度偏弱。同化结束时刻风暴发展稳定，真实场暖区中心增强，风暴前端出现了大小为5 K的扰动位温中心，采样误差订正局地化方法在风暴前端形成模拟出与此一致的扰动位温中心，而经验局地化方法得到的位温中心呈现东西走向、狭长且面积偏大。

基础对比试验的结果验证了采样误差订正局地化方法可以应用于WRF-EnSRF系统中，同化效果也得到一定程度的提高，同时发现采样误差订正局地化方法相较于经验局地化方法能捕捉更多有用的观测信息，从而对距离的敏感度更低，另外加入反射率的同化订正了水物质变量而显著提高要素场的同化质量。

3.2混合试验同化结果分析

根据试验3的均方根误差（图6）显示第60分钟前采样误差订正局地化方法的均方根误差相对更低，但随着同化时次的递增经验局地化方法的均方根误差相对有更好的收敛效果。此现象的产生与两种方法局地化权重系数的选取有关，经验局地化方法中观测对模式状态向量的影响关于距离是单调递减的，所确定的权重系数是一个给定的系数值，而采样误差订正局地化方法的局地化权重系数有自适应特征，且不严格依赖于局地化距离，在原理上存在强非线性。依据局地化权重系数的水平特征分布（图5），采样误差订正局地化方法中观测对每个状态变量的影响在大体上满足远距离处权重系数较小的特点，但是在一定距离范围内其权重函数系数的分布形态与经验局地化方法的基本不同。经验局地化方法的权重系数的等值线是均匀分布的，采样误差订正局地化方法的等值线却无规律，反映出新方法的非线性特征，且各状态变量的权重系数形态也不同。而在风暴发展初期非线性发展为主，采样误差订正局地化方法的局地化函数体现了这一特性，则第60分钟前同化结果优于经验局地化方法的结果；而之后风暴趋于线性发展，经验局地化方法的均方根误差更收敛。

针对以上现象为使局地化方法最大可能的发挥优势，对两种局地化方法进行组合。在同化时间顺序上混合两种局地化方法，试验4在第60分钟后将采样误差订正局地化方法换为经验局地化方法继续进行同化（表2），混合试验4和试验3-2的均方根误差曲线在前35 min重合，而后期混合试验有效收敛（图6）。对比第90分钟同化结束时刻的要素场（图7），对比试验3-1试验4雹霰混合比的中心位置和范围得到了矫正，对比试验3-2风暴附近原有的虚假回波消失，垂直速度中心的强度提高了约5 m/s，更接近真实风暴，证明了在风暴稳定发展阶段，经验局地化方法能更好的订正采样误差。

采样误差订正局地化方法应用后，风暴发展期间的同化效果具有一定的提升，且和经验局地化方法不同的是采样误差订正局地化方法中各状态量的局地权重系数分布不同（图5），尤其对于水物质变量分布差异更大，所以假设新方法对两种雷达观测资料的同化结果影响不同。因此设计试验5（表2），对不同观测算子应用不同的局地化方法。

定量分析均方根误差（图8），对比同化径向风时使用不同局地化方法，而同化反射率时均采用采样误差订正局地化方法（试验5-1和试验3-2），以及同化反射率时均使用经验局地化方法（试验5-2和试验3-1）。同化结果表明每组试验对比的均方根误差曲线走势都大致相同，即两种方法对同化径向风结果影响不大。同样比较试验5-1和试验3-1，以及试验5-2和试验3-2，确保同化径向风时均采用相同的局地化方法，而同化反射率时采用不同的局地化方法，两组试验的均方根误差曲线走势却不同，但随同化时次的推进，差别逐渐减弱，认为两个方法对反射率同化结果的影响存在差异。

以上现象根据径向风和反射率特征分析其原因，径向风的观测算子主要反映的是风场信息，且两种局地化方法对风场权重系数分布相似（图5），因此两个局地化方法对同化径向风后的结果影响度相似；而雷达反射率的观测算子由水汽相关量构成，而采样误差订正局地化方法和经验局地化方法计算出的水物质场的权重系数差异大，有明显的非线性和线性之分，所以不同局地化方法对反射率同化后的结果存在差异大。特别在对反射率同化使用采样误差订正局地化方法的试验中，风暴快速发展阶段均方根误差快速削减，这是因为采样误差订正局地化方法对水物质产生强非线性权重系数符合反射率和风暴发展的特点，有利于缩短模式spin-up的时间。

综合对比各混合同化试验结果发现，对不同的观测量针对他们的特点选用不同的局地化方法，能够有效提高同化质量，乃至针对风暴發展的运动性质，对不同同化时次使用不一样的局地化方案也能获得更好的同化效果。

4结果和讨论

本文基于WRF-EnSRF同化系统，通过引入采样误差订正局地化方法，利用WRF中自带的一次超级单体风暴完成一系列风暴尺度的资料同化理想试验，并与经验局地化方法对比，详细讨论了采样误差订正局地化方法在风暴尺度集合卡尔曼滤波同化中的实际应用特性和同化效果。研究主要得到如下结论：

1）不考虑模式误差的理想试验中，仅同化径向风采用采样误差订正局地化方法，随同化时次推进模拟出的风暴能够接近真实风暴，证明了采样误差订正局地化方法的应用能力和可行性；对比应用采样误差订正局地化和经验局地化两种方法后的同化结果，证实采样误差订正局地化方法可以获得更准确的风暴要素场。

2）采样误差订正局地化的权重系数根据状态变量和对应观测值的相关系数的先验分布关系，由离线蒙特卡洛技术制作的关于集合数和样本相关系数的查找表格确定，不再依赖于距离半径，因此相对于经验局地化方法对距离半径的敏感度较低。另外，采样误差订正局地化方法随同化时次不断更新权重系数，体现出流依赖的特性。

3）在风暴非线性快速发展阶段，因为采样误差订正局地化方法本身具有强非线性特征，所以同化效果比经验局地化方法好；但对处于稳定且线性发展阶段的风暴，相对于采样误差订正局地化方法，具有线性特征的经验局地化方法的均方根误差得到更好收敛。在风暴发展的不同阶段，选用不同的局地化方法更有有利于同化结果的优化。

4）相对于所有的状态量，两种局地化方法关于风场的权重系数分布近似，混合试验结果也证明同化径向风时两种方法获得的同化结果相似；而两种方法关于水物质量的局地化权重系数分布差异大，所以在同化反射率时两种局地化方法的同化结果存在差异。因此对不同观测量针对其自身的特性选用相应的局地化方法能够更合理的改善同化结果。

本文完成了对WRF-EnSRF同化系统中采样误差订正局地化方法的测试，以及其特点的分析，同化试验也获得初步成功。但是本研究仍是基于模拟雷达观测资料的基础上完成的，该方法对于实际雷达资料应用能力还有待进一步验证，更加全面的研究采样误差订正局地化方法在EnSRF同化系统的应用性对在业务中发挥WRF-EnSRF同化系统的优势有着重要的意义。