建立我国数值预报同化诊断系统的行动方案顶层设计
2023-05-11朱国富
朱国富
(中国气象局地球系统数值预报中心,北京 100081)
0 引言
数值天气预报已成为公认的现代气象事业及其发展的最核心的科技。资料同化是数值天气预报的一个主要组成部件,它基于统计最优估计方法产生大气状态的最优估计,来提供预报模式的尽可能准确的初始条件。更精确的资料同化方法的使用,诸如“四维变分同化方法”和“同化系统误差参数设定的优化改进”这些主要科学进展,连同“可利用观测资料的大量增加”,使得预报模式的初始条件得以改善,真正带来了数值预报性能的显著提高[1]。
历经多年,数值天气预报中资料同化系统已经发展成非常复杂的系统。现在的同化系统要处理非常广泛的空基、地基多种来源的气象观测数据,将这些数据与大气状态的先验信息结合起来,并使用综合复杂的预报模式线性化模型进行四维资料同化以确保观测信息得到与模式动力一致的传播和吸纳。对如此复杂的系统,进行有效和协调的诊断是必要的,例如,仅就被同化的观测数量,近几十年来呈“指数级”增长,未来还将继续增长;这需要基本的诊断工具进行一整套日常例行的观测信息监控来保障正常的信息输入,并需要复杂先进的诊断工具评估数据质量和信息冗余,以便对最有希望的观测进行优先排序处理。同化诊断中观测信息监控的一个经典例子是,利用1981年月平均资料,欧洲中期天气预报中心(ECMWF)同化系统发现,在距离开普敦东南2300 km的一个南印度洋孤岛(南非Marion Island)上,背景风和观测报告风之间平均有10°~12°的系统性差异。对此进行的一项调查显示,多年前安装计算风向的软件时,指定的风向参考是磁北极,而不是地理北极!之后ECMWF在1982年开启了一个业务和研究部门间的重点合作研究项目,发现一些观测平台在持续地发送不正确的天气报告,甚至有些简直不按照约定标准编写数据代码!1985年,ECMWF被世界气象组织(WMO)指定为监测全球高空资料的领导中心[2]。这是ECMWF之所以成为领导中心地位的一个具体经历。可见,也正是源自观测信息监控,可以理解对分析场产生有害影响的观测黑名单是作为基础一环的质量控制方式。
诊断一直是ECMWF研究和开发的一个活跃领域。而且,数值预报系统的诊断是ECMWF总体战略所必需的组成部分:面向ECMWF发展“从此处向何处去”,一个诊断战略是必不可少的[3]。
诊断工作不仅仅是获得一个总体了解,因为诊断是面向数值预报系统的所有环节及其组成部分,所有的研究人员都需要在自己的特定领域中制作相应的详尽诊断。另一方面,随着数值预报的发展,不可避免地,制作出预报的所有环节任务更加细分化和专门化。正是如此,提出了一个问题:未来我们是否需要加强跨传统部门界线的沟通、协调和协作。面对这一问题,2010年ECMWF成立了“诊断工作组”(WGD:Working Group on Diagnostics),并作为WGD的第一个主要成果撰写出技术报告“诊断研究进展”(Developments in diagnostics research)[3]。这份报告为考虑一般意义的诊断策略提供了借鉴,并为从无到有地开展常态化同化系统诊断工作提供了参考,包括诊断的要义、诊断工作定位的角色作用及其实现途径或方式、诊断工作内容的框架等基本方面,例如数值预报的诊断框架(图1)。
从图1可以一般地描述数值预报意义上诊断工作的目的:深入动力框架、物理过程、资料同化各个组成部分,通过识别系统的缺陷、减小各环节的偏差、改进物理过程不确定性和观测不确定性的描述等工作,来识别、调查和理解数值模式系统的预报性能问题和模式气候状态,以助力数值预报系统发展战略的实现;并在所涉及的工作中将研究和业务的各个部门联合起来。
后来ECMWF的诊断工作[4],其目的不变。诊断工作的发展体现在以下方面:诊断的施展空间面向预报系统在“所有预报时效”敏锐度和可靠性的改进;诊断以“极端天气预报”为目标;与诊断关联的互动超越ECMWF内部的研究和业务各部门而扩大到ECMWF成员国之间。而且,预报系统(以及观测)的准确性不断提高,意味着误差比以往任何时候都要小,需要发展更精确的诊断工具来量化这些误差。
本文将面向中国气象局(CMA)四维变分同化系统自主研发的现实状况和发展需求,思考国际上气象数值预报先进业务中心的相关工作,结合在CMA同化系统自主研发实践中的理解,形成建立CMA常态化同化诊断系统的顶层设计,旨在初步形成一套日常例行的同化诊断能力。
1 ECMWF诊断工作的启示
1.1 诊断的要义(是客观要求的“问题导向”,不是主观的“找事情”;是“理解”,不是“较真”)
对于不同工作和人群的视角,“诊断”看似有不同的解释,但所有的解释都体现了“理解”这一概念。像ECMWF这样的业务预报中心的诊断工作属于“对(预报系统)误差的诊断”(diagnosis of error),是调查、发现和理解数值预报系统中观测、分析或预报各环节的误差,进而解决问题来推动数值预报的发展。ECMWF诊断工作组从成立之初的2010年到2019年,尽管具体的诊断工作和诊断工具有了发展更新,但不变的是诊断要义:理解[2-3]。这对开展诊断工作的启示是:数值预报系统的诊断是通过“问题导向”来调查研究制作出预报的各环节的误差,和通过“理解”来推动数值预报的发展,也就是它“基于问题、归于理解和终于协作”来解决问题。
事实上,这对于我国CMA数值模式的自主研发更有着现实意义。自主研发基于理解,理解是科技自主自强的首要要求,是气象核心科技数值预报高质量发展的前提条件,不追求理解的自主研发是不可思议的。注重理解也是科学家精神的基本内涵。
1.2 认识诊断工作的出发点(首要在“前端”和“基本”)
在ECMWF最初成立的诊断工作组的诊断研究进展[3]中,观测信息监控(Observation monitoring)是ECMWF诊断系统的一个关键组成部分;其中的许多诊断是基于观测空间下背景场(B)和分析场(A)与观测(O)的离差,即所谓的(O-B)和(O-A)。对于再分析的诊断,重点是数据的时间一致性。ECMWF集合预报系统的诊断集中关注“集合离散度和集合平均误差之间的不一致性”如何与“初始条件和预报模式中不确定性原因的描述缺陷”关联起来。从中我们能联系到其中内在的原因和事实:
1)对于观测信息监控,许多诊断基于(O-B)和(O-A)。这是因为对(O-B)和(O-A)进行的数据统计为观测、同化或预报等方面的特征描述提供了强有力的基础,而且其中的(O-B)(称作“新息”(innovation))是同化系统的基本输入,是用来更新背景场而得到分析场的、用作订正的新信息;如果基本输入错误,则直接对分析场产生有害影响,如引言中的观测信息监控的一个经典例子[2]。
2)对于再分析,它是基于观测、同化、预报三个串联方面的先进性和一致性来得到先进的稳定一致的长时间序列格点资料。其中观测数据的时间一致性不仅处在这个串联链条的最前端,而且是再分析的关键性重点;因为再分析是基于使用当下最先进的业务同化系统和预报模式系统而制作出来的,这样再分析中同化和预报这两个方面的先进性和一致性而自然得到了保障。
3)对于集合预报,评估集合预报可靠性的一个通用诊断是集合离散度和集合平均误差之间的关系[5]。“概率预报崩溃”被定义为当集合离散度很小、但集合平均误差很大时发生的情况。因此集合离散度和集合平均误差是集合预报诊断中必需首要考虑的“基本所在”。
这些对我们开展诊断工作的启示是:诊断工作首要和首先从“链条前端”和“基本所在”开始。为此,需要在认知上理解清楚“哪些是基本的”和在实施上考虑哪些是“现在能做的”和“客观上必须做的”。
1.3 诊断工作的架构和范围(所有环节及其组成部分)
数值预报的步骤过程表现为:通过资料同化方法得到分析场,由它作为预报模式的初值;然后积分预报模式到未来某一时刻,便得到该时刻的预报场。相应地,数值预报系统有两个主要组成部分:初值形成的资料同化系统和时间积分的预报模式系统。资料同化系统包含引入各类观测的若干观测算子和作用于每一个观测来传播观测信息的一个核心框架;预报模式系统包含一个动力框架和若干物理过程。通常地,预报模式动力框架是指预报模式方程的绝热、无摩擦的网格尺度动力过程,各个模式物理过程是指不同的源、汇项或不同的次网格尺度物理过程(如深/浅对流过程、辐射过程、大气边界层过程和陆面过程)。
诊断是面向数值预报系统的各个环节及其组成部分。因此,数值预报系统诊断工作的架构包括资料同化诊断和预报模式诊断两个部分。预报模式的诊断范围包括动力框架诊断和各个物理过程诊断。
因为资料同化是上接各类观测、下连预报模式的一个综采工作面(coal-face),因此它的诊断范围是巨大的,而且随着观测日益增加在不断增长扩大。资料同化的诊断范围包括面向观测(O)的观测信息监控、面向(O-B)和(O-A)统计特征描述的诊断及其观测质量的监测和评估、面向得到分析场之求解过程的监控和分析、面向同化系统预先设定的误差参数的诊断、面向分析场(A)的观测对分析的敏感性评估、面向模式预报效果的观测对预报质量的影响评估等。
1.4 诊断工作组的角色定位(把各个部门联合起来,加强跨部门的“交流”“协调”和“协作”)
随着数值预报的发展,生产出预报的所有环节任务更加细分化和专门化;同时,把各个部门联合起来的作用(the unifying role)又随之日益变得越来越重要。正是在这个背景下,ECMWF成立了诊断工作组(WGD),来加强跨部门的交流、协调和合作[3]。WGD的第一个任务就是明确界定这些角色作用:
1)合作课题的监督(the over-sight of collaborative projects)。一些很好的例子如:现有同化或预报问题需要协作开展的诊断;预报系统升级时所需的各环节诊断评估;改善灾害性天气预报的交叉性诊断课题(涉及该类天气的识别方法,预报系统对其预报能力相关的所用资料的同化和关键物理过程的描述等评估,集合预报系统是否能够足够地表示其发生的可能性等调查研究)。除了这些明确主题的合作课题,还可能从中产生未来的诊断领域或开发新的诊断工具。
2)诊断工具研发的战略协调(the strategic coordination of diagnostic developments)。包括:共同感兴趣的新诊断工具的研发,如对于物理过程诊断工具的研发,因为未来随着模式变得更好,物理过程的改换对模式气候的影响应该会更小并需要更精确的诊断工具,以及物理过程数量的增加大大增加了相互作用的范围,这些因素都要求新诊断工具的研发及相关环节的研发协作;使现有诊断工具得到更广泛应用的战略协同,如诊断工具的通用脚本语言的使用和更广泛可操作的界面接口,以及诊断工具的持续维护和文档化;需要确保诊断在计算和存储资源方面得到满足。
正是通过这些角色作用,ECMWF诊断工作组利用诊断研究,理解业务数值预报的优势与不足,发现问题并研讨确定解决问题的方案,确立了它在模式进展中的中心地位,推动数值预报系统多年来取得了许多重要的进展[6]。
这些对我们开展诊断工作的启示是:把各个部门联合起来的“融合发展”是诊断工作组的工作属性;“能协作得起来”的客观要求是数据存取格式和图表绘制显示的通用性、共用性,而且特别是高度的灵活性,因为它们是诊断工作的基础性支撑:诊断中为了发现、分析问题,需要大量的数据和图表,来以此为基础进行各种各样的对照比较和数据统计。
上述合作、协调和交流的角色作用对我们建立诊断工作组以及如何发挥作用和从无到有地开展诊断工作提供了直接参考。事实上,在ECMWF专家的一直关注下[6],中国气象局地球系统数值预报中心的一个实体诊断小组已经成立;ECMWF专家还建议:应该考虑制定一项战略来确定诊断小组的主要优先任务,包括建立一整套日常例行的诊断,旨在监测和指导数值预报系统的改进。
2 CMA常态化同化诊断系统的顶层设计
CMA同化系统采用四维变分同化方案。变分同化方法是大气状态的后验概率最大时取众数的统计最优估计方法;导出变分同化目标泛函的一个基本假定是“观测和背景场的误差无偏且为正态分布”。CMA四维变分同化系统在业务实施上利用一种增量方法[7],考虑内外循环,进行目标泛函的极小化迭代数值求解,来减少计算开销。
CMA同化诊断系统面向CMA同化系统的各个组成部分和业务同化系统研发的环节步骤,理清“现在能做的”和“客观上必须做的”基本所在,以程序流的全过程和业务研发的内在逻辑进行顶层设计。
2.1 同化诊断的总体架构
首先理清楚任一同化系统运行的组成部分和业务同化系统研发的基本环节步骤:
1)同化系统中的程序流表现为观测输入、求解过程和结果输出。
2)现行的先进同化方法都属于统计最优估计方法,因为它们基于数据误差是高斯分布等假定,所以都存在预先设定的参数;对于一个业务的同化系统,在其建立之后,不论是必需的不断优化改进,还是要考虑系统中参数的季节变化,都首先是需要诊断预先设定的参数是否合适。
3)对于不断涌现和更替的新资料,是否能进入业务数值预报系统,必需对新资料的准入进行诊断评估;面向观测—预报交互式数值预报,需要诊断评估观测对分析或预报的敏感性影响。这些都是基于同化系统的诊断。
1.1.3 CKD-MBD诊断标准 参照2013年中华医学会肾脏病学分会颁布《慢性肾脏病矿物质和骨异常诊治指导》[8]拟定:(1)血清钙(Ca)、磷(P)、甲状旁腺激素(iPTH)或维生素D代谢异常;(2)骨转化、矿化、骨量、骨线性生长或骨强度异常;(3)血管或其他软组织钙化。符合以上三点之一即可诊断为CKD-MBD。
由此按照同化系统的程序流和业务同化系统研发的内在逻辑,形成同化诊断的总体架构:
1)利用同化系统的“输入信息”进行诊断。
2)利用变分同化的“执行过程”进行诊断。
3)利用同化系统的“输出结果”进行诊断。
4)面向业务同化系统研发精雕细刻的“参数优化”进行诊断。
5)面向业务同化系统的新观测资料准入进行诊断评估。
这些在一起能够初步形成一套日常例行的同化诊断能力。
2.2 同化诊断的内容及其途径和作用
2.2.1 输入信息的诊断
这在内容上属于观测信息监控。观测信息监控处在整个数值预报系统诊断的前端,也是ECMWF诊断系统的一个关键组成部分。
观测信息监控包含了观测资料计数及其空间分布的监控和输入信息的诊断。资料计数包括到报的资料数、被筛除的资料数、被同化的资料数,空间分布包括各类观测的总体和不同层(或通道)的空间分布。输入信息的许多诊断是基于观测空间下(O-B),如它的统计特征描述,包括均值、均方差、偏差订正、频数分布(对应概率密度分布PDF)等。利用(O-B)的信息,在了解数据、认识数据上有诸如以下的许多作用:
1)用来监控资料同化中观测亦或背景场的误差是否无偏和正态分布,以及监控观测资料处理的偏差订正。
2)它的时序资料可用来监控观测资料的时间稳定性、质量控制有效性和观测质量,确保只有始终如一好质量的资料在业务中被同化使用。
3)利用它和其他观测进行比较,来监控观测的质量。
事实上,观测空间下(O-B)和(O-A)数据统计为观测、同化或预报等方面的特征描述提供了强有力的基础,许多诊断是基于此,因为(O-B)和(O-A)的监控对资料同化过程的上、下游都发挥作用,除了上面的作用,如对上游:用于同化系统中误差参数的预先设定即下面2.2.4节“参数优化的诊断”;如对下游:当不同观测都一致发现(O-B)的系统性的非零值时可突显出预报模式问题。
2.2.2 执行过程的诊断
这是面向得到分析场的求解过程进行的诊断。极小化求解迭代是否收敛和收敛程度,分析值受其直接影响。所以一个基本的方面是需要通过极小化的迭代步数、目标泛函值下降率、目标泛函梯度下降程度等的监控和分析,来诊断目标泛函求解的收敛情况。
2.2.3 输出结果的诊断
这是面向分析结果进行观测对分析的敏感性评估。通常地,根据分析场(xa)与观测(yo)和背景场(xb)的关系:xa=xb+W[yo-H(xb)](其中,H为观测算子,W为最优权重矩阵),利用变分同化系统核心框架中的变量变换和同化系统观测算子的切线性模式及其伴随模式,通过伴随技术可以相当严谨地得到各个观测对分析场的敏感性。还可以比较简单地利用变分同化系统目标泛函的观测项(Jo),通过由(O-B)和(O-A)计算的目标泛函值来大致地评估各个观测对分析场的相对贡献。
面向分析场的诊断可用来评估不同观测的贡献作用多少、是否信息冗余和可能的数据质量,以便对最有希望的观测进行优先排序处理和应用于观测—预报交互式数值预报。
2.2.4 参数优化的诊断
同化系统误差参数包含于xa=xb+W[yo-H(xb)]中的最优权重矩阵W,所以直接左右了分析结果xa。因此,诊断预先设定的误差参数是否合适是同化系统自主研发在系统建立之后需要考虑的固有步骤,以及应用已有或他人同化系统时进行参数优化改进的必备环节。
可以利用(O-B)和(O-A),通过观测空间的后验诊断方法[8-9]进行新息、背景场误差、观测误差的一致性诊断和分析误差的诊断:,R表示观测误差协方差矩阵,B表示背景场误差协方差矩阵,H表示H的切线性模式,上角标T表示矩阵(或向量)的转置,HBHT为观测空间下的背景场误差协方差,HAHT为观测空间下的分析场误差协方差)。
通过计算出的后验诊断值与同化系统中的预先设定值的比较,用来诊断同化系统中预先设定的误差参数是否合适,以及如果不合适时给出调优改进的方向。
2.2.5 新种类观测资料准入的诊断评估
这是面向模式预报进行观测对预报的影响评估。通常地,对现有的所有观测,通过观测系统试验(OSE)(考虑逐个观测排除的一个时段预报试验(data denial experiments),即逐个观测排除敏感试验),来诊断评估不同设置的各种类观测对预报质量的影响。对于新种类观测,通过一体化设计的观测系统模拟试验(OSSE)和OSE,来评估新种类观测资料是否准入。正是这样的诊断评估保障了使用所有资料的控制预报试验的预报质量最好。
3 开展这项工作的主要优先任务和开端性思考
3.1 主要优先任务
巧妇难为无米之炊。同化诊断工作的前提和基础是必需同化诊断必备数据的数据库建设。首要是观测空间的数据,其最基本内容包含:观测值yo、观测误差标准差σo、质量控制标识IQC、观测偏差bo、背景场的观测相当量yb、分析场的观测相当量ya。也由此得到(O-B)和(O-A)数据。
必须用利于通用性、共用性、特别是高度灵活性的观测空间数据库和模式空间数据库的数据存取格式;它们是诊断工作的最基础性工作和保障性支撑,也是保障“能协作得起来”的客观要求。
在同化诊断工作的内容上,首要是针对观测资料数统计和利用观测空间的(O-B)和(O-A)数据,建立一套日常例行的同化诊断系统,来实现观测信息监控、观测项(Jo)中观测对分析作用大小的诊断评估和同化系统参数的观测空间后验诊断。
3.2 开端性思考
诊断是“基于问题、归于理解和终于协作”来解决问题而推动数值预报系统的进展。诊断的出发点在“问题导向”,且是以过程为导向的面向各个组成环节的问题,诊断的要求是“追求理解”,完成诊断工作依靠“团结协作”。这些是诊断工作的客观固有的工作属性,是诊断工作的应有之义和实际样子。特别是,把各个部门联合起来的“融合发展”是诊断工作组的工作属性。开启诊断工作在观念上首先需要这些基本共识,来了解这是一份在作风上不在说好话、在过程上还是个急不来的工作,而营造和增加工作上的理解氛围和克服“找事情”“较真”“各自为战”的主观性倾向。
在行动上特别需要把各个部门联合起来的“融合发展”来开展同化诊断工作,例如:
1)对于不断更替的卫星辐射率新资料,卫星观测信息监控的研发需要同化诊断部门和卫星资料同化部门的共同协作。
2)对于极小化求解过程的诊断和利用观测算子的切线性模式及其伴随模式的观测对分析或预报的敏感性影响的诊断评估,需要同化诊断部门和同化系统研发部门的共同协作。
而且,贯彻落实“充分发挥组织优势,强化与上下游气象业务单位的合作衔接,统筹用好全国资源”①http://www.cma.gov.cn/2011xwzx/2011xqxxw/2011xqxyw/202203/t20220303_592682.html。,来优势互补、团结协作地推进同化诊断系统的技术攻关和业务建设,例如:
1)可以通过CMA数值预报中心与国家卫星气象中心、国家气象信息中心、CMA气象探测中心的通力协作,针对数据管理,建立通用、共用、特别是高度灵活的观测空间和模式空间诊断必备数据库存取平台,筑牢诊断工作的前端基础。
2)可以通过CMA数值预报中心与国家气象中心、国家卫星气象中心、华风气象传媒集团有限责任公司的通力协作,针对软件系统的开发和管理,研讨一体化、模块化的软件系统封装技术、界面接口顶层设计和避免自说自话的开发工作方式,建立灵活、丰富的数值预报诊断输出图表绘制显示平台,在技术上支撑诊断工作的现实需要和规范化发展。
3)预报员有着在数值预报产品应用中通过天气场景分类的模式产品表现而更具象化地发现问题的优势,研发者有着在数值预报系统诊断中通过物理和数值模型的理解而更深入地发现问题的优势。基于问题导向,建立和加强一线研发人员和全国有经验的优秀预报员的联系桥梁,通过课题合作机制和定期交流机制,共赢地促进研发人员对数值模式问题的诊断与改进和预报员对数值模式产品的理解与更好应用。
对于开启同化系统的诊断工作,观念上有共识至关重要,是团结奋斗的思想基础和前提;行动上通用、共用、特别是高度灵活性的诊断必备数据至关重要,是开展诊断工作的前端基础任务和团结协作的支撑条件。需要遵循诊断工作的实际样子,开启和推动同化诊断系统研发基于“问题导向、科学理解和团结协作”的高质量发展。