研究型业务:来自2020年AMS百年年会的3个解读
2020-06-03贾朋群李攀邓京勉
■ 贾朋群 李攀 邓京勉
(作者单位:中国气象局气象干部培训学院)
2 0 2 0 年初,美国气象学会(AMS)隆重召开了庆祝成立100年年会。会议除了常规年会内容以外,美国及国际上很多气象机构,都充分利用AMS搭建的“百年一遇”平台,展示21世纪初期20年过后气象科技发展的态势。AMS百年年会呈现很多值得记忆的特征。持续了一周的年会包括52个主题学术会和更多的交叉会议、边会、培训和展览等活动,给人留下深刻印象。
首先,会议交流科学报告的题目中,盛行“status,update,vision(现状、更新、展望)”等关键词。很多与会学者都希望借助这次里程碑式的会议,将自己、团队、所在机构或组织等的研究和业务开发等方面的成果、进步,在会议上给出一个全面的总结,并借机讨论本领域未来10年甚至更长时间的发展趋势、可能路线和预期成果及带来的能力提升。再有,会议的组织更加温馨。会议安排了3场以学者“Robert Dickinson、Wayne Schubert和Susan Solomon”命名的学术交流会。最令全球华人气象学者感到温暖的,是会议为了纪念会前刚刚逝去的美国华人科学家张福清,在相关的学术会议上,标出了纪念逝者做出特殊贡献的主题。最后,学术交叉成为常态。会议组织者为了让不同领域的学者针对复杂的跨学科问题能在会议上“不期而遇”,在会议的主题和届次延续的情况下,通过细化设计每个会议的分节主题、更多的联合会议和讨论主题,让带着成果和问题来的学者,都能通过阅读会议材料,找到自己的“归宿”。尤其是,很多会议分节的提示语,展示了主办方和主持人、联络人的集体智慧,率先让会议生辉,也在一定程度上改变了学会会议的不同阶段,只是更换主持人的传统印象。
2020年是美国国家海洋和大气局(NOAA)成立50年和美国国家气象局(NWS)成立150年。年会上不仅来自NOAA和NWS的学者非常活跃,而且围绕气象业务的重要改进方向之一——研究型业务,也呈现了一些新探索和思路。本文基于会议上下相关信息,概要介绍其中或许具有引领性的理念和实践。
解读1 CCPP打通研究和业务模式编码的围墙
图1 CCPP的概念框架
NCAR与NOAA是预报模式研发的重要部门,但多年来两个机构的模式独立发展,彼此模式编码各成体系。为了促进创新型研究业务化,全球模式测试平台(GMTB)协同NOAA和NCAR整合了物理参数和软件框架——通用社区物理包(Common Community Physics Package, CCPP,图1)。2019年,NOAA和NCAR达成协议备忘录,将合作开发CCPP框架,促进模式和物理参数的互通性,作为两家统一预报系统(UFS)和大气集成模式系统(SIMA)的一部分。NCAR主要在SIMA系统中参与CCPP框架的开发工作,包括加强元数据标准、使物理组变量实现自动分配、对比元数据和实际Fortran编码,以及改善系统建设与代码生成器。这使得CCPP成为美国几个王牌模式的核心,以一种独立、标准化的方式将物理参数与大气模式(以及其他地球系统的组成部分)相结合,同时还降低了CCPP框架的研发和维护费用。
对于NWS的预报系统UFS来说,CCPP的出现是一次重大的转折。目前,CCPP的技术设计以及物理参数要求、CCPP与主模式的结合方式等都有了明确的规则。美国气象业务系统以外的模式系统或构建单元,可以通过CCPP转化为UFS的命令式代码,供NWS使用。
CCPP在引领NOAA与学界NWP模式的互通。AMS年会来自NCAR强调业务创新互操作性的CCPP平台的一个可期结果是,NCEP的预报系统因为今天的CCPP,其未来某个升级版将会是与NCAR、高校众多模式中最优部分的合成版本。这一迹象实际上早在FV3引领的业务模式系统升级时就已显现,而CCPP让这个统一模式互操作接口的思想落地。
解读2 张量处理芯片TPC助力
近年来掀起的A I 和大数据理念,在天气预报方面提出了利用大数据而抛弃动力学的预报理念。然而,谷歌公司并没有跟风,而是将新技术与经典的动力学原理结合起来。谷歌研究结构的学者,用公司为印度研发的洪水预报系统,系统阐述了谷歌的“大数据+动力”的预报理念。
演讲人详尽分析了谷歌发起的洪水预报项目(印度),开发的预报系统的整个过程,明确在不同过程中谷歌的优势所在:例如,从水文模式到直接预报洪水的水力模式过度时,需要对复杂地形的快速改变量化,作为重要变量输入系统中。谷歌可以用预报区域几乎完美的遥感图层,给出地形的改变。
实际上,谷歌代表的企业创新,不同于其他机构的特点是整个预报体系的全程创新,其中,更加适应预报系统中AI算法的新的芯片——TPU(Tensor Processing Unit,张量处理单元,图2)已经发展到第二代,TPU因为具有高速矩阵乘法单元(M×U),可以表示矩阵乘法的细微不同,性能远远超过目前其他机构所用的,例如我们熟悉的x86 CPU芯片。TPU这类基于机器学习的AI芯片,能够跳过传统模拟计算的繁琐,借助完整模拟的输出输入,寻找模式并学习猜测新输入对模拟产生的影响。
谷歌预报系统将控制方程组中代表平流的方程,更多通过AI技术模拟;而对其他热力和动力过程,仍以传统动力学方法为主。这样的预报系统应用于印度,使得当地暴雨预报的准确性从19.7%提升到75%,覆盖面积也从31.8%上升到94.8%。类似TPU这样的AI仿真器,借助云技术,使得预报系统的计算速度得到大幅度的提升,甚至一些媒体报道称,提高数十亿倍。尽管或许有些夸张,但从根本上为改变气象预报系统越来越受到高速计算系统制约(包括计算系统能耗)提出了解决路径。
图2 TPU和CPU芯片
解读3 HOTL:自动预报时代预报员作为“护栏”管理人的新定位
来自I B M 旗下天气公司的Jim Lidrbauch则带来了另一个平台HOTL:瞄准的是在气象公司里,围绕预报流程中的预报员的作用展开。报告人特意在报告首页提升了HOTL(Human Over The Loop,[预报]循环中人的作用)的念法:发音和英文单词“旅馆”相近(图3),似乎是在预示天气公司的气象员工需要下沉到不同的特别应用领域开展业务服务。
所谓HOTL,是介于自动预报系统和最终用户之间的一个图形化规则平台,在这个平台上,可以人工输入与自动预报不同步的时空变量的数值。公司员工用HOTL通过绘制地理多边形确定向客户提供服务的位置,然后应用规则修改某个时间范围内指定的一个或一组参数。当急需某地定时要素预报时,可启动HOTL规则得到比自动系统更好的预报。该系统最初的目的是进行质量控制,同时增加15 d定制预测的细节信息。目前的HOTL更像是为预报产品增加了一个“护栏”,能防止自动预测过程中出现的明显错误。
为什么要建立HOTL?主要有三方面原因。首先,尽管模式的预测能力不断提高,但是出现错误在所难免,模式出现重要天气错误预报时,预报员们往往要抱怨:“GFS(NCEP的预报模式)怎么会这样?”此时,人的干预作用就变得很重要。第二,对于最终用户来说,预测(其全过程)的时空分辨率永远不够高。最后,传统的预报管理应该是[从预报到决策的]“一个循环”,而预报员是这个“循环”中必不可少的一部分,没有他们的干预是不能发布预报的。而过度的干预让整个预报过程变慢,而且随着时空分辨率的提升,数据量和模式种类不断增加,越来越多的预报数据也对预报员如何干预预报提出了更高的要求。这时,HOTL无疑是优化预报员干预和显示预报员在循环中的价值所在的一个选择。
那么H O T L又是如何运作的呢?预报员首先登陆到工作站,在云上连接HOTL服务器,继而通过云获得其他服务器的“ 底层”天气数据;接着,预报员便可以利用这些数据绘制多边形图形,并通过配置属性来管理预测;将查询接口指向API,以查看表格和图形详细信息。此外,在平台上还可以与来自不同领域的预报员通过Slack进行交流。
自动化的预报需要“护栏”式的呵护,HOTL式的护栏则即可防止数值模式“跑偏”,更是在精细化气象服务中发挥预报员智慧的有力支撑。HOTL运行反馈和倒逼的对预报系统“后端”改进的研究,与会上NSF提出的“收敛性研究”有异曲同工之妙,其核心均体现在解决业务实践中的关键科学问题上。
在生物工程学领域,器官芯片已经研发出来,各种器官芯片耦合成的“芯片人”也浮出水面。AMS年会展示的借助AI芯片(TPU)的更有效的模拟、借助统一编码规则(CCPP)研发各种物理过程的“芯片”并方便地耦合成与人体一样复杂的地球系统,再借助护栏式的“纠偏”机制,已然成为未来预报系统的关键节点。这3个解读单独看是发展动态,合力贡献却可能是未来气象预报全流程的变革和新方向。这些新年代出现的一些创新思想,释放出来的新理念和提示的研究型业务的有力抓手,值得我们关注、学习和在实际工作中思考及选择性借鉴。