“精准”预报的追求与误区
2022-09-14许小峰
许小峰
回顾了通过数学物理方法使天气预报实现了客观、定量后又被证明无法实现确定性的认识过程。庞加莱、洛伦兹等人的探索,最终创建了混沌理论,对初值的敏感性和没有周期解使得对大气这一复杂混沌系统长期预报无法实现,也得不到精准结果。集合数值预报有助于提高预报准确率,并提供了天气系统可预报性等更多信息。不能涵盖不确定性信息的预报是不完整的,提供反映客观真实的概率预报需要与用户充分沟通,才能达到预期效果。
21世纪初,随着数值天气预报技术在日常天气预报业务中占据了主导地位后,为用户提供“定时、定量、定点”的中短期预报服务产品的目标初步得以实现。尽管在时空分辨率和准确率提升上仍需逐步推进和完善,但这种清晰、完整、客观的预报产品提供方式基本确定,是一个跨越式的进步。随着数值产品实现进程的不断推进,对精准问题的要求不断提升已成为气象业务及相关工作中通常追求的目标。从用户角度,提出精准预报产品的需求应属自然,合乎情理,但从专业角度,如何界定“精准”的内涵则与预报本身一样,是个十分复杂的问题。“我们做不到百分之百的准确,但会尽百分之百的努力。”对于天气预报员而言,这是一句很励志的话,或许其中也表达出了难以回避的无奈,即天气预报实际上是无法做到精准的,预报员只能提供不很准确的预报,至少依据人们对“精准”的通常认知标准是如此。这样表达和理解或许有些不够积极,但与实际情况相符,应坦诚面对,否则,任何过度的苛求反而会使本已不错的预报结论因预期过高而得不到符合实际的评价。
1 引言
1904 年,挪威气象学家皮叶克尼斯(Vilhelm Bjerknes)发表著名论文《从力学和物理学的角度考虑天气预报问题》,最早提出了应用数学物理方程处理大气数据信息、开展数值天气预报的构想[1]。1950年美国气象学家查尼(Charney)首次成功地计算出第一个与实际过程演变相符的数值预报结果[2],开启了天气预报向客观化、数字化、自动化转型的时代,被称为是一场“寂静的革命”,延续至今,已从大气圈层拓展到整个地球系统,各种理论与技术方法的探索仍方兴未艾。无论是对大气活动的理论研究还是实际预报业务,数值模式计算结果都发挥着关键性作用。但伴随而来的问题是依赖确定性物理规律的数值计算能否彻底解决天气预报的准确性和时效性问题呢?答案并不那么乐观。几乎所有开展全球数值预报模式的机构都会检验模式初始场误差伴随时间的演变,无一例外地发现初始误差会迅速扩大,表现出对初值的敏感性[3]。换句话说,尽管数值模式可以做出较好的短期预报,但并不意味着这代表了大气的真实行为,问题是这种可以接受的准确性在时间上可以持续多久。长期位于数值天气预报国际领先地位的欧洲中期天气预报中心(ECMWF)从成立时就将预报时效定位中期,即10天以内的预报。20世纪60年代初,全球大气研究计划的组织者之一查尼将原计划“制作两周预报”的目标改为了“确定两周预报是否可行”。这些都表明在气象学家试图通过物理方程计算方法预测大气的长期行为时遇到了难以逾越的障碍。著名美国气象学家、混沌理论的奠基人洛伦兹在谈到“为什么我们不能准确地做出天气预报呢?”这一问题时说,我倒一直想要反问:“为什么我们一定能做出准确的天气预报呢?[3]”
将天气预报做得尽可能准确一些,使之与实况更为接近,是气象科技人员努力的方向和期望的结果,但也应理性认识到,面对大气运动这样复杂系统的变化,难以用确定性的方式给出准确答案。对于天气预报的使用者而言,也不应报有过高的预期,如果得不到精准的预报,就认为这不是所需结果,或抱怨预报员做得不够好,这反而会影响到对预报产品的客观认识与合理使用,切不可认为不够准确的预报就是无用的信息。
影响预报准确率的因素很多,从产生偏差角度大致可归结为如下几个来源:一是来自初始信息的准确性和覆盖度,无法做到精准测量和全覆盖,即初值问题;二是来自对天气系统演变规律掌握的不确定性,即认知偏差;三是数值模式积分过程中不断累积的误差,可统称为截断误差;四是大气不断受到难以确定的外力作用,大气不是孤立存在的,其运动的基本能源来自太阳辐射,辐射强度也会在不同时空尺度上表现出随机变化,还要考虑地球系统各圈层间的影响,即相互作用,这一因素可以造成随机性或系统性偏差,既增加了不确定性,也可以通过强信号提升大气系统长期行为的可预测性;五是大气系统本身存在的随机运动,如云物理过程和湍流变化,会表现出类似布朗运动的随机性特征。无论是预报员的主观分析过程,还是数值天气预报模式计算,都会遇到这些方面的问题,可以设法减少,但无法从根本上消除,从而也注定完全准确的天气预报是无法获得的。正确认识天气预报结果的不确定性本身也是一个科学认知问题,只有理解了无法消除预报结果与真值的偏差,才有可能采取合理的方式给出预报准确率的预期。
2 “混沌”的困扰
大气初始场的偏差难以避免,但若初始偏差在处理过程中能保持稳定,对大气系统的预测也可能得到相对稳定或确定的结果,遗憾的是在大气这一非线性复杂系统演变过程中做不到这一点,偏差会被快速放大,导致失之毫厘,谬之千里,初始有效信息最终会全部消失,这正是混沌理论(Chaos Theory)所揭示的结果[3]。
混沌现象的发现最早源于法国数学家庞加莱(H.Poincare,1854—1912年)1890年发表的一篇著名论文《关于三体问题的动态方程》(Sur le probleme des trois corps et les equations de la dynamique)[4],讨论的是至今仍在困扰人类的三体问题(Three-body Problem),希望揭示三个星体在万有引力作用下各自变化的运行轨迹。单个星体不受外力作用,表现为静止或匀速直线运动,两个星体则会在万有引力作用下,呈现圆锥曲线运动,包括椭圆、抛物线或双曲线,可以求得其轨道的完整表达式或严格解析解。而当出现了三个或三个以上星体时,问题就变得异常复杂了,由于系统自由度过高,无法给出物体运行轨道的完整表达式,更无法给出严格解析解,以至于推出了统治天体运动万有引力定律的天才科学家牛顿对处理这一问题也表示了无奈,认为“如果我没有弄错的话,三体问题的精确解超越了任何人类智力的极限”[5]。
庞加莱对问题做了尽可能的简化和限定,降低了系统的自由度,但即使简化成了三个微分方程,保留三个变量,也仍然无法在给定初始条件下,预测当时间趋于无穷时系统变化的稳定状态,且轨迹的变化对初始条件极为敏感,微小的差异会导致最终结果的巨大偏离。在庞加莱的脑海里呈现出了这类系统变化的复杂特征,但由于当时缺乏足够的计算条件,无法将其完整地描绘出来。当他依靠超凡的计算能力试图在纸上绘出受两个天体影响的一个小尘埃的运动轨迹(图1)时,发出了如此感慨:“这难以画出的图形的复杂性令我震惊![6]”从这一研究成果中已可以看到在确定性的非线性系统中发生了复杂的随机运动。尽管庞加莱未能解决三体问题,由于他在这一领域取得的重要进展,经评选,那篇重要文章仍获得了瑞典的奥斯卡国王奖,庞加莱随后用了近10年的时间将这篇论文扩展为专著《天体力学的新方法》(Les méthodes nouvelles de la mécanique céleste)。
图1 庞加莱绘制的受两个大天体影响的小尘埃运行轨迹
如果说庞加莱已撬动了混沌之门,并通过缝隙触碰到了其中的奥秘,而最终破门而入挖掘到其中宝藏的则无疑当属美国气象学家洛伦兹(Edward Norton Lorenz)了。1963年洛伦兹在一篇关于大气对流运动问题的经典论文《确定性的非周期流》(Deterministic Nonperiodic Flow)中对混沌问题做了创建性揭示,在科学界和社会相关领域都产生了广泛且持续的深刻影响,类似于蝴蝶翅膀的奇异吸引子(Strange Attractor)图形现已成为研究混沌理论的经典画面,而“蝴蝶效应”更是成为家喻户晓的可以解释复杂变化的科普概念。洛伦兹的工作与庞加莱方法类似之处也是简化方程,将复杂的大气运动方程简化为只有三个变量的热对流非线性常微分方程,研究这一系统随时间变化的长期行为,试图解决大气运动的长期预报问题。在对这一看似不很复杂的微分方程组进行数值求解时,发现了体现混沌系统变化的两个基本特征,一是奇异吸引子,二是系统变化对初值的敏感性(The Sensitive Dependence On Initial Conditions),这一重要进展标志着混沌问题研究取得了重大突破,通过量化图形方式给出了系统的混沌特征,也体现了洛伦兹在这一领域所做出的奠基性贡献。
要清晰看清动力系统随时间变化特征,直观的方法是在相空间中观察。一个系统中的各独立变量构成了系统的相空间,系统的每个状态在相空间中表现为一个点。若能计算出系统状态随时间变化时各个变量的伴随变化值,就可以跟踪系统状态在相空间中的运动轨迹趋势。而由每个状态点在相空间中变化所构成的最终趋向图形,称为该系统的吸引子,或者说吸引子是系统演变的最终归属。
在洛伦兹研究他的简化热对流系统之前,已存在普遍认同的三类经典吸引子,分别为系统最终收敛于固定不变状态的稳定点吸引子,系统趋于稳定振动状态的极限环吸引子,和系统趋于似稳状态的极限环面吸引子[7]。这三类吸引子所描述的系统运动变化总体上是规则的,即便初值出现了一些偏差,终值也会有偏差,但不会很大,可以根据初始状态计算出系统未来的变化走向,当时间足够长时,系统趋于与初值无关的定常状态,很长一个时期,确定论者都是以此为依据的。洛伦兹最初也想通过这一方式开展长期天气预报,他在与同行讨论不同时间周期的预报难易程度时,就提出长期预报应比短期更容易,并举例说,一杯热水的温度预报,报长显然要比报短容易,因温度最终是要回归环境温度的[8]。
但洛伦兹的热对流模型则不同了,状态点在三个变量构成的相空间中表现出了随机运动的变化趋势,围绕两个中心点构成双重缠绕,轨迹空间类似于蝴蝶的两个翅膀,运动轨迹不相交,但被限定在两翼构成的边界之中,这意味着系统状态不会重复,长期趋势又表现为乱中有序。洛伦兹将这一变化称为“确定性的非周期流”,准确地反映了其运动特征,在确定的方程和初始条件下,系统变化完全来源于内部因素,最终演化为遵循确定规则的随机运动。而这个类似于蝴蝶双翼的图像显然无法被归为已有的三类经典吸引子,被定义为奇异吸引子,或洛伦兹吸引子。按照洛伦兹的解释,奇异吸引子就是某个混沌系统的核心,显然,若想了解这个系统,要先建立核心意识,关注吸引子的状态(图2,几种不同的吸引子[7])。如果一个混沌系统已运行许久了,所有远离吸引子的状态就不再存在。复杂的全球天气构成的混沌系统,最终都会收敛于气候这个吸引子。
图2 三种经典吸引子(稳定点、极限环、极限环面)和洛伦兹奇异吸引子
如果说洛伦兹发现奇异吸引子的过程是按照确定性的经典物理方程和正常计算流程获取的结果,那么对初值敏感性的认识则有些偶然因素的介入。1961年,洛伦兹在一个老牌计算机上计算描述气象演变的非线性动力方程,分析开展长期天气预报的可能性,时间步长设定为6小时,每计算一天打印一次,为了能在打印纸上排列好计算结果,只能将数字四舍五入保留三位。从计算结果看,表现出明显的非周期性,这些真实的结果引起了洛伦兹的兴趣。
为了进一步检验某一时段究竟发生了什么变化,洛伦兹需要做一些重复计算,为了节省计算资源,他将已计算出的中间结果作为初值重新输入计算机计算,在等待结果的间隙出去喝了杯咖啡,1小时后,约计算出了两个月的天气变化,但从结果看,与曾经计算过的数据出现了很大偏差。在确认了不是机器出了问题后,洛伦兹对计算偏差做了详细核查,发现大约每计算4天的时间,偏差会增加1倍,两个月后,两列结果已完全无相似之处了。经进一步分析,这一显著改变源自小数点后四舍五入产生的影响,正是这一微小误差最终主宰了方程的解,也清晰体现了混沌系统的固有特征。洛伦兹通过这一结果意识到在日常的天气观测中无法将初值误差控制在三位小数点精度范围内,这意味着长期数值天气预报将无法实现,在1962年东京数值天气预报研讨会上洛伦兹报告了这一结果(The Statistical Prediction of Solutions of Dynamical Equations)[9]。
从历史角度看,对于初始时刻的微小误差造成结果重大变化的认识并不少见,但能像洛伦兹这样给出一个简单且精准的物理系统的数学模型确属首次。究竟什么是混沌,洛伦兹在2005年访问美国马里兰大学一位教授时给出了一个简明的解释:“现在可以确定未来,但近似的现在无法近似地确定未来。[10]”阐释了混沌系统中初值的误差与非周期解的关系。如果能获得系统的精确初值,混沌系统的演变本质上仍是确定性的,但这无法做到,从而也导致获取精准预报的预期难以实现。
3 与不确定性共存
寻求精准的良好愿望无论从科学理论还是实践过程都缺少必要的支撑,合理的方式应是坦然与无法消除的预报偏差共存,并找到合理的处理方法满足使用者的需求。在理念上从追求唯一的精准结果到设法获取接近真实的误差分布,如果预报的发布者和使用者都能清晰认识到这一点,则如何量化不确定性,使其与预报值结合构成完整的信息就成为自然的选择。此外,既然不确定性是从初始场开始的,对不确定性的处理也理应从初值开始,伴随始终,全过程跟踪分析。
通过依赖数学物理方法的数值预报模式预测大气存在其固有的不确定性,解决问题的方法也应从这一本质问题出发来考虑,改变追求确定性的思维方式,集合预报正是针对大气运动的混沌特征而设计出的解决方案。爱泼斯坦(Epstein,1969年)和莱斯(Leith,1974年)先后提出了动力随机预报理论框架和实用的集合预报法,开拓了以不确定性方法来解决不确定性问题的新途径,这种方法并不是在追求做出更准确的单一预报,而是一种可以定量估计预报误差分布的动力学方法。在这种模式设计的构架下,大气模式的初始场、模式的物理过程、模式本身都不再是唯一,而是依据特定规则设计的一个群组,模式的最终预报值也不是唯一结果,而是概率分布[11-15]。
经过几十年的探索、实践和拓展,这种理念和方法已在实际业务中被广泛接受,成为各国数值预报中心业务系统的重要组成部分。以单一模式预报能力国际领先的欧洲中期天气预报中心(ECMWF)提出的发展目标,将预报时效提升到两周,也是选择以集合预报方法为基础的[16]。
我们已知实际大气真正初始状态不可能完全精确获取,作为模式计算获取的初始场就只能是一个近似值,而其与真值的偏差随着时间积分会快速放大,对初值的敏感性导致所得到的计算结果可能与大气真实演变状况出现较大偏差,或两个偏差不大的初值却得到差别很大的计算结果,这与大气的混沌特性是相符的。集合预报的创新之处是不再使用单一的初值启动计算,而是一组初值的集合,集合中的每个成员虽不能被确认为真值,但都有着同等的代表性。从这些相差不大的初值集合成员就可以得到一个预报结果的集合,单一的预报就转换为一组预报结果,即“集合预报”。除了对初始场进行集合外,还可以对模式的物理过程和模式本身进行集合,目的都是一个,降低单一预报成员的不确定性。而在确立集合成员时,首先需要确认每个成员特征的一致性,即各成员初始场相差不能过大,或不同模式或物理过程的水平大体相当,从统计平均意义上,各成员应保持等同性,若成员之间水平相差过大,如同一个有经验的预报员与一个缺乏实践的新手集合,就没有实际意义了;其次是在各成员不出现系统性误差的基础上,保持适度的离散性,目的是确保大气的真值大概率被包含在集合成员之中。如何确定集合成员本身也有不确定性,需要慎重处理,如离散度的要求与预报可信度的关系,会呈相反走向,离散度愈小,可预报性愈高。在初始场上叠加扰动是确定初始集合成员的通常做法,要考虑扰动场的特征与实际分析资料可能误差分布的一致性,以保证所叠加后的初值对反映实际大气状态有同样的代表性,同时还要保持扰动场之间在模式计算的演变方向上保持适当的发散度,使集合结果最大限度包含实际大气可能出现的状态。总之,设计和运行一个好的集合预报系统不是件容易的事,但最终结果确实可以提供单一模式不能提供的信息。
集合预报产品最初级的应用是通过集合预报结果可以获取集合均值,形成单一结果,通常情况下,这一结果较单一初始场预报效果要好[17],但也仅是提供了大气变化的一种可能,无法涵盖全部,特别是当大气状态出现不稳定时会出现较大偏差;进一步的应用则是获取对大气预报可信度的分析,通过方差或标准差可以计算各集合预报成员间的发散程度,进而确定预报的可信度;最能完整体现集合预报价值的是通过所有集合预报成员算出单个预报发生的可能概率,而多个成员的概率分布则包含了集合预报结果所能提供的完整信息。图3是英国气象局对一次降雨过程所做的集合预报的示意图,可以体现集合预报产品的制作过程和结果。
图3 英国降水36小时集合预报示意图(红线和红框表示单一预报结果,通过最初的单一初始大气状态分析场(左侧红点)向前进行时间积分获得;左侧圆内为一组在已知不确定范围内获取的一组小扰动初始场集合,通过时间积分获取了中间多个框内的一组降水预报集合,体现了预报的不确定性,通过对这一集合结果的处理得到右侧的降水概率分布)[18]
在对预报的不确定性有了较客观、完整的认识后,天气预报的制作者与使用者都开始进一步思考如何更完整地提供和使用好气象信息问题。2006年,受美国国家天气局(NWS)之托,美国国家科学院组织专家委员会完成、发表了一份调研报告,题目为《完整的预报:通过对不确定性的刻画与沟通,有助于利用天气气候预报做出更好的决策》(Completing the Forecast:Characterizing and Communicating Uncertainty for Better Decisions Using Weather and Climate Forecasts)[19]。报告针对预报不确定性问题进行了系统性分析,最后给出了9条建议,其关键理念是要正确地刻画预报产品的不确定性,并同用户进行有效的交流沟通,使用户能对不确定性也有正确的理解,这样的预报才能算是完整的预报。随后,2008年美国气象学会(AMS)也针对预报不确定性问题发表了一篇题为《通过概率预报提升天气信息》(Enhancing Weather Information with Probability Forecasts)的声明[20],提出所有天气预报都应包括准确量化的不确定信息,这种概率信息传播可以产生巨大的经济和社会效益,用户可以通过明确的不确定性来做出更好的决策。而完成这一转变并取得效果的前提是改进量化不确定性的技术,如制作集合预报。同时,预测人员和用户都需要接受培训,掌握如何正确理解和使用概率信息,并增进相互间的沟通。
从业务应用角度,20世纪70年代开始,一些发达国家开始尝试发布概率预报,如美国,1972年开始在业务中发布小尺度雷雨预报,1976年开始发布降水类型、降水等级、雷暴、云量、云高、能见度等要素的概率预报;进入20世纪80年代,加拿大、日本、澳大利亚及欧洲一些国家也相继开展了概率天气预报业务[21]。中国也曾尝试过概率预报,1995年,上海、北京等大城市相继试点对公众发布概率天气要素预报,从外界反映看,不够理想,用户对概率产品缺少足够的理解,引起了一些认识上的混乱,抱怨较多,仅有一些专业用户表示了肯定和欢迎,试点坚持了10年左右,先后停止了,从中也反映出仅有科学依据还不能完全解决现实问题,用户的认知、理解、习惯、实际需求、提供方式等都会制约新的变革。
4 结论
1)数值天气预报的发展通过依靠数学物理方法和探测、通信、计算技术的结合,解决了天气预报的定量化、客观化、连续性等问题,但大气运动的复杂性与混沌特征决定了预报过程从始至终都存在其固有的不确定性,难以做到100%的精准,无论是预报的制作者还是使用者都应把握好这一客观规律。
2)集合预报的发展为提供客观的概率预报奠定了基础,较单一预报包含了更丰富的预报信息,有助于提高数值预报的准确性和对可预报性的认识,应进一步挖掘其为用户提供完整气象信息服务的价值。
3)将尽可能准确的预报产品和可量化的误差都如实告知用户,从理念上无疑是正确的,虽与理想化精准预报相比有一定差距,但可以确保信息的真实、客观和完整,并逐渐使预报产品的制作者和使用者都建立起正确的观念和思维方式,客观地看待天气预报出现的偏差。
4)在实践中,不能简单为之,其中最重要的应是预报产品的提供者与使用者之间的沟通,用户的需求和理解决定着预报产品的最终应用效果,分析其中的障碍点,打通影响沟通的环节,采取适当的表达方式,才能实现完美的预报服务流程。