谈谈统计预报的必要性
2016-04-14陶祖钰赵翠光陈敏北京大学物理学院大气和海洋科学系北京0087国家气象中心北京0008中国气象局北京城市气象研究所北京0008
陶祖钰 赵翠光 陈敏( 北京大学物理学院大气和海洋科学系,北京 0087; 国家气象中心,北京 0008; 中国气象局北京城市气象研究所,北京 0008)
谈谈统计预报的必要性
陶祖钰1赵翠光2陈敏3
(1 北京大学物理学院大气和海洋科学系,北京 100871;2 国家气象中心,北京 100081;3 中国气象局北京城市气象研究所,北京 100081)
摘要:首先从认识论的角度,即确定论和概率论,讨论了天气预报具有不确定性,在数值预报日益取代主观经验预报的今天,统计预报还有其不可取代的重要性。在方法论上,统计预报属于客观归纳法;在理论上,统计预报具有不受数值预报可预报性限制的特点。统计预报有相关法和相似法之分;小概率的极端天气,可以用相似法进行预报。集合预报是确定论方法和概率论方法的有机结合,是当前天气预报的发展方向。最后指出,统计预报本身同样存在局限性,也必须经受实际预报应用效果的检验。
关键词:天气预报,统计,相关性,相似性,小概率极端天气
0 引言
天气预报有主观预报(或经验预报)和客观预报之分,又有确定性预报和不确定预报(或概率预报)之分。数值模式做出的天气预报,既是客观预报,又是确定性预报。预报员的传统预报,是根据所掌握的理论知识和个人实践经验的主观预报,既不定量,又因人因时而变,有很大的不确定性。目前主观经验预报在天气预报中的贡献已在很大程度上被数值预报所取代。
统计预报也可看作是经验预报,因为它也是根据以往的资料做出的预报,只不过它避免了人的主观影响,故也可看作是客观预报。统计预报的结果虽然是定量的,但它是建立在概率统计基础上的预报,所以本质上属于概率预报,而不属于确定性预报。
数值预报虽然被称作20世纪人类最伟大的科学成果之一,并成为当前天气预报的基础和主角,但根据混沌理论,作为确定性预报它有一个不可逾越的极限——2周的可预报性[1]。从自然辩证法的哲学观点来看,偶然性和必然性都客观存在,两者都不可避免,天气预报也不例外。自然辩证法还认为,必然性寓于偶然性之中,即必然性通过无数个个别事例表现出来,只要样本数足够多。因此,统计预报应该是天气预报中一个不可缺少的成员。
早年的统计预报,由于观测资料的年代短,样本数不够多,统计的对象也很不充分,所以,统计结果不稳定,预报效果当然也不理想。这就造成了在过去的数十年中统计预报的地位既不能与数值预报相比,也不能与主观经验预报效果相比的状况。
在数值预报逐渐逼近可预报性上限的今天,统计预报的不可缺少性也随之显现出来。本文将从科学研究的方法(演绎法和归纳法)及数值预报的现状和极限谈起,介绍相关法统计预报和相似法统计预报的特点,讨论统计预报超越确定论预报极限的可能性、大概率事件和小概率事件及极端天气预报、集合预报是确定论和概率论的结合等问题,指出统计预报的必要性,强调集合预报是当前天气预报技术的一个重要发展方向。
1 演绎法和归纳法
科学研究方法分为演绎法和归纳法两大类。数值天气预报属于演绎法,即根据已知的规律推演出未来的天气。演绎法的基础是分析,因为它所依据的规律是从对个别样本(或事件)的分析中找出来的。虽然所分析的样本数量是有限的或少量的,甚至可以只有一个样本,但只要所得出的规律具有普遍性,就可以成为演绎法的基础,例如大家熟知的比萨斜塔自由落体实验,在哲学上叫作从个别到一般;确定性预报,则是从一般到个别。
演绎法的特点是唯一性或确定性,不能模棱两可。其数学形式表现为因变量唯一地由自变量决定。数值天气预报就是根据一系列的方程,从初值通过时间积分计算出未来的天气。如果没有计算误差,则理论上初值和预报两者是一一对应的,只不过演绎的方法不是推理而是数值积分。
归纳法是指对已经发生的大量的样本(或事件)进行分类归纳,根据总结出的规律来预报未来天气。经典天气预报属于归纳法,其基础是分型和概念模型(例如锋面气旋模型),根据当前形势和概念模型的相似性来预报未来天气。寻找历史个例的相似性是经典天气预报(或主观经验预报)的本质[2]。但是主观经验的归纳不仅不够定量,而且不同的人掌握科学知识的程度不同,实践的经验也不同,因此归纳的结果也不具有唯一性。
统计,是现代客观归纳法的数学手段。相对于经验归纳,统计是定量的、客观的归纳。只要统计模型相同,对于同一组数据只有一个统计结果,所以现代的客观归纳法具有一定程度的唯一性。当然,如果模型或数据不完全相同,显然,结果就不具有唯一性。
统计归纳法本身虽然不受物理规律控制(没有预设的控制规律),但如果统计方法足够全面(或充分),统计样本足够大,则统计结果可以揭示客观存在的物理规律。这方面比较成功的典型例子是Wallace 等[3]的“遥相关”研究[4]。他对北半球冬季500hPa月平均高度场并不事先设定关键区,而是普遍地计算每一个格点与其他全部格点的相关系数。从最大正、负相关系数的空间分布归纳出五种遥相关型,其中纬向的PNA型、EU型和EA型分别反映了太平洋—北美、欧洲—亚洲和东大西洋这三条主要的长波频散路径(图1),具有非常清晰的天气动力学意义[5-6],在天气预报和气候诊断的领域中得到了普遍的肯定和应用。
图1 Wallace的遥相关型和长波频散路径[3](闭合圈为相关系数大值中心,实线和J分别为200hPa急流轴和急流中心)Fig.1 Wallace teleconnection patterns and long-wave dispersion path(closed loop is correlation coefficientmaximum center,Vector lines and J were 200 hPa jet axis and the jet center)
2 数值预报的现状和极限
图2 欧洲中期数值预报中心1981—2011年全球和南北半球500hPa高度场预报3,5,7和10天距平相关分布(来源:Uccellini LW美国宇航局/大气海洋局卫星资料同化联合中心成立十周年纪念会报告幻灯片)Fig.2 The anomaly correlation coefficient of 500 hPa height forecast field in global and the northern and southern hemisphere at 3 days,5 days,7 days,10 days,Medium-Range Forecast Centre in Europe in 1981—2011
从欧洲中期数值预报中心(ECMWF)对1981年以来数值预报水平的评估(图2)可以看到,500hPa高度场3天预报的距平相关目前已高达97%,而且进入21世纪后,3天预报相关系已接近水平线,看不出明显的上升趋势。它似乎表明,500hPa环流形势的3天预报已达到几乎完美的程度,很难再有所提高。其他数值模式与ECMWF相比没有本质上的差别,预报水平也大体相当。但是,从降水和温度等的单站要素的强度、时间的确定性预报来看,无论哪个模式都还有很多不能令人满意之处。即使是看似相对比较容易的2m温度预报,也有相当大的预报误差(±2~4℃)。所以在预报温度、降水等要素时,必须采用数值预报产品的统计释用(如MOS方法(模式输出统计)和PP方法(完全预报)等)。
图3 2012年7月21日06,09,12和15时(UTC)的观测小时降水(单位:mm)及各起报时刻预报对应时刻的降水分布[8](第1—6行分别表示CMORPH降水融合资料起报时间分别为20日21时,21日00,03,06,09和12时,第7行为21日15时实况;各列分别表示21日06,09,12和15时的降水分布)Fig.3 In July 21,2012 0600,0900,1200 and 1500/UTC observation hour precipitation(mm)and the corresponding time precipitation forecast map(1-6th row denote the reported time of CMORPH precipitation fusion data is at 2100 on the 20th,at 0000,0300,0600,0900 and 1200 on the 21th,the 7th row is real data at 1500 on the 21th; the columns represent precipitation distribution at 0000,0900,1200 and 1500 on the 21th)
对于降水或强对流天气的预报则更是难以令人满意。例如2012年7月21日北京的特大暴雨过程,世界各国的模式大都在2~3天前就预报了这次强降水过程,但降水强度普遍偏小,降水时间普遍偏晚约6小时,都没有报出最强的第一场锋前暖区暴雨[7-8]。从图3所给的北京快速循环中尺度数值模式(BJ-RUC)的预报检验看[8],即使是同一个数值模式,不同初始时刻的预报结果也有明显差别。更有甚者,预报水平并不一定随着时效的缩短而变好,表现出时好时坏的现象。这种摇摆不定就是数值预报“不确定性”的典型表现。它说明虽然模式控制方程所代表的物理规律是确定的,但实际计算结果却存在不确定性,因为初值和每一步差分计算都不是100%的正确,总有一些误差,即使非常微小。所以,不确定性是不可避免的,确定性预报的有效时间长度是有限的。
在图2中还可看到,5,7和10天的相关系数随着预报时效的延长而下降,10天预报的相关系数已下降到不足0.5,作为确定性预报似可认为已无参考价值。欧洲中期预报中心30年的总结说明,确定性预报的水平随时效延长而下降是不可避免的,数值预报的实际能力不可能突破2周可预报性的理论极限。后面将会提到,要突破这个极限的办法是采取确定论和概率论相结合的方法,即数值模式的集合预报。
3 统计预报——超越确定性预报极限
统计预报的性质属于归纳法,统计是归纳的数学手段。统计预报可分为相关法和相似法两大类;相似法又可分为直接相似法和分型相似法两类。
3.1相关法统计预报
相关法是用预报因子和预报量之间的直接相关性来做预报,例如建立多因子回归方程。在建立预报方程前,通常先要进行因子筛选,即先根据经验和科学知识选取一定数量的因子从中挑选出相关系数最大的作为预报因子。所以,统计方法虽然是定量的、客观的,但也存在因人而异的问题。因为可以作为预报因子的参数很多,选择不同的因子,就会得到不同的统计结果(相对而言,采用不同的统计方法造成的差异则要小得多)。在长期天气预报会商中经常遇到这种情况,不同的统计预报得到不同的结果,因而难下预报决心。所以。统计预报也存在主观性。
理论上,如果因子的筛选能够穷尽一切可能的因子,同时样本数又足够大,就可以克服统计预报的主观性。当前计算能力已强大到足已从海量的因子(如数百、数千甚至数万个因子)中筛选预报因子,无需人为地圈定待选因子的范围,那么,统计预报就有可能完全摆脱主观预设的影响,而只反映客观事实的内在联系。
3.2相似法统计预报
相似法统计预报又可分为两类:直接相似预报和分型相似预报[2,9-10]。
3.2.1直接相似预报
如文献[11]所述,直接相似预报就是“从众多的历史个例中找出一个与当前形势相似程度非常高的个例,则可以认为引起当前形势演变的全部机制都基本上隐含在这个历史个例中,因此可以直接根据历史相似个例的演变作为当前预报的基础”,故称为直接相似预报。在人们对天气形势演变和局地天气产生的物理机制还不甚了解的时代,直接相似法是天气预报的基本方法,故郭树忠等[2]把它称为经典预报方法。他们定义了一个所谓相似系数(S),
用它在众多的历史样本中找出最相似的个例来制作当前机场天空状况的逐时预报。式中,Xi为当前某一气象要素的测站值,下标i代表测站,Yi为同一要素的某一历史个例,N为测站的总数,和为全部测站的平均值,即
理论上任意一个气象要素场都可以用傅氏级数展开成谐波的集合。两个波长相同的谐波,其相似性应包括振幅、位相和其围绕的平均值三个方面。可以证明[11],经典的相关系数(C),
由于对变量都做了归一化处理,所以只能反映谐波的位相相似程度,同位相时相关系数为1,反位相时相关系数为-1。而S不仅反映位相的相似,还能反映振幅的相似程度。为了使S还能同时反映平均值的相似程度,陶祖钰等[11]对S进行了修改,即
但是,如文献[11]所指出的,“天气形势的相似应包括天气系统的位置、相对强度和绝对强度三个方面。相对强度相似是指高值系统和低值系统之间差异大小的相似。气压系统和温度系统相对强度的大小与锋区、急流等有直接的联系,因此相对强度相似无疑是十分重要的。绝对强度相似是指天气系统本身的数值是否接近。绝对强度和各年的气候特征有关。例如,副热带高压(以下简称副高)的强度和各年副高季节变化的早晚有关,它是天气形势是否相似的一个重要的方面”。因此,试图用一个相似系数来代表二维场的相似无疑是难以做到的。
3.2.2分型相似预报
天气分型是经典天气预报中最常用的方法。分型相似法和相关法不同之处在于,前者不仅仅看到气象变量本身,还看到变量的空间和时间分布,然后再按当前实况所属的类型或者最相似的历史个例做出预报。天气形势的主观经验分型种类繁多,有的简约,有的繁琐;有的着眼高空,有的着眼低空或地面,如此等等不一而足。而且,分型的标准往往模糊不清,同一个样本,不同的人会确定为不同的型。
现代统计学中的聚类分析是一种可以客观地按相似性进行分类的方法。例如芬兰Teuvo Kohonen于1981年提出的自组织特征映射(Self-organizing Feature Map,SOM)神经网络法[12]是一种通过反复调整识别图像之间的相似程度(包括数值的相似和形状的相似)从而达到聚类的目的。赵翠光用这一技术对2000—2009年6—8月华北地区107次区域暴雨前一天的环流形势场(500hPa高度场、850hPa流场、850hPa温湿场(θse))进行了客观分型[13]。从图4给出的其中两种型的降水分布和500hPa高度场形势(省略850hPa形势)可见,客观分型结果的天气学意义非常明显。图4a和4b为华北经向型暴雨,其特点是副高偏北、河套低槽明显;图4c和4d为华北的纬向暴雨型,其特点是副高偏东、华北受低槽影响。
现代统计学中分型的方法很多,例如EOF(Empirical Orthogonal Function)方法,即经验正交函数分解方法,是一种既包括空间分布特征,也包括时间变化特征的客观分型方法。文献[13]中用旋转主分量(REOF)方法[14-16]对华北地区夏季降水进行分区,客观地反映出华北范围内不同区域降水的气候特征。
图4 华北夏季区域性暴雨的客观分型[13],副高偏北型暴雨典型场(河套低槽类)日平均暴雨实况(a,单位:mm)和500hPa高度场(b,单位:dagpm),副高偏东型暴雨典型场(华北低槽类)日平均暴雨实况(c)和500hPa高度场(d)Fig.4 Objective classification of Regional Rainstorm in North China in summer(13),Daily average observed precipitation about northerly subtropical rainstorm type(trough in Hetao)(a,mm)and 500hPa height(b,dagpm),daily average observed precipitation about easterly subtropical rainstorm type(trough in North China)(c,mm)and 500 hPa height(d,dagpm)
图像识别也是统计学应用中的一个重要领域。广义地看,寻找相似也属于图像识别领域。光流法是一种研究外界物体运动的光影变化在人眼视网膜上所形成的光的流动的图像识别技术[17]。它特别适用于图像雷达回波系统的识别和追踪,因此是在短时和临近预报中很有应用价值的一种统计学方法[18]。
4 讨论
4.1预报时效
统计预报的特点是不预设物理条件。无论时间间隔多长,只要前后两组数据之间表现出有足够的相关性,就可以把前一组数据当作预报因子来做预报,因此它没有时效的限制。数值预报时效的理论极限是两周,实际上超过7天高度距平、相关系数小于0.5表明预报接近随机概率,参考价值不大[7]。因此10天以上的中长期预报,在相当长的时间内还只能依靠统计预报。
直接相似法统计预报的特点是只看结果,不问过程,不讲“道理”。例如相似法统计预报,只要现在相似,则未来也一定相似,无论3天、5天,还是10天、半月,甚至更长的时效,对相似法而言并无差异(注:当然原则上随着预报时效的延长相似的空间范围应该扩大到全球)。虽然我们对统计出来的结果(如分型),可以做出一定的物理解释,但统计过程并不受物理规律控制,因此可以说统计预报是不讲“道理”的。这是统计预报和确定论的数值预报的最大不同。正因为此,统计预报可以不受数值预报时效的可预报性限制。总之,从当前数值预报的水平看,超过一周的延伸期预报就不能直接依靠数值预报,而应该采用统计预报方法来制作,只要样本的数量足够多。
4.2转折性天气预报
从气象服务的角度看,转折性天气,如寒潮爆发、干旱、连续低温阴雨的开始和结束,或夏季高温伏旱的开始和结束等都是社会大众最关心的,因此是天气预报的重点。从预报的难度来看,连续数日不变的稳定天气最容易预报;但是转折性天气,一旦启动,变化迅速,导致预报失误。此外,对于重大的天气转折,预报员很难下决心当机立断,也是造成预报失误或影响预报服务效果的心理原因,而统计预报的客观性可以为预报员下决心提供支持。因此,统计预报是一种比较适合转折性天气的预报方法。
4.3极端天气预报——大概率事件和小概率事件
从统计学的角度看,天气事件可简单地分为两大类:大概率事件和小概率事件。大概率事件的样本多,统计关系稳定,比较适用于相关法的统计预报,例如晴雨预报、温度预报等。
极端天气,如暴雨或大暴雨等,属于小概率事件,由于样本很少,无法建立稳定的统计关系,因此不能直接使用相关性做预报。但是,有长期工作经验的预报员仍可以根据亲身经历的案例做出适当的预报,只要历史上曾经有过类似的案例。
相似法是对全体样本进行分类,既包括大概率事件,也包括小概率事件,所以相似法原则上也可用于极端天气预报。例如,2012年7月21日北京的特大暴雨(简称“7∙21”暴雨)对北京地区的雨量纪录而言是百年,甚至是二百年一遇的极端暴雨事件。图5出示了2012年7月21日08时的海平面气压场。按Zhao等[19]倾斜旋转T模态主成分分析方法对1951—2012年夏季5704个海平面气压场客观分型的结果看(图6),“7∙21”暴雨的环流形势属于暴雨概率最大的第六型,但其气候概率也只有0.491%(图6中环流型概率和暴雨概率的乘积),仍属于小概率事件。从环流型看,此型海上副热带高压偏强,暖湿空气与河套地区的冷空气在华北对峙,是华北比较典型的经向型暴雨形势,在赵翠光[13]的分型中也同样可以看到这种类型(图4a和4b)。
图5 2012年7月21日08时的海平面气压场(单位:hPa)Fig.5 July 21,2013 0800 SLP(unit:hPa)
与此相反的是第二型,环流特征是副高偏南,北方都在冷气团的控制下,所以出现此型暴雨的气候概率更小,只有0.052%,可以说是真正的罕见暴雨。从分型结果中找出对这类罕见暴雨的历史个例进行分析,或许可为此类罕见暴雨的预报提供重要的线索。
上述海平面气压场的客观分型尽管分型时并未考虑降水的情况,但分型的结果却能反映出环流形势与暴雨之间的物理联系。由此可见,只要样本数足够大,统计结果中就会反映出事物内在的规律性。在自然辩证法中这就叫做必然性存在于偶然性之中(或普遍性存在于特殊性之中)。同时,即使是“小概率”事件,它也受普遍的内在规律控制。像2008年金融危机和“9∙11”事件,它们的发生也都有前兆可循[20],极端天气预报也不例外。统计的本质就是将所需要的信息从大量的、充满噪音的信息中提炼出来。在信息爆炸时代(大数据时代)特别需要统计学。
4.4集合预报——确定论和概率论的结合
如前所述,数值预报属于确定性预报,但是数值模式预报的气象要素(如温度、风和降水)存在相当大的误差。为了提高预报的准确率,人们提出数值预报产品释用方法,如模式输出统计方法MOS(model output statistics)。它将模式输出的物理量作为预报因子,通过建立与预报量之间的统计关系(如逐步回归方程)来完成预报。所以MOS预报是一种确定论和概率论相结合的预报方法,是一种间接使用数值预报的方法。
图6 1951—2012年夏季9种海平面气压场客观分型[19]、发生频率(左上数字)与此型发生暴雨的频率(右上数字)Fig.6 Objective classification of nine kinds SLP field in summer 1951-2012r[19],frequency of occurrence(upper left number)and the frequency of this type rainstorm occurs(upper right number)
当前数值预报和统计预报相结合的方法是集合预报。所谓“集合”,就是用数值模式制造出数十个乃至上百个不同的预报结果。其中的每一个成员,都与一定的模式过程和初值相对应,都是确定的预报。但是由于每个成员的模式过程或初值多存在一些微小的差异,所以预报结果各不相同,整个集合的预报有一定的离散度。换言之,集合预报是用确定论方法人为制造出来的不确定性。然后,再用统计方法从这个预报集合的离散特征中做出预报。集合预报不同于MOS预报,仍是直接的数值预报,统计只是归纳数值预报结果的方法。更重要的是,集合预报从方案设计开始就在概率论的指导之下进行,所以集合预报是确定论和概率论方法的有机结合。显然,集合预报的思路更符合客观世界变化的根本规律。
特别有意思的是,集合预报不仅可以提供大概率事件的预报,也可提供极端事件的预报。图7是从互联网下载的各国数值模式对721暴雨过程的集合预报比较[7]。图中给出的不是具体的降水量,而是24h极端降水的发生概率。虽然对图中极端降水的定义及其发生概率的具体算法还没有深入了解,但图7所显示的预报效果令人惊叹。因此,开展集合预报的研究和应用,在广大预报员中普及集合预报的基本知识是很有必要的。
本文第一作者早年曾做过少量的统计预报工作,所用的也都是比较简单的统计方法。本文只是通过对统计预报基本概念的讨论和几个统计预报具体事例的介绍,试图说明统计预报是天气预报方法中不可缺失一个方面,值得引起大家的重视。
篇后语:初稿完成后,作者又把《信号与噪音——为什么有的预报失败,但有的成功》[20]和《赤裸裸的统计学——除去大数据的枯燥外衣,呈现真实的数据之美》[21]这两本书找出来从头至尾重新翻阅。感到除了强调统计预报的必要性,还必须指出统计预报的局限性,还有一些非常重要的话需要说,例如统计预报是否真的可以不讲“道理”。为此补充介绍以下内容。
这两本书都一方面指出“在大数据时代,统计的重要性怎么强调都不过分”,但同时也强调统计数字也会“撒谎”。如果数据不足,或者统计方法错误也会得出谬以千里的结论。书中举了一个浅显易懂但值得每一个预报员深思的例子:统计数据可能得出“工作时小憩的人更易死于癌症”这样的结论,但实际是离开办公室休息的员工中有很多人在办公楼入口处抽烟,是抽烟而非小憩引发了癌症。可见,如果在数据处理过程中有先入为主的偏见,就可能犯重大的错误。只有对科学保持谦虚谨慎的态度,承认客观世界具有不可测性和不确定性,才能避免错误。
图7 各国模式2012年7月18日20时的第3~4天的24h雨量极端天气概率预报[7](来源:http://tparc.mri-jma.go.jp/TIGGE/tigge_extreme_prob.html)Fig.7 Extreme weather probability forecast for 24h rainfall of 3-4th day at 2000 July 18th,in each country mode[7]
书中举了瑞典数学家、作家安德烈斯的一句话:用数据说谎容易,但是用数据说出真相却很难。因此书的作者认为最重要的是首先必须明确自己所持的观点源于哪个科学原理,避免曲解统计结果。也就是说统计预报也必须讲“道理”,不可盲目。
书中还有一个重要的观点是:“假设不能算是科学,假设只有通过预测得到检验才能成为科学。”也就是说,中长期预报和气候研究中的统计结论,都要经过预报检验才能成立。总之,“实践才是检验真理的唯一标准”。
参考文献
[1]丑纪范.天气和气候的可预报性.气象科技进展,2011,1(2):11-14.
[2]郭树忠,罗宝玉.经典预报自动化系统.航空气象,1989,(增刊1):11-13.
[3]Wallace J M,Gultzler D S.Teleconections in the geopotential height field during the Northern Hemisphere winter.Mon Wea Rev,1981,109(4):784-812.
[4]陶祖钰,郭炜.冬季500 hPa侯平均高度场的遥相关.气象学报,1989,47(4):486-492.
[5]Hoskins B J,Karoly D J.The steady linear response of a spherical atmosphere to thermal and orographic forcing.J Atmos Sci,1981,38:1179-1196.
[6]Simmons A J,Wallace J M,Branstator G M.Barotropic wave propagation and instability and atmospheric teleconnection patterns.J Atmos Sci,1983,40:1363-1392.
[7]陶祖钰,郑永光.“7·21”北京特大暴雨的预报问题.暴雨灾害,2013,32(3):193-206.
[8]姜晓曼,袁慧玲,等.北京“7.21”特大暴雨高分辨率模式分析场及预报分析.气象学报,2014,72(2):207-219.
[9]李南声.用网格点相关系数法选相似形势场.气象,1982,8(1):16-17.
[10]赵鹏福,邱志生.环流型聚类分析问题的初步探讨.气象,1985,11(6):13-16.
[11]陶祖钰,汤桂生.寻找相似天气形势的客观方法研究.大气科学研究与应用,1993,(5):81-88.
[12]Kohonen T .Self-Org anization Maps.Berlin:Springer Verlag,1995.
[13]赵翠光.华北夏季降水多尺度研究及客观预报.南京:南京信息工程大学,2012.
[14]施能.气象统计预报.北京:气象出版社,2009.
[15]黄嘉佑.气象统计分析与预报方法.北京:气象出版社,1990.
[16]魏凤英.现代气候统计诊断与预测技术.北京:气象出版社,2007.
[17]柳士俊,张蕾.光流法及其在气象领域里的应用.气象科技进展,2015,5(4):16-21.
[18]韩雷,王洪庆,林隐静.光流法在强对流天气临近预报中的应用.北京大学学报(自然科学版),2008,44(5):751-755.
[19]Zhao Y Y,Zhang Q H,Du Y,et al.Objective analysis of circulation extremes during the 21 July 2012 torrential rain in Beijing.Acta Meteor Sin,2013,27(5):626-635。
[20]纳特·希尔弗.信号与噪音.胡晓娇,张新,朱辰辰,译.北京:中信出版社,2013.
[21]查尔斯·惠伦.赤裸裸的统计学.曹槟,译.北京:中信出版社,2013.
The Necessity of Statistical Forecasts
Tao Zuyu1,Zhao Cuiguang2,Chen Min3
(1 Department of Atmospheric and Ocean Sciences,School of Physics,Peking University,Beijing 100871 2 National Meteorological Centre,Beijing 1000813 Institute of Urban Meteorology,China Meteorological Administration,Beijing 100081)
Abstract:First,weather forecast uncertainty is discussed from the perspective of epistemology,namely,deterministic and probabilistic theory.Today,subjective forecast is increasingly replaced by the numerical weather prediction(NWP),but statistical forecasting is still irreplaceable.In terms of methodology,statistical forecasting is objective induction.Statistical prediction is not limited by predictability of NWP in theory.Statistical forecasting has a correlation or similar method; rare event related with extreme weather can be forecasted in similar method.Ensemble prediction method is a combination of deterministic and probabilistic methods,and is the development direction of the current weather forecast.Finally,there are limitations on statistical prediction itself,and statistical forecasting must be also verified by the effect in the forecast practice.
Keywords:weather forecasts,statistics,correlation,similarity,rare event of extreme weather
收稿日期:2014年3月3日;修回日期:2014年6月5日
DOI:10.3969/j.issn.2095-1973.2016.01.001
第一作者:陶祖钰(1939—),Email:taozuyu@pku.edu.cn
资助信息:公益性行业(气象)科研专项(GYHY200906003,GYHY201206004,GYHY201306023);国家重点基础研究发展计划(2013CB430106)