基于SVM和RF方法的安阳雾预报研究
2023-09-14胡航菲
胡航菲
摘要 利用常规观测资料,采用统计分析方法得到雾天气时各气象要素指标,然后基于SVM和RF方法建立安阳雾预报模型,并检验分析。结果表明:相对湿度越大,越易出现低能见度;出现雾时气温主要分布在-3~3 ℃,温度露点差在0~3 ℃,风速大部在0~3 m/s,风向主要为偏南风、西南风,且以偏南风为主;SVM和RF 2种方法对雾分级预报效果总体一般,相对来说RF效果较好,综合采用RF方法对雾进行分级预报。
关键词 气象要素;SVM方法;RF方法;雾
中图分类号:P457.1 文献标识码:B 文章编号:2095–3305(2023)07–0148-03
大雾天气是一种常见的灾害性天气。大雾天气带来的低能见度会对城市交通、高速公路、机场等交通安全带来很大危害,而雾一旦与气溶胶颗粒结合形成雾霾,将会对空气质量、人体健康等方面产生严重的负面影响。
近年来,已有许多气象学者对雾进行了大量研究[1-4]。黄彬等[5]对GRAPES-TYM模式海雾预报性能进行了检验,发现该模式对均压场形势下黄海海雾的落区预报最准确。冯涛等[6]利用统计方法建立了华北高速公路沿线及邻近气象站的雾定量统计预报模型,检验表明该方法具有一定的预报能力。杨红子[7]分析研究了乌海市雾的环流特征和气象要素变化,最终提炼出了预报指标—地面相对湿度≤90%,地面风速<3.0 m/s,气温日较差在9~16 ℃之间。但是,由于不同地区的天气条件不同,雾的预报技术存在一定的地域差异。安阳特殊的气候特点、地形条件及城市布局,使其在大范围天气形势比较稳定、湿度条件较好等条件下容易出现雾。在实际业务中,由于雾的局地性强、时空分布差异大,其预报存在较大的难度。
基于安阳市近30年常规气象观测资料,采用支持向量机方法(Support Vector Machine,SVM)和随机森林方法(Random Forests,RF)分别建立雾预报模型,并对比检验分析,以期建立雾的有效预报方法,为安阳市雾预报预警服务工作提供参考。
1 资料与方法
1.1 资料
采用1992—2021年安阳市5个县(市)常规观测资料,选用其中的雾日数据和气温、相对湿度、露点温度、定时10 min风速、定时10 min风向、小时降水量、能见度等。
根据地面气象观测规范的定义,雾是指大量微小水滴浮游空中,使水平能见度V<1.0 km的天气现象。只要出现雾即统计为一个雾日。
1.2 方法
1.2.1 支持向量机方法(Support Vector Machine,SVM) SVM方法是基于统计学理论发展而来的,它是通过一个非线性映射p,将样本空间映射到一个高维乃至无穷维的特征空间,使得在原来的样本空间中非线性可分的问题转化为在特征空间中的线性可分的问题。即升维和线性化。SVM方法在气象预报领域,如温度、暴雨、云量的预报等方面已经取得了一定的进展。
1.2.2 随机森林方法(Random Forests,RF) RF方法是集合了多个决策树对样本进行训练,并预测的一种分类器。随机森林方法的基本思想是先应用自助法重抽样技术从原始训练集中有放回地重复随机抽取k个样本,且每个样本的样本容量与原始训练集相同;然后对k个样本分别建立k个决策树模型,得到k种分类结果;最后根据k种分类结果对每个记录进行投票表决,决定其最终分类。大量理论和实践研究证明,RF方法具有很高的预测准确率。
2 雾天气的气象要素特征
从形成原因来看,影响雾的气象要素主要有气温、相对湿度、温度露点差、风速等,通过分析可知,在选取的样本时段,小时雨强主要在0.1~5.0 mm,
占比92.8%,此时能见度大部在2 km以上,占比77.3%,而本研究预报的重点是雾天气的能见度情况,因此,暂时不考虑降水對能见度的影响。
从表1可以看出,在雾天气时,影响能见度的主要因子是相对湿度和温度露点差,其次是气温。除能见度与相对湿度呈负相关外,与其余气象要素均呈正相关。
水汽饱和是雾形成和发展必不可少的条件之一,而饱和水汽压与气温关系密切,故气温对雾的形成很重要。对于不同类型的雾,风的作用也不同。由图1可知,出现低能见度时其水汽几乎是近于饱和的,相对湿度越大,越容易出现低能见度天气。出现雾时气温主要分布在-3~3 ℃,温度露点差在0~3 ℃,风速大多在0~3 m/s,风向主要为偏南风和西南风,且以偏南风为主。
3 雾预报方法
在实际业务中,雾预报的重点是雾强度预报,依据其强度发布相应级别的预警信号。雾强度预报实质上是能见度的分级预报。本研究采用SVM和RF 2种分类算法进行建模,并对比分析,建立雾的有效预报模型。
3.1 预报模型的建立
在采用分类算法建模前,先确定分级标准。在建立雾预报模型时,能见度的分级标准以其等级进行划分,但由于现有预报能力对V<200 m的情况预报效果较差,因此结合业务实际,重点研究0级(V≥10 000 m)、1级(1 000 m≤V<10 000 m)、2级(500 m≤V<1 000 m)和3级(V<500 m)的预报情况。
在建立模型时需先将训练样本数据离散化处理,再进行预报因子的确定。SVM中预报因子的确定采用逐步回归方法。RF则是将所有预报因子输入,在模型建立时自动筛选。以林州为例,由表2可知,模型4的复相关系数最大,结果最好,因此对于林州考虑采用模型4中的4个因子作为预报因子建立模型,其余站的因子使用同样的方法选取。
对于SVM,确定预报因子后即可输入训练模型。训练模型以原始样本的2/3数据作为训练样本,以剩余的1/3数据样本作检验,最后将1/3的数据样本预报结果与其对应的实况进行对比,确定模型优劣。而RF相对简单,将预报因子输入建立预报模型后,使用与SVM相同的方法进行检验分析。
3.2 預报模型检验
对能见度分级预报模型的评价基于5种预报检验方法,分别为级别正确性评分、准确率(GR)、漏报率(PO)、空报率(FAR)和预报偏差(BS)。级别正确性评分中预报级别与实况级别完全正确100分,相差一级50分,相差两级及以上0分。
式(1)~(4),NA为预报正确样本数,NB为空报样本数,NC为漏报样本数。
3.3 结果分析
对SVM和RF方法建立的雾分级预报模型进行对比检验分析,2种方法对能见度分级的总体预报效果一般,相对来说RF较好。对于5个站点,2种方法均是以林州的预报效果最好,对安阳、滑县预报效果较差。RF和SVM对各县能见度分级的总体预报准确率分别为73.4%~75.6%和63.5%~75.1%,能见度级别正确性评分分别为86~87和81~87分。比较而言,RF对SVM方法中预报准确率较低的站点预报效果改善较明显,如安阳站(表3)。
表4是5个站点雾分级预报的结果检验,0级时RF的预报准确率明显高于SVM,RF和SVM对雾的分级预报准确率分别为56.5%~76.5%和35%~71%。
(1)1级时,2种方法的预报准确率均高于0级时,SVM的预报准确率高于RF,对于站点预报效果的好坏与0级时呈相反情况,1级时对林州预报效果最差,对安阳和滑县预报效果较好。SVM和RF的预报准确率分别为81%~95%和76.3%~84.2%。
(2)2级时,2种方法对雾分级预报效果都不理想,几乎均在10%以下,其中RF的预报效果稍好,SVM对除林州外的其他站点预报准确率均为0。
(3)3级时,2种方法对其预报效果都不太理想,但是其预报准确率高于2级时,对于安阳、林州、内黄,RF预报效果优于SVM,RF和SVM的预报准确率分别为19.4%~47.2%和1.0%~43.0%;对于汤阴和滑县SVM预报效果优于RF,SVM和RF的预报准确率分别为44.0%~60.0%和24.8%~46.4%。
结合空报率、漏报率和预报偏差来看,除2级外RF预报效果均高于SVM。因此,综合采用RF方法进行能见度分级预报。且2级和3级的低能见度预报效果明显低于0级和1级。一方面,是分级造成的,在进行等级划分时,0级和1级的数据量占总样本的90%以上,低能见度的样本量太少,采用RF或SVM时无法充分学习该等级的分类特征,效果较差。另一方面,在建立模型时,仅仅考虑了相对湿度、气温、温度露点差、风速等气象要素,尚未分析探空数据、天气类型等,这对能见度具有一定的影响。
4 结论
(1)在雾天气时,影响能见度的主要因子是相对湿度和温度露点差,其次是气温。在出现雾时,气温主要分布在-3~3 ℃,温度露点差在0~3 ℃,风速大多在0~3 m/s,风向主要为偏南风和西南风,且以偏南风为主。
(2)SVM和RF 2种方法对雾分级的预报效果总体一般,相对来说RF效果较好。综合采用RF方法对雾进行分级预报。
(3)目前,对于低能见度的预报准确率较低。这可能主要受限于采用的预报因子数量、要素预报的准确率和统计资料的数量。随着探空技术的不断增强、新资料的挖掘应用以及EC细网格预报产品的进一步丰富,将会进一步提高预报准确率。
参考文献
[1] 赵德法.雾对农业生产的影响及相关措施[J].农业与技术,2017,37(1):144-145.
[2] 王鹤婷,刘小雪,周涛.2019年1月12日:14日雄安新区大雾过程分析[J].农业灾害研究,2022,12(8):79-81.
[3] 张庆奎,项阳,王莹,等.安徽阜阳市大雾天气的潜势预报方法[J].干旱气象, 2015,33(6):1045-1049.
[4] 刘熙明,胡非,邹海波,等.北京地区一次典型大雾天气过程的边界层特征分析[J].高原气象,2010,29(5):1174-1182.
[5] 黄彬,高荣珍,时晓曚.GRAPES-TYM模式对我国东部近海海雾预报性能评估[J].气象科技,2022,50(06):783-792.
[6] 冯涛,李迅,丁德平,张德山,等.华北地区高速公路沿线雾预报[J].气象科技, 2011,39(6):719-722.
[7] 杨红子.乌海市雾预报指标分析[J].内蒙古气象,2020(3):20-23.
Study on Anyang Fog Forecast Based on SVM and RF Methods
Hu Hang-fei (1.Anyang National Climate Observatory, Anyang, Henan 455000)
Abstract Using conventional observation data and statistical analysis methods to obtain various meteorological element indicators during foggy weather, an Anyang fog prediction model was established based on SVM and RF methods, and the analysis was tested. The results show that the higher the relative humidity, the easier it was for low visibility to occur; When fog occurs, the temperature was mainly distributed at -3 to 3 ℃, the temperature dew point difference was 0 to 3 ℃, and the wind speed was mostly 0 to 3 m/s. The wind direction was mainly southerly, southwesterly, and mainly southerly. The overall effect of SVM and RF methods on fog classification and prediction was generally average, while the effect of RF was relatively good. RF methods were comprehensively used for fog classification and prediction.
Key words Meteorological elements; SVM method; RF method; Fog