降水类天气现象自动与人工观测质量对比分析
2022-04-13周坤论黄剑钊李艳萍
周坤论,黄剑钊,陶 伟,李艳萍,李 强
(1.广西壮族自治区气象技术装备中心,南宁 530022;2.广西壮族自治区气象信息中心,南宁 530022)
引言
天气现象是指一定条件下在大气、地面出现并可以观测到的物理现象,主要分为降水现象、地面凝结、视程障碍、雷电及其它现象等5 大类。其中降水类天气现象有3 大类11 种,分别为液态降水(雨、阵雨、毛毛雨)、固态降水(雪、阵雪、冰粒、米雪、霰、冰雹)、混合降水(雨夹雪、阵性雨夹雪)[1]。
早期,由于相关探测技术还不成熟,降水类天气现象一直都是人工观测。而人工观测存在主观性强、简单化、定性化等问题,对不同降水类型以及起始和结束时间的判断存在一定难度,尤其是夜间降水观测。为开展天气现象自动化观测,推动气象现代化建设,2010 年以来,中国气象局相关研究人员根据目前自动化观测技术的发展现状对其展开调研[2];并对我国主要气象台站(50 年来)长期观测天气现象进行了详细分析[3];随后开展了降水现象仪的试验并于2015 年完成考核[4]。与此同时,为克服人工观测的主观性,针对目前国内对雨滴谱降水现象仪常用标定方法存在的问题,中国气象局探测中心杜波等人开展了雨滴谱降水现象仪对比观测实验[5]和雨滴谱降水现象仪综合测试系统的设计[6];国内各省份也先后进行降水天气现象平行观测数据对比分析[7-11]。此外,更多科研人员基于雨滴谱降水现象仪资料的特征统计研究[12]以及在雷达定量评估降水方面也做了大量的研究[13,14]。
近年来,气象部门开始布设降水类天气现象仪,广西作为首批开展降水类天气现象平行观测的省级单位,全区所有国家级地面气象观测站(91 个)于2017 年8 月1 日正式运行,其中,所选用的设备有DSG1(40 个)、DSG4(10 个)、DSG5(41 个)等3 种型号。人工观测记录包括雨、阵雨、毛毛雨、雪、阵雪、雨夹雪、阵性雨夹雪、冰雹等8 种降水现象[15];自动化观测则包括雨、毛毛雨、雪、雨夹雪、冰雹等5 种。设备识别的阵雨、阵雪、阵性雨夹雪分别订正为雨、雪、雨夹雪。
本文主要对2017 年8 月至2018 年7 月期间广西91 个国家级地面气象观测站自动观测数据进行统计,结合人工观测记录进行对比分析,指出设备算法识别降水类天气现象存在的问题,其研究结果可为评估设备性能优劣方面提供参考。
1 资料和方法
1.1 资料来源
数据资料来源于广西壮族自治区气象信息中心,选取2017 年8 月—2018 年7 月广西所有国家级地面气象观测站人工观测与自动观测降水类天气现象数据。根据业务改革,人工观测要求严格按照《地面气象观测规范》要求进行,白天期间(08∶00—20∶00)各地市台站值班员分别在08∶00、11∶00、14∶00、17∶00、20∶00 定时观测五次,及时记录出现在视线区域内的天气现象。夜间出现天气现象,尽量判断,不记录时间。因此观测资料只选取白天08∶00—20∶00。
1.2 数据筛选
全区91 个站点,使用的降水现象仪类型如表1。DSG1 型40 个、DSG4 型10 个、DSG5 型41 个。若剔除个别台站非设备原因与维护造成的缺测天数[16],全区设备观测数据总计33045d,共计23825445 条分钟记录。其中,设备正常运行状态,剔除降水类现象缺测数据,有效数据应为23800307 条(08∶00-20∶00)。
表1 降水现象仪类型
计算三种类型设备年缺测率结果如表2 所示,全区降水类天气现象仪平均缺测率为0.11%,DSG1型缺测率(0.22%)明显大于DSG4 型、DSG5 型,特别地三类设备中DSG5 型年应观测总次数最高(10675847 次),缺测率反而最低(0.01%)。
表2 降水现象仪的年缺测率(单位:%)
1.3 处理方法
广西国家级地面气象观测站按现行业务要求开展降水类天气现象观测,人工观测降水现象按照地面气象观测规范要求记录,记录降水的起始和结束时间,计算出每次降水过程中人工观测降水的持续时间。以人工记录时间为参照标准,通过统计以及分析不同类型设备平行观测数据的捕获率、吻合率、漏报率、错报率、空报率,对DSG1、DSG4 和DSG5 型降水类天气现象仪性能进行评估。计算公式如下[7-8]:
此外,在处理降水类天气现象方面,结合广西当地实际天气特征,人工甄别阵雨和毛毛雨方面存在很大的局限性,为减少人工观测与设备观测产生的误差,统一把阵雨和毛毛雨归为雨。因此,本研究将人工观测和自动观测资料降水类天气现象分为雨、雪、雨夹雪、冰雹四类。DSG1、DSG4、DSG5 三类设备安装的地市区域下文分别记为G1(南宁、梧州、贵港、玉林、百色、崇左)、G4(北海、防城港、钦州)、G5(柳州、桂林、贺州、河池、来宾)。
2 结果与分析
通常认为不同类型的设备观测的降水类天气现象也存在不同的差异。为探讨设备类型对降水类天气现象的识别差异以及与程序算法的关联,对91 个台站平行观测资料进行统计分析,以人工观测数据为参考标准,设备类型分为DSG1、DSG4、DSG5 三类,降水类型分为雨、雪、雨夹雪、冰雹四类。下文按设备类型分别对降水现象进行统计以及分析其捕获率、吻合率、漏报率、错报率、空报率。
2.1 自动观测与人工观测分钟数对比
表3 为三类设备降水类天气现象分钟记录表。由表可知,广西全年降水类型主要以雨为主,人工观测降雨发生的分钟数均明显大于设备观测的,主要原因为广西降雨普遍时断时续,人工观测时间段是连续的,而设备观测则是分散不连续的。此外,广西全年人工观测到降雪、雨夹雪、冰雹的分钟数较少,特别是G4 等区域人工没有观测到;但设备观测到雪、雨夹雪、冰雹的分钟数明显比人工观测的多。
表3 降水现象分钟记录数总计
2.2 自动观测与人工观测过程次数对比
自动观测与人工观测降水过程次数如表4。总体上,三类设备自动和人工观测降水过程次数相差很大,相比于人工观测,自动观测过程次数均明显更多。广西各地市全年降水过程较多,设备和人工都较容易识别,而设备更精细化。若出现间歇性降水,设备可识别出多个降水过程而人工通常会记为一次;在识别雪、雨夹雪和冰雹方面,三种设备与人工观测数据都存在很大误差。
表4 不同设备降水现象过程次数总计(单位:次)
2.3 捕获率、吻合率、漏报率、错报率、空报率对比
(1)捕获率对比
人工观测降水过程起止期间,若自动观测能够正确识别该次降水类型的分钟数达1min 以上即认为设备正确捕获该次降水过程。由表5 可知,DSG1、DSG4、DSG5 三类设备对全年降雨过程的捕获率超过了80%,特别是DSG5 型天气现象仪捕获率最高,达到了90%以上,与文献[6]研究结果相近[6]。此外,全区人工观测降雪、雨夹雪、冰雹过程次数极少,总计31 次;与降雨过程捕获率相比,G1 区域6 次冰雹(捕获率66.67%),G5 区域7次降雪(捕获率57.14%),捕获率均明显偏低,尤其是G5 区域人工观测雨夹雪14 次无正确捕获。
(2)吻合率对比
由表5 可以看出,DSG1、DSG4 型识别降雨过程吻合率相近,且都超过50%,DSG5 型吻合率最高(58.22%),这与2.2 中的解释一致,若出现间歇性降水,设备可精准识别出降水起止的分钟数,而人工往往很难判断降水起止时间,通常会记为连续性降水,从而出现降雨过程捕获率高达80%以上,而吻合的分钟数仅达到50%以上。另外,三类设备识别降雪、雨夹雪、冰雹的吻合率较低,结合2.1 设备与人工观测分钟数对比,自动观测出现错判降雪、雨夹雪、冰雹的分钟数较多。
(3)漏报率对比
如表5 所示,与DSG1(47.95%)、DSG4(49.42%)型设备相比,DSG5 型漏报率略小(41.15%);DSG1型识别降雪(人工观测24min)全部漏报,冰雹(人工观测28min)漏报率为25%;总体上DSG5 型识别降雨、雪、雨夹雪、冰雹的漏报率都小于45%,较文献[7]的研究结果略小[7]。结合实际观测业务分析漏报主要原因,自动观测分钟数据分散不连续,普遍要比台站人工观测记录的分钟数少。
表5 不同设备识别降水现象的捕获率、吻合率、漏报率、错报率、空报率对比
(4)错报率对比
如表5 所示,全区降雨较多,观测分钟数据量大,三类设备识别的降雨错报率均较低。结合上述2.5,三类设备在识别降雪、雨夹雪、冰雹等降水类型方面,漏报和错报占主导;雨夹雪的错报率最高,主要原因是雨夹雪为混合降水,人工和设备识别难度较高;查看数据发现人工观测为雪、雨夹雪、冰雹时候,设备多识别为雨。
(5)空报率对比
如表5 所示,三类设备空报率都较低,一年中无降水现象的时间较长,当人工观测无降水时,自动观测很少有降水现象发生,这样使得人工没观测到降水现象的分钟数很多,以致空报率极低。
2.4 错判分析
据统计,近年来广西全年出现雪、雨夹雪、冰雹的天气非常少,结合2.1 和2.4,G1 区域全年人工观测降雪24min(吻合分钟数0)、冰雹28min(吻合分钟数7);G4 区域全年人工观测无降雪、雨夹雪、冰雹;G5 区域人工观测降雪537min(吻合分钟数72)、雨夹雪432min(吻合分钟数0)、冰雹26min(吻合分钟数0)。综合以上情况,相比于人工观测,自动观测降雪、雨夹雪、冰雹的分钟数相对较多,雨误判为雪、雨夹雪和冰雹等占绝大部分,特别是瞬时雨强较大的暴雨,雨滴重叠容易误判为冰雹[17,18],而G1 区域DSG1 型设备容易误判为冰雹,而G5 区域DSG5 型设备容易误判为雪,这可能与G1、G5 区域的降水雨强或者设备内在的程序识别算法有关。此外,环境也是造成误判的重要因素,如:草木灰、蜘蛛网、昆虫等。
3 结论和讨论
结合人工和自动观测,对广西2017 年8 月一2018 年7 月DSG1、DSG4 和DSG5 型降水类天气现象仪自动观测数据进行整理和统计分析,总结如下:
(1)广西91 个国家站点数据完整性好,全区年降水以雨为主,设备平均缺测率符合不大于2%的要求,DSG5 型设备数据完整性最高(数据量最大,缺测率最低:0.01%)。
(2)在降水过程中,三类设备对降雨的捕获率较高,均超过80%,DSG5 型设备捕获率最高(90.18%),吻合率较好(大于50%),错报率较低;但三类设备对雪、雨夹雪、冰雹的识别均较困难,但DSG1 型设备对冰雹的捕获率为66.67%,DSG5 型设备对雪的捕获率为57.14%;另外漏报和错报率较高,特别是雨夹雪(错报率70.6%)。
(3)人工观测无降雪、雨夹雪、冰雹,三类设备均将雨误判为雪、雨夹雪和冰雹的分数较多;特别地DSG1 型设备容易误判为冰雹,DSG5 型设备容易误判为雪。
综上所述,降水类天气现象仪自动化观测对降雨过程识别较强,捕获率较高,大大减轻了基层观测人员的工作压力,降低了人工观测的主观性,能全面连续地反映降水实情。但遇到暴雨时,雨滴重叠易将雨错判为雪、雨夹雪、冰雹等,且漏报错报率较高,三类设备需在雪、雨夹雪、冰雹等微降水和混合类降水方面进行更好地智能识别和质控算法优化。此外,广西自动观测与人工观测期限为一年,且人工观测对值班人员的专业技能及工作经验要求较高,数据质量易受主观判断的影响,仅从缺测率、捕获率、吻合率、漏报率、错报率、空报率等还未能准确评估三类设备性能的优劣,后期将从设备端识别的降水粒子的属性分析,进一步加强雨滴谱的特征研究。