贵州省地面观测数据质量统计系统的实现
2020-08-06支亚京卜英竹陈贞宏杨恩波
支亚京,卜英竹,陈贞宏,杨恩波
(1.贵州省气象信息中心,贵州 贵阳 550002;2.贵州省生态气象和卫星遥感中心,贵州 贵阳 550002; 3.贵州省安顺市气象局,贵州 安顺 561000;4.贵州省松桃苗族自治县气象局,贵州 松桃 554100)
0 引言
2014年4月30日,中国气象局预报与网络司下发的《预报司关于印发全国地面自动气象站实时观测资料质量评估办法通知》中提到,为了加强台站数据处理能力和提高数据质量,要对自动气象站观测数据进行质量考核。数据质量统计有助于综合考核台站数据质量,提高全国自动气象站资料质量,促进自动气象站资料在国家、省级气象业务和服务中的应用。贵州省观测网络处为了加强本省台站数据处理能力和提高数据质量,对本省自动气象站数据按照中国气象局观测司地面观测数据质量评估办法进行考核,其质量评估对象包括国家级自动气象站(不包含无人值守气象站)和考核区域站。
气象资料业务系统(Meteorological Data Operational System, MDOS)[1-2]实现了国家、省、台站三级观测数据收发、数据质量控制(以下简称,数据质控)、数据处理及应用等流程,实现了历史资料和实时资料业务一体化,全面提高各类气象资料的应用。MDOS系统完成的质量统计包括国家站(包含无人值守气象站)和所有区域自动气象站(无考核区域站和非考核区域站之分)质量统计。其统计结果与国家气象局和贵州省质量考核对象不一致,每次进行观测数据质量统计,业务人员需要人工将非考核台站从质量统计结果中剔除,再重新计算考核站观测数据质量,增加了业务人员的工作量,有时统计结果不准确。
1 理论概述
1.1 数据质量控制码(QC码)[3]规定
数据质量控制码规定如表1所示:
表1 数据质量控制码规定Tab.1 Data quality control code specification
1.2 地面观测资料数据质量评估指标[3]
评估气象观测数据质量的4个指标分别是:数据可用率、数据错误率、数据可疑率和数据缺测率,通过统计MDOS数据库中数据质控码来反映气象观测数据质量状况。统计方法如下:
假设有n(1,2,…,i,…)个台站进行观测数据质量统计,其中,第i个台站在观测运行期间数据个数为应有数据个数i,对通过质量检查的数据个数i、错误数据个数i、可疑数据个数i以及缺测数据个数i进行统计,则该站观测数据质量统计结果为:
(1)
(2)
(3)
(4)
数据可用率i、数据错误率i、数据可疑率i和数据缺测率i满足如下关系式:
数据可用率i+数据错误率i+数据可疑率i+数据缺测率i=100%
(5)
n个观测数据质量统计结果为:
(6)
(7)
(8)
(9)
2 系统设计介绍
2.1 系统设计原理
系统的设计流程是:首先,按地市读入自定义的台站配置表,根据台站号按照各类台站考核要素,通过读取本地MDOS oracle数据库台站信息表中的观测要素标识码来判断该台站是否观测此要素,计算该台站考核要素中总观测要素个数。其次,遍历对应台站逐时次的小时数据表,获取查询时间段的考核要素质控码。最后,通过遍历质控码,根据可用率计算公式得到各台站和各地市的可用率,输出到Excel表格中。系统的程序结构逻辑图如图1 所示:
图1 程序结构逻辑图Fig.1 Logic diagram of program structure
系统设计的核心基于Windows系统的客户端-服务器端(以下简称C/S)架构体系和MDOS2.1的ORACLE 11g数据库。利用Micorosoft Visual Studio 2010[5]在此数据库的基础上进行二次开发。逻辑结构为典型的三层C/S结构:表示层、功能层、数据层。系统界面即为表示层,负责用户与应用间的交互,业务人员可以直接进行操作;功能层是观测数据质量统计功能编入程序中;数据层即数据管理系统,负责对ORACLE 11g 数据库的查询[5]。各模块在逻辑上独立,逻辑结构图如图2所示:
图2 系统逻辑结构图Fig.2 System logic structure diagram
2.2 系统功能介绍
本系统能够根据用户需求,统计任意时间段内任意可用率阈值地面观测数据的可用率,系统包括国家级自动气象站的可用率统计、考核区域站的可用率统计以及所有区域站的可用率统计。在界面上选择好时间、文件存放路径、可用率阈值之后,需要统计哪类观测资料数据质量就点击相应的按钮,期间可以显示出当前资料数据质量统计的运行进度,其统计结果便于业务人员统计了解全省各个地市数据质量情况。系统的主界面图如图3 所示:
图3 系统界面图Fig.3 System interface diagram
2.3 系统输出结果
系统可按地市、台站分别统计国家地面气象站、区域气象站观测数据可用率,对观测数据可用率低于99%的台站统一列出,根据业务需要统计有关站数。以考核区域站统计结果为例,图4 为考核区域站可用率统计_按台站升序排列统计结果图、图5为考核区域站可用率统计_按地市升序排列统计结果图、图6为全省各地市可用率低于99%的台站个数的统计结果图。
图4 考核区域站可用率统计_按台站升序排列统计结果图Fig.4 The statistical results diagram of data availability order by station ascending
图5 考核区域站可用率统计_按地市降序排列统计结果Fig.5 the statistical results diagram of data availability order by city descending
图6 全省各地市可用率低于99%的台站个数的统计结果Fig.6 Statistical results of the number of stations with a rate of less than 99% in all cities
3 结语
贵州省地面观测数据质量统计结果有助于台站工作人员了解本站的数据质量状况,及时发现仪器运行故障、数据传输失败、省级数据未入库等问题,有助于省级管理部门掌握全省自动气象站的运行情况,提高贵州省自动气象站资料质量,为气象业务、服务中应用提供及时准确的观测数据。作为MDOS的辅助系统,存在以下待优化方面:一是选取时间不够灵活,目前统计时间间隔为1 d,后续需要调整时间间隔为1 h,使数据质量统计时段更加灵活;二是基于客户端-服务器端(C/S)[6]架构,不便于扩展系统性能,希望改进成浏览器端-服务器端(B/S)架构。