天津市信息化地面气候资料质量评估

2021-03-09任建玲

天津科技 2021年2期

任建玲，徐梅

(天津市气象信息中心天津300074)

0 引言

地面气象观测资料是研究区域乃至全球气候变化与预测、天气动力分析、数值天气预报模式研究、资料同化的基础，是雷达与卫星定标、水文设计、农业决策的重要依据[1]。在2004 年自动观测仪器使用前多以纸质记录为主，1979 年按照中央气象局业务管理处下发的《全国基本站地面气象资料信息化基本模式暂行规定》，天津市气象局气候资料室(信息中心前身)启动了地面气候资料信息化工作。气候资料的信息化工作，就是把气象台站观测的各类原始气象记录，经过人工输入微机处理，转换成计算机能够接收和处理的信息[2]。初期是使用纸带穿孔方法对纸质地面气象观测记录月报表进行信息录入操作，用手工打键的方法，把手工记载的气象资料变成电子计算机能接收识别的信息，记入纸带、卡片、磁带或胶片等信息载体[3]，将资料进行纸带穿孔后利用光电机进行复查，后用DJS-6-108 机进行逻辑检查。1985 年9 月国家气象局配备了CCS400 型微机，从此气候资料信息化工作全部转入CCS400 型微机上；1989 年底完成了天津市全部台站历史气候资料的信息化任务，形成了A0 模式数据文件；1990 年底又完成了全部信息化资料的标准处理和信息载体的转换工作。A0 文件作为重要的信息化气候资料为之后的气象事业发展提供了可靠的基础数据资源[3]。

1987 年配置了电子计算机后，开始用计算机审核、修改和打印气象观测报表。1997 年全市所有台站的资料均由台站直接将地面资料信息化处理后以D文件的形式上传到市气象局，全部机审和制作机制报表。随着网络技术的发展，气象资料的传输方式发生了根本变化，由以前的人工报送或邮寄纸质报表，改变为网络传输，1999 年国家气象局规定停止报送纸质报表，只报送经计算机处理的标准数据。

2005 年开始，天津市所有台站改为自动气象站，大部分观测项目实行自动仪器观测。由于历史地面信息化资料时间跨度大，地面气象观测规范也做过多次修改，数据格式(特别是信息化数据格式)变动非常大，信息化工作参与人员众多等因素或多或少影响数据的质量，对其进行质量评估意义非常重大。

1 评估目的

通过对天津市信息化地面气候资料的评估，达到以下目的：

①为其他各类观测资料的信息化工作提供参考，总结经验吸取教训，以便进一步提高资料信息化质量。

②让信息化气候资料数据的使用用户了解各个观测要素疑误发生的频次、时间分布、空间分布，以便他们使用数据时，有一个全局和客观定量的把握。

③了解地面气候资料整体质量状况、疑误数据类别和原因，避免类似错误再次发生，为确定进一步质量控制工作的重点和方法、为数据产品研发等后续工作提供依据。

2 评估资料

本次评估主要针对信息化地面月报数据文件(A文件)进行评估，包括：

①疑误数据时间分布；

②疑误数据空间分布；

③疑误数据要素分布；

④疑误数据产生原因分析。

评估项目：新版本A 文件中所有要素。

资料时段：1951—2004年(自动站正式使用之前)。

评估台站：2 个国家基本站，11 个国家一般站。

使用资料：天津13 个地面站建站至2004 年共6 718 个A0 文件；天津2 个基本地面站1951—2004 年共1 296 个A6 文件。

3 评估方法

采用中国气象局下发的省级质量控制软件对天津市13 个地面观测站1951—2004 年共6 718 个A文件进行质量检查，A 文件是由信息化产生的A0 文件和A6 文件合成转换生成的，经省级质量控制软件质量控制，形成带质量控制码的A 文件，并同时得到各月质检结果提示文件AIIiiiyyyymm_Check.txt(其中IIiii 为区站号，yyyy 为年份，mm 为月份)，再利用“A 文件质检结果统计软件”-Project_Count.exe，对质检结果进行统计输出。

统计结果输出文件：ErrTXT.txt、ErrYaosu.txt 和ErrYear.txt。其中ErrTXT.txt 是经整理确认后的全部“错误”“可疑”和“提示”内容文本文件；ErrYaosu.txt 是按要素统计的“错误”“可疑”和“提示”内容文本文件；ErrYear.txt 是各要素按年份统计的“错误”“可疑”和“提示”内容文本文件。

评估公式：

4 评估结果分析

4.1 疑误数据空间分布

统计结果显示，天津市13 个观测站的地面资料均有疑误数据产生。蓟州、城市气候监测站(市区)出现的疑误数据明显多于其他台站，而大港和东丽站出现的疑误数据相对较少。其中市区为687 个，是天津地区出现疑误数据最多的台站，占全部疑误个数的17.3%。统计结果与观测时间长短和数据量多少有一定的关系。

图1 疑误数据年际分布图Fig.1 Interannual distribution of suspected and incorrect data

4.2 疑误数据年际分布

图1 给出天津市疑误数据个数的年际分布图。如图所示，1951—2004 年各气象要素的疑误个数基本呈现双峰分布，20 世纪70 年代至80 年代前期以及80 年代中后期为疑误数据的集中分布区，2000 年以后锐减。从年际变化来看，1951、1953 年没有出现疑误数据，1987 年疑误数据出现最多，为220 个。

4.3 疑误数据月际分布

从疑误数据的逐月分布来看(图2)，春、秋季月份出现的疑误数据个数较少，而夏、冬季月份出现相对较多。其中，7 月份出现526 个疑误数据，是全年中最多的月份，4 月份出现的最少，仅为170 个。

图2 疑误数据月际分布图Fig.2 Monthly distribution of suspected and incorrect data

4.4 疑误数据要素分布

本次评估的气象要素依次为：气温、降水、气压、湿球温度、水汽压、相对湿度、云量云状、能见度、天气现象、蒸发量、积雪、风、地温、冻土深度、自记风、自记降水量、10 分钟平均风、日照。

其中：气温资料出现24 条疑误，占总疑误数的0.60%；降水资料出现539 条疑误，占总疑误数的13.56%；气压出现21 条疑误，占总疑误数的0.53%；湿球温度资料出现 109 条疑误，占总疑误数的2.74%；相对湿度资料出现疑误195 条，占总疑误数的4.91%；云量云状资料出现疑误173 条，占总疑误数的4.35%；能见度资料出现疑误47 条，占总疑误数的1.18%；天气现象出现疑误2 607 条，占总疑误数的65.60%；蒸发量出现疑误5 条，占总疑误数的0.12%；雪深雪压资料出现疑误35 条，占总疑误数的0.88%；风速资料出现疑误 36 条，占总疑误数的0.90%；地温资料出现疑误158 条，占总疑误数的3.97%；冻土深度资料出现疑误23 条，占总疑误数的0.58%；日照时数资料出现疑误2 条，占总疑误数的0.05%。其他要素质量正确，没有疑误。具体见图3。

以疑误信息出现最多的要素天气现象为例，疑误产生原因包括：天气现象终止时间小于开始时间，终止时间输入错误；天气现象代码记录重复，降水现象代码及时间重复输入；天气现象时间格式错，输入降水现象时间间断出现没用“′”分隔；天气现象较多占行时，遇逗号程序不认提出错误；降水现象转换时连接记载，程序提出错误等。其他要素出现疑误信息的原因包括：数据人工录入错、要素方位有误、天气现象与记录矛盾、录入错、漏录天气现象符号等。

图3 各要素疑误数据占比分布图Fig.3 Distribution chart of proportion of suspected and incorrect data of each element

4.5 疑误数据产生原因分析

按疑误数据产生的方式可以分为4 种。

观测错误：地面气象观测记录簿上的数据有误，这可能是观测员的观测错误或记录错误。

报表数据错误：信息化地面气候数据时的基础数据来源于地面气象记录月报表(即气表-1)，而气表-1的数据来源于地面气象观测记录簿，如果气象台站观测员在制作气表-1 时，数据抄录错误，将导致最终信息化的A 文件有误。

信息化过程中产生的错误：这类错误是指在人工录入A0 文件时，由于人为疏忽等原因产生的错误，如将观测的气温33.3 录入为30.3。

其他错误：数据不符合数据文件格式要求；数据质量控制处理软件对于不同观测规范的处理方法不同导致提示疑误信息；数据质量控制处理软件本身的Bug 所引起的等。

5 结论

总体来看，信息化地面气候资料A0 文件质量可靠，由A0 转换的A 文件由于种种原因出现的疑误信息较多，主要集中在天气现象、云、能见度这3 个要素。其他气象要素是按照国家标准规范以及通过检定部门检测的仪器进行观测记录，数据质量是可靠的。从2020 年4 月1 日开始，地面气象观测迈入全面自动化时代，有效消除了人为观测造成的误差，也有效控制了天气现象、云、能见度这3 个要素的疑误信息。综合所有统计结果，天津市13 个国家级地面气象台站的平均单站月疑误数据个数为0.57 个，疑误数据率为0.043‰。