环境气象应用数据库的设计及实现
2019-09-10陈晴王俊骄陈晔峰杨明孙晓燕高婷吴书成
陈晴 王俊骄 陈晔峰 杨明 孙晓燕 高婷 吴书成
摘要:目前气象部门能够获取的环境监测数据来源不同,各部门存储数据的规范也存在差异,各项数据缺乏统一性和完整性。针对上述情况,讨论了数据处理的方法,梳理了环境监测数据来源,统一存储规范将不同来源的环保数据分别进行处理,统一存储在环境气象应用数据库中。对环境监测信息的数据进行初步质量控制,利用克里金算法对数据插值形成网格化产品,为空气质量预报、空气污染气象条件预报业务和相关科研项目提供基础数据支撑。
关键词:环境气象应用数据库;存储规范;质量控制;克里金算法;空气质量预报
中图分类号:TP393文献标志码:A文章编号:1008-1739(2019)14-59-3
0引言
随着经济社会的不断发展,人们的环保意识在不断增强,各级政府部门对于环境保护工作也更加重视[1]。围绕气象防灾减灾需求,进一步做好环境气象数据共享、提升气象业务中环境气象数据的支撑保障能力,深化在大气环境质量监测预警、预报服务、应急响应等方面的合作,与环保厅合作实现数据共享,建立了环境气象应用数据库。该数据库的建设可为全省空气质量预报、空气污染气象条件预报业务和相关科研项目提供基础数据支撑,实现环保与气象大气环境监测资料实时共享,丰富大气环境预报预警服务信息,有助于共同建立极端气象条件下空气质量和突发大气环境事件监测预报、预警响应、应急联动的工作机制。
1数据库设计及实现
1.1数据库设计
环境气象应用数据库包括环保站点信息表、环保数据日报表和环保数据实时报表,分别如表1、表2和表3所示。环保站点信息表记录环保站点的详细信息,环保数据日报表按天记录环保数据,一般当天的日报于次日录入,环保数据实时报表按小时记录环保数据,当前小时的数据于下个时次录入。
1.2数据库的实现
气象部门能获取的环境数据分别来源于4种不同途径:①中国气象信息中心内网下载的全国环保站的数据;②省环保监测中心获取的全省环保站的数据;③省内自建的大气成分站上传录入数据库的本省自建气象站数据;④CMACAST广播通信系统下发的报文中获取录入数据库的周边省份气象站数据。
通过分析不同来源的数据属性,将数据按不同方式、相同规则统一录入到户数据库,方便环保与气象大气环境监测资料实时共享。具体数据流程如图1所示。
(1)全国环保站数据
通过网络抓取技术获取从中国气象局内网上的全国环保站数据。网页抓取技术是一个自动抓取网页信息的程序,它是搜索引擎的重要组成部分,为搜索引擎从Web上采集信息资源[2]。传统网页抓取技术从包含一个或若干个原始的种子Web页面的URL开始,最先抓取种子Web頁面并提取该页面的子链接,然后将提取的链接加入到待抓取的URL队列中,在Web页面的抓取过程中,网页抓取程序不断从当前抓取的Web页面上提取新的子链接URL加入到待抓取的URL队列中去[2]。重复上述过程,直到网页抓取系统的停止条件得到满足时才停止抓取网页。分析网页属性将有用的数据信息录入数据库。
(2)全省环保站数据
通过WebService接口调用获取数据,采用SOAP协议登录服务平台的Web Service接口后,实时向服务平台发出数据调用请求,经验证通过后返回所需要的数据内容。上述基于Web Service方法的数据交换均按照XML规范进行。
(3)本省自建气象站数据
从省内自建的大气成分站上传入库至数据库,编写程序将数据实时同步到环境气象应用数据库中。
(4)周边省份气象站数据
从国家局的CMACAST广播系统下发的报文中获取报文,编写程序将实时数据录入环境气象应用数据库中。
2数据质量控制
为提高资料的准确率,对环境监测信息的数据进行初步质量控制。大气中的观测数据与时间显著相关,具有良好的时间一致性[3]。根据这一特性,将数据与其时间上前、后的测值相比较,来判断其数据是否发生异常[4]。时变检查主要是根据要素在某一时段内可能变化范围判断要素值质量[5]。
在实际过程中,设某一要素0时次的观测值为0,0-1时次的观测值为-1,0+1时次的观测值为+1。要检验0的值是否在正常范围内,设定:avg=(-1++1)/2,0>=2avg,初步判定0为异常;0<2avg,初步判定0为正常。对于初步判定是异常的数据,将该数据设为缺测。
3环境气象数据库的应用
3.1基于克里金算法的网格化产品生成
由于站点的数据量有限,空间分布是离散的,利用插值通过已知样点的数据估算未知点的数据,通过一次或多次插值将离散点数据插值成连续的表面数据,进一步形成等值线或者色斑图后显示[6]。对已有的环保监测资料进行克里金算法的空间插值,将离散的环保站点数据合成连续的表面数据,进一步形成色斑图后显示。目前产品已在省环境气象预报业务平台等业务系统中得到应用,丰富大气环境预报预警服务信息,为政府决策和社会公众生活提供环境预报预警服务,为生态省建设工作提供数据保障。
3.2克里金算法的插值过程
克里金插值的前提是根据空间场的结构,选择适当的变异函数模型,并求出变异函数。其计算步骤如下:
①网格化,选择区域的范围及网格的大小。
②计算被估点(网格节点的)的坐标。
③根据搜索策略(近点距离搜索和方位搜索)选择合适的参估点。
④根据已经求出的变异函数,求出方程组的系数。
⑦重复步骤②~⑥,直到网格节点的值全部求出。
4结束语
建立环境气象数据的入库机制,梳理环境监测数据来源,统一存储规范,将不同来源的环保数据按照统一的存储规范录入到环境气象应用数据库中,实现数据的集中管理。利用时变检查环境监测数据进行初步质量控制,生成环境监测要素的网格化产品,为全省空气质量预报提供技术支撑,丰富大气环境预报预警服务信息,为政府决策和社会公众生活提供环境预报预警服务。
参考文献
[1]张霞.基层环境监测站存在的问题与改革措施[C]//2008中国环境科学学会学术年会优秀论文集(下卷),2008: 319 -320.
[2]谢治军.垂直搜索引擎的主题网页抓取策略研究[D].重庆:重庆理工大学,2012:8-31.
[3]范文波.地面气象观测数据综合质量控制方法研究与实现[D].江苏:南京信息工程大学,2016:88-93.
[4]周青,张乐坚,李峰,等.自动站实时数据质量分析及质控算法改进[J].气象科技,2015,43(5):814-822.
[5]王海军,杨志彪,杨代才,等.自动气象站实时资料自动质量控制方法及其应用[J].气象,2007,33(10):102-109.
[6]吴焕萍,罗兵,王维国,等.GIS技術在决策气象服务系统建设中的应用[J].应用气象学报,2008,19(3):380-384.