APP下载

辽宁省水文数据库质量管理和控制研究

2016-04-13刘立杰

水资源开发与管理 2016年1期
关键词:数据质量质量控制资源

刘立杰

(绥中县水资源办公室, 辽宁 绥中 125200)



辽宁省水文数据库质量管理和控制研究

刘立杰

(绥中县水资源办公室, 辽宁 绥中125200)

【摘要】科学技术的飞跃式发展,人民物质生活水平的不断提升,对水旱问题、环境管理和保护、水土保持以及水资源的控制等各方面的要求越来越严格,对水文数据分析处理、交换、储存、保护、信息公开的标准也相应提高,水文数据库的作用也越来越突出,提高数据质量已成为数据库应用的主要问题。本文以辽宁省水文数据库为研究对象, 从数据的质量管理、准确性的验证以及合格率的验证方面指出了水文数据库质量控制存在的关键性问题,并给出了相应的解决方案。

【关键词】资源; 水文数据库; 数据质量; 对策; 质量控制

1概述

1.1水文数据的作用

国家基础信息资源中非常关键的一个方面就是水文,这方面的信息涉及很多经济和政治因素,其作用不仅体现在经济方面,还体现在环保和国家的正当防卫等方面。在环境和财产保护方面,水文信息不仅可以预测旱涝灾害,还能够根据相关数据及时做出应对措施,甚至可以对未来经济建设和基础建设做出规划,成为保障安全的一道数据防护网络。

1.2辽宁省水文数据库的发展

在处理水文信息的方式中,最常利用的是大小地域相互结合的方式,建立四级不同的防护保障,从而形成系统有效的整治网络。四级为中央流域、省级流域以及省级以下单位的不同流域,辽宁省水文信息处理库便是其中之一,在这个数据库中不仅保留了从1902年以来的所有重要信息,而且经过不断地发展,数据库已经初具规模,出现错误信息的情况也越来越少,已经远远低于国家要求,所包含的信息也越来越多,所有的信息经过整合和分析没有重复,因此辽宁省水文数据库已经形成了系统、完整的处理和分析方式,为水文信息的处理提供了很大的便利[1]。

在20世纪80年代,由于我国特殊的国情和人民生活的基本要求,部分省(自治区、直辖市)对水文工作进行了一定程度的改变和完善。90年代,水文工作经过进一步更新和发展,开始利用计算机和局域网进行信息的分析、采用和储存。

在发展的初期,由于还没有全面普及计算机,一些重要信息的处理是通过职工输入、检查,然后经过比较复杂的程序进行信息整合、储存。经过长期的改变,目前数据库一共储存了100多年的水文信息,按照国家的相关标准,建立了完整的数据表,以供查看和分析。例如:在2002年的信息中显示辽宁省现有水文巡测基地14处,国家基本水文站116处,水位站11处,雨量站560处,墒情站72处,地下水站480处,其中,信息涉及各个方面[2],多种因素都有完整的记录,具体情况见表1。因此辽宁省水文数据库在国家发展方面做出了不可磨灭的贡献。

表1 辽宁省水文站数量

2数据质量控制

2.1数据录入质量控制

在人工录入方式中,必须采用两组人员,同时录入相同的数据,然后经过录完后的信息比较,对不同的信息采取相应的措施进行改正和完善。这种方式能够在一定程度上避免错误,统计学家判定这种方式可以降低信息错误率,因此在水文数据库建立的初期阶段大多采用这种人工录入的方式进行信息处理。

2.2不同来源的数据相互校验

由于水文信息错综复杂且来自不同的信息源,很容易出现不同来源的相同数据。例如:在某些重点流域,一些重要的水文管理机构已经对该流域的水文信息进行了完整的分析和处理,但是一些其他的水文机构由于自身的原因可能会对同一个地方进行重复检测和实地查看,从而也将相关信息录入同一个水文数据库中,对于这样相同的信息,可以通过信息比较来判断两个信息的正误,并通过这种方式提高信息的正确率。

2.3异常值检验即一致性检查

在测量数据过程中,由于各种原因不可避免地会出现误差,而这种误差在数据检验的步骤中无法准确判断,这种数据就被称为异常值,也是常说的阈值。这种误差也是一个相对概念,它是相对于正常值来说的,因此这些异常值有可能是正确的却易被工作人员忽视的数据。由于在数据处理的整个过程中,每一个环节的不当操作都会出现这种误差,因此判断异常值正确与否的最合适的方法被称为异常值检验法(见表2),这种方法是通过判断正常值的误差范围来判断异常值的正误。

表2 数据库一致性检查

2.4利用数据库数据规则校验

由于错误的不可避免性,因此除了上述方法外,在漫长的发展中,还有另外一种方法——数据库数据规则校验法经常被采用。这种方法也能够对信息进行完整处理,并且从根本上对信息进行判断。主要是通过双路输入后,对信息进行分析,通过不同的数据规则,根据数据的不同属性来检验信息的正常或异常。这种方法能在一定程度上降低信息错误率,在水文数据库的发展阶段也常常被采用。

2.5数据合理性校验

数据校验也是一种切实可行的检验信息正确率的方法,在完成上述步骤之后,可以再利用数据合理性校验的方法来判断信息(见表3),这种方法主要按照以下步骤进行:

a.日表类数据表间校验。

b.上下对照校验。

c.相关水文量值校验。

d.不同类型相关表间数据校验。

这种方法可以从细节方面检验信息,完成信息的上下判断,从而在正确值的合理误差范围内剔除掉错误信息,提高信息的正确率。

表3 数据库合理性检查

2.6数据打印输出校核

相关人员的管理是工作的重点,可以采取以下方法来提高人员的工作效率和正确率:

a.将一些确定正确信息人为地设置成错误数据,然后将正确信息保存,打印出错误数据的纸质版信息,然后交给相关人员进行校对。对他们的工作严格把控,在工作结束后,要求他们对信息的处理结果拿出三份工作记录,分别为改错后的纸质版数据、数据库中出现了错误的数据和年鉴的错误数据,对他们的工作成果进行详细检验,并进行工作成果评定,对于正确率低于一定数值的要求返工,以此来提高相关人员的工作效果。

b.对于已经初步判定为合格的信息,抽取一定比例,再进行详细的检验,在这一过程中,应该首先还原由人为改动的那些错误信息,再对抽检样本进行错误率比较,按照相关的规定,如果合格则完成工作,反之则要求相关工作人员再次返工。

3结果分析

针对所描述的质量控制方法,采用2015年整编水文数据作为质量检查的实验数据,对随机选取的水文测站分别进行各类要素的完整性、合理性和一致性检查。质量控制的程序界面如图1所示,完整性、合理性和一致性检查的部分结果如图2~图4所示,图2和图4利用饼图分别统计所选测站历史水文记录中完整和一致的记录所占的百分比;图3和图4分别利用趋势图和一致性图描绘所选测站水文要素的变化情况,检查数据的合理性。

图1 质量控制程序界面

图2 某测站2015年记录完整性检查结果统计

图3 某测站2015年蒸发量合理性检查趋势

图4 某测站2015年记录一致性检查结果统计图

从图2~图4可以看出,水文质量的控制方面受数据不合理、不一致的影响很大,也存在由于某些水文要素在一定时期内变化的不规律或不连续而导致的不合理。因此,对入库的水文数据资料进行完整性、合理性和一致性质量检查十分必要。

4辽宁省在数据库方面存在的主要问题

a.数据库所涉及的范围不足,比如:中小河流防洪基础设施比较薄弱,防御中小河流暴雨洪水灾害能力差,对其进行的研究较少,数据库内容涉及的较少。

b.中小型河流设定的网站点较少,数据资源较少。

c.对水文数据的监测设备比较简单,不能够完全达到信息化水平,并且获得的数据资源准确性不能保证。

5对策与建议

现有测站建设时间较长,设施设备陈旧落后,不能更好地满足防洪要求,要对测站进行改造、更新换代,配备先进的水文仪器,以适应现代社会的发展,用现代化的水文测报手段,更好地为社会经济服务。水文站的改建项目见表4。

表4 水文站的改建项目

续表

6结语

综上所述,建设好辽宁省水文数据库,需要对河流数据资源的获取方式做出一定的改变,整顿监测设备,避免一些落后的设备造成数据不准确的现象,逐渐实现信息的准确性、快速性,为辽宁省的水文质量检测提供最高的水准。要根据实际情况研究讨论,对一些容易忽视的地区要加强水资源的管理和控制,要使水文资源数据库内容全面,避免出现一些不必要的损失和破坏。

参考文献

[1]张铁楠.柳河流域生态建设对河流水沙变化的影响[J].水利规划与设计,2010(6):25-26,46.

[2]董婷婷,于燕,党如童.辽宁省旱情监测预警与评估系统设计与实现[J].水利技术监督,2014(6):43- 46.

Research on hydrological database quality management and control in Liaoning Province

LIU Lijie

(SuizhongCountyWaterResourcesOffice,Suizhong125200,China)

Abstract:With the speedy development of science and technology, and constant improvement of people’s material life level, higher and higher requirements are proposed in terms of flood and drought problem, environmental management and protection, soil and water conservation, water resource control, etc. Hydrological data analysis processing, exchange, storage, protection and information disclosure standards are also correspondingly improved. The function of hydrological database is increasingly outstanding. Improving data quality has become the main problem in database application. In the paper, hydrological database in Liaoning is adopted as the research object. Critical problems in hydrological database quality control are proposed in the aspects of data quality management, accuracy verification and compliance validation, and corresponding solutions are given.

Key words:resources; hydrological database; data quality; countermeasures; quality control

中图分类号:TV12

文献标志码:A

文章编号:1005- 4774(2016)01-0061-04

DOI:10.16616/j.cnki.10-1326/TV.2016.01.017

猜你喜欢

数据质量质量控制资源
基础教育资源展示
一样的资源,不一样的收获
资源回收
资源再生 欢迎订阅
浅析统计数据质量
金融统计数据质量管理的国际借鉴与中国实践
浅谈统计数据质量控制
浅谈机车总风缸的制作质量控制
浅谈在公路桥梁施工环节的质量管理及控制
浅谈石灰土基层施工及质量控制