海洋监测数据质量评估系统研究*
2014-09-29崔文林宋文鹏
郑 琳,刘 艳,崔文林,宋文鹏,曲 亮,谢 利
(1.国家海洋局海洋溢油鉴别与损害评估技术重点实验室 青岛 266033;2.国家海洋局北海环境监测中心 青岛 266033;3.国家海洋局烟台海洋环境监测中心站 烟台 264006)
近年来,全国海洋环境业务化监测得到了迅猛发展。随着海洋监测项目的不断拓展,监测技术水平的不断提高,监测数据资源迅速丰富起来。监测数据是环境质量科学表征的重要来源,高质量的监测数据是环境质量的科学反映。然而,在实际监测过程中,样品采集、运输、分析和采样地点的偶发事件以及各环境要素本身的时空变化等一系列因素都可能对监测结果产生影响,导致数据出现异常[1]。在利用海洋环境监测数据进行海洋环境保护、海洋管理方面的分析评价、决策支持及相关科学研究之前,需要对监测数据进行质量审查和质量控制。美国EPA依据《数据质量评估导则 QA/G-9R、QA/G-9S》对监测数据进行质量评估[4]。我国海洋监测数据的质量控制主要依据《海洋监测规范第2部分:数据处理与分析质量控制》(GB17378.2-2007)[5]。本研究根据海 洋监测数据特征,结合海洋环境评价业务需求,研究了适用于海洋环境监测数据管理与质量评估的方法及模型,在此基础上构建了数据质量评估系统,从而实现海洋监测数据的快速质量评估与高效服务,为我国海洋监测业务数据资源开发利用提供一定的依据。
1 海洋监测数据质量评估内容
目前海洋监测工作中所获取的数据由于监测时间较短、次数较少、环境及人为等造成的不确定性,因此获取的数据具有一定的局限性、区域性、数据样本小等特征。对所获取的监测数据开展质量评估应对数据的准确性、精密性、代表性、完整性及可比性等内容分别进行评估。
1.1 准确性和精密性评估
准确性表示测量值与真实值的一致程度,精密性表示多次测定同一重复样品的分散程度[2]。对海洋环境监测数据的准确性和精密性的评估主要表现为判别监测数据的准确与合理性,是否符合海洋环境特征,发现及剔除异常数据。
1.2 完整性评估
完整性是指获得有效监测数据的总量是否满足预期的要求。主要表现在监测项目是否齐全,监测频次是否达到要求,其他必需的数据项是否有漏测漏报等。
1.3 代表性评估
代表性是指判别所获取的数据是否客观地反映监测区域海洋要素的时间和空间变化特征,符合区域监测要素的区域特征[3]。
1.4 可比性评估
可比性是指在环境条件、监测方法、数据表达等可比条件下所获数据的一致程度。对于海洋监测数据主要判别其是否符合合理的环境变化趋势。
2 海洋监测数据质量评估模型
2011年和2012年全国海洋监测数据达240余万个[6-7],北海区监测数据达60万个,地市级监测机构的监测数据也达几万至十几万个。海洋监测数据不仅种类多、而且数据结构多样、并具有动态特征。对监测数据质量评估应在数理统计理论的基础上结合专业判别。
2.1 数理统计评估模型
海洋监测数据一般都符合正态分布,根据《海洋监测规范第2部分:数据处理与分析质量控制》 (GB17378.2-2007)和《数据的统计处理和解释正态样本离群值的判断和处理》(GB/T 4883-2008)[8],Dixon检验法是对海洋监测数据进行质量审查和控制较方便、实用的方法。该方法可以较好的对污染物组分相对固定区域,连续监测资料达到一定数量时,判别1个或多个异常值。计算公式为:
式中:Dn为Dixon统计量,n为样本量,通过计算统计量与确定检出水平α后,查询Dixon临界值表进行异常值判别。
为了避免Dixon法计算及查表的繁杂过程,对于大样本(数据量n>30)数据,传统Z值检验法和莱特准则(3σ)检验法也有很好的判别功效[9,10]。传统Z值法计算公式为:
2.2 专业判别模型
依据数理统计理论对监测数据进行异常值判别是整个质量评估的一部分,其判别结果仅是统计理论在现实生活中的应用,判别的结果是否准确,与真实的环境质量情况吻合与否,还必须结合区域环境要素特征、历史数据分析成果通过阈值或相关性检验进行专业判别。
2.2.1 阈值检验法
阈值检验法是基于研究区域环境要素时空分布和变化规律,在分析研究已有的长期监测结果的基础上,确定的符合区域环境特征的各监测要素正常取值范围(即阈值),并通过数据比对判别异常值。如,中国近海断面监测与趋势性监测都是长期监测任务,至少积累了50年的数据,对于这些监测区域的环境要素的环境特征已经有了一定基础,这些区域的监测数据质量评估就可以充分运用阈值检验法。阈值检验法操作简单、直接,能够有效地检验出极端异常的数据。
2.2.2 相关性检验法
由于物质自身的化学性质和现实海水环境中的实际情况,海水环境监测中的一些基本项目间必然存在一定的相关性,如总氮(TN)是有机氮(TON)和无机氮(TIN)的总和,无机氮的量不应高于总氮的量。总磷(TP)是指水中正磷酸盐、聚合磷酸盐、可水解磷酸盐以及有机磷的总浓度值,则正磷酸盐、聚合磷酸盐、可水解磷酸盐的总和应小于总磷。六价铬的浓度不能高于总铬的浓度。河口、海湾及小区域的环境要素具有一定的相关性,如胶州湾溶解无机氮、活性磷酸盐、活性硅酸盐3种营养盐之间、营养盐与pH、化学需氧量、盐度环境因子之间具有明显的相关性[11];福建省深沪湾溶解氧与浮游植物、悬浮物相关性显著[12]。在数据质量评估中可以根据这些监测要素的相关性判别是否存在异常数据。
3 海洋监测数据质量评估系统设计
通过以上质量评估内容及评估模型的研究,充分考虑海洋监测数据现状及服务需求,开发了海洋监测数据质量评估系统。该系统通过人机交互的方式,对海洋监测数据实现了Dixon法、传统Z值法、莱特准则法、阈值和相关性检验等方面质量评估,以友好的图形化界面表现出来,并把处理后的数据传回数据库,对评估结果进行发布和输出。以下从系统总体结构设计、系统框架及环境、系统功能、数据质量评估模块等方面进行研究。
3.1 系统总体结构设计
根据监测数据质量评估的要求,对系统的结构和主要功能进行合理设计,对用户界面进行友好性、方便性统一设计,系统主要设计包含登录子系统、输入输出子系统、数据检索查询子系统、数据质量评估子系统等,可以实现系统的登录、数据检索、质量评估以及数据管理等。系统总体结构设计图如图1所示。
图1 总体结构
系统基于.NET与数据库技术的管理系统,采用3层C/S的SOA架构:应用层(表示层)、功能层、数据层。① 数据层:利用数据库技术实现数据的集中存储与管理,主要包括源数据库、评估后数据库、异常值数据库。源数据库主要存放原始监测数据;评估后数据库主要存放剔除异常数据后的准确数据;异常值数据库主要存放剔除的异常值。② 功能层:建立与数据库的链接,实现数据获取、数据分析、数据剔除、数据可视化显示等工作,并处理应用层与数据层数据的交互任务。③ 应用层:基于图形界面的用户应用接口,采用图形用户接口(GUI),进行人机交互操作,进行数据输入与数据输出,实现用户与功能层的对话功能。
3.2 开发环境
系统开发平台为Visual Studio 2005、数据库平台为ORACLE 10G、运行环境为 .Net Framework 2.0,在 Windows 2000/XP/2003/Vista操作系统下运行。系统采用单机版的架构方式,直接由本机对数据进行操作,而无须构建庞大的数据库服务器,以及大量的服务配置和网络配置工作,从而大大简化了用户安装配置系统的工作,提高数据处理的速度,并最终提高质量评估的效率(图2)。
图2 系统架构
3.3 数据质量评估系统实现
3.3.1 系统登录与用户界面
根据数据质量评估人员的分类设置了3级使用权限,登录界面见图3。系统用户界面分为文件、工具、质量评估、数据库管理、设置、帮助和退出7个菜单。除退出和帮助外,每个菜单均对应一定的任务模块(图4)。
图3 系统登录界面
图4 系统主界面
3.3.2 数据库
系统使用数据库技术,建立本地数据库,实现数据库的规范存储、安全过滤,同时方便数据的查询、统计操作和管理(图5)。
图5 数据管理界面
3.3.3 数据输入输出模块
通过 “文件”菜单,实现不同监测类型数据的导入、数据格式转化、标准格式输出的功能。目前已实现海洋水环境化学要素、海洋沉积环境化学要素、叶绿素a、海洋生物(浮游植物、浮游动物、底栖生物)、生物质量等调查要素数据的导入与标准格式导出(图6)。
图6 数据导入模块
3.3.4 数据质量评估模块
“质量评估”菜单中设置了数据完整性检验(数据格式、有效数字等方面)、数据范围检验(即阈值检验)、Dixon法、传统Z值法、莱特准则检验、数据合理性检验(即相关性检验)、平行样检验等多种质量评估模型,可以根据数据质量评估目标和要求采用一种或几种联合的方法进行质量评估,检测出的异常数据系统会以红色进行标注(图5~9)。同时系统设置了报告编写功能,自动保存质量评估结果,并显示到当前窗口(图10)。系统还设置了图形显示功能,用以显示数据统计分析及评估结果图,从而清晰显示数据分布特征(图11)。
图7 阈值评估
图8 Dixon法评估
图9 合理性评估
图10 检验报告
图11 数据统计分析图显示
通过数据质量评估模块基本实现了监测数据合理性、代表性、可比性等方面的质量评估。
3.4 系统兼容性
系统可以随着数据类型的增加和用户需求的变化,通过集成新的数据处理功能,较快地对系统进行补充和完善,提高系统的适应能力,便于系统的更新与维护。
4 结束语
海洋监测数据质量评估系统建设的目的就是满足海洋环境监测业务需求,实现对监测数据的科学、快速、准确的质量评估功能。本研究根据海洋监测数据的特征和应用服务的实际需求,对适用于海洋监测数据质量评估系统的评估模型进行了探讨研究,构建了海洋监测数据质量评估系统,实现了监测数据的自动分析与质量评估等功能,可以为我国建立新型海洋监测系统和体系提供技术研究基础和应用示范。
[1]王尔宜,魏莉,张怀北,等 .浅谈监测数据审核及异常数据的分析与判断[J].环境监测管理与技术,1999,11(3):46.
[2]杨驰宇 .环境监测数据的审核研究[J].吉林师范大学学报,2004(2):72-73.
[3]陈上及,马继瑞 .海洋数据处理分析方法及其应用[M].北京:海洋出版社,1991.
[4]周驰,刘波,任越,等 .浅谈美国环境监测质量保证与质量控制[J].中国环境监测,2010,26(3):45-50.
[5]中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会 .GB 17378.2-2007海洋监测规范第2部分:数据处理与分析质量控制[S].北京:中国标准出版社,2007.
[6]国家海洋局.2011年中国海洋环境状况公报[R].北京:国家海洋局,2012.
[7]国家海洋局.2012年中国海洋环境状况公报[R].北京:国家海洋局,2013.
[8]中华人民共和国国家质量监督检验检疫总局、中国国家标准化管理委员会.GB/T 4883-2008数据的统计处理和解释正态样本离群值的判断和处理[S].北京:中国标准出版社,2008.
[9]楼润瑜,吴江云,王水生,等 .检测数据异常值判断方法的优选[J].检验检疫科学,2008,18(6):19-20.
[10]史静涛,周智海 .海洋站数据质量控制技术研讨[J].海洋技术,2011,30(1):114-116.
[11]姚云,郑世清,沈志良,等.胶州湾营养盐及富营养化特征[J].海洋通报,2007,26(4):91-97.
[12]罗冬莲 .深沪湾溶解氧的分布及其与浮游植物、悬浮物的相关性研究[J].海洋通报,2002,21(1):31-36.