浙江海洋浮标监测数据质量控制体系设计
2023-01-17赵聪蛟宋琍琍余骏刘希真陈思杨张晓辉刘瑞娟
赵聪蛟,宋琍琍,余骏,刘希真,陈思杨,张晓辉,刘瑞娟
(浙江省海洋监测预报中心 杭州 310007)
0 引言
准确有效的数据是开展各项海洋科学研究的基础和前提,监测数据的质量控制通常与数据的获取和分析同时开展。数据获取的流程通常为采样准备、样品采集和预处理、样品储存和运输、实验室分析、数据处理、数据归档[1],其中数据的质量控制应贯穿于整个流程。
因数据获取方式不同,质量控制方法略有侧重。海洋站观测数据具有长期性、连续性和近岸性特点,获取温盐、潮汐、波浪和气象四大类数据的质控流程通常为数据采集、传送和转化,质控方法的选择和处理以及质控结果的显示和存储,常用的质控方法有极值控制、狄克逊检验、Cochran检验、全等性检验、相关性检验和相邻站一致性检验[2-3]。谭哲韬等[4]介绍范围检查、相关性检验和连续性检验等14种海洋观测数据质量控制方法的原理;赵秀玲等[5]从准备、实施和内业分析3个方面介绍海洋调查数据的质量控制要求。
船舶走航采样监测的质量控制工作通常分为采样前、采样中和采样后3个阶段。采样前主要从管理制度、人员和仪器设备等方面加强质量控制[6-7]。采样中的水质样品通常采用现场空白样、现场平行样以及现场加标样或质控样等进行样品采集、储存和运输的质量控制[6-8],生物样品通常要现场固定、防止污染以及选择合适的样品容器,沉积物样品要有代表性、避免水体搅动以及规范预处理和储存[8]。采样后将样品带回实验室进行分析测试,通常采用室内空白样、平行样、质控样或加标样以及质控图进行质量控制[7-8],必要时开展一致性检验和异常值剔除[9]。
自Argo计划实施以来已获取海量全球海洋温盐剖面数据资料,常采用阈值、轨迹、与可信数据比对以及基于“三倍标准差”的异常数据检测等方法开展质量控制[10-13]。福建和广西是我国较早开展海洋水质浮标在线监测的沿海地区:张江龙等[14]从规章制度、实验室条件、设备维护和校准、数据检查和审核以及记录等方面介绍厦门近岸海域水质自动监测系统运行过程中的质量保证和质量控制措施;舒俊林等[15]从规章制度、人员素质、仪器设备维护与保养、软件系统维护、周报和月报制作以及资料归档等方面介绍广西近岸海域自动监测系统的质量保证和质量控制。中国环境监测总站等单位联合编制的《近岸海域水质自动监测技术规范》(HJ 73l-2014)在标准量值传递、仪器性能审核、校准和比对以及数据有效性检查等方面提出系统运行的质量保证和质量控制方法[16]。此外,还有少数报道介绍浮标监测叶绿素、温度、盐度和氮磷营养盐等参数的质量控制方法[17-19]。
由于浮标所处的海洋环境十分复杂,随着时间的延长,监测数据可能发生渐变式整体偏移。张宇等[20]研究浙江海域水质浮标监测数据中的这一异常现象,根据酸碱度(p H值)、溶解氧(DO)和叶绿素(Chl-a)三者的相关性特性,建立基于相关性的渐变异常数据自动识别质控方法。已有研究大多仅提出监测资料或浮标监测的普适性质量控制方法,虽然有少数报道对叶绿素等个别参数进行研究,但仍停留在探索阶段,没有深入研究浮标所载仪器设备监测参数集的质控方法和质控结果,也没有具体量化较长时间序列的各监测参数集的数据质量。
浙江近岸海域浮标实时监测系统自2011年正式启动建设,至2017年年底已完成18套海洋水质浮标的建设任务(其中宁波有7套)[21],这些浮标已获取大量的常规水质、气象、营养盐和特征参数数据。本研究选用浙江近年的浮标监测数据,从浮体稳定性、仪器设备校准、系统运行维护、数据传输接收、比对监测和异常值判定等关键环节,设计浙江近岸海洋浮标监测数据质量控制体系,并以此为指导开展浙江海洋浮标监测数据质量控制,以期整体提升浙江近岸海域浮标在线监测数据质量,为客观反映海洋环境质量及其变化趋势、准确预警赤潮等海洋生态问题和突发状况以及助力海洋经济健康有序发展提供有效基础数据。
1 研究对象
本研究采用浙江近岸海域11套海洋水质浮标,其中包括嘉兴1套、舟山4套、台州3套和温州3套。浙江近岸海域浮标实时监测系统(不含宁波)自2011年正式启动建设,2012年8月在台州大陈海域投放第一套试点海洋水质自动监测浮标,至2017年3月完成全部11套浮标的建设任务[21](表1)。
表1 浙江近岸海域海洋水质浮标基础信息
根据投放地点的功能区特点,浮标具有不同的监测参数。浮标1~6所在海域为赤潮高发区、增养殖区、贝类种质保护区和排涝通道,监测参数为常规水质、气象和营养盐;浮标7~11所在海域为滨海旅游区、核电温排水区和石油储备基地附近,监测参数为常规水质和气象,且浮标10增加核辐射监测参数,浮标11增加碳氢化合物监测参数。其中,常规水质参数包括水深、水温、盐度(电导率)、浊度、溶解氧、p H值和叶绿素a;气象参数包括风向、风速、雨量、气压、气温、湿度和光照度;营养盐参数包括氨氮、硝酸盐氮、亚硝酸盐氮和活性磷酸盐。
2 数据来源
自浙江海洋浮标实时监测系统省级监控平台提取上述11套海洋水质浮标2020—2021年连续2年的水温、盐度、p H值、溶解氧、叶绿素a、浊度、氨氮、硝酸盐氮、亚硝酸盐氮、活性磷酸盐和碳氢化合物11项监测参数集,开展质量控制技术研究。浮标运行维护、仪器设备性能核查和现场比对监测等数据分别来自浮标系统运行维护服务商和浮标属地建设任务承担单位。
3 质量控制体系设计
区别于传统船舶走航的监测流程,海洋浮标在线监测无须人工现场采样、样品预处理和运输以及室内测试分析,从样品采集到数据分析完全实现自动化,数据质量控制的重点也不再聚焦样品采集和分析测试阶段,而是从浮体稳定性、仪器设备校准、系统运行维护、数据传输接收、比对监测和异常值判定等关键环节开展质量控制,保证浮标监测数据的有效性。
3.1 浮体稳定性
浮标浮体为圆饼形,直径为2 m或3 m,设计海上使用寿命为15年,目前未超过使用寿命。浮体标架上安装的太阳能电池板和蓄电池为各传感器和数据传输提供动力,警示灯、雷达反射器和防撞环可避免往来船只碰撞。浮体下方安装的稳定锤可保证浮标水平稳定,并通过双锚设计保证浮标稳定在预定海域范围内。通过运行维护检查浮体各组成部分的紧固程度和运行状态,确保浮体及所载仪器设备处于稳定工作状态。
3.2 仪器设备校准
仪器设备在投入使用之前或维修后再次使用之前,须经过检测、校准或性能核查,以保证仪器设备在海上的正常运行。对多参数水质传感器以及氨氮、硝酸盐氮、亚硝酸盐氮和活性磷酸盐等传感器进行定期性能核查,包括检出限检查、稳定性检查、标准曲线检查、量程漂移和零点漂移等;对p H值、溶解氧、浊度和叶绿素a等传感器进行校准;对碳氢化合物和核辐射传感器进行性能检测校准。
3.3 系统运行维护
通过例行维护、应急维护和年度整体维护,保证浮标系统的正常稳定运行。通常情况下例行维护为每月开展1次,维护内容包括浮体和传感器清洁、试剂更换、仪器设备校准、紧固件检查以及通信检查等。受台风和恶劣海况影响,或发生渔船碰撞、断电或通信故障等突发事件时,立即开展应急维护。每年开展1次整体维护,包括将浮体拖上岸进行清洁后重新涂刷防腐材料,以及将各传感器带回实验室进行检测和校准等。
3.4 数据传输接收
监测数据经加密处理后,采用GPRS/CDMA或北斗系统实时传输至浙江海洋浮标实时监测系统省级监控平台。通过该平台每日监控数据传输接收情况,查看各浮标数据接收是否正常、数据入库是否正常、有无异常值或故障值以及经纬度是否明显偏移。一旦发现数据缺失、通信中断和经纬度明显偏移等情况,须立即采取措施加以解决。
3.5 比对监测
每个浮标每年开展6次现场采样比对监测,即每2个月开展1次。采样方法和要求为:在距离浮标10 m范围内布设1个采样点,采样前用GPS定位并记录经纬度;采集海水表层(离海面0.5~0.8 m,与传感器同一高度)样品,整点采集并连续采集5次以上,与在线监测时间保持同步。
表层海水温度、p H值和浊度均在现场完成比对分析,溶解氧、盐度、叶绿素a和碳氢化合物样品经现场采集处理后带回实验室完成比对分析。样品现场固定、运输和实验室分析应符合《海洋监测规范》(GB 17378-2007)和《海洋调查规范》(GB/T 12763-2007)的要求。各比对参数的分析方法和依据标准如表2所示。
表2 各比对参数的分析方法和依据标准
水质监测的质量控制采用平行样,其中p H值和溶解氧采用100%的现场平行样,碳氢化合物采用10%的现场平行样。
3.6 异常值判定
建立异常值判定方法库,将已见诸报道的方法纳入方法库,并针对各参数特点进行适宜性筛选。海洋监测异常值判定方法主要包括:
(1)标定[22]。室内标定由国家标准计量单位进行,现场标定选用有效期内的标准物质。主要适用参数为水温、盐度、p H值、溶解氧。
(2)值域检验[9]。检验参数是否超出对应的经验值域。主要适用参数为盐度、水温、p H值、透明度、溶解氧。
(3)检出限检验[9]。利用仪器设备的检出限范围检验参数的最小值。主要适用参数为海洋环境要素。
(4)最大污染倍数检验[9]。利用参数最大污染等级的倍数检验该参数值域的最大值。主要适用参数为重金属、有毒污染物、化学需氧量、活性磷酸盐、溶解无机氮、总氮、石油类、硫化物。
(5)专家经验检验[9]。利用专家经验对参数进行审核确认。主要适用参数为大气干沉降和湿沉降。
(6)极值检验[4]。根据对海洋的基本认知,结合海洋环境要素的历史极值等统计经验,判定参数是否异常。主要适用参数为海洋环境要素。
(7)相关性检验(一致性检验)[3-4]。根据同一时刻和同一地点的监测数据的相互关系(是否符合一定的物理联系)进行检验。主要适用参数为风速与风向、风速与浪高、水温与气温、盐度与雨量、水温与寒潮以及浮标观测要素。
(8)连续性检验[2,23]。通过确定要素相邻时刻间的差值进行检验。主要适用参数为海洋站、浮标站和验潮站等定点和长时间监测资料。
(9)等值检验[24]。在一定深度范围内出现多个相同的监测值,推测可能是仪器设备故障造成的可疑值。主要适用参数为Argo监测要素。
(10)逆温检验[4]。通常海水温度随深度增加而逐渐降低,若出现逆温且超过一定的阈值,可判定为异常值。主要适用参数为水温。
(11)尖峰检验(牛眼检验)[24]。由于仪器设备性能或操作等原因,可能出现明显不合理的较大突变即“牛眼”。主要适用参数为Argo监测要素。
(12)深度递增检验[4]。现场监测的水温和盐度等剖面深度均是从海表单调往下递增,据此检验数据异常值。主要适用参数为水深。
(13)密度递增检验[25-26]。下层海水密度总是大于上层海水密度,据此检验数据异常值。主要适用参数为深层水温和盐度。
(14)陆地位置检验[4]。经纬度是否在预定范围内。主要适用参数为仪器设备及其载体。
(15)垂直梯度检验[4]。相邻2个深度值对应监测值的垂直梯度是否超出一定阈值。主要适用参数为盐度。
(16)局地最大深度检验[25]。深度监测值是否比该地的海底深度更深。主要适用参数为水深。
(17)局地气候态检验[10,27]。根据局地历史监测数据的统计分布特征或概率分布界定阈值,据此标记可疑值。主要适用参数为水温、盐度和溶解氧等剖面资料。
(18)温度-盐度图检验[4]。将监测的温-盐曲线与事先构建的气候态温-盐曲线进行比较,检验异常信息。主要适用参数为水温和盐度。
(19)非法码检验[28]。根据各类要素的数据编码格式,对不同位置出现的符号、数字或字符进行范围检验。主要适用参数为水温、盐度、海浪、海冰和气象等海洋站监测数据。
(20)全等性检验[28]。部分参数相对于固定的海洋站往往是长期不变的,据此检验参数是否保持不变。主要适用参数为资料类型、经纬度、水深、监测方法、仪器设备、海拔高度。
(21)24 h滑动平均[29-30]。对某数据序列在逐一小区间上不断进行局部平均,即可得出较平滑的监测结果,而滤掉频繁起伏的随机误差。主要适用参数为浮标监测叶绿素。
(22)渐变异常数据自动识别[20]。在一定时序上参数之间的相关性是稳定甚至一致的,据此开展自动识别。主要适用参数为p H值、溶解氧和叶绿素。
(23)现场比对监测[15,31]。现场人工采样监测结果与同一时刻浮标在线监测结果进行比对。主要适用参数为浮标在线监测数据。
(24)实时质量控制[10]。对72 h内获得的浮标监测参数进行垂向斜率统计检测、与同浮标历史对比检测以及浮标漂移速度检测等。主要适用参数为Argo监测要素。
(25)延时质量控制[10]。将浮标监测数据和质量控制标准数据进行比对,再进行数据校正。主要适用参数为温盐剖面数据。
(26)平均值-标准差检验[13]。用气候态资料或较长时间序列浮标监测数据的“平均值-标准差”范围判定异常值。主要适用参数为温盐剖面数据。
(27)“最佳匹配”历史剖面资料比对[11]。比对Argo和历史剖面数据对应的漂移轨迹和要素图,有效识别数据误差。主要适用参数为温盐剖面数据。
(28)三倍标准差检验[11]。计算浮标监测位置剖面资料的对应平均值和标准差,同时考虑与其他剖面之间的关系。主要适用参数为温盐剖面数据。
(29)气候态校正[12]。使用海洋气候态平均数据集WOA对浮标监测数据进行校正,增加深水值校正和表层值校正。主要适用参数为Argo监测溶解氧剖面数据。
(30)空气测量校正[12]。用可信的海表面氧气分压校正Argo浮标监测空气中的氧气分压。主要适用参数为Argo监测溶解氧的漂移误差。
(31)空白样、平行样、加标样和内控样[6]。主要适用参数为海洋环境要素。
(32)莱茵达检验[2,19]。以基于莱茵达准则计算的3倍标准差作为标准范围。主要适用参数为浮标在线监测水温和盐度。
(33)狄克逊检验[2]。基于规则计算样本中的最大值和最小值是否异常。主要适用参数为数据量较少的参数。
(34)格拉布斯检验[2]。基于规则计算样本中的最大值或最小值的残差是否超过选定显著性水平的临界值,超过则判定为异常值。主要适用参数为服从或近似服从正态分布的数据集。
(35)均方差检验[17]。计算某时刻值与邻近50个值的平均值和均方差,据此判定异常值。主要适用参数为浮标在线监测数据。
3.7 质量控制流程
对11项参数开展3个层级的质量控制,分别获得有效、可信和相对准确的浮标监测数据集(图1)。
图1 浮标监测数据质量控制体系的设计流程
第一层:去除明显的故障值、异常值和离群值,得到有效数据集。传感器故障期间、网络通信故障期间、浮标运行维护期间以及浮标发生明显偏移或移位期间产生的数据不是浮标正常运行采样获取的数据,应首先判断为故障值或异常值。波浪造成浮体明显摆动、传感器采样过程中产生气泡以及数据加密传输解码异常等情况可能产生低于或高于传感器检出限的离群值。对各监测参数整年的数据集进行滑动平均处理,剔除明显离群值。根据传感器的工作状态,结合各监测参数的历年均值、传感器检出限和阈值等判定故障值和异常值。
第二层:自方法库选取合适的质控方法,对各项参数的有效数据集开展质量控制,去除可疑数据,得到可信数据集。根据各监测参数的特点,选择极值检验、等值检验、尖峰检验、相关性检验、连续性检验、均方差检验、莱茵达检验和狄克逊检验等数据质量控制方法,判定有效数据集的可信程度。台风过境期间,应视台风对浮标造成影响的程度确定数据是否可信;赤潮期间浮标数据会发生明显变化,如无其他异常情况发生,应视为可信数据。
第三层:根据现场采样比对监测结果,结合历年均值,检验可信数据集的质量,必要时增加修订系数,得到相对准确数据集。例如:厦门西海域浮标监测叶绿素数值仅约为现场比对监测数值的50%[17],则可设定修订系数为2.0。
4 讨论
质量保证是整个监测过程的全面质量管理,质量控制是质量保证的组成部分,是为达到监测质量要求所采取的作业技术和活动[32]。浮标监测全过程涉及的人员素质、规章制度、站位布设、设备投放和运行维护、传感器校准、数据传输接收存储、软件系统维护、比对监测、异常值判定、数据应用和资料归档等方面均属于质量保证范畴。本研究从中归纳并选取浮体稳定性、仪器设备校准、系统运行维护、数据传输接收、比对监测和异常值判定等关键环节开展质量控制,获得有效、可信和相对准确3个层级的数据集。
第一层是去除明显的故障值、异常值和离群值等无效数据后得到的浮标监测有效数据集,可用于评估浮标监测有效数据接收率,进而评估浮体系统运行的稳定性以及各传感器的运行状态。第二层是针对各参数特点,自方法库选取适宜的质控方法去除可疑数据后得到的浮标监测可信数据集,可用于反映浮标所在海域的水体环境质量及其变化趋势;由于此数据集反映的趋势性变化是可信的,其结果可用于制作赤潮短期预警等信息产品[33],也可用于研究相关海洋生态问题和突发状况。第三层是经现场比对监测结果验证后的浮标监测相对准确数据集;该数据集以段代线,结合浮标监测各参数的历年均值,验证较长时间序列浮标监测数据的准确性,通过设置合适的修正参数,所得结果可视为水体环境质量的相对准确值。
经过3个层级的质量控制,期望获得较长时间序列且相对准确的水质、营养盐、核辐射和碳氢化合物等监测参数集的量化数据结果,整体提升浙江近岸海域浮标在线监测数据质量,为客观反映海洋环境质量及其变化趋势、准确预警赤潮等海洋生态问题和突发状况以及助力海洋经济健康有序发展提供有效基础数据。
5 结语
本研究充分考虑海洋浮标在线监测的特点,从浮体稳定性、仪器设备校准、系统运行维护、数据传输接收、比对监测和异常值判定等关键环节设计浮标监测数据质量控制体系,重点从异常值判定和比对监测2个方面开展研究,设计合理且操作可行;3个层级的异常值判定规则具有一定的创新性,预期获得有效、可信和相对准确的浮标监测数据集,为整体提升浙江近岸海域浮标在线监测数据质量发挥积极作用;以浙江海洋浮标监测数据为基础提出的浮标监测数据质量控制体系的设计思路和方法,可为全国海洋浮标监测数据质量控制以及相关数据质量控制提供参考。