APP下载

海冰观测数据质量控制方法研究及北海区冰情分析

2017-12-27虞兰兰张海宁虞洋江宇张玉强金海琴

海洋信息技术与应用 2017年4期
关键词:海冰北海年度

虞兰兰,张海宁,虞洋,江宇,张玉强,金海琴

(1. 国家海洋局北海信息中心 青岛市 266061;2. 海军北海舰队海洋水文气象中心 青岛市 266003;3. 青岛91049部队 青岛市 266000)

海冰观测数据质量控制方法研究及北海区冰情分析

虞兰兰,张海宁,虞洋,江宇,张玉强,金海琴

(1. 国家海洋局北海信息中心 青岛市 266061;2. 海军北海舰队海洋水文气象中心 青岛市 266003;3. 青岛91049部队 青岛市 266000)

根据海冰观测数据的特点,分析、借鉴几种常用的气象、海洋数据质量控制方法,制定海冰观测数据的质量控制体系,包括非法码检验、全等性检验、极值检验、一致性检验、统计特性检验、可视化图形绘制检验等方法。选取最近4个年度 (2013/2014-2016/2017年度)北海区5个海冰测站的观测数据,分别进行人工和程序质量控制,结果显示,目前业务中使用的人工检测质量控制效率较低,海冰质控程序则提升了海冰观测数据质量控制的效率和准确度,在日常业务中有较高的应用价值。同时,对质控后的海冰数据进行北海区冰情分析发现,从海冰持续时间、总冰量、浮冰冰状分布情况,均可看出2015/2016年度北海区的冰情最为严重;在同一年度,北海区冰情基本随纬度增加而加重,而在相似纬度上,黄海冰情比渤海更为严重。

海冰;质量控制;北海区;冰情分析

海冰是我国中、高纬度海域的重要海洋灾害之一,频繁出现在渤海和黄海中北部海域 (本文简称北海区),主要由海水冻结及一部分江河注入的淡水冰组成,是北海区特有的水文现象。海冰对海面气热交换的影响十分显著,直接影响地球、大气的能量收支平衡[1],受西伯利亚寒潮侵袭的影响,我国北海区每年冬季均出现不同程度的结冰[2]。据资料统计,北海区海冰为一年冰,发生严重 (或比较严重)海冰灾害的周期约为5年,轻冰年与重冰年的冰情差异很大[3]。轻冰年,海冰出现范围小、持续时间短,厚度较薄,对航运交通和其他海上活动的影响较小;重冰年,北海区大面积海域被厚冰覆盖[4],造成航道堵塞、海洋工程设施损坏,严重制约港口航运、海上油气开采、渔业生产和水产养殖等发展,影响了人民的生产生活[5]。掌握有冰海域的环境条件,利用多种手段开展海冰冰情监测对国民经济发展和国防建设具有十分重要的意义[6]。

对观、监测数据进行质量控制,及时对发现的错误数据进行分析判断,能够妥善解决资料中可能存在的问题,剔除资料中的错误,提高资料的可靠性与准确性[7],是实测数据应用分析的前提。而质量控制方法的好坏则直接影响到数据质量,是数据质量控制的重点[8]。由此可见,对海冰资料进行质量控制,获取准确的海冰监测数据,从而提高海冰实测资料的可靠性,对于推进海冰观测资料的广泛利用、建立较为完善的海冰防灾减灾系统具有意义重大。因此,海冰数据的质量控制是制约相关研究工作的技术瓶颈,是海冰冰情监测成果应用的基础,为确保海冰数据的真实性和准确性,必须对其实行准确有效的数据质量控制和检验评估。目前国内外针对海冰观测数据的质量控制研究较少,并未产生一套完整可靠的海冰质控方法体系。

自1969年特大冰封以来,我国海冰监测、研究和预报工作全面展开。随着遥感技术的发展,20世纪80年代开始大量应用遥感技术监测海冰。21世纪以来,北海区海洋站已形成业务化运行的海冰观测数据,然而,在实际业务中缺乏专门的海冰质控软件,主要对其进行初步的人工检验,影响了海冰观测资料使用的规范性,亟待开发系统的海冰质控应用程序,对海冰资料进行有效的质量控制,以满足业务的需求。本文借鉴气象、海水温盐度、海浪等业务化观测数据的质量控制方法,针对海冰观测数据的特点,初步分析制定海冰数据质量控制的流程,通过实例进行海冰数据质量控制的检验,并分析最近4个年度北海区冰情分布特征。

1 质量控制方法简介

根据观测数据的实际情况进行质量控制方法的选择和应用,是数据质量控制的重点,质量控制方法直接影响了数据的质量。由于目前并无系统的海冰质量控制方法体系,本文主要借鉴气象及其它水文数据质量控制的常用方法,包括非法码检验、全等性检验、极值检验、一致性检验、海洋环境气候特性检验、统计特性检验、人机交互图形绘制检验等[7-14]。

1.1 非法码检验

对温盐度、海浪、海冰、气象数据等要素的海洋站观测数据,必须按照规定的格式和代码进行记录,每一类观测要素的标准数据格式,均具有固定的编码方式和特定属性。根据规定的各类要素数据编码格式,对不同位置出现的符号、数字或字符进行范围检验,即为非法码检验。

1.2 全等性检验

观测数据的部分参数相对于固定的海洋站,往往是长期不变的,如资料类型、观测点经纬度、观测点水深、观测方法、仪器名称、观测仪器海拔高度等参数值,质控过程中检验上述参数值是否保持不变,即为全等性检验。

1.3 极值检验

极值检验是指结合海洋环境要素的物理征、历史极值等统计经验,分别给定各要素的极大值和极小值,作为该要素观测数据的上、下限,从而判定数据是否异常的方法,亦被称为极值控制法。极值控制的关键是极值的确定,若观测数据超出极值的范围,则判定该数据可疑。选取适当的极值范围可有效检验出极端异常的数据,然而,极值控制无法检验出数值在极值范围内的异常数据,需进一步采用更为精准的控制方法。

1.4 一致性检验

一致性检验法通过分析要素之间的内在关系和时空分布联系,对要素的正确性进行判定,包括内部一致性检验、空间一致性检验及时间持续性检验。

内部一致性检验主要分析各要素自身属性及要素之间的联系是否正确,如对于风向这一要素,出现大于360°或小于0°的风向、风速为0而风向未记为C的情况,则风向未通过内部一致性检验;要素之间的联系,如总云量≥低云量、气温≥露点温度、风速与风浪的浪高成正比等,若出现有悖于上述关系的要素时,则该要素未通过内部一致性检验。

由于不同空间的数据分布特征具有较大的差异和不确定性,故空间一致性检验使用四分位距检查法,又称四分位法[15-17]。四分位法主要用于描述观测数据的偏态分布、分布不明确及末端无确定值等特征,可消除异常大值的影响,相对于均值、标准差等更加稳定可靠。本文根据四分位法的实质内涵,对其现有的计算公式进行了归纳、精简。将观测数据整理为升序排列的样本X=[x1, x2,…,xn], n≥3, 选取 3 个数据点将 X 划分为四等分,数据点对应数值即为四分位数,分别用Q1、Q2、Q3表示,计算步骤如下所示:

另外,由于月经血内会混有一些具有抗凝作用的活性酶,所以月经为非凝固性的,这样有利于经血的排出。但是当月经量过多的时候,抗凝血酶原的量会出现相对不足,就会使经血内混有血块。此时,由于经血里一些细碎甚至大块的血块,所以颜色也会偏黑。

1.4.1 计算第1个四分位数Q1

Q1在X样本中的下标为进行mQ向下取整 (即截断取整)得到整数 ,则1可由用xm和xm+1插值得到:

1.4.2 计算第3 个四分位数Q3

Q3在X样本中的下标为进行pQ向下取整 (即截断取整)得到整数,则1可用xp和xp+1插值得到:

1.4.3 计算四分位距IQR

1.4.4 确定样本X中异常值的界限为:

公式(4)中的Fl、Fu分别为异常值的下限和上限,在[Fl, Fu]以外的数据认定为异常值。然而四分位法也有一定的局限性,该方法必须保证异常数据占总数据量的比例较小,否则将无法有效识别异常数据,故使用时应结合其它检验方法对数据进行质量控制。

时间持续性检验主要检测数据是否不随时间发生改变,应根据要素的特征进行检查时间的设置,当某要素在检查时间内 (如24 h)样本的标准差小于给定的最低值,则该要素未通过时间持续性检验。

1.5 海洋环境气候态特性检验

根据各要素的海洋环境气候态分布特性进行资料检验,将某海洋站某要素的月统计值与该站该要素的多年历史统计值进行比较,分析其超出或低于给定值的原因,排除异常天气现象的影响因素后,即认为该要素未通过海洋环境气候态特性检验。气候态检验必须保证已有的观测数据序列足够长 (至少20年),否则不具备进行该项检验的条件。

1.6 统计特性检验

一定时间序列的观测资料在理论上往往符合某些概率统计的特性,数据对应的随机变量和随机过程相互独立并服从一定的分布。对观测资料进行数据的统计特性检验,可选用的检验方法包括3δ方法 (莱茵达检验法)、卡方拟合优度检验、轮次检验、格拉布斯检验以及狄克逊检验等,应根据数据的观测特性和实际情况选取统计检验方法。对时间序列为一个月的观测数据一般采用莱茵达检验法进行质量控制。

1.7 人机交互图形绘制检验

国内外成功的质量控制体系表明,数据质量控制的完全自动化无法解决所有的资料质量问题。质量控制程序计算出的异常数据未必是错误数据,若不加分析直接算作缺测或内插得出替代值,则会造成数据误判。因而,使用人工检查和计算机判定相结合的方法进行数据的统计和分析,是观测资料质量控制的主要方法之一,而便捷友好的人机交互界面是实现该方法的关键步骤。在人机交互过程中,工作人员根据自己的专业知识和经验,核查相关要素的变化情况,对质控软件判定出的异常观测数据进行最终的分析判断。

2 海冰观测数据质量控制体系的建立与检验

观测数据质量控制的核心是通过分析数据的特征,选择适当的质量控制方法,以提高可疑数据的检出率。海冰观测要素包括观测冰量、冰型、冰表面特征、冰状、最大浮冰块水平尺度、浮冰密集度、浮冰漂流方向和速度、沿岸冰堆积量、沿岸冰堆积高度等。本文根据海冰各要素的特性,全面考虑海冰资料的各种误差,选用非法码检验、全等性检验、极值检验、一致性检验、统计特性检验、人机交互图形绘制检验等方法(表1),初步建立海冰观测数据质量控制的方法体系。由于观测数据时间序列的限制,海洋环境气候态特性检验暂未考虑,应在时间序列达到20年以上时将该检验加入海冰质控方法体系。

表1 海冰观测数据质量控制方法体系

现有的海冰质量控制方法主要为人工检验,极易造成异常数据的漏检。选取最近4年的北海区海冰观测数据 (2013/2014-2016/2017),对本文建立的海冰质控体系的准确性进行验证与分析。首先,对海冰观测数据分别进行人工检测与程序质量控制的结果对比,将发现的问题条数列出,如表2所示:人工检测主要针对标题记录和说明记录,最核心的数据记录的质量无法得到保证;而质控程序输出的质控报告显示,其数据记录亦存在较多的问题,需要资料产出单位进行检查和修改。经人工复核,质控程序检测出的异常数据无错检现象,充分证明了海冰质控程序的可行性,提升了海冰观测数据质控过程的效率和准确度,可在业务运行中推广使用。

表2 近4年(2013/2014-2016/2017年度)海冰观测数据质量控制结果对比

3 北海区海冰冰情分析

选取2013/2014-2016/2017年度 (下文全部以13/14-16/17年度代替)北海区最北部5个海冰测站的观测数据,进行质量控制后作相应的修正并剔除可疑值,以得出最近4年北海区海冰(图1)的冰情分布特征。

图1 北海区海冰测站的位置示意图

统计各海冰测站能够观测到冰量的有冰日数,即初冰日期与终冰日期之间的天数,可表征海冰持续时间的长短,如图2所示:从时间上分析,15/16年度北海区海冰持续的时间最长,5个测站总计309天,其余3个年度分别为249、234、260天。从地域上分析,黄海北部近岸 (东港)海冰持续的时间最长,辽东湾北部近岸 (葫芦岛、鲅鱼圈)次之,辽东湾南部 (芷锚湾、温坨子)海冰持续时间最短。

图2 北海区13/14-16/17年度各海冰测站有冰日数统计(单位: 天)

统计各海冰测站观测到的总冰量,即各观测时刻海冰覆盖面积占整个能见海面的成数之和。总冰量越大,表明海冰面积越大,如图3所示:从时间上分析,15/16年度北海区海冰总冰量最大,5个测站总计3 074,其余3个年度分别为1 566、1 782、1 746。从地域上分析,基本上纬度较高的葫芦岛、鲅鱼圈总冰量最大,东港次之,芷锚湾、温坨子最小。

图3 北海区13/14-16/17年度各海冰测站总冰量统计

由于13/14-16/17年度观测得出的固定冰冰量均为0,为研究海冰水平尺度的特征,图4绘制出浮冰的冰状统计情况。假设浮冰最大水平尺度为L(单位:m),L与浮冰冰状的关系为:巨冰盘 (L≥2000)、大冰盘 (500≤L<2000)、中冰盘 (100≤L<500)、小冰盘 (20≤L<100)、冰块 (2≤L<20)、碎冰 (L<2)。

浮冰冰状分布特征为:北海区海冰主要以冰块、碎冰这两类较小水平尺度的形式存在,小冰盘出现次数约为冰块出现次数的一半;除15/16年度出现40次大冰盘的统计外,巨冰盘和大冰盘的统计次数均为0。从冰状的时间分布来看,15/16年度浮冰各冰状出现次数均远高于其他年度。

图4 北海区13/14-16/17年度浮冰冰状统计次数(单位: 次)

综上所述,从海冰持续的时间、总冰量大小、浮冰冰状分布情况,均可看出15/16年度北海区的冰情在最近4个年度中最为严重。在同一年度,北海区冰情随纬度增加而加重;在相似纬度上,黄海冰情比渤海更为严重。

4 结论与展望

(1)北海区海冰观测数据在实际质控业务中主要进行人工检验,影响了海冰观测资料使用的规范性。本文借鉴气象、海水温盐度、海浪等业务化观测数据的质量控制方法,针对海冰观测要素的特点,分析其质量控制过程,初步建立了北海区海冰质控方法体系,并将其应用于海冰的实测数据。与目前的人工检验结果相比,本文建立的海冰质控程序更加方便快捷,质检正确率亦得到了提升。

(2)从海冰持续的时间、总冰量大小、浮冰冰状分布情况可看出,15/16年度北海区的冰情在13/14-16/17 4个年度中最为严重。基本上在同一年度,北海区冰情随纬度增加而加重;在相似纬度上,黄海冰情比渤海更为严重。

(3)在海冰质量控制体系的应用过程中,由于实测海冰数据时、空序列的限制,无法进行海洋环境气候态特性和空间一致性的检验过程,在时间序列达到20年以上、空间观测点分布达到相应密度后,应在海冰质控体系中分别加入长期观测数据的气候态统计信息和四分位距检查法。

(4)本文仅以莱茵达检验法进行了海冰观测数据的统计特性检验,为更全面地检验数据的随机过程,应在进一步的质控方法研究工作中考虑卡方拟合优度检验、轮次检验、格拉布斯检验、狄克逊检验等方法。此外,应考虑更加便捷友好的人机交互界面,以便于工作人员根据程序质控结果进行人工复核校验的分析判断。

[1] 侯海倩, 李家国, 米晓飞等. 基于资源 3号卫星的海冰监测研究[J]. 遥感信息, 2014, 29(6): 36-40.

[2] 吕晓东. 海冰基础知识及船舶冰区航行的注意事项[J].学术, 2015, (2): 77-79.

[3] 周群, 魏立新, 黄焕卿. 秋季巴伦支海海温异常对冬季我国渤海冰情的可能影响[J]. 海洋学报, 2016, 38(3):40-48.

[4] 郑冬梅, 张书颖, 周志强等. 逐步回归分析在渤海海冰等级预报中的应用[J]. 海洋预报, 2015, 32(2): 57-61.

[5] 吴鑫, 王晓东, 王召进等. 东营市海冰发展规律及防范措施浅析[J]. 海洋开发与管理, 2014, (10): 54-57.

[6] 朱亚平, 程周杰. 基于FY-2C的渤海海冰监测分析研究[J]. 海洋技术学报, 2015, 34(6): 6-12.

[7] 于婷, 刘玉龙, 杨锦坤等. 实时和延时海洋观测数据质量评估方法研究[J]. 海洋通报, 2013, 32(6): 610-625.

[8] 史静涛, 周智海. 海洋站数据质量控制技术探讨[J]. 海洋技术, 2011, 30(1): 114-117.

[9] 耿爱菊, 孟楠. 地面气象观测软件质控异常数据的处理[J]. 山东气象, 2013, 33(4): 64-65.

[10] 郭春迓, 李天然, 胡东明等. 南海北部测站风速质量的控制方法[J]. 广东气象, 2016, 38(1): 44-52.

[11] 全国海洋标准化技术委员会中国标准出版社第五编辑室.海洋观测工作执行标准汇编[S]. 北京: 中国标准出版社, 2010: 15-81.

[12] 任芝花, 赵平, 张强等. 适用于全国自动站小时降水资料的质量控制方法[J]. 气象, 2010, 36(7): 123-132.

[13] 汪宁, 张晓慧. 海洋水文气象实时数据质量控制[J]. 中国科学技术综述, 2014, (19): 223-223.

[14] 许铭, 杨国辉, 董海英. 区域自动站雨量资料质量控制方法及应用[J]. 北京农业·下旬刊, 2013, (6): 129-130.

[15] GonzMez-Rouco J F, JimSnez J L, Quesada V, et a1. Quality control and homogeneity of precipitation data in the southwest of europe. J Climate, 2000, 14: 964-978.

[16] 何宇飞, 杨冬梅, 朱荣等. 四分位法在地磁日变化观测数据分析中的应用[J]. 地震地磁观测与研究, 2011, 32(1): 65-70.

[17] 赵永宁, 叶林, 朱倩雯. 风电场弃风异常数据簇的特征及处理方法[J]. 电力系统自动化, 2014, 38(21): 39-46.

2017-08-23

2015年北海分局海洋科技项目--海洋站海冰观测资料的质控方法研究与初步应用 (2015B14)。

猜你喜欢

海冰北海年度
年度新锐之星
年度创意之星
北海北、南海南
年度
末次盛冰期以来巴伦支海-喀拉海古海洋环境及海冰研究进展
近三十年以来热带大西洋增温对南极西部冬季海冰变化的影响
北海 美丽的地方
汉北海淳于长夏承碑
基于SIFT-SVM的北冰洋海冰识别研究
1936年抗战前夕的“北海事件”始末