基于时间序列的海洋赤潮灾害特征分析
2014-03-20徐海龙谷德贤张文亮高启乔秀亭
徐海龙, 谷德贤, 张文亮, 高启, 乔秀亭
(1.天津农学院 水产科学系 天津市水产生态及养殖重点实验室,天津 300384;2.上海海洋大学 海洋科学学院,上海201306;3.天津市水产研究所,天津 300221;4.天津市海洋局 渤海海洋监测监视管理基地筹备处,天津 300457)
赤潮是水体中某些微小的浮游植物、原生动物或细菌在一定的环境条件下突发性地增殖和聚集,从而引起一定范围内、一段时间中水体变色现象,是一种存在已久的自然生态现象(赵冬至,2010)。由于社会经济的发展、海洋环境恶化、全球平均气温升高、以及人类用海行为增加等影响,赤潮的发生频率总体呈逐渐增多趋势,面积不断扩大,危害也越来越严重。据不完全统计,约有60%的赤潮事件对水产养殖或捕捞业造成直接经济损失,其中约30%的事件是灾难性的,使受害区的水产养殖业损失达80%以上。尽管目前赤潮发生的机制尚不十分清楚(齐雨藻,2003;赵冬至,2010),但已有学者对赤潮的发生、发展及消亡过程的理化环境因素等方面进行了大量的研究(林凤翱等,2008;林祖享等,2002;刘义豪等,2012;屠建波 等,2011;王素芬 等,2010;韦桂秋 等,2011),并基于环境参数的变化(陈国斌,2012;矫晓阳,2001;李慧等,2012;马玉梅等,2007;齐雨藻 等,1991;王正方等,2000;杨建强等,2003;张俊峰等,2006;张丽旭等,2010) 及利用SeaWiFs可见光(Ahnetal,2006) 或MODIS波段(Huetal,2010;Kimetal,2009) 对赤潮发生的预测进行了建模。而以赤潮发生频率为研究对象,对中国海赤潮发生月份的时间序列分析和预测尚未见报道,文章以近现代中国海域赤潮发生频率为研究对象,定量地分析了赤潮发生的时序特征,并根据1977-2012年赤潮发生的年频率和2001-2012年赤潮发生的月频率统计,利用时间序列分析法进行分析,并对2013-2020年赤潮发生的年频率和2013-2016年赤潮发生的月频率进行预测。
1 资料与方法
1.1 资料
基于赤潮通报统计的1977-2012年信息和国家海洋局发布的1989-2012年《中国海洋灾害公报》为依据,收集、整理了中国海赤潮发生频率的数据资料,建立中国海赤潮发生的年频率和2001-2012年发生的月频率的时间序列。
1.2 分析方法
根据1977-2012年赤潮的年发生频率的变化趋势,采用分段式线性拟合的方法建立赤潮的年发生频率与年份的关系;并对2001-2012年赤潮发生的月频率的组成部分进行分解,分析其趋势性、季节性和随机性的特点;以赤潮发生的年频率和月频率分析结果为基础,分别利用Holt指数平滑法和Holt-Winters指数平滑法建立模型(刘罗曼,2009),预测2013-2020年赤潮的年发生频率及2013-2016年赤潮发生的月频率,数据的处理和作图均通过R(i3863.0.1) 软件TTR,forecast函数包和EXCEL实现。
2 结果与分析
2.1 赤潮的年发生频率趋势
1977年至2012年赤潮的年发生频率变化规律的时间序列分析(图1) 结果显示,赤潮的年发生频率整体呈上升趋势,存在1个主峰和1个次峰,分别是2003年的119次和1992年的50次,其中2003年的峰值为有记录以来赤潮的年发生频率极大值。根据赤潮的年发生频率趋势规律,可将其分为5个阶段,包括1个缓慢增加阶段(1977-1988年), 2个快速增加阶段(1989-1992年,2000-2003年) 和2个缓慢下降阶段(1993-1999年,2004-2012年)。分别对5个阶段进行相关分析,得到各阶段赤潮发生频率与时间的回归函数关系,除2个缓慢下降阶段外,方程的拟合效果均较好(R>0.89)。
对比分析1989-1999年和2000-2012年两个时期赤潮的年发生频率的离差趋势(图2),两个阶段赤潮的年发生频率,尽管存在数值或幅度上的差异,但变化趋势规律相似,上升阶段均发生在3年,且在中间年份均较平缓,下降阶段经过初期的较快速下降后,逐渐呈现缓慢且波动下降的趋势。
图1 1977-2012年赤潮的年发生频率
2.2 赤潮发生的月频率规律
对2001-2012年发生赤潮的月频率的组成进行分解,分别得到赤潮发生的月频率趋势性部分、季节性部分和随机性部分。从图3中可以看出,赤潮发生的月频率的趋势性部分从2003年8月份的10次逐渐降到2011年9月的4.5次,季节性因素最大值在5月(约18.22),最小值在12月(约-6.76),说明每年的赤潮高峰期为5月,低谷期在12月份,而随机波动的大小总体上是随时间序列逐步上升的,对随机波动的数值统计,波动峰值主要出现在5-7月,其中在5月和7月各出现1次,分别是2004年和2007年,其他年份的季节性波动峰值均出现在6月。
图2 1989-1999年和2000-2012年赤潮的年发生频率的离差规律
图3 2001-2012 发生赤潮的月频率的组成部分分解
2.3 赤潮的年频率预测
利用Holt指数平滑法对赤潮的年发生频率进行样本期内和短期预测,并对预测结果进行检验(图4),样本期内的预测结果显示,平滑参数α和β 的值分别为0.93和0,说明样本期内的预测值仅是观测值的水平移动,预测样本期内误差平方和是6774。对2013-2020年赤潮的年发生频率进行短期预测,年发生频率呈缓慢上升趋势,从2013年的73(均值) ±28(95%CI) 增加到2020年的80(均值) ±74(95%CI),平均每年增加1次。对预测误差进行滞后1-20阶的非零自相关检验、Ljung-Box检验、及零均值正态分布检验,结果显示,预测误差的样本自相关系数在滞后1-20阶未有超出置信边界,Ljung-Box检验的P 值为0.374,预测误差在整个时间段内基本服从零均值的正态分布,说明Holt指数平滑法为赤潮的年发生频率预测提供了一个合适的模型。
图4 赤潮的年发生频率的Holt 指数平滑法预测
2.4 赤潮的月频率预测
基于Holt-Winter指数平滑法的赤潮发生的月频率预测(图5),结果显示,样本期内的预测平滑参数α、β 和γ 的值分别为0.039、0.090和0.457,误差平方和为3085.52,α 与β 值较小,说明预测赤潮的月频率水平上和趋势的斜率上受近期影响较小,该方法预测的赤潮季节峰值大约发生在每年的5月,对2013-2016年各月发生的赤潮频率进行预测,表明5-7月份仍为赤潮高发期,峰值出现在5月,基本稳定在25次左右,12月赤潮发生次数最少,甚至有可能不发生。对模型预测的误差进行滞后1-20阶的非零自相关检验、Ljung-Box检验、及零均值正态分布检验,预测误差的样本自相关系数在滞后11阶的时候超过了置信边界,Ljung-Box检验的P 值为0.362,预测误差的密度分布图显示预测误差近似符合均值为0的正态分布。
3 讨论
近现代中国关于赤潮的记录始于1933年发生在原浙江水产实验场(镇海至台州、石浦等海域)的夜光藻赤潮,之后直到1977年,才有赤潮发生的连续记录,但由于在赤潮方面研究的滞后,20世纪90年代以前的赤潮发生记录与统计缺乏完整性和系统性(齐雨藻,2003;赵冬至,2010),对该时段赤潮的年发生频率真实情况的分析及以此为基础的准确预测带来困难。文章中通过对比1989-1999年和2000-2012年两个时期赤潮的年发生频率的离差规律,发现1989-1999年时段赤潮发生频率缓慢下降后随之出现的是赤潮的年发生频率的快速增加(2000-2003年),而2000-2012年时段,继2011年赤潮的年发生频率为该时段最低后亦在2012年开始出现上升,根据两个时间段离差规律相似的特点可得出2013年及之后赤潮的年发生频率应为快速增加的趋势,这与利用Holt指数平滑法预测的2013-2020年赤潮的年发生频率的数值趋势一致,但Holt指数平滑法预测的增加趋势相对缓慢(约每年增加1次),这可能与Holt指数平滑法预测是基于1977-2012年的赤潮发生的年频率数据,其中包含了20世纪90年代以前的缺乏完整性和系统性的信息有关,同时仅基于两个时期离差规律相似进行赤潮发生的年频率预测,在基础信息量,预测的理论及方法方面都尚显不足。但对于海洋赤潮事件而言,因其影响因素较多、影定,而分析显示赤潮时间具有明显的季节规律(图3),且一定时间范围内,人类行为活动也具有较好的周期规律性,因此使用离差规律相似的方法或许不失为赤潮的年发生频率趋势预测的有效途径,然而量化分析这种周期性规律,以及确定周期的波动特性及周期的内在参数,并利用这种周期规律进行赤潮的年发生频率预测,还有待更多资料的积累和更广泛的研究开展。
指数平滑法自1958年提出后,经统计学家深入研究和拓展,已成为各个领域与时间序列相关事件预测中最普遍和常用的方法,包括Simple指数平滑法、Holt指数平滑法和Holt-Winters指数平滑法(刘罗曼,2009)。其中,Simple指数平滑法要求时间序列处于恒定水平和没有季节性变动的时间序列,Holt指数平滑法要求时间序列可以被描述为一个增长或降低趋势的、 没有季节性,Holt-Winters指数平滑法主要应用于时间序列呈现增长或降低趋势并存在季节性。根据研究对象1977-2012年赤潮发生的年频率和2001-2012年发生的赤潮的月频率时间序列特征的分析结果,1977-2012年赤潮发生的年频率的5个阶段,分别呈现出不同的增长和下降趋势,且不具有季节性,而2001-2012年赤潮的月频率具有明显的季节性,其频率在一年的周期中随月份变化整体呈现出先增加后减少的趋势,因此进行时序分析和预测时分别采用Holt指数平滑法和Holt-Winters指数平滑法。
运用Holt指数平滑法估计,其平滑化是由两个参数控制的,α 用于估计当前时间点的水平,β 用于估计当前时间点趋势部分的斜率,两个参数介于0-1之间,当参数接近0时,大多数近期的观测在预测中所占权重越小。该研究中β 值为0,说明赤潮的年发生频率出现突然增加或减少的可能性较小,这与20世纪90年代之前赤潮数据占总数据的比例较大且变化趋势平缓有关。预测误差的检验,对预测误差进行检验,预测误差在滞后1-20阶不具非零自相关的特点,且预测误差服从零均值的正态分布,说明基于Holt指数平滑法赤潮的年发生频率预测模型是不可再被优化的。
Holt-Winters指数平滑法估算依靠三个参数来控制,α、β 和γ 分别对应当前时间的水平,趋势部分的斜率和季节性部分。利用Holt-Winters指数平滑法分析2001-2012年赤潮的月频率时,α和β 值都较低,说明在样本时间点估计的水平更多地是基于历史观测值,估计出来的趋势部分的斜率在整个时间序列上是不变的,γ 的值接近0.5,表明当前时间点的季节性部分的估计是基于早期数据和近期观察值的综合效果得到,各部分权重相当。Holt-Winters指数平滑法在时期内预测的季节峰值与实际观测值基本一致,而月频率组成中随机波动的大小整体上随时间序列延续呈逐步上升的趋势,说明赤潮的月发生次数受随机因素的影响逐渐增加,这可能与沿海经济的快速发展,偶然诱因的增多有关。
图5 Holt-Winters 指数平滑法预测赤潮的月频率
赤潮的月频率预测误差检验中,Ljung-Box检验P 值为0.362,说明不足以证明样本期内预测误差在滞后1-20阶的时候是非零自相关的,因此可认为前20滞后阶中1/20(滞后11阶) 的自相关值超出95%的显著边界是偶然的。尽管预测误差的密度分布图展现出预测误差尽管图形看起来是一个偏向右侧的正态分布,但右偏是相对较小的,故可以认为预测误差是服从均值为零的正态分布,因此Holt-Winters指数平滑法为赤潮的月频率提供了一个适当的预测模型。
4 结论
赤潮是全球三大近海污染问题之一,也是中国近海主要海洋灾害之一。文章基于中国海1977-2012年赤潮的年发生频率和2001-2012年赤潮发生的月频率,分别利用Holt指数平滑法和Holt-Winters指数平滑法建立预测模型进行年频率和月频率预测。结果显示:赤潮的年发生频率出现突然增加或减少的可能性较小,以年均增长1次的趋势从2013年的73次增加到2020年的80次;赤潮的月发生次数受随机因素的影响逐渐增加,2013-2016年5-7月份仍为赤潮高发期,峰值出现在5月,基本稳定在25次左右,12月赤潮发生次数最少,甚至有可能不发生。文章以中国海全海域赤潮发生频率为研究对象,而中国海所跨纬度和经度较大,且各海区的地形、水文等环境差异明显,赤潮藻的组成亦存在不同,因此,对中国海海域各海区及各赤潮藻引发赤潮的频率进行预测,有待深入研究。
Ahn Y H, Shanmugam P, 2006. Detecting the red tide algal blooms from satellite ocean color observations in optically complex Northeast-Asia Coastal Waters. Remote Sensing of Environment, (103): 419-437.
HU C M, CANNIZZARO J, Carder K L, et al, 2010. Remote detection of Trichodesmium blooms in optically complex coastal waters:Examples with MODIS full-spectral data. Remote Sensing of Environment,114(9):2048-2058.
Kim Y, Byun Y, 2009. Detection of Cochlodinium polykrikoides red tide based on two-stage filtering using MODIS data. Desalination, 249(3):1171-1179.
陈国斌,2012.厦门同安湾海域血红哈卡藻赤潮前的自动监测研究.海洋环境科学,31(3):391-394.
矫晓阳,2001.透明度作为赤潮预警监测参数的初步研究.海洋环境科学,20(1):27-31.
李慧,顾沈明,2012.基于RBF 神经网络的赤潮预测方法.计算机工程与应用,48(1):228-230,248.
林凤翱,卢兴旺,洛昊,等,2008.渤海赤潮的历史、现状及其特点.海洋环境科学,27(Z2):1-5.
林祖享,梁舜华,2002.探讨影响赤潮的物理因子及其预报.海洋环境科学,21(2):1-5.
刘罗曼,2009.时间序列分析中指数平滑法的应用.沈阳师范大学学报(自然科学版),27(4):416-418.
刘义豪,宋秀凯,靳洋,等,2012.一次陆源降雨污水引起血红哈卡藻赤潮的成因.生态学报,32(15):4836-4843.
马玉梅,高静宇,王清华,2007.基于人工神经网络的赤潮预测模型.海洋预报,24(1):38-44.
齐雨藻,黄伟建,邱漩鸿,1991.大鹏湾夜光藻种群动态的时间序列模型.暨南大学学报(自然科学与医学版),12(3):96-103.
齐雨藻,2003.中国沿海赤潮.北京:科学出版社.
屠建波,张秋丰,徐玉山,等,2011.渤海湾天津近岸海域首次棕囊藻赤潮初探.海洋通报,30(3):334-337.
王素芬,唐丹玲,2010.南海赤潮的时空分布特征及其与南海环境关系的综合分析.海洋通报,29(5):577-583.
王正方,张庆,吕海燕,等,2000.长江口溶解氧赤潮预报简易模式.海洋学报,22(4):125-129.
韦桂秋,王华,蔡伟叙,等,2012.近10年珠江口海域赤潮发生特征及原因初探.海洋通报,31(4):466-474.
杨建强,罗先香,丁德文,等,2003.赤潮预测的人工神经网络方法初步研究.海洋科学进展,21(3):318-324.
张俊峰,俞建良,庞海龙,等,2006.利用水文气象要素因子的变化趋势预测南海区赤潮的发生.海洋预报,23(1):9-19.
张丽旭,赵敏,蒋晓山,2010.中国赤潮发生频率的变化趋势及其多发年份的R/S 预测.海洋通报,29(1):72-77.
赵冬至,2010.中国典型海域赤潮灾害发生规律.北京:海洋出版社.