基于神经网络的长江口深水航道海域悬浮泥沙浓度研究
2010-12-28张宏韩震
张宏,韩震,2,3
( 1. 上海海洋大学海洋科学学院,上海 201306; 2. 上海海洋大学防灾减灾中心,上海 201306;3. 大洋渔业资源可持续开发省部共建教育部重点实验室,上海 201306 )
基于神经网络的长江口深水航道海域悬浮泥沙浓度研究
张宏1,韩震1,2,3
( 1. 上海海洋大学海洋科学学院,上海 201306; 2. 上海海洋大学防灾减灾中心,上海 201306;3. 大洋渔业资源可持续开发省部共建教育部重点实验室,上海 201306 )
航道治理和维护的核心问题为泥沙问题。在充分分析遥感和遥测数据的基础上,利用BP神经网络方法对长江口深水航道海域悬浮泥沙浓度进行了研究。当隐含层神经元个数为8时,预测效果最好,网络的RMSE仅为0.102,网络的拟合度达到0.899。预测的最大相对误差为28%,最小相对误差为6%,总的相对误差为21.5%。
遥感;遥测;悬浮泥沙;BP神经网络;长江口深水航道
研究河口区高浓度悬浮泥沙水体,传统的方法多是采取定点测量,这不仅不能全面地反映整个水域的情况,而且耗费大量的人力、物力和财力。而卫星遥感技术在大面积水域悬浮泥沙定量监测研究中具有一定的优势。关于利用卫星遥感数据进行悬浮泥沙浓度的研究,国内外学者已经做了大量的工作。李四海等[1]利用海洋水色卫星SeaWiFS数据和准同步实测表层含沙量资料,建立了长江口区悬浮泥沙遥感定量模式;王芳等[2]建立了基于MODIS遥感数据和泥沙粒径二元特征参数的主成分和神经网络两种泥沙浓度的反演模型,并对比分析了这两类模型的反演精度以及泥沙粒径因子对模型的影响;Keiner等[3]利用TM影像前3个波段作为神经网络的输入,估算了特拉华湾海域表层悬浮泥沙的浓度,模型的RMS小于10%,比多元回归模型的效果好;Zhang Yuanzhi等[4]结合TM数据和SAR数据,利用神经网络算法估算了芬兰河湾的悬浮泥沙浓度,模型的R2和RMSE分别为0.89和0.72;Kishino等[5]利用神经网络模型,使用ASTER数据反演了东京海湾悬浮物质的浓度,取得了较好的效果。尽管国内外学者在悬浮泥沙遥感领域做了许多工作,但是利用遥感和遥测数据相结合的方法,进行悬浮泥沙浓度反演研究的较少。本文在充分分析遥感和遥测数据的基础上,利用BP神经网络方法对长江口深水航道海域悬浮泥沙浓度进行了研究,取得了比较理想的结果。
1 数据采集与处理
1.1 数据来源
遥感影像数据源为2007年7月28日、2008年3月24日和2008年4月25日的TM数据。悬浮泥沙实测浓度为长江口深水航道科学试验中心“长江口深水航道水文、泥沙、波浪自动遥测系统”的同步遥测数据,本次研究数据总共有22组,从低浓度到高浓度随机选取16组数据作为BP神经网络的训练样本,剩余的6组数据用于BP神经网络的验证。图1为“长江口深水航道水文、泥沙、波浪自动遥测系统”站位示意图。
图1 “长江口深水航道水文、泥沙、波浪自动遥测系统”站位分布图Fig. 1 Station distribution map of “Hydrology, sand, wave automatic telemetry system of the Yangtze estuary deepwater channel”
1.2 遥感数据预处理[6,7]
TM数据的反射率采用式(1)和式(2)进行计算。
辐射亮度计算:
式中:DN为图像的像元灰度值,取值范围为0—255;Lλ为辐射亮度;Gain为增益;Bias为偏差; 为行星反射率;d为日地距离参数;ESUN为太阳光谱辐射量;θ为太阳天顶角。表1 为反射率计算所使用的各参数值。
表1 反射率计算使用的各参数值Tab. 1 Parameter values for computing reflectance
此外,利用ENVI 4.5软件对TM反射率图像进行了几何校正,配准图像采用研究区1∶5万地形图,校正后的像元误差小于0.5个像元。
1.3 遥测数据分析
传统的泥沙观测方法为利用测量仪器(例如OBS)进行现场单点或走航测量。由于监测费用昂贵,往往现场仅布置少数几个单点(垂线)或断面,且易受气候环境影响,如无法获取台风、暴雨等恶劣气候条件下的泥沙数据。“长江口深水航道水文、泥沙、波浪自动遥测系统” 是在YJD-500NT基础上开发出来的水文气象多要素实时监控系统软硬件平台,可全天候、实时地接收长江口深水航道水域的水文、泥沙、波浪数据,主要由7个浮标和3个平台构成(见图1)。各个站点的悬浮泥沙浓度数据见图2,其中0值代表该站点数据缺失。从图2可以发现,南槽东平台站位的悬浮泥沙浓度最高,其次就是南槽东站位,2007年7月28日南槽上、牛皮礁、W3、北槽中、横沙各站位泥沙浓度缓慢增大,但都低于0.3 g/L ;2008年3月24日南槽上、牛皮礁及W3站位泥沙浓度大约为0.6 g/L,而口外、北槽中、横沙及北槽中平台各站位泥沙浓度则低于 0.6 g/L;2008年 4月25日南槽上、牛皮礁、W3站位泥沙浓度呈逐步上升趋势,但都低于0.6 g/L,而北槽中站位悬浮泥沙浓度与2008年3月24日基本持平。(经和遥测系统人员沟通,南槽东平台和浮标站位数据偏高属于异常点,故未采用)。
图2 各站位实测悬沙浓度Fig. 2 Suspended sediment concentration in different stations
2 神经网络
2.1 BP网络的设计
人工神经网络是20世纪80年代迅速发展起来的一门非线性科学,它能够解决那些由数学模型或描述规则难以处理的问题,且具有较好容错性能。本研究所使用的BP神经网络是一种非线性映射人工神经网络,即误差反向传播网络,具有很强的学习和记忆能力,以及结构简单、可调参数多、训练算法多、可操控性好的优点。
本文主要是从网络的层数、每层的神经元个数和传输函数、初始权值、以及学习速率、期望误差的选取等几个方面来考虑[8],利用MATLAB 7.0软件进行了BP网络的设计。本研究采用的神经网络模型为三层的反向传输神经网络,第一层为输入层,中间层为隐含层,第三层为输出层。各层的神经元之间形成连接,各层内的神经元之间没有连接。图3为一个简单的人工神经网络的结构。
对于输人层神经元,其输出和输入相同。隐含层的神经元的输出为:
图3 人工神经网络结构Fig. 3 Artificial neural network structure
当对该网络进行训练时,首先有若干组训练样本,其中的每个样本由输入和理想输出组成;当网络的所有实际输出与理想输出一致时,训练结束。否则,通过修改权重,使网络的实际输出与理想输出一致。
本文在进行神经网络设计时,隐含层和输出层的传输函数分别为S型正切函数 (tansig) 和S型对数函数 (logsig),因为 S型函数的极限值落在 [0,1] 之间,使得网络训练时能够快速地收敛,同时采用自适应的Levenberg-Marquardt快速学习算法训练网络[9]。在设计网络的训练过程中,期望误差值也应当通过对比训练确定一个合适的值,合适的程度相对于隐含层神经元的数目而言,本网络的训练误差设置为0.01。考虑到长江口悬浮泥沙光谱反射率具有双峰特征(第一反射峰位置在600 ~ 700 nm,第二反射峰位置在760 ~820 nm[10]),为了更好地反映悬浮泥沙浓度与遥感影像反射率之间的关系,输入层含有三个神经元,分别对应TM影像的2波段、3波段和4波段的反射率。
3 结果与分析
3.1 隐含层神经元数目的确定
为了找到最佳的隐含层神经元个数,通过计算样本模拟值与实测值之间的Pearson相关系数 (R) 的平方值和均方根误差 (RMSE) 来完成,二者的计算公式为:
表2列出了不同神经元数目下模型的预测结果。从表2可以发现,隐含层神经元为8的BP网络对函数的逼近效果最好,因为它的误差最小。另外,网络的性能并非隐含层神经元的个数越多越好,当神经元个数增加到10时,误差反而增大了。图4是当隐含层神经元为8时的网络训练停止图。从图4可以看出,模型经过26次训练就达到了目标误差。
表2 不同隐含层神经元神经网络模型的R2 和RMSETab. 2 R2 and RMSE of different hidden layer neurons neural network model
3.2 模型的验证
为了检验所建立的神经网络模型的预测精度,本文选取剩余的6组数据对网络进行了验证(表1)。从表1可以看出,当选择隐层神经元为8时,网络的RMSE仅为0.102,网络的拟合度达到 0.899。刘志国等[11]在最小二乘法的基础上建立了单波段反射率与泥沙浓度关系的回归方程,模型的最小RMSE为0.108,模型的最大RMSE为0.316,相对应的R2分别为0.916 3和0.869 6。由此可见,本文的拟合度小于文献[11]的研究结果,原因在于文献[11]模型建立的是单一波段,而本文是整个波段的,但是本文的RMSE比其要好。图5是神经网络所模拟的值与实测值的一个对比。从图5可以发现,4号浮标(南槽东平台)位置处的误差较大。这可能与该水域附近的水动力条件有关,因为南槽东平台刚好处于南槽航道(图1),这里由于浅滩地形和潮流掀沙过程引起的泥沙再悬浮,使悬浮泥沙浓度较高[12]。但是整体来看,预测的最大相对误差为28%,最小相对误差为6%,总的相对误差为21.5%。对比李四海等[13]利用像元灰度法建立的长江河口表层悬浮泥沙线性反演模式(其误差为24.35%),这个结果还是比较理想的。
图4 神经网络模型训练停止示意图Fig. 4 Stop training of neural network model
图5 BP神经网络模拟值和实测值对比Fig. 5 Measurement values and prediction values of BP neural network
4 结 论
本文以TM影像2、3、4波段的反射率作为输入,悬浮泥沙浓度作为输出,结合遥测的悬浮泥沙浓度,利用BP神经网络对长江口深水航道水域悬浮泥沙浓度进行了研究。当隐含层神经元数目为8个时,BP神经网络的训练效果最好,RMSE仅为0.102,拟合度达到0.899;BP神经网络预测的最大相对误差为28%,最小为6%,总的相对误差为21.5%。本文研究结果说明,BP神经网络能比较准确地反演长江口深水航道悬浮泥沙的浓度,可揭示长江口深水航道海域悬浮泥沙的时空分布规律,为其治理和维护提供技术支撑。
致谢:对上海河口海岸研究中心刘杰高工在本次研究工作中给予的帮助在此深表谢意。
[1] 李四海,唐军武,恽才兴. 河口悬浮泥沙浓度SeaWiFS遥感定量模式研究 [J]. 海洋学报, 2002, 24(2): 51-58.
[2] 王芳, 李国胜. 海洋悬浮泥沙二元特征参数MODIS遥感反演模型研究 [J]. 地理研究, 2007, 26(6): 1 186-1 196.
[3] Keiner L E, Yan X H. A Neural Network Model for Estimating Sea Surface Chlorophyll and Sediments from Thematic Mapper Imagery [J].Remote Sensing of Environment, 1998, 66(2): 153-165.
[4] Zhang Y Z, Jouni P, Sampsa K, et al. Application of an empirical neural network to surface water quality estimation in the Gulf of Finland using combined optical data and microwave data [J].Remote Sensing of Environment, 2002, 81(3): 327-336.
[5] Motoaki K, Akihiko T, Joji I. Retrieval of Chlorophyll a, suspended solids, and colored dissolved organic matter in Tokyo Bay using ASTER data [J].Remote Sensing of Environment, 2005, 99(1): 66-74.
[6] 韦玉春, 黄家柱. Landsat5图像的增益、偏置取值及其对行星反射率计算分析 [J].地球信息科学, 2006, 8(1): 110-113.
[7] Chander G, Markham B L. Revised Landsat-5 TM Radiometric Calibration Procedures and Post-Calibration Dynamic Ranges [OL]. http://landsat.usgs.gov/documents/L5TMCal2003.pdf.
[8] Demuth H, Beale M. Neural Network Toolbox user's guide, for use with MATLAB,Version4. The MathWorks, online only, 2002.
[9] Hagan M T, Menhaj M. Training feedforward networks with the Marquardt algorithm [J]. IEEE Transactions on Neural Networks,1994, 5(6): 989-993.
[10] 韩震, 恽才兴, 蒋雪中. 悬浮泥沙反射光谱特性实验研究 [J]. 水利学报, 2003, (12): 118-121.
[11] 刘志国, 周云轩, 沈芳. 河口水体泥沙浓度的水面光谱统计模式分析 [J]. 水利学报, 2007, 38(7):799-805.
[12] 陈沈良, 张国安, 杨世伦, 等. 长江口水域悬沙浓度时空变化与泥沙再悬浮 [J]. 地理学报, 2004, 59(2): 260-266.
[13] 李四海, 恽才兴. 河口表层悬浮泥沙气象卫星遥感定量模式研究 [J]. 遥感学报, 2001, 5(2): 154-160.
Research on suspended sediment concentration of the Yangtze River estuary deepwater channel sea area using neural network
ZHANG Hong1, HAN Zhen1,2,3
( 1. College of Marine Sciences, Shanghai Ocean University, Shanghai 201306, China;2. Ocean Disaster Prevention and Reduction Center, Shanghai Ocean University, Shanghai 201306, China;3. Key Laboratory of Sustainable Exploitation of Oceanic Fisheries Resources, Ministry of Education, Shanghai 201306 , China)
Suspended sediment is one of the most important factors concerning the maintenance of the Yangtze River estuary deepwater channel. By analyzing the remote sensing data and the telemetry data, the paper estimated the suspended sediment concentration in the Yangtze River estuary deepwater channel with BP neural network method.While the neurons number of hidden layer is 8, the prediction is the best, the RMSE is only 0.102 and the fitting degree reaches 0.899. The maximal relative error is 28%; the minimum relative error is 6%; and the total relative error is 21.5%.
Remote sensing; Telemetry; Suspended sediment; BP neural network; The Yangtze River Estuary deepwater channel
TV148.1
A
1001-6932(2010)02-0213-06
2008-05-11;
2009-08-13
上海市教育委员会科研创新重点项目(08ZZ81)、上海市科委重点项目(08230510700)、教育部科学技术研究重点项目(209047)、水利公益性行业科研专项(200701026)资助
张宏 (1984-),男,安徽泾县人,硕士研究生,主要研究方向为环境遥感,电子邮箱:lkdd10000@163.com
韩震,教授,博士,电子邮箱:zhhan@shou.edu.cn