基于GoogleEarthEngine平台的太湖围网养殖时空变化
2021-05-06李尚志薛华柱李静茹
李尚志 薛华柱 李静茹
摘要:基于谷歌地球引擎(Google Earth Engine,简称GEE)平台,以我国太湖水域为例,利用30年时间序列的Landsat系列卫星数据,结合光谱信息、多种遥感指数和纹理信息,利用分类与回归树的方法对1985—2019年之间的太湖围网养殖区域进行分类提取,并且探讨太湖围网养殖空间分布模式及时间序列上的面积变化情况。结果表明,分类与回归树方法可以用于提取围网养殖区域,同时提取精度较高,细节信息也较为丰富;在空间上,太湖围网养殖活动主要存在于东太湖水域,西太湖区域面积较小。在时间序列上,太湖围网养殖产业自1985年开始以来,围网养殖区面积逐年提高,至2007年达到峰值,然后逐年缩小,在近年保持稳定状态。养殖区最大面积达到136.57 km2,经过近年来的一系列的治理工作之后,太湖水产养殖区面积减少至15 km2以下。利用谷歌地球引擎遥感大数据平台提取围网养殖区对于太湖水资源保护具有极大的优势,主要表现在GEE平台降低了数据准备的时间,同时保证大数据量的高性能计算,在以后的水资源保护研究中有着极大的优势。
关键词:谷歌地球引擎;太湖;围网养殖;分类与回归树;时空分布
水产养殖是指出于商业目的而饲养水生生物(包括鱼类、软体动物、甲壳类动物和水生植物等)的人类活动。我国是水产养殖大国,水产养殖规模处于快速增长状态[1]。太湖是我国著名的水产养殖基地,随着经济的发展和生活水平的提高,在太湖水域进行围网养殖的现象越来越普遍。常年围网养殖导致太湖水质恶化,已经严重威胁到太湖流域生态环境安全,也影响了太湖正常的蓄水防洪能力,加剧了洪涝灾害出现的可能性。利用卫星遥感手段对太湖围网养殖区域进行监测,为实现可持续发展提供了有力的技术支撑。众多学者基于遥感手段围绕水体围网养殖行为导致的水域面积、养殖区面积及水质变化做了大量的研究工作。沈芳等利用1986—1998年的陆地卫星专题成像仪(Landsat TM)影像对太湖流域的滆湖、洮湖围网养殖面积变化进行了研究工作,并对养殖区水质进行了评价[2]。杨英宝等利用多时相TM数据对东太湖围网养殖区域进行了提取工作,并且确定了超密度围网养殖区域范围[3]。马艳娟等基于ASTER卫星遥感影像构建水体指数,结合波段运算提取了近海水产养殖区,为养殖区决策提供了参考依据[4]。贺秋华等利用高分二号遥感影像采用人机交互目视解译的方法提取了湖南省网箱养殖信息,研究了围网养殖的空间分布情况并且估算了养殖产生的氮、磷排放量[5]。黄帅等利用资源三号高分遥感影像,利用围网养殖区和非养殖区的光谱信息差异,采用梯度变换的方法提取养殖区,精度达到90.66%[6]。王家伟等利用 5期TM遥感影像, 利用多段光谱数据构建了改正归一化差异水体指数,提取了太湖围网养殖区域[7]。李俊杰等利用CBERS卫星遥感数据,提出了基于遥感影像纹理信息的湖泊围网养殖区提取的方法,并取得了较好的提取效果[8]。目前,对于太湖围网养殖的研究多针对单个时间段,缺乏连续的调查资料。而且对太湖围网养殖现象进行长时间序列的分析与监测,需要的数据量较大,传统的遥感手段,从数据下载到数据预处理,再到遥感数据分析,需要大量的准备工作,而且受限于本地运算能力,导致运算速度慢,耗时较长。
谷歌地球引擎(Google Earth Engine,简称GEE)是基于谷歌云的遥感大数据处理平台,部署了PB级遥感数据供用户免费使用。谷歌地球引擎也支持在线处理各种复杂的空间分析运算,包括图层叠加、数组运算、图像分类、图像拼接、时间序列分析等。另外,谷歌地球引擎提供了Javascript和Python应用程序接口,通过Code Editor模块可以实现数据在线使用与算法编写,方便算法的开发与应用。借助强大的云计算资源与海量影像数据,谷歌地球引擎已成为地理、空间信息学研究的重要基础性工具[9]。与传统的遥感平台如ENVI、e-Cognition软件相比,GEE平台简化了数据收集流程,提高了数据处理效率,是一个高效且实用的科研平台。
1 研究区概况
太湖位于我国江苏省南部,地处30°56′~31°14N′,119°54′~120°36′E,水域面积为 2 338 km2,湖中岛屿面积为89.7 km2,平均水深 1.9 m,是我国第三大淡水湖(图1)。太湖地处亚热带,气候温和湿润,属季风气候。太湖周边河港纵横,有主要进出河流50余条,周边主要城市有江苏省无锡市、江苏省苏州市、浙江省湖州市、江苏省宜兴市等,在历年的汛期起到重要的防洪和水量调节作用。太湖西侧和西南侧为丘陵山地,东侧为平原。太湖流域是我国重点淡水养殖基地,全域淡水鱼产量约占我国总产量的10%。围网养殖是太湖渔业养殖的传统模式,传统围网养殖中高密度的围网设置、为追求经济效益而过渡投放饵料等行为已经对太湖生态系统给造成了严重的不良影响[10]。按照自然形态进行划分,太湖可以分成梅梁湖、五里湖、贡湖、竺山湖、湖心区、西部沿岸区、东部沿岸区、东太湖、南部沿岸区等9个区域[11]。太湖中存在若干岛屿,其中,西山岛为太湖第一大岛,贡山島位于太湖东北部,由小贡山和大贡山组成。太湖中部为漫山岛,东南部为三山岛,也是太湖的重要组成部分。
2 试验数据
卫星遥感数据为Landsat系列卫星多光谱数据,空间分辨率为30 m(表1),具有成像质量高、观测周期长等优点,在地球资源环境监测领域具有很大优势。太湖的捕捞时间是每年9月1日至翌年1月15日[12],每年的7—8月是围网养殖力度最大的阶段。为此,选择每年7—8月高质量的遥感影像作为输入数据。谷歌地球引擎遥感大数据平台部署的开放获取数据集涵盖了40多年的Landsat系列陆地卫星历史影像数据和科学数据集,而且处于每天都在更新的状态。主要传感器包括陆地成像仪(operational land imager,简称OLI)、热红外传感器(thermal infrared scanner,简称TIRS)、多光谱扫描仪(multi-spectral scanner,简称MSS)、增强型专题绘图仪(enhanced thematic mapper,简称ETM+)和专题成像仪(thematic mapper,简称TM),传感器参数在设计时具有较好的历史一致性,能够满足长时间序列分析的要求。借助谷歌地球引擎平台,可以在线使用各种形式的Landsat数据,包括原始影像,地表反射率和大气顶端反射率。
3 分类特征
3.1 光谱特征
利用遥感影像提取围网养殖区域的关键是围网养殖行为导致的光谱信息差异,太湖水体可以分为养殖区和非养殖区2种,非养殖区呈现水体的典型光谱特征,其中,在蓝波段有明显的吸收峰,而绿波段有反射峰,短波红外反射率较低。而水产养殖区域在养殖过程中产生的多余的饲料及养殖生物产生的排泄物残留在水中,导致水中氮磷排放指标高而对水生环境产生较大影响。2种水体之间存在一定的光谱差异,具体表现为水产养殖区域水体在近红外波段和短波红外波段的反射率高于正常水体。
3.2 遥感指数
归一化差异水体指数(normalized difference water index,简称NDWI)由Mcfeeters提出,由于水体在绿光波段的反射率大于红光波段,因此归一化差异水体指数既保留了归一化植被指数(normalized vegetation index,简称NDVI)对植被和土壤的增强作用,又最大化了水体特性,能够最大程度地抑制植被信息,突出水体信息,可以有效地将植被与水体被分割开来[13],表达式如下:
NDVI可以用来反映植被生长情况,由于人工围网养殖过程中,渔户使用挡水材料组织投喂饵料流失,容易产生大量的饵料残余,使得有机质含量远高于正常水体,吸引水中大量藻类微生物聚集,使得NDVI增高。NDVI表达式定义为
由于绿光波段反射率高于近红外波段反射率,因此归一化水体指数会混杂土壤或建筑用地信息[14]。因此,改进的归一化差异水体指数(modified normalizd difference water index,简称MNDWI)也是提取水体信息的常用方法。公式为
3.3 纹理信息
遥感影像的纹理结构反映了地面目标中同质现象排列的视觉特征,表征了物体表面的缓慢变化或者周期性变化的结构组织排列属性。灰度共生矩阵(gray level co-occurrence matrix,简称GLCM)能够从方向、间隙、变化范围等方面综合反映图像信息,是图像纹理分析中最为常用的分析方法[15]。灰度共生矩阵的原理是取图像中的任意一点和另一个在水平和垂直方向上均有偏移的点之间形成一个点对。对于每个点对出现的次数,将其排列为一个矩阵,再用点对总的出现次数归一化为出现概率,由此构造灰度共生矩阵。灰度共生矩阵提供了影像中像元与像元之间的空间关系,Haralick等提出了14种灰度矩阵的纹理统计指标[16]。根据灰度共生矩陣,本研究选择了对比度(Contrast)和熵(Entropy)2种统计方法描述图像的纹理信息,公式如下:
4 研究方法
分类与回归树(classification and regression tree,简称CART)算法既可以用于分类问题,也可以用于连续变量预测。该算法不要求输入数据服从统计分布,而且可以确定变量对于分类任务的重要程度,结构清晰并且易于理解。分类与回归树算法首先将训练样本分为测试变量(特征向量)和目标变量(地物类型)。然后采用递归分割的方式选择特征向量中合适的变量集分割节点,并构建二叉决策树。分类与回归树算法利用基尼系数作为选择最佳测试变量和阈值的准则。在分类问题中,假设有K类,样本点属于第k类的概率为pk,则概率分布的基尼系数的定义为
在实际应用过程中,决策树可能会存在过拟合现象,为此分类回归算法采用交叉验证的方法对决策树进行修剪,通过决策树剪枝可以有效防止过拟合,最终获得一棵兼顾复杂度和错误率的最优二叉决策树[17]。
5 精度验证
利用混淆矩阵对本研究的分类精度进行评价的结果表明,综合光谱信息、遥感指数及纹理信息的分类方法较为准确地反映了研究区内的养殖区分布情况,总体分类精度在90%左右。由于30 m分辨率Landsat影像空间分辨率并不足够高,因此存在一定的混合像元现象,在一定程度上降低了分类精度。谷歌地球引擎平台引擎提供了影像导出功能,可以将分类结果下载到本地,同时使用谷歌地球提供的高分辨率遥感图像,辅助混淆矩阵对分类结果进行验证工作。
由于围网养殖区域的养殖强度差异较大,在低密度养殖区域与正常水体差异较小,在高密度养殖区域在光谱上与陆地类似,因此会造成一定的误分存在。除此之外,湖边内塘也存在相应数量的养殖区域,在不引入位置信息等先验知识的条件下,仅凭借遥感影像也很难区分。分类结果的混淆矩阵如表2所示。
6 结果与分析
6.1 太湖养殖区空间分布特征
利用分类与回归树对各个时期太湖水域的分类结果见图2,围网养殖区显示为红色,自然水体为蓝色,陆地及其他地物类型为绿色。太湖围网养殖活动在不同时期表现出不同的分布特点。1984年以前,太湖渔业以人工放流和自然捕捞为主,土地利用类型以自然水体和沿湖围垦为主。由于受到“围湖造田”等历史政策因素影响,东太湖水面南岸地区为陆地类型,随着渔业的经济价值增大,沿岸围垦区域逐渐转为沿岸养殖区。20世纪80年代初期,太湖周边各级政府就开始在太湖实施封湖禁渔制度,由此太湖成为全国首个封湖禁渔的内陆湖泊。同时,政府部门也鼓励渔民变捕捞为养殖,网围养殖得到了快速发展[10],由此开启了太湖的围网养殖时代。
1984年太湖围网养殖主要存在于东太湖南岸,依托围堰分隔湖边水体开展人工养殖活动。到1985年,太湖围网养殖区域面积仍然较小,在随后几年内受到经济利益的驱使,太湖人工围网养殖区域逐年扩大。其中,部分增长来自于围堰用地转为养殖区域,部分来自于侵占正常水体。1989年,东太湖北岸区域开始出现围网养殖区域,养殖面积开始逐年扩大。至1999年,东太湖近一半区域为人工养殖区域。到2004年,东太湖水域几乎全部被围网养殖活动覆盖。2004年,漫山岛西侧部分水域被开辟为养殖区,并在随后的几年内面积不断扩大养殖规模。
1993年以后围网养殖面积迅速增大,至2000年围网遍及整个东太湖流域,除了湖中央的主航道以外,湖面几乎全部被围网设施覆盖。2000年左右,围网养殖区域沿东太湖湖湾向湖中心扩展,养殖面积加倍。至2004年,东太湖水域养殖区几乎全部沦为人工养殖区域,使正常水体恶化,对生物多样性造成了严重的破坏。随后,围网养殖区域已经突破东太湖,向西太湖逐步发展。到2005年,七都以北、西山岛以南、东太湖以东的区域,围网养殖已经形成规模,正常水体逐年压缩。2006年,太湖西山岛的东侧和南侧也存在少量的围网养殖区域。至2007年5月,常年高密度和大范围的围网养殖活动致使太湖蓝藻事件暴发,太湖水质遭到严重污染,影响了周边城市居民的正常生活。
从2008年起,在各级政府的主导下,太湖水域开始压缩围网养殖面积。到2013年,围网养殖被压缩到东太湖北岸水域,养殖格网更加规则,表现出较高的养殖密度。到2014年,太湖围网现象优于1997年以前的水平,围网养殖现象得到控制,保持稳中向好的趋势。随着太湖治理力度加大,东太湖养殖区域进一步缩小,但至今仍然是太湖主要围网养殖区域。2015年,东太湖养殖区的面积略有减少,但整体不变。
2017年围网养殖区域被大量拆除,退回到1994年时的状态。2018年,太湖围网养殖区域面积进一步收缩,为了增加水体的流动性,沿岸围网区域拆除。2020年,太湖围网养殖区域可能将会消失。
从太湖养殖区的空间演变情况可以看出,太湖围网养殖区多依托湖岸,利用道路交通优势,方便饵料与水产品运输。太湖养殖区主要分布在东太湖地区,湖中央和北部地区零星分布,太湖北部的贡湖、梅梁湖水域一直没有大规模养殖现象出现,南部太湖水域整体情况较好。
6.2 太湖养殖区年际面积变化特征
太湖水域从1985年以来的围网养殖区面积变化曲线见图3。太湖地区围网养殖主要经历了5个阶段。包括1985—1991年的缓慢增长阶段;1992—1997年的快速增长阶段;1998—2007年的高水平稳定阶段;2008—2013年的逐步减少阶段;以及2014—2019年的进一步减少阶段。1984—1991年期间,太湖围网养殖活动处于起步阶段,围网养殖区域面积在20 km2以下,年均增长面积达1.3 km2,1992—1996年期间太湖围网养殖区面积增加了约7192 km2,其中,1993年太湖围网养殖区的面积为58.67 km2,1994年的为64.12 km2,年平均增加围网养殖区面積为14.38 km2。1997—1999年期间,太湖围网养殖区面积增加了36.4 km2,1999年太湖围网养殖区的面积为76.17 km2,年平均增加围网养殖区面积为7.28 km2。1999—2007年期间,太湖围网养殖区面积增加了69.11 km2,至此达到太湖围网养殖区面积的峰值,为136.57 km2。
2008—2013年期间,太湖围网养殖区面积减少了89.14 km2,2013年太湖围网养殖区的面积为4587 km2,年平均减少围网养殖区面积为 20.28 km2。2013—2016年期间,太湖围网养殖区面积保持稳定,但有进一步降低的趋势,受到经济利益的影响,面积在40 km2左右浮动。
2017年通过一系列的退渔还湖改造,推广绿色渔业,使得过度养殖现象得到一定的缓解,网围养殖比例从79.3%下降为37.6%。2018年,太湖围网养殖区总面积约为29.95 km2,与1992年的相当。2019年,太湖水域围网设施大量拆除,面积进一步降低到15 km2左右。根据太湖周边政府公告,太湖流域各级政府加大治理力度,太湖围网养殖将有望成为历史。
7 讨论与结论
本研究尝试利用谷歌地球引擎遥感平台对太湖养殖区开展提取工作,利用30 m分辨率Landsat卫星系列数据,结合遥感指数和图像纹理特征,使用CART算法,实现了太湖围网养殖区提取,并就提取结果在空间和时间2个维度上进行了分析与讨论,而且在长时间序列上给出太湖围网养殖区面积变化的情况。研究表明,基于Landsat 8影像监测太湖养殖区,可以全面、客观地表现出围网养殖空间分布状况和面积的变化概况。太湖流域养殖区主要分布在东南沿岸,空间分布上并不均衡。近40年来,太湖水域中围网养殖区面积变化呈现出先增加后减少的趋势。与以往的养殖区提取工作相比,使用谷歌地球引擎遥感大数据平台可以很方便地实现大量遥感数据收集,快速获取结果,为大范围、长时间序列围网养殖监测提供了强有力的手段。但是,利用遥感影像提取围网养殖区域也存在较大的局限性,比如,不同时期围网养殖强度存在较大的差异,而且围网养殖区域导致的水体富营养化扩散作用明显,给围网养殖提取带来了较大的挑战。以上研究结论对于在太湖流域生态环境保护、合理利用水资源具有重要的参考价值,可为太湖流域水资源综合开发利用提供科学依据与理论支持,在确保发展经济效益的同时保证太湖生态环境健康发展。
参考文献:
[1]程田飞,周为峰,樊 伟. 水产养殖区域的遥感识别方法进展[J]. 国土资源遥感,2012(3):1-5.
[2]沈 芳,匡定波. 太湖流域典型中小湖群水资源利用及动态变化的遥感调查与分析[J]. 遥感学报,2003(3):221-226.
[3]杨英宝,江 南,殷立琼,等. 东太湖湖泊面积及网围养殖动态变化的遥感监测[J]. 湖泊科学,2005,17(2):133-138.
[4]马艳娟,赵冬玲,王瑞梅. 基于ASTER数据的近海水产养殖区提取方法对比研究[J]. 测绘通报,2011(1):59-63.
[5]贺秋华,邹 娟,余姝辰,等. 基于高分二号数据的湖南省十大水库网箱围栏养殖分布遥感调查[J]. 测绘通报,2019(10):8-11.
[6]黄 帅,宋开宏,罗菊花,等. 基于梯度变换的浅水湖泊围网区遥感提取算法[J]. 湖泊科学,2017,29(2):490-497.
[7]王家伟,李云梅. 多参数融合的太湖围网养殖遥感动态监测[J]. 安徽农业科学,2009,37(29):14334-14337.
[8]李俊杰,何隆华,戴锦芳,等. 基于遥感影像纹理信息的湖泊围网养殖区提取[J]. 湖泊科学,2006,18(4):337-342.
[9]Gorelick N,Hancher M,Dixon M,et al. Google Earth Engine:planetary-scale geospatial analysis for everyone[J]. Remote Sensing of Environment,2017,202:18-27.
[10]杨再福,施炜纲,陈立侨,等. 网围养殖对太湖生态环境的影响[J]. 中国农业科学,2004,37(6):928-932.
[11]商兆堂,任 健,秦铭荣,等. 气候变化与太湖蓝藻暴发的关系[J]. 生态学杂志,2010,29(1):55-61.
[12]谷孝鸿,白秀玲,江 南,等. 太湖渔业发展及区域设置与功能定位[J]. 生态学报,2006,26(7):2247-2254.
[13]Mcfeeters S K. The use of the normalized difference water index (NDWI) in the delineation of open water features[J]. International Journal of Remote Sensing,1996,17(7):1425-1432.
[14]徐涵秋. 利用改进的归一化差异水体指数(MNDWI)提取水体信息的研究[J]. 遥感学报,2005,9(5):589-595.
[15]Gribkov I V,Koltsov P P,Kotovich N V,et al. Performance evaluation of texture segmentation methods[EB/OL]. (2009-10-16)[2020-06-01]. http://www.iiis.org/cds 2008/cd2009sci/sci2009/PapersPdf/s491vm.pdf.
[16]Haralick R M,Shanmugam K,Dinstein I H. Textural features for image classification[J]. IEEE Transactions on Systems,Man,and Cybernetics,1973,6:610-621.
[17]Lewis R J. An introduction to classification and regression tree (CART) analysis[C]//San Francisco:Annual Meeting of the Society for Academic Emergency Medicine,2000.
[18]吳庆龙. 东太湖养殖渔业可持续发展的思考[J]. 湖泊科学,2001,13(4):337-344.张 伟,彭晓燕. 挑战与回应:城乡融合视域下的浙江省土地综合整治再审视[J]. 江苏农业科学,2021,49(6):232-237.