基于深度学习的水体生境图像分类与质量评价<br/>——以长三角一体化先行启动区为例

基于深度学习的水体生境图像分类与质量评价
——以长三角一体化先行启动区为例

2023-08-01汪洁琼江卉卿王敏

风景园林 2023年7期

汪洁琼江卉卿王敏＊

长三角一体化地区是典型的江南水网地区之一，其间河渠水网交织、坑塘星罗棋布[1]。水体作为江南水乡的生命线，其水生态系统服务的提升至关重要。近年来，国家陆续出台与河湖健康相关的政策、法规与指南，如2020 年生态环境部制定的《河流水生态环境质量监测与评价技术指南》[2]，明确提出从水质、生境、生物多样性3 个方面综合评价水生态环境质量，着重强调生境质量评价的重要性。

在20 世纪80 年代就有学者对河流生境质量进行评价，最早提出的方法主要是对河流物理生境进行定性描述，后续的研究基于生态学视角在不同空间尺度上拓展了评价标准，已构建出多套系统完整的生境调查方法与评估体系[3]。伴随着河湖生态修复工作的开展，水体生境质量评价在国内逐渐成为研究热点。王建华等[4]参考国内外相关评价标准，对挠力河流域进行了河流生境质量调查和评价；刘华等[5]综合使用快速生物评估草案（rapid bio-assessment protocols, RBPs）、河流状态指数（index of stream condition, ISC）等方法，建立了河道、河岸与滨岸带生境的评价指标体系，并应用于太湖流域宜兴段的研究；王强等[6]采用河流生境调查方法调查了东河河流生境，并使用河流生境质量评价指数与河流生境退化指数对其进行评估；曾鹏等[7]在城市河流调查评价体系的基础上，基于河段尺度构建了太湖流域城市河流生境评价体系，并对物理生境、植被指数、材料指数和污染指数4 个二级指标进行了调查。通过文献综述发现现有研究存在不足：在研究对象上，国内研究多以北方平原地区的河网与南方山区的河流为主，对于江南水网水体生境质量评价的研究较少；在研究内容上，集中于对单条河流流域进行抽样调查与评价；在研究尺度上，多为对大尺度区域的宏观、定性研究，尚未开展大范围、大样本、精细化分类评价研究；在研究方法上，尽管国际上已有较为成熟的评价体系，但多建立在田野调查与抽样调查的基础上，数据采集与处理耗时长，获取的数据样本量小，评价范围受限，且数据时效性较差，往往跟不上土地利用与覆盖的变化速度。对于长三角一体化地区高密度的水网而言，现有研究方法存在明显的技术瓶颈，无法满足生态修复规划设计的实践需求。

伴随数字中国的发展，数字图像信息获取的便利使建立包含大批量水体生境图像的数据库成为可能，也为水体生境质量评价提供了新途径。面对多源信息获取渠道的增多及数据量的井喷式增长，急需一个全新的数据分析体系架构进行支撑，在此背景下，计算机深度学习（deep learning, DL）方法脱颖而出。深度学习善于从原始输入数据中挖掘抽象特征，具有良好的泛化能力，在目标检测、计算机视觉（computer vision, CV）、自然语言处理、语音识别和语义分析等领域卓有成效[8]。在对城市建成环境的研究中，国内已有学者引入深度学习图像识别技术进行大批量数据处理，主要集中在城市环境认知评价、城市与建筑的文化元素识别、建成环境与社会经济耦合分析、城市风貌评估等方面[9-11]。甘欣悦等[12]运用人工打分与深度学习相结合的方法，进行街景图片分类，识别具有非正规特征的街景；叶宇等[13]运用深度学习的方法识别百度街景图像，并进行绿化可见度分析，实现了街道绿化品质的定量化测度；胡一可等[14]运用深度学习的方法识别街景图像，量化分析了城市室外环境视觉景观要素及空间分布特征。在环境质量评价方面，深度学习的方法主要应用于环境污染监测、水体富营养化预测、洪水预警等方面[15-17]，如Lieshout等[15]运用深度学习的方法从水体图像中检测漂浮的塑料，以达到对多个地点长期进行塑料污染自动化监测的目的；Lee 等[16]使用深度学习模型对韩国4 条主要河流的富营养化以及有害藻华的暴发进行预测；Vandaele 等[17]基于对河流图像的深度学习，提出了河流水位自动化监测方法，以实现洪水事件预测与洪涝灾害预警。深度学习在水体生境方面的应用还有较大发展空间，目前的研究更多聚焦于水体的污染识别、物理特征分辨与模拟的层面，在水体生境质量评价方面，鲜有研究使用深度学习图像分类的方法对其进行评价。

基于对现有评价指标体系与研究方法的梳理，本研究收集了长三角一体化先行启动区①范围内的水体生境卫星图像数据，以基于英国城市河流调查法（urban river survey, URS）的图像分类评价指标体系作为模型训练数据集分类标注的依据，借助深度学习方法中的卷积神经网络（convolutional neural networks,CNN）训练水体生境质量评价模型，实现对水体生境卫星图像的智能识别、分类与评价。

1 研究对象与范围

1.1 研究对象

长三角一体化地区湖荡密布、河港相连、水网绵密，河网密度达4.8～6.7 km/km2，湖泊达200 余个，水系资源极为丰富，特别是长三角一体化先行启动区，水域相连的情况处处可见，是典型的以水为核心的生态环境。因此，水体生境调查与质量评价对长三角一体化地区的重要性不言而喻，故本研究将研究对象确定为长三角一体化先行启动区范围内的水体生境。

1.2 研究范围

基于深度学习的高适应性和可转移性，训练好的深度学习模型适用于所有与研究范围具有相同特征（江南水网）的区域，同时为了便于数据的收集与使用，本研究将研究范围划定为几乎覆盖长三角一体化先行启动区全域的2 个相交矩形（图1）。

1 研究范围Research area

2 数据收集与预处理

传统的水体生境质量评价所采用的田野调查与抽样调查相结合的方法工作量大、耗时长、数据收集不够全面[18-21]，本研究使用计算机识别卫星图像的方式可对目标水体进行全覆盖式评价。为了便于计算机识别，本研究通过爬取百度卫星地图，获取研究范围内分辨率为256×256 像素、实际尺度为256 m×256 m 的卫星瓦片图作为图像单元。在去除非河流生境区域的图像后得到研究数据集，共包含卫星图像8 051 张。

为消除卫星图像色彩差异的影响，使用Python 对研究数据集中的图像进行重构数组（reshape）、去噪、对比度增强、图片灰度、二值化、缩放、归一化等预处理，以保证本研究的信度。

3 长三角一体化先行启动区水体生境质量评价深度学习模型构建

基于CNN 图像分类方法，长三角一体化先行启动区水体生境质量评价深度学习模型构建包含3 个步骤（图2）：1）模型训练数据集准备；2）CNN 搭建与模型训练；3）准确度测试。

2 模型构建过程Model construction process

3.1 模型训练数据集准备

在研究数据集中随机选取4 000 张卫星瓦片图作为本研究的模型训练数据集，用于深度学习模型的训练、验证与测试。

3.1.1 图像分类评价指标体系

目前影响力较大、应用较为广泛的水体生境质量评价方法有河流生境调查法（river habitat survey, RHS）[18]、快速生物评估草案[19]、河流状态指数[20]等。其中，以RHS 为前身的URS 是目前国际上主流的城市河流评价方法之一[21]，该方法将城市水体生境与自然水体生境的异同纳入考虑范畴，能较为准确地对城市水体生境进行分类评价，评价结果可为水体生境的生态修复提供参考[22]。URS 主要由3 个部分组成[23-24]：1）城市河流生境调查方法；2）数据库与数据管理系统；3）城市河流生境的专题分类与专用于水体生境质量评价的河段生境质量指数（stretch habitat quality index,SHQI）。由URS 手册可知[24]，URS 通过对大量实证研究数据的分析归纳得到指标决策树，并从中筛选出对河流生境影响程度较高的指标，包括物理环境、植被类型、材质类型3 个大类及其下属的14 个小类；对指标进行评分与加权计算得到SHQI 值，结合与SHQI值对应的“很好、好、一般、较差、差、很差”6 个等级的评价标准，可得到水体生境质量等级。

结合相关研究的可行性论证[21-25]，本研究将以该指标体系为基础对深度学习模型训练数据集进行分类标注。由于材质类型中的河床材质指数无法通过图像识别，且在通过指标决策树进行打分叠加计算时，发现该指标剔除后对SHQI 值的分类结果影响较小，因此，本研究最终使用的水体生境质量评价指标为：物理环境类别中的植被堆积边数量、河岸自然断面比例、河道生境类型数量、水流缓流比例；植被类型类别中的河岸乔木连续性指数、河岸乔木特征指数、水生植被平均覆盖度、主导水生植物类型、河岸表层植被结构复杂度；材质类型类别中的固定河床材料比例、护岸存在比例、河岸材质指数、主导护岸材质等级。该评价指标体系是模型训练数据集图像分类标注的依据，也是水体生境质量评价深度学习模型的图像评价规则。

3.1.2 模型训练数据集分类标注

依据图像分类评价指标体系对模型训练数据集中的4 000 张水体生境图像进行人工打分，并加权计算出SHQI 值，进而结合SHQI 值的评价标准对图像进行评价，并将评价的等级结果作为图像分类标注的标签（label）。为减小误差，本研究结合实地调研结果，严格按照评价方法对图片进行打分。评价结果为：“很好”0 张，“好”94 张，“一般”544 张，“较差”1 071 张，“差”2 050 张，“很差”241 张。由于“很好”类别无对应图片，缺乏模型训练所需数据，且实地调研时未发现“很好”类别的水体生境，因此，本研究中的图像分类标签最终设定为5 类，水体生境图像质量相应地确定为5 个评价等级。

3.2 CNN 搭建、模型训练与准确度测试

图像分类是CV 领域的一个基础任务，能够以最小误差将图像划分成不同类别[8]。与传统机器学习相比，基于深度学习的图像分类网络更加适用于大批量数据的处理，且具有更高的准确性[8]。CNN 是当前较为前沿且被广泛使用的图像分类架构，具有局部连接、权值共享、池化操作等特点，其模型具有一定程度的不变性、强鲁棒性和较高的容错能力[8]。本研究采用基于深度学习的图像分类方法，搭建CNN 并进行模型训练与优化，经过准确度测试后，得到长三角一体化先行启动区的水体生境质量评价深度学习模型。

本研究使用TensorFlow 2.0 框架读取模型训练集数据，将模型训练数据集中的图像以6∶2∶2 的比例随机分为训练集、测试集与验证集，再搭建CNN 进行模型训练（图3）。由于部分类别的图像样本量较少，为提高模型准确率，在模型训练时使用数据增强的方法对数据集进行扩充。在训练的过程中，每个训练轮次（epoch）结束后，需要使用验证集来验证当前模型的性能，以进一步优化模型，确定最佳参数；验证完成后再使用测试集来测试模型的准确度。

3 水体生境图像分类 CNN 工作原理Working principle of convolution neural network (CNN) for water habitat image classification

4 长三角一体化先行启动区水体生境图像分类与质量评价

训练好的深度学习模型能够快速识别长三角一体化先行启动区的卫星图像，对该区域的水体生境质量进行智能化分类与评价。由评价结果可知在长三角一体化先行启动区的水体生境图像中，评价等级为“好”的图像占比为1.06%，评价等级为“一般”的图像占比为27.45%，评价等级为“较差”的图像占比为12.04%，评价等级为“差”的图像占比为56.74%，评价等级为“很差”的图像占比为2.71%（图4）。由于模型训练过程中未纳入“很好”这一等级，该结果与实际情况可能存在微小误差。将深度学习模型的评价结果与人工打分的测试集进行对比验证，发现误差小于20%。综合使用实地调研、图像人工打分、深度学习图像分类3 种方法可证明深度学习模型评价结果的可信度较高。

4 长三角一体化先行启动区水体生境质量评价结果Evaluation results of water habitat quality in the pilot zone of the YRD integration area

整体而言，长三角一体化先行启动区的水体生境质量仍存在提升空间，质量“好”的水体生境分布较少，是因为该区域内水体驳岸人工化程度较高、河道生境类型较少、河岸带植被类型较为单一，此外主干河道（如太浦河）还需满足通航水运的需求。结合评价结果与实地调研发现：1）质量评价相对较好的水体生境往往具有以下特点——近自然或自然化驳岸比例高，河道存在浅滩、浅流等多种生境类型，河岸带植被丰富，河道内有多种类型的水生植物，河道护岸较少、材质大多为可降解生物（芦苇、木桩等）或开放基石（抛石、石笼等）等；2）位于大面积农田内的水体生境质量等级多为“较差”和“差”，其特点为河道生境类型单一、河岸带植被类型少或无植被覆盖、人工挖掘的水渠河道有硬质护岸；3）由于城区、村落或居民点的水体河道工程化程度高，故此区域内的水体生境情况以“差”为主。

5 基于深度学习的水体生境质量评价模型的应用

5.1 对水体生境质量的评价应用

5.1.1 对比不同乡镇、村落水体生境质量评价

长三角一体化先行启动区的乡镇有大量河网交织，复杂的水陆空间形态对水体生境质量评价提出了挑战，本研究运用基于深度学习方法所构建的水体生境质量评价模型获得了研究范围内水体生境质量的高精度评价结果，可支持研究范围内不同乡镇、村落水体生境质量（图5）的对比研究。

5 黎里古镇（5-1）、金泽镇中心镇区（5-2）、朱舍村与西宋村（5-3）水体生境质量评价结果对比Comparison of the evaluation results of water habitat quality in Lili Ancient Town (5-1), Jinze Town central area(5-2), Zhushe Village and Xisong Village (5-3)

5.1.2 对比不同骨干河道及支流的水体生境质量评价

骨干河道生境质量评价是目前水体生境质量评价研究中的主流，除骨干河道外，密布的支流河道也是水体生境的重要组成部分，已有研究多采取抽样调查的方法，全域评价较鲜见。本研究的评价模型可以快速对研究范围内的骨干河道与细小支流进行全域水体生境质量高精度评价，并支持研究范围内多条骨干河道及支流的水体生境质量对比研究。

以太浦河、泖河在研究范围内的区段（图6）为例，在太浦河（区段长约42.34 km）的水体生境质量评价中，“一般”等级的水体生境占比10.89%，“较差”等级的水体生境占比3.02%，“差”等级的水体生境占比86.09%；在泖河（区段长约20.12 km）的水体生境质量评价中，“一般”等级的水体生境占比2.55%，“差”等级的水体生境占比97.45%。两条河道水体生境质量等级均以“差”为主，太浦河总体生境情况相对较好。

6 太浦河（6-1）与泖河（6-2）水体生境质量评价结果对比Comparison of the evaluation results of water habitat quality of the Taipu River (6-1) and the Mao River (6-2)

以研究范围内的骨干河道泖河及其4 条支流（图7）为例，泖河的水体生境质量以“差”为主（图6-2）；4 条支流中，朱泖河—新胜村区段长约7.04 km，其中“一般”等级的水体生境占比33.71%，“较差”等级的水体生境占比4.62%，“差”等级的水体生境占比61.67%；南安庄—潘泾村区段长约8.98 km，其中“一般”等级的水体生境占比31.98%，“较差”等级的水体生境占比8.06%，“差”等级的水体生境占比59.96%；大莲湖路—小坪村区段长约3.49 km，其中“一般”等级的水体生境占比12.27%，“差”等级的水体生境占比87.73%；南横港—莲爱路区段长约8.14 km，其中“一般”等级的水体生境占比8.90%，“较差”等级的水体生境占比3.78%，“差”等级的水体生境占比87.32%。泖河及其4 条支流均不存在等级为“好”和“很差”的水体生境。生境质量对比结果显示，泖河4 条支流的水体生境质量均比干流更佳；在4 条支流中，朱泖河—新胜村区段、南安庄—潘泾村区段的水体生境质量最佳，大莲湖路—小坪村区段次之，南横港—莲爱路区段最差。

7 泖河4 条支流的水体生境质量评价结果Evaluation results of water habitat quality of the four tributaries of the Mao River

5.2 对水体生境质量的实践应用

5.2.1 对水体生境质量的修复指导

本研究总结不同评价等级水体生境对应的问题，针对水体生境的管理和生态修复实践提出较为具体的指导建议。

“好”等级的水体生境物理环境类型主要为近自然、半自然、恢复型和少部分规整型，具有较高的河岸表层植被结构复杂度和乔木覆盖度。该等级的水体生境应以保护为主。建议尽量移除现有河道、岸带的硬化措施，使水体生境得到自由修复，并且避免被进一步开发。

“一般”等级的水体生境以较低或中低程度工程化的河道为主。此类河道具有一定的修复潜力，河岸表层植被结构复杂度较低也是其存在的问题。该等级的水体生境修复应遵循近自然修复、基于自然的解决方案（Nature-based Solutions, NbS）的理念。建议减少使用固定的河床基质与河岸材质并增加水体蜿蜒度，适当管理近岸乔木和河岸植被，以丰富植被种类、增加群落复杂度。

“较差”等级的水体生境主要为中低程度工程化的河道。此类河道河岸表层植被结构复杂度较低，部分河道常被浮游藻类覆盖，水体透明度较低，存在水体富营养化的风险。在此等级水体的生境修复中，建议尽可能降低河道的硬化水平或改变河道材质类型，丰富岸带植被层次、提升物种丰富度、优化群落结构，通过构建稳定的沉水植物复合群落提升水体透明度，以及浮游植物、动物的多样性，并增加河道弯曲度使其更接近自然形态、提升水动力。

“差”等级的水体生境主要为中到重度工程化的河道。此类河道河岸表层植被结构复杂度低，存在较高的水体富营养化风险。建议结合水质检测结果制定水生植物修复方案，改善岸带的“乔-灌-草”群落结构，以提升河道植物多样性，在不影响河道通航等重要功能的前提下，降低河道硬化水平，增加河道弯曲度。

“很差”等级的水体生境主要为重度工程化的河道。此类河道中，水生植物通常以藻类为主，河岸表层植被结构复杂度很低。建议首先应重点改善水质，然后对河道修复需求进行详细的评估，采用综合技术手段，构建具有一定自我修复能力的水生态系统，在一定程度上降低河道硬化水平，进行生态护坡、生态驳岸的改造。

5.2.2 对水体生境质量的跟踪监测

训练好的深度学习模型能够快速、高效地识别长三角一体化先行启动区的卫星图像，并自动化、智能化地对其进行水体生境质量评价，输入经过预处理的卫星图像，即可得出评价结果。理论上，只要能够实时获取卫星图像，该模型的运用就能实现水体生境质量的实时监测，但实时卫星图像获取成本极高，落地性不强。基于此，通过定时爬取百度地图卫星图像、使用Mapbox 等卫星地图API 端口获取等方法，不断获取与更新高质量卫星图像，可以做到对长三角一体化先行启动区水体生境质量评价的跟踪监测，并通过时间积累构建该区域的水体生境质量评价数据库。该数据库的应用可解决大批量数据处理的问题，高效、快速、智能化地处理卫星图像信息，并做到数据的更新与跟踪监测，为长三角一体化先行启动区的生态绿色发展提供有效的数据支撑。

6 结论

本研究使用基于深度学习的图像分类方法，结合国内外水体生境质量评价相关研究，选取图像分类评价指标，并以此作为模型训练数据集分类标注的依据，搭建CNN 并进行模型训练与优化，构建长三角一体化先行启动区水体生境质量评价深度学习模型。模型的应用能够长时序、大范围地对水体生境进行质量评价，在提高工作效率的同时，拓展水体生境质量评价的时空维度。通过对图像数据的更新，可以做到对长三角一体化先行启动区水体生境质量的跟踪监测，探索景观生态领域的数字化发展方向，为水体生境修复实践提供技术支撑，助力长三角地区生态绿色一体化发展。

计算机视觉技术的发展与智能算法的应用大大减少了人力、物力与时间成本，能更加高效地完成庞大的图像识别与评估任务，并降低误差。当然，该技术也存在缺陷：计算机识别有独特的运算逻辑，在技术层面还存在升级的空间；深度学习所获得的高精度结果需要大量数据的支撑，在数据量有限的情况下，深度学习算法对数据规律的分析可能会出现偏差。

本研究构建模型所需数据的获取与处理难度高，且受研究范围内生境特点的限制，数据集中各类样本分布不均，部分类型样本量过少，对研究结果的准确度产生了一定影响，后续的研究可使用更高精度、更大样本量的数据库进行迭代，以达到更精准的识别效果。此外，现今的深度学习图像识别方法多依赖专业人士为计算机设定好“标签”，而这一问题所产生的主观误差是无法避免的。

基于深度学习的特性，训练好的深度学习模型适用于具有相同土地覆盖与水系结构特征的生境条件相似的地区，长三角一体化示范区与先行启动区具有较为一致的生境条件，可将本研究中的深度学习模型推广至长三角一体化示范区范围进行应用，为未来长三角一体化地区水体生境数据库的构建与高精度深度学习模型的训练提供参考，以期实现对整个长三角一体化地区的水体生境质量评价。

注释(Note)：① 根据《长三角生态绿色一体化发展示范区先行启动区国土空间总体规划（2021—2035 年）》，长三角一体化示范区包括上海市青浦区、江苏省苏州市吴江区、浙江省嘉兴市嘉善县，总面积约2 413 km2；先行启动区包括朱家角镇、金泽镇、黎里镇、西塘镇、姚庄镇，总面积约660 km2。

图片来源(Sources of Figures)：图1、图4～7 底图来源于百度地图卫星影像图（2021 年10 月）；图3 参考深度学习CNN 基本结构模型绘制；其余图片均由作者绘制。