APP下载

基于多源遥感卫星河南洪灾淹没范围自动化提取分析

2021-02-11衡艺婷

科技创新导报 2021年24期
关键词:洪涝灾害机器学习

衡艺婷

摘 要:本文以河南省北部洪涝灾害为例,结合洪灾前后多期光学和雷达卫星,分析阈值法和机器模型迁移法对不同传感器影像的水体识别能力,并分析研究区的洪涝灾害情况。重点分析机器学习模型在时间序列影像上的水体迁移识别的技术,讨论不同特征对水体的识别能力,并对分类结果进行精度检验和评价。研究结果表明,基于阈值法的光学影像水体提取受到云阴影的影响,而雷达影像水体提取受到部分道路的干扰。基于机器学习模型迁移的水体识别提取方法能够快速、准确提取系列光学和雷达的洪灾影像。本次洪灾持续时间近两个月,淹没面积最大值达到320km2。基于机器学习模型迁移开展多源光学雷达卫星影像水体快速识别,对于洪涝灾害范围监测具有重要的意义。

关键词:洪涝灾害,水体识别,机器学习,模型迁移,多源遥感

Automatic Extraction and Analysis of Flood Area in Henan Province Based on Multi-Source Remote Sensing Satellite

HENG Yiting

(Liaoning Normal University, Dalian, Liaoning Province, 116000 China)

Abstract: In this paper, it takes the flood disaster in the north of Henan Province as an example, combined with the multi-scene optical and radar satellites before and after the flood, the water extraction ability of the threshold method and the machine model transfer method for different sensor images as well as the flood disaster situation is analyzed. This paper focuses on the technology of water transfer classification based on machine learning model in time series image, discusses the recognition ability of different features to water, and verifies and evaluates the accuracy of classification results. The results show that the water extraction from optical image based on threshold method is affected by cloud shadow, while from radar image is interfered by some roads. The water extraction method based on machine learning model transfer can extract a series of optical and radar flood images quickly and accurately. The flood lasted nearly two months and submerged an area of 320 km2 at its maximum. Rapid water extraction based on multi-source radar satellite image based on machine learning model transfer is of great significance to flood disaster area monitoring.

Key Words: Flood disaster; Water extraction; Machine learning; Model transfer; Multi-source remote sensing

洪涝灾害是世界上主要自然灾害之一,遥感是监测洪灾的重要手段,洪涝灾害的遥感监测技术关键在于水体信息提取和识别。

已有水体提取方法主要基于阈值法和分类法。阈值法构建特征直方圖,或直接使用类间最大方差法,找到区分水体和背景的最佳阈值分割水体范围。王帆等[1]提出了基于红绿和近红外波段组合的改进水体指数NNDWI,该指数能较好地区分水体、云及云的阴影,得到去云的水体范围。而光学影像常受到云雨影响难以提取完整水体,雷达影像则具有穿云透雨的能力。已有研究基于表面近似平滑的水体在SAR影像中后向散射值较低的特点,构建双峰直方图找到分割水体的阈值[2-4]。受到雷达成像特点的影响,山体阴影会干扰水体提取,通常结合地形信息剔除山体阴影的影响[5]。除单波段阈值法外,贾诗超等[6]提出的雷达水体指数SDWI结合阈值提取的方法也被广泛运用。分类法多采用监督分类结合训练样本进行水体提取,随机森林是经典的监督分类方法。童莹萍等[7]、王一帆等[8]采用随机森林分类器成功提取了不同地区的水体。

2021年7月,受到台风烟花水汽输送的影响,河南发生特大暴雨,短时间内郑州发生严重的内涝,造成重大人员伤亡和经济损失。之后雨团持续北上,卫河成为了本次洪灾的主要蓄滞洪区。本文基于光学和雷达遥感卫星数据,结合阈值法和分类法进行灾前、灾中和灾后洪水淹没范围识别和提取,并对比阈值法和分类法水体提取效果,分析淹没和受灾情况。

研究区和数据

研究区概况

研究区位于河南省北部卫河经过的新乡卫辉、鹤壁淇县、浚县和安阳滑县。研究区内主要的自然和人工水系有卫河、淇河、孟姜女河和共产主义渠等,其余水系在非雨期几乎处于半枯水状态。除西部山地丘陵区外,大部分地势较低,高程分布在50~100m的范围内。作为本次洪灾的主要蓄滞洪区,卫河两岸积水时间长达近2个月,洪涝灾害造成重大的经济和财产损失。

卫星数据与预处理

选取欧空局哨兵二号(Sentinel-1)作为本次研究的光学数据,Sentinel-2从可见光和近红外到短波红外覆盖13个光谱波段,具有不同的空间分辨率,双星重访周期5d,从中选取蓝B2、绿B3、红B4、近红外B8和短波红外B11波段。雷达数据选择欧空局哨兵一号(Sentinel-1)地距影像(GRD,Ground Range Detected),极化方式为VV、VH,对Sentinel-1数据进行轨道校正、热噪声去除、辐射定标、多视处理、噪声滤波和地形校正,采样后的空间分辨率为10m,最终转为后向散射系数dB。

下载SRTM 30m分辨率的DEM高程数据,计算坡度,并重采样为10m分辨率。

样本数据

选取水库、河流及洪灾淹没区域作为研究的水体样本;选取未被淹没的耕地、林地和人造地表作为非水体样本,对于光学影像,还选取了云覆盖区域及云阴影作为非水体样本,结合波段特征分别提取得到光学、雷达的水体/非水体样本数据集。

洪水监测方法

技术路线

首先对光学和雷达数据进行预处理和特征提取,目视解译得到水体和非水体样本,构建特征—样本水体识别数据集。基于阈值法和机器学习分类法分别提取光学和雷达影像中的水体分布,进行精度评价并对比阈值法和分类法的水体识别效果。使用训练好的机器学习模型迁移到其他时期的影像,实现序列影像水体范围快速自动化识别提取。最后分析研究区淹没面积变化和洪灾影响的范围和严重性。技术路线如图1所示。

特征提取

基于光谱和极化特征波段组合运算,分别构建光学和雷达水体指数,以增强水体识别提取的能力。

归一化差异水体指数NDWI:

NDWI= (G-NIR)/(G+NIR)

改进的归一化差异水体指数MNDWI:

MNDWI= (G-MIR)/(G+MIR)

新型改进归一化差异水体指数NNDWI:

NNDWI= (NIR+R)/(G*C)

雷达水体指数SDWI:

SDWI= ln⁡(10*VV*VH)-8

其中G、R和NIR分別为光学影像的绿、红和近红外波段,MIR为中红外波段,在哨兵二号中对应短波红外1(SWIR1)波段。C为NNDWI水体指数的常数,本文将C设置为1。VV和VH分别为雷达影像的垂直发射、垂直接收和垂直发射、水平接收的两个极化波段。

阈值法水体提取

OTSU阈值法又称最大类间方差法,是常用的二分类阈值分割方法。阈值法基于水体与其他地物的反射差异,寻找区分水体和其他地物的最佳阈值从而提取得到水体范围。

本文光学数据基于水体指数(NDWI、MNDWI和NNDWI)提取水体,雷达数据则基于单波段(VV、VH)极化数据和雷达水体指数(SDWI)提取水体。水体指数结合阈值提取水体的基本原理,是特征进行对进行波段运算,以此扩大水体与其他地物间的差异,而使用雷达单波段极化特征结合阈值提取水体的原理,则是雷达影像中接近镜面的水体具有区别于其他地物的较低后向散射值的特点。

分类法水体提取

采用监督分类的策略,选取一定数量的样本数据训练模型,预测得到水体分布。随机森林RF是经典的机器学习监督分类方法,被广泛运用于遥感地物信息提取。RF属于集成学习,由多个决策树组成,是一种非参数估计的方法。

本文采用RF分类器,分别对构建好的光学和雷达样本/特征数据库进行训练。训练得到水体识别提取模型后,从而将模型迁移到其他时期的影像,实现序列洪灾影像的快速水体识别提取。

采用精确率(PA)、召回率(UA)和F1值(F1 score)指标对分类结果进行精度评价。

PA=TP/(TP+FP)

UA=TP/(TP+FN)

F1= (2*PA*UA)/(PA+UA)

其中TP、FP、FN、TN分别为“被分为水体,实际也是水体”“被分为水体,但实际是非水体”“被分为非水体,但实际是水体”“被分为非水体,实际也是非水体”的样本个数。

结果与分析

水体提取结果分析

以7月26日的光学影像为例,利用OTSU阈值分割方法分别对NDWI、MNDWI和NNDWI这3种水体指数进行阈值分割。由于光学影像容易受到云和阴影的干扰,阴影具有较低的反射率,与同样具有较低反射率的暗黑水体可能造成混分,而云具有较高的反射率,云的遮挡作用直接导致了云下水体信息的缺失。由图2可以看出,3种水体指数的阈值分割结果均将阴影归为水体(黄框),未能正确区分阴影和水体;对于云而言,MNDWI水体分割结果能够将云剔除(绿框),而其他两个水体指数则将云也划入了水体,未能正确区分云和水体。因此,对比三种水体指数,MNDWI阈值分割结果最优。

以7月27日的雷达影像为例,利用OTSU阈值分割方法分别对VV、VH和SDWI进行阈值分割。由于雷达侧视成像,背向雷达发射的极化波的山坡会产生雷达阴影,即具有较低的后向散射值,同时因为水体也具有低的后向散射值,因而容易造成山体阴影和水体的混分,常用DEM高程数据辅助提取水体。本文基于DEM得到坡度数据,基于水面近似平面而坡度较小的特点,去除山地阴影的干扰,进一步得到更为精确的水体范围。如图3所示,部分道路也被提取成水体(黑框),结合光学影像得知被误分为水体的道路是沥青路。由于沥青路具有平滑的表面,在雷达影像中同水体一样产生了较低的后向散射值,因而在阈值分割的方法下被误分为水体。同时,对比VV、VH和SDWI的提取结果,SDWI提取结果从视觉效果上看更优,具有更少的噪声信息和更完整连续的水体分布。

对比阈值法和RF分类法得到的水体提取结果,如图3所示。对于光学影像,将阈值分割结果最优的MNDWI特征与RF分割结果进行对比分析,结果表明RF能够正确区分阴影和水体信息(绿框),同时对于细小的水体和小块的云也能够正确区分。对于雷达影像,将阈值分割结果最优的SDWI特征与RF分割结果进行对比分析,结果表明SDWI分割結果与RF分割结果接近,没有明显的差异,同时二者均不能正确区分水体和沥青路。

综合对比阈值法和分类法的水体提取结果,RF提取光学影像水体更优于阈值法,表现在RF水体提取结果能区分阴影。而两种方法对雷达影像水体提取结果则没有明显差异,均受到了部分道路的干扰。

精度检验与评价

RF的水体识别精度总体上大于阈值法的精度,基于阈值法的水体提取精度都在85%以上,而RF精度都在90%以上。而RF对光学影像的识别精度高于雷达的识别精度,这是由于在雷达影像中不能将部分道路和水体正确区分,而在光学影像中正确区分水体和云及阴影。因此,需结合数据质量选取对应的识别方法,如对无云影像而言,选取光学进行水体识别会比雷达的识别效果更好,这是因为雷达的提取结果带有部分道路和一些细小的后向散射值低的斑块噪声;对于有云影像,雷达的识别效果则更好,但需要进一步结合经验知识去除道路的干扰。

洪水灾害评估

根据RF对Sentinel-1和Sentinel-2序列影像的水体迁移分类结果,统计主要蓄滞洪区(图6)的水体面积变化信息,主要蓄滞洪区指卫河和共产主义渠两岸的区域,是本次洪灾的主要淹没区,得到以下结果,如图4所示。

根据主要蓄滞洪区水体面积变化情况,可以得出,研究区至少于7月26日开始积水,且在7月31日淹没面积达到最大值,约为320km2,之后洪水开始快速消退,8月20日后洪水消退速度趋于平稳,直至9月15日,研究区仍有50km2水体滞留。

使用洪水范围达到最大值时即7月31日的影像进行水体分布制图,该日影像由Sentinel-2获取,影像无云,成像质量好,使用RF迁移分类得到的水体提取结果,制图得出本次洪灾的全部影响范围。由下图可以看出,本次河南洪灾主要蓄滞洪区发生的洪涝灾害较为严重,其中卫辉城区发生城市内涝,部分道路被洪水淹没,而浚县则有大面积耕地被洪水淹没。

结论

本文对比分析了阈值法和机器学习模型迁移分类法在多源光学和雷达影像中的水体识别提取应用,并分析了洪灾水体面积变化和洪灾的影响程度。对比分析以上结果,得出以下结论。

(1)阈值法人工选取样本且速度快,但其提取水体的精度易受到水体与背景面积比例的影响,误差较大,仅适用于水体占比较大影像。

(2)机器学习模型依赖训练样本,而基于单期影像训练得到的水体识别模型,不需要重新选择样本,能够直接用于其他时期的影像水体提取,快速提取得到时间序列水体分布提取结果,并且分类精度较高,具有自动化快速识别水体的应用潜力。

(3)MNDWI水体指数结合阈值法能够区分云和水体,但仍受到阴影干扰,而RF分类法则能够较好地区分水体和云阴影;雷达影像水体调则由于后向散射特性受到山体阴影的干扰,使用坡度数据能够剔除山体阴影的影响;基于SDWI结合阈值法和RF分类法的雷达影像水体提取效果相近,但均受到了部分道路的干扰。

(4)本次河南北部蓄滞洪区洪涝灾害影响持续时间长达近两个月,最大淹没面积达到320km2,卫辉城区发生内涝,浚县大片农作物受灾,洪涝灾害影响严重。

参考文献

[1]. 王帆,李崇贵,马婷,等.一种改进的遥感影像水体信息快速提取方法[J].人民长江,2021,52(6):223-228.

[2]. 任正情.高分三号影像在洪涝灾害应急监测中的应用[J].西部资源,2021(4): 112-114.

[3]. 杨明军,康冰锋,张珣,等,苗世源.高分三号卫星SAR影像在水体信息提取中的应用[J].科技创新导报,2018,15(32):66-70.

[4]. 谷鑫志,曾庆伟,谌华,陈尔学,赵磊,于飞,涂宽.高分三号影像水体信息提取[J].遥感学报,2019,23(3):555-565.

[5]. 杨泽楠,黄亮,王枭轩.结合DEM的面向对象高分三号SAR影像高原山区水系提取[J].昆明理工大学学报:自然科学版, 2019.44(1):39-46.

[6]. 贾诗超,薛东剑,李成绕,等.基于Sentinel-1数据的水体信息提取方法研究[J].人民长江,2019,50(2):213-217.

[7]. 童莹萍,冯伟,全英汇,等.基于GF-3与Sentinel-2A图像融合的高精度水体提取算法[J].无线电工程,2021,51(8):750-753.

[8]. 王一帆,徐涵秋.基于客观阈值与随机森林Gini指标的水体遥感指数对比[J].遥感技术与应用,2020,35(5):1089-1098.

猜你喜欢

洪涝灾害机器学习
水环境对玉米生长的影响
洪涝灾害后动物防疫工作重点浅谈
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
洪涝灾害对动物疫病防控的影响及对策
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
机器学习理论在高中自主学习中的应用
刍议当前水库管理现状与改进对策