基于多源数据的城市洪涝灾害风险评估*
2022-09-19程朋根郭福生周万蓬
程朋根,黄 毅,郭福生,周万蓬,吴 静
(1.东华理工大学 测绘工程学院,江西 南昌 330000;2.自然资源部环鄱阳湖区域矿山环境监测与治理重点实验室,江西 南昌 330000;3.东华理工大学 地球科学学院,江西 南昌 330013)
近年来,随着城市的高速发展和全球气候变化的不断加剧,也使得城市灾害变得更加频繁[1-2]。其中,据统计城市洪涝灾害占比城市灾害约为40%,城市洪涝灾害成为城市灾害的主要来源[3-4]。因此,提高城市的抗洪涝灾害风险能力,是实现城市可持续发展的重要保障,而掌握城市内产生洪涝灾害的风险程度和面对洪涝灾害产生时的抵抗能力是其重要基础[5]。
城市洪涝灾害风险评估是指由孕灾因子、致灾因子、承灾因子和洪涝灾情共同组合成的复杂地球表层异变系统[6]。目前,对于城市洪涝灾害风险的研究评估,国内外许多专家学者已经有了较多的研究和评估方法[7]。通过梳理总结,前人的主要的方法有四种[8]:一是基于历史灾情数据的数理统计法,如方建等[9]通过统计全球范围内的降水、数字高程、土地利用、城市人口经济以及利用历史城市洪涝损失等数据对全球城市洪涝灾害风险进行评估;二是基于RS和GIS构建分析模块,朱静[10]基于遥感和GIS方法的应用,将数字高程模型同山洪水位和洪峰流量相结合进行淹没分析,并模拟分析洪涝淹没范围和淹没水深;三是基于水文水利学的模拟法,叶陈雷等[11]基于InfoWorks ICM建立水文水动力耦合模型,对沿海城市福州市主城区白马河片区进行城市洪涝模拟和风险评估,实现了对片区洪涝危险性的量化计算和空间分析;四是指标体系评估法,如刘媛媛等[12]通过收集孟印缅地区的土地利用、河网、数字高程以及雨季降水等10个指标,基于AHP和熵权法对孟印缅地区的洪涝灾害进行风险评估。CAI Shunyao等[13]基于三角模糊数的层次分析法确定了在山区城市中与洪涝灾害相关的11个指标的权重,探测评估了动态变化的洪涝灾害风险地区。
不同的洪涝评估模型适应于不同的评估环境,但收集研究区域内历史洪涝灾害数据和城市气候与城市地形等数据,是保证城市洪涝评估有效性的关键。而城市数据的收集往往成为制约城市洪涝评估关键因素;同时,应用较广普适性较好的指标体系评估法,对于市级单位的评估结果效果较好,但在传统的指标权重参数设置方面,因不同城市、学者所采用的指标不同,权重设置较难固定。为探究一种可供复现的可靠城市洪涝评估方法,本文通过收集整理城市开源数据以及互联网城市数据,并从中提取洪涝因子,结合随机森林回归分析和AHP和熵权法构建洪涝灾害风险评估模型,以南昌市为例,评估市级城市的洪涝灾害风险。
1 城市洪涝灾害风险评估指标体系构建
基于城市洪涝灾害的相关理论,城市洪涝灾害的产生有三个阶段:①地区在短时间内产生足够多的降雨量,导致降雨地区环境在短时间内无法将雨水迅速排出;②形成洪涝积水;③地区内的洪涝积水对当地产生了破坏性影响。因此,本文从洪涝灾害产生的机理条件出发,对引发洪涝灾害的三大阶段分别梳理,构造出城市洪涝灾害的致涝危险性(产生洪涝灾害的致涝因子)、孕涝敏感性(形成洪涝积水的地理环境的孕涝因子)和承涝脆弱性(城市的经济发展程度与防洪减灾救灾能力的承涝因子)。因此洪涝灾害风险结构可以表示为如下形式。
致涝因子:
(1)
孕涝因子:
(2)
承涝因子:
(3)
洪涝灾害风险系数:
R(X)=WMM(X)+WBB(X)+WSS(X)。
(4)
式中:Mji(X)、Bji(X)和Sji(X)是各指标标准归一化后的值;M(X)、B(X)和S(X)的值分别表示洪涝灾害风险系数中的致涝因子危险度、孕涝因子敏感度和承涝因子脆弱性;WM、WB、WS是相应度评估因子的权重,R(X)表示该区域洪涝灾害风险系数值。
指标选取原则:基于洪涝灾害的形成机理,综合城市的实际情况,依据洪涝灾害发展的各个阶段,选取出具有普适性和代表性的洪涝指标因素。最终通过参考城市洪涝灾害风险评估指标体系法的相关研究[12-15]和查阅城市建设相关标准等[16],构建城市洪涝灾害风险评价指标体系表(表1)。评估流程图如图1所示。
表1 南昌市洪涝灾害风险评价指标体系
图1 实验流程图
2 研究区域及数据来源
2.1 研究区域
南昌市作为江西省省会,地理位置较为优越,水资源丰富(图2)。东北部紧靠我国最大的淡水湖鄱阳湖,是中国唯一一个毗邻珠江三角洲、珠江长江三角洲和闽南金三角的省会中心城市。全市以平原为主,南北长约112.1 km、东西宽约107.6 km,全市面积约为7 194.61 km2,截止2019年,南昌市人口已达到536万人。
图2 南昌市水系分布情况(审图号:GS(2021)6026号,底图无修改,下同)
2.2 数据来源
随着评估精度要求的提升,为收集到更高精度的指标数据,可以利用互联网搜集城市数据,提取出洪涝灾害风险指标[17],如城市人口分布情况(城市热力值)等可由互联网进行收集整理,以获取更高的数据精度。
本文所使用的研究数据共分为4类:气象水文数据、基础地理数据、遥感数据和社会经济数据(表2)。
表2 数据来源
3 基于AHP和熵权法的洪涝灾害风险评估模型
3.1 随机森林回归分析
随机森林是一种Bagging类型的集成算法,通过组合弱评估器,构建多个决策树形成森林,再通过Bagging随机采样,使得模型结果具有较高的泛化性能。随机森林算法的优点在于样本随机和特征随机,使得随机森林不易于过拟合且增强了森林的抗噪能力;能够判别特征的重要程度和不同特征之间的相互影响;由于是树的组合,随机森林可以处理非线性的高维数据,对于数据集的适应性较强,且易于实现、训练速度较快、精度较高,能够处理大规模数据,适应于本实验。缺点在于对于数据集的维度有一定限制,低维数据训练效果不如高维数据;并且在某些噪音较大的分类或回归问题上容易出现过拟合[20]。
随机森林的弱评估器使用的是CART决策树(分类回归树),当输入算法数据集为离散型数据时,决策树为分类树;当数据集为连续性数据时,决策树为回归树,并计算其均值作为回归预测值。回归算法的核心是通过建立一系列回归决策树{h(x,θt),t=1,2,…,T},并计算其均值作为回归结果。其中,θt表示随机变量,x表示自变量,属于特征向量X,T表示决策树数量。
分类预测结果为:
(5)
回归模型预测结果为:
(6)
3.2 AHP和熵权法
3.2.1 AHP层次分析法
AHP层次分析法的主要思想是通过将最终目标拆分成各个因素指标,并根据层次关系将指标组成不同级别的层次结构,通过重要程度指标进行权重评分,并以此构建权重判断矩阵,最终自下而上求出目标结果。
构建过程为:①构建结构层次模型;②构建判断矩阵;③一致性检验。最终利用一致性合格的判断矩阵计算各层次中指标的相应权重值。AHP层次分析法是一种简便、灵活且实用对定权方法,但是缺点在于人为对主观性过强,过于依赖人为判断。
3.2.2 熵权法
熵权法是利用数据的信息熵来描述数据指标差异程度的概念。根据熵权法的基本理论,数据指标的数值差异度越大,则表示该指标离散程度较大,对综合评价结果的影响较大,即相应的权重值较高。
构建过程为:①洪涝指标数据标准化;②构建评价指标矩阵;③计算洪涝指标权重。过程相对简单,普适性较强,缺点在于对于部分指标无法进行人为修正。
3.2.3 AHP和熵权法
AHP层次分析法是由专家经验对目标进行比较判出指标权重,熵权法则由客观数据判出指标权重,由于AHP层次分析法和熵权法都是通过先获取指标权重,再对权重目标进行评估计算,因此可以将两种权重评估方法进行集成[21]。
本文所用的AHP和熵权赋权法的原理是根据不同洪涝指标在两种定权方法间的差异度,采用“距离函数的组合评价法”[22],将AHP层次分析法所得到的m个洪涝因子的权重值WAHP和由熵权法所计算出的m个洪涝因子的权重值WEWM当作两组m维的向量,再从两组向量Wm×1间找出一组向量,使其到WAHP和WEWM的距离和最小,此时可以将Wm×1当作AHP与熵权法的组合权重。构造公式如下:
(7)
式中:α与β分别为AHP与熵权法的分配系数,其值与WAHP和WEWM的差异度相同。而WAHP和WEWM的差异度可有距离函数D(α,β)2求得:
(8)
由此可以求出组合权,由于组合权之和∑Wm×1不等于1,故还需对其进行归一化处理,最终得到归一化处理过后的指标数据矩阵W。
4 洪涝灾害风险评估
依据洪涝灾害风险评价指标体系,将采集到的多源数据按照指标属性的正负性,做归一化指标处理划分入栅格网中,数据的投影坐标系为WGS84-UTM,各栅格图层单元大小为200 m×200 m,共计181 643个栅格单元。
4.1 随机森林回归分析
随机森林能够对特征因子进行评分,揭示特征因子对结果影响程度,本文根据随机森林回归分析,对洪涝灾害风险因子与城市洪涝对相关性进行研究,对洪涝灾害风险因子间的重要性进行对比分析,为指标权重设置提供参考依据[23]。
本文将洪涝因子作为特征向量(X),将洪涝积水点作为目标向量(Y),对南昌市洪涝危险性指标和洪涝脆弱性指标与南昌市洪涝积水点(由2020年夏季南昌市洪涝灾情数据提取)进行随机森林回归分析。在200 m的格网尺度下,通过将洪涝灾害风险区域以70%和30%的比例划分为训练集和测试集,并在训练集上利用sklearn中的GridSearchCV(格网搜索和交叉验证)工具,从所有参数中找出找到训练集上精度最高的参数。
实验结果如图3所示,在南昌市洪涝灾害风险指标中,暴雨占比的重要性最高,达到0.22;其次暴雨变化趋势、短历时暴雨占比以及归一化植被指数也具有较强的洪涝相关性;相对而言,河路密度在南昌市城市洪涝影响中重要性最小,说明在洪涝灾害中,城市的河网中的河水外溢的概率较小,与城市道路密度和洼地深度等相比,对城市洪涝灾害的影响较小。
图3 洪涝灾害因子比值重要性对比
4.2 AHP和熵权法评估分析
本文基于AHP层次分析法的基本思想,利用随机森林所得重要性,构建判断矩阵。由于洪涝灾害的发生只与灾害发生前的环境因素相关,对于灾害发生后,洪涝灾害并不能反映出不同区域间的救灾能力,因此本文根据实际情况只对洪涝危险性以及洪涝敏感性进行随机森林回归分析,利用随机森林重要性结果作为南昌市洪涝危险性以及洪涝敏感性判断矩阵的构造依据,对于城市经济能力和抗洪救灾指标的洪涝脆弱性,则参考前文以及相关文献中的洪涝因子对比结果以及咨询相关专家后,完成洪涝脆弱性因子的对比分析,进而构建相应的洪涝脆弱性判断矩阵[12]。将所构建的判断矩阵,做一致性检验,在检验通过后,由判断矩阵可求出各层洪涝指标的主观权重值;同时利用熵权法对数据进行客观评价,并将结果与AHP层次分析法所得结果相融合,最终计算出洪涝灾害风险评估的指标权重值,组合权重结果如表3所示。
4.3 洪涝灾害风险评估结果
依据组合权的计算结果,分别将洪涝因子权重与洪涝栅格单元数据相结合,可得南昌市的洪涝灾害风险评价结果。
表3 指标权重
4.3.1 洪涝危险性
洪涝危险性是反映洪涝灾害程度的因素之一,根据指标权重可计算出各栅格区域内的洪涝危险性,最后利用自然断点法将洪涝危险性评价结果分为高度风险、较高风险、中等风险、较低风险和低风险。评价结果如图4所示。从图4中可以看出,南昌市的洪涝降雨风险呈现出中部点状较高,并向外下降,从纵向看则呈现出由北向南梯度下降的趋势。中部西湖区东南部与青云谱区南部为高风险地区,由于“城市雨岛效应”的影响,该地段的降雨量更多,短历时暴雨占比占据了总暴雨雨量的80%以上,致涝危险性系数较高;其次,除去“城市雨岛效应”的影响,从整体上来看,南昌以北的新建区也有较高的致涝风险,原因在于新建区地带暴雨频率逐年呈快速上升趋势,且暴雨雨量占比大,因此也有较高的洪涝危险性。
4.3.2 洪涝敏感性
洪涝危险性表现了在暴雨来临时,研究区域的地形地貌、植被与河流等不同地理环境对洪涝灾害形成的敏感度。同理根据危险性权重指标可计算出各栅格区域内的洪涝危险性。评价结果如图5所示。从南昌市洪涝敏感性分布情况上看,敏感性和城市发展状况相关度较高,高敏感区域主要分布在城市中部的主城区,主要原因在于西湖区、东湖区与青云谱区等地位处于平原,植被较少,道路密度大,不透水层的占比率较高,加大了城市洪涝的形成风险;同时,安义县中部向南和进贤县以东的城镇部分区域也有较高的洪涝敏感性风险;其次,南昌县西部敏感性较高,东部敏感性高风险地区呈点状分布,原因在于南昌县西部的植被归一化指数较差,而东部植被指数表现较好,但存在较大范围的洼地,增加了洪涝敏感性风险;北部的新建区由于植被归一化指数较好且地表较为平缓又复杂密集的道路和水路网,因此在洪涝敏感性风险中整体表现最好。
4.3.3 洪涝脆弱性
洪涝脆弱性表现了在城市中形成洪涝灾害后,城市的救灾、抗灾的抵御灾害能力。同理利用自然断点法将洪涝脆弱性评价结果进行分级。评价结果如图6所示。城市的发展规模能够体现在洪涝发生时的抗洪能力,但是在大比例尺范围内,不同地区间在面临相同规格的洪涝灾害时,抗风险能力不同,较为发达地区所造成的洪涝损失更多。从图6 e南昌市洪涝脆弱性分布图中可以看出,东湖区南部与西湖区北部属于脆弱性高风险地区;其次,青山湖区与青云谱区为较高风险地区;低风险地带集中在新建区北部、南昌县东北部和进贤县北部地区。从整体上看,南昌市的洪涝脆弱性分布情况呈现中部以及西南地带较高,北部地区脆弱性整体偏低,人口稀疏、城市建设度较低,洪涝产生的破坏性风险不高。
图4 洪涝危险性评估结果
图5 洪涝敏感性评估结果
图6 洪涝脆弱性评估结果
4.3.4 洪涝灾害风险综合评估
洪涝灾害风险综合评估是综合洪涝危险性、洪涝敏感性和洪涝脆弱性,根据AHP和熵权法的所求出的组合权重将所有的洪涝因子导入评估模型,最终得出评估结果。最终结果如图7所示。
图7 南昌市洪涝灾害风险评估结果
由南昌市的洪涝灾害风险评估结果可以看出,南昌市的东湖区南昌部、西湖区同青云谱区和南昌县西部属于洪涝高风险地带;其次,青山湖区与安义县和进贤县南部部分地区属于洪涝较高风险地区;安义县和进贤县洪涝灾害风险等级整体呈中等偏高;湾里区整体的洪涝灾害风险较低;新建区东北部与南昌县中北部属于低风险地区。从分布结果上看,南昌市洪涝灾害风险呈现出中间高、两端低的包裹状态;中部主城区地势平坦且河流交错,植被较少、不透水层的占比率较高属于洪涝高风险地区,而且人口较为密集,发生洪涝灾害时,经济损失较为严重;植被较多地势高的湾里区属于洪涝中低风险区域;中部南昌县洪涝灾害风险地区较为分散,中部以北洼地较多,有较多零散的中高洪涝灾害风险地区,西南与青云谱区接壤区域属于洪涝高风险地带,该部分城市建设较为发达、人口分布较为密集、植被较少且有较大面积的不透水层,极大的增加了洪涝灾害风险;进贤县外接抚河,内有军山湖,而湖泊水系周围的陆地伴有较多的洼地,植被归一化指数较差,因此湖泊水系两岸也有较多零碎的中高洪涝灾害风险地区;新建县整体属于中等洪涝灾害风险,东部地带虽然靠近鄱阳湖,但是城市居住人口较少,水域占比率较大,城市建设度没有西湖区与东湖区等地高,因此,所能产生的洪涝损失有限,洪涝灾害风险略低于中南部。
4.5 评估结果验证
为更为清晰直观的反映城市洪涝的真实状况,本文以人工视检法对南昌市洪涝灾害风险评估结果进行验证。通过中国农业大学和国家对地观测科学数据中心提供的2020年7月11—30日的夏季洪涝灾情数据,以其中两期高分辨率卫星遥感影像提取洪涝灾情期间南昌市的水体信息,该数据空间分辨率为10 m;再经过裁剪拼接,得到的南昌市的洪涝灾情水体分布结果;最后,从水体数据中剔除南昌市晴朗时段的湖泊、河流等水体数据,得到南昌市洪涝灾情期间的积水分布概况,并在此基础上添加由百度地图提取出的南昌市建筑轮廓分布数据。最终结果如图8所示。
图8 洪涝水体分布情况
图9 南昌市乡镇级洪涝灾害风险评估结果
从图8洪涝水体分布图中可以看出,7月20日前后南昌市江河湖泊部分的水体明显减少,而城市居民住宅区附近零碎的洪涝水体在大幅增加,说明虽然城市暴雨虽然在持续进行,但洪水正在消退。而新增的零散洪涝水体,为城市洪涝灾害风险较高地域,在城市暴雨时期,更易产生洪涝积水。从洪涝水体整体分布上看,在南昌2020年夏季灾情期间,大块的洪涝积水集中在新建区北部和南昌县的南北地区,这类区域均处于赣江以及抚河两岸,虽然对比晴朗时期的水域有所扩展,但考虑到江河流域的实际宽度与河岸高度,并未大范围的漫延至城市居民地带,江河的水体外溢的程度有限,潜在洪涝灾害风险较大;南昌市中部以东湖区、西湖区和青云谱区为中心的区域,具有较为密集的城市建筑物,通过放大洪涝水体分布图后可以发现,存在部分建筑地段被洪涝水体淹没覆盖,且在城市道路中出现洪涝水体,说明在洪涝暴雨期间,南昌市主城区存在交通瘫痪和城市建筑的淹没状况,值得说明的是,城市城区中的城市建筑物较多,当房屋周围出现可识别性的洪涝水体时,说明城区内已有较为严重的城市洪涝状况;同时,在洪涝水体分布图中,可以发现南昌县北部,存在部分较为规整的条形洪涝水体,说明在本次洪涝灾害期间,南昌县北部的较大范围的农作物被洪水淹没,造成了农作物的直接损失。
将洪涝水体分布图与洪涝因子分布情况进行对比可以看出,南昌市洪涝致涝危险性分布较高的中部主城区,在本次城市暴雨期间,洪涝积水点增加较快;致涝危险性较高的新建区,存在较大范围的持续性积水区域,但洪涝水体减退较快;在南昌市的孕涝敏感性分布图中,在除去江河湖泊与城市建筑物后,孕涝敏感性分布状况与洪涝水体分布情况高度一致,以人口较少的进贤县和南昌县北部为例,在孕涝敏感性较高的地段,洪涝水体面积更为集中、密集,在孕涝敏感性较低的地区,洪涝水体更少。与实际灾情相符。因此,本文利用AHP和熵权赋权法对洪涝因子的权重进行取值的结果较为合理。
4.6 评估结果展示
为更为直观的展示南昌市各区之间的洪涝灾害风险差距,将栅格化的图7洪涝灾害风险评估结果以地区的平均值进行分区统计汇总,以绘制出南昌市的乡镇级洪涝灾害风险分布图,结果如图9所示。
5 结论
本文通过梳理国内外城市洪涝灾害风险评估的相关研究,改进了一种指标评估法,从历年城市暴雨特征、城市自然地理环境与城市发展状况出发,建立南昌市洪涝灾害风险的指标体系,筛选洪涝灾害风险因子。基于随机森林算法分析洪涝灾害风险因子与洪涝灾害的相关性,并计算洪涝因子间对于洪涝灾害的相关重要性。根据随机森林计算的洪涝因子重要性,融合利用AHP层次分析法与熵权法相结合的组合方法确定各洪涝因子的最终权重,最后将栅格化预处理后的各洪涝因子数据导入建立的洪涝灾害风险评估模型中,得到南昌市的洪涝灾害风险评估结果。
其中,通过爬取开源数据以及互联网城市数据,克服了传统洪涝评估中数据获取困难的短板,为城市洪涝评估数据的获取途径提供新的方向。结合RS与GIS手段,利用随机森林回归算法,能够因地适宜的对洪涝因子的重要性进行定量对比分析,改进了为以层次分析法为主的洪涝评估方法中权重值对比困难的问题,有效降低人为误判概率。为缺乏城市关键性数据的同类型洪涝灾害风险评估提供参考依据,同时能够为城市洪涝灾害风险管理、土地利用规划和洪涝灾害应急避难等提供重要依据。