机器学习模型在城市内涝模拟预报中的应用综述
2025-02-13陈泽明方序鸿李家叶汪孟尧陈爱芳尹玲
摘要:近年来,频发的极端暴雨天气易引发城市内涝灾害,直接影响到人民生活和生命财产安全。为提高城市应急管理水平,有效制定城市防灾减灾策略,亟需建立1个准确且高效的城市内涝模拟预报模型。随着人工智能技术的快速发展,其在城市内涝模拟预报方面逐渐显示出巨大潜力和价值。通过对近10 a发表的相关文献进行系统检索和综合分析,梳理了城市内涝的背景、趋势成因和研究热点。基于近5 a发表的基于机器学习算法的城市内涝模拟预报模型研究进展,总结了基于机器学习算法的城市内涝模拟预报模型的技术流程,并提出了目前存在的一些技术瓶颈和可能的解决方案。最后,展望了机器学习模型的技术优势、发展方向和应用前景,旨在为将来的城市内涝模拟预报和防灾减灾研究提供参考。
关键词:城市内涝;机器学习模型;模拟预报
中图分类号:TP319文献标识码:A文章编号:1001-9235(2025)01-0009-14
An Overview of Application of Machine Learning Models in Urban Flood Simulation and Forecasting
CHEN Zeming1,FANG Xuhong1,LI Jiaye2,3*,WANG Mengyao2,CHEN Aifang2,3,YIN Ling1,3
(1.School of Computer Science and Technology,Dongguan University of Technology,Dongguan 523808,China;2.School ofEnvironment and Civil Engineering,Dongguan University of Technology,Dongguan 523808,China;3.Guangdong Provincial KeyLaboratory of Intelligent Disaster Prevention and Emergency Technologies for Urban Lifeline Engineering,Dongguan 523808,China)
Abstract:In recent years,the frequent occurrence of extreme rainstorms has been prone to causing urban flood disasters,directly affecting people's lives and property safety.To enhance the level of urban emergency management and effectively formulate urban disaster pre vention and mitigation strategies,there is an urgent need to develop an accurate and efficient urban flood simulation and forecasting model.The rapidly developed artificial intelligence technology gradually shows great potential and value in urban flood simulation and forecasting.By systematically searching and synthesizing the relevant literature published in the recent decade,this paper sorted out the background,trendcauses,and research hotspots of urban floods.Additionally,this paper also focused on the research on urban flood simulation and forecasting models based on machine learning algorithms published in the recent five years,summarized the technical processes for urban flood simulation and forecasting models based on machine learning algorithms,and proposed several current technological bottlenecks and potential solutions.Finally,this study summarized the technical advantages,further development directions,and application prospects of machine learning models,so as to provide a reference for future research on urban flood simulation and forecasting and disaster prevention and mitigation.
Keywords:urbanflood;machine learning model;simulation and forecasting
1概论
1.1研究背景
随着城市化进程的不断推进和全球气候变化的影响,极端暴雨天气导致的城市内涝频率不断增加,影响范围不断扩大,城市内涝问题愈发成为城市必须面对的重大挑战之一[1-2]。城市内涝是指在城市区域遭遇强降水或连续性降水事件导致城区积水的一种气象衍生灾害[3]。由于突发性的降水事件导致城市排水系统无法及时排空大量积水,雨水在道路表面或地下空间积蓄。出现积水过深、覆盖范围广的状况,不仅会影响城市交通系统的正常运行,而且还会对人民生活以及生产活动造成显著的影响[4]。
极端天气事件引发的灾难性洪水已经造成了数百万人死亡,并且对社会经济发展和社会稳定造成了巨大影响[5]。洪水具有频率高、预防难度大、突发性强、危害性高等特点[6]。根据国际灾难数据库(EM-DAT)的统计数据显示,从2000年至2020年期间,全球共发生自然灾害事件8 591次,其中洪涝灾害占比达到了40.2%[7]。自1988年发生特大洪水以来,中国在水利工程建设方面持续加大投入,有效提高了流域的防洪能力,降低了主要江河洪水的威胁。但是,随着21世纪以来中国城市化进程的快速推进,城市内涝问题日益严峻,已经对社会和经济发展造成了广泛的影响[8],中国成为了世界上受洪涝灾害影响最为严重的国家之一。洪涝灾害在中国自然灾害中不仅发生频率最高,而且涉及范围广泛,造成的经济损失和人员伤亡也极为严重[9]。根据《2023中国水旱灾害防御公报》数据统计,2013—2022年全国因洪涝受灾人口年平均值为7 009.82万,死亡失踪人口年平均值为529人,直接经济损失占当年GDP百分比的年平均值为0.27[10]。一旦发生城市内涝,将会带来严重的人员伤亡和经济损失。表1罗列了全球近10 a来因内涝造成的人员伤亡和经济损失。
1.2城市内涝趋势成因
1.2.1城市气候变化因素
持续而显著的全球气候变化加剧了极端天气的出现频率[21]。与此同时,城市化进程的加速推进也带来了一定的影响。城市的快速扩张加剧了城市“热岛效应”,导致城市上空中的热空气流不断积聚并且增厚,最终形成降水,这一现象被称为城市“雨岛效应”[22]。这两大效应以其不断增多的频次和扩大的范围,正在加剧城市内涝的发生[23]。气候变化是影响水资源最直接的因素[24]。在城市地区,气候变化的影响尤为显著。城市气候变化因素正在影响城市区域的水循环过程,如蒸发、降水等环节,这些变化增加了极端降雨事件的出现的频率和强度,成为了城市内涝最直接的驱动因素。
1.2.2地表变化及蓄洪面积减少
传统的建筑技术和日益增长的城市化导致了城市不透水下垫面区域的比例增大,大量的道路、建筑取代了原有的自然地表环境,导致地表径流量增加,从而增加了内涝风险[25]。此外,城市化进程中的填湖等行为使得城市蓄洪区域面积减少,蓄洪能力下降,产流量增加[26]。城市地表径流的变化和蓄洪面积减少使得城市径流形成规律发生改变,雨水向城市低洼地区更加快速地汇集[27],导致城市区域产生积水,进而形成城市内涝。
1.2.3城市排水系统更新滞后
城市排水系统是城市基础设施的重要组成部分,承担着城市排洪的重要功能,其覆盖的区域大小及排洪能力对控制和调节城市水文径流具有重要作用[28]。目前国内一些城市的排水管网系统已经不适应当前城市的发展情况,排水系统建设标准与城市实际排水能力不匹配[29]。由于一些历史原因,城市的扩展大多是在旧城的基础上进行的,这导致旧城区的地下管网系统普遍存在管径规模不足、设施老化等问题,缺乏健全的排水系统[30]。同时,在排水系统建成以后,如果对其维护和管理不当,将会导致排水系统的局部排水能力下降,从而可能引发城市局部性内涝问题[31]。此外,随着城市人口的稳步增长和建筑面积的持续扩大,也会使原本的排水管网承受超负荷的压力。
1.3城市内涝研究热点
国内外学者对城市内涝的模拟预报工作已经进行了大量的研究。主要方法包括基于统计的经验模型、基于物理学原理的传统模型以及基于地理信息的空间模型[32]。在国际领域,水动力学模型已经成为了预测城市内涝的主要方法。基于物理学原理的数值模型的相关研究已较为成熟,并在一些领域内得到了应用。但是,这类模型在应对大规模数据处理、解析多因素关系时,存在着求解过程复杂且耗时较长的问题,不能满足紧急决策的时效需求[33]。
近些年来,随着人工智能技术的不断发展,人工智能已经广泛应用于自然语言处理、医学影像、计算机视觉、机器翻译等领域[34]。为了解决传统的城市内涝模型中存在的一些问题,学者们已经逐渐将人工智能技术应用到城市内涝的模拟预报领域,特别是基于机器学习算法的城市内涝模型已经逐渐成为当前城市内涝问题的研究热点。
机器学习模型可以对大规模的气象数据和城市数据,通过机器学习和深度学习技术进行加工处理和分析,从中获取模式和规律,识别出城市内涝风险因素以及潜在的内涝地区。基于历史气象数据和实时监测数据,运用机器学习技术可以建立起城市内涝模拟预报模型。这些模型可以动态调整,模拟不同情况下的城市内涝程度和影响范围,帮助城市管理者提供决策和应急方案,保障人民生命财产安全。基于机器学习算法的内涝模型,特别是基于深度学习的模型,能够处理大量的输入变量和复杂的非线性关系,从而更好地模拟城市内涝。相较于传统的城市内涝模型,基于机器学习算法的城市内涝模型计算成本更小、效率较高[35]。
2机器学习模型研究进展
准确预测和模拟城市内涝对于提高城市应急能力,减少灾害带来的损失具有至关重要的意义。目前,机器学习技术在城市内涝模拟预报中展现了巨大的潜力和价值,国内外学者已经开始研究基于机器学习算法的城市内涝模拟预报模型,并取得了一定的成果。本文通过梳理和分析近五年机器学习模型在城市内涝模拟预报中的应用统计,旨在为城市内涝防控策略和灾害管理工作提供新颖的视角和解决方案。表2为近5 a机器学习模型在城市内涝模拟预报中的应用统计。
通过对机器学习模型在城市内涝模拟和预报中的应用情况的统计分析,可以得出机器学习在提高洪水预测的准确性、响应速度和决策支持方面具有较大的优势。近5 a来机器学习模型在城市内涝模拟预报中的应用主要具有以下特征。
2.1算法的多样性
多种算法被应用于城市内涝的模拟与预报当中,例如,LSTM、RF、CNN、RNN、MLP、KNN等,图1为表2中提及的文章所使用的主要算法统计。在机器学习领域中有多种算法,每种算法都有其独特的优势和适用场景。根据统计,LSTM算法在城市内涝模拟预报领域使用频率较其他算法来说较高,且相较于往年,2022年后LSTM的使用次数也在增加,这说明LSTM算法在该领域比较适用。因为LSTM非常适合处理和预测时间序列数据[66],而城市内涝模拟预报需要分析历史降水、水位等时间序列数据,LSTM能够很好地捕获这些数据中的长期依赖关系。并且LSTM拥有记忆单元和控制信息流动的门机制,这使得其可以学习数据中重要的时间信息和遗忘掉不重要的信息。这些机制让LSTM在处理城市内涝问题时表现出色。因为城市内涝是1个动态变化的过程,LSTM能够很好地处理这种动态性,并能通过记忆和遗忘机制捕捉随时间变化的关键特征。
2.2应用场景的广泛性
机器学习模型在城市内涝模拟预报中的应用场景非常广泛,主要分为两大类:洪水风险绘图和洪水事件预测。洪水风险绘图关注的是识别和预测可能发生洪水的区域,这通常涉及到对地形、土地利用、气候模式等因素的综合分析。例如,Lei等[47]在韩国首尔地区使用CNN和RNN技术进行的洪水风险绘图,能够提供2 m空间分辨率精度的洪水易发性地图。洪水事件预测则侧重于预测特定区域在未来一段时间内的洪水水位变化,这对于预警和应对可能的洪水事件至关重要。例如,Motta等[49]开发的RF模型,能够提供未来2 h的水位预报,这对于快速响应洪水事件非常有帮助。而Sampurno等[55]使用的MLR模型,可模拟预测数十年,这对于长期规划和风险评估来说具有重要价值。
利用机器学习模型,特别是深度学习模型,能够对大量的历史数据和实时数据进行分析,进而提高预测的准确率。在缺乏监测数据的地区,机器学习模型能够充分利用现有数据,通过智能分析和模式识别,为这些地区提供可靠的洪水预测服务[67]。此外,通过机器学习模型,也可以实现来自不同来源的数据的高效融合,这不仅增强了模型的综合性能,还提高了系统应对各种突发事件的响应能力。机器学习模型在城市内涝模拟预报中的应用,为城市管理和灾害防控提供了新颖的工具和方法,能够为城市管理者提供更为精确、及时的信息,提升城市的防灾能力和应急管理水平。
3机器学习模型技术流程
目前,机器学习技术已经不断应用于城市内涝的模拟预报中,其基本流程为数据采集与预处理、模型选择与建立和模型训练与优化。
3.1数据采集与预处理
在有关机器学习技术的研究项目中,数据采集与处理是一个十分关键的过程。数据采集与处理,指的是通过收集不同来源的数据信息,并采取一定的方法对收集来的原始数据信息进行处理和转换,从而可以从中获取和提炼出有价值的数据信息来用于下一步的研究工作。
3.1.1数据采集
数据采集指的是收集与特定主题相关数据信息的过程。这些数据信息的来源可以是物理或者数字的形式,在收集过程中,通常涉及大数据、物联网、云计算、地理信息系统等技术的应用[68]。模拟与预报城市内涝的数据一般来源于城市排水系统、城市内涝点、气象数据和城市地形地貌。但这些数据的采集较为困难,因为城市内涝所涉及的影响因素较多,某些具体数据的获取可能还会受到访问限制。这就导致了城市内涝相关公开数据稀缺,大部分研究者都是通过自建的数据集进行研究,而且不同来源的数据在格式和精度上也存在差异,存在着数据质量低等问题。城市内涝模拟预报模型所需相关数据通常包括以下几个方面。
3.1.1.1城市排水系统数据
城市排水系统数据一般包括流量、水位和管道状态等数据信息[69]。流量数据反映的是1个时间段内通过管道的水流量,如果流量超过了管道的承受能力,则有可能导致城市内涝。水位数据则反映了雨水的积聚程度,精确的水位数据可以帮助评估城市的内涝风险。管道状态可以提供有关城市排水系统的健康状态信息,得知排水系统的工作状态,找出可能存在隐患,从而帮助城市管理者制定有效的预防措施。
3.1.1.2城市内涝点数据
城市内涝点数据指的是在一段时间内,城市各个区域发生内涝的具体记录,包括社交媒体数据、道路交通网络拥堵情况等。作为一种低成本和信息丰富的自发地理信息,社交媒体数据可以通过人类行为反映地理事件,是城市地区精细洪水监测的有力补充来源[70]。道路交通网络是经济、社会活动的基础,支撑着城市内部以及城市间庞大的人口和物质要素的流动[71]。道路交通网络拥堵情况也可以作为一个预测城市内涝地区的参考因素,为预测模型提供实时、空间化的数据。
3.1.1.3气象数据
气象数据在模拟和预报城市内涝中具有十分重要的价值,因为气象条件是城市内涝发生的主要因素之一。其中降雨量是导致城市内涝最直接和最重要的因素[7],降雨量过大可能会导致城市排水系统超负荷运转,从而引发内涝。风速风向会改变降雨的方向和雨水的分布区域。同时,温度也是一个重要的影响因素,温度会影响雨水的蒸发速度、土壤吸收水分的能力和气候模式,在进行内涝模拟与预报时,考虑温度因素可以提高模拟与预报的准确性。
3.1.1.4地形地貌数据
城市的地形地貌数据,可以辅助研究者理解雨水在城市中的流动模式,从而提高城市内涝模拟与预报的准确性和高效性。对于城市地形地貌数据的采集,一般会涉及高程模型、河道分布、地形坡度这几个因素。高程模型通过有限的地形高程数据实现对地面地形的数字化模拟[72],提供城市地形高低变化数据,对模拟雨水流动方向,分析潜在的洪涝区域有着重要的作用。通过对河道分布数据的研究,有助于研究人员了解雨水流向和河道排水能力。分析地形坡度数据对于了解雨水径向、流速等信息具有重要意义,这些信息可以为城市内涝的研究提供重要依据和数据支撑。
3.1.2数据预处理
数据预处理是建立机器学习模型任务中必不可少的步骤,其主要作用是将数据清洗、转换和标准化,以确保数据的一致性和可用性。数据来自于不同的来源和格式,可能存在不必要的信息和噪声。通过数据处理可以去除其中不必要的信息和噪声,提高数据质量,进而增强模型的准确性和效率。数据处理包括数据清洗、数据规范化以及特征提取。
3.1.2.1数据清洗
数据清洗旨在识别数据集中的错误与异常,通过剔除或修正这些问题来提高数据的准确性和可靠性,确保数据的质量和一致性[73]。在气象数据和地理信息数据的采集过程中,可能会存在操作失误,测量方法不当等情况,导致数据缺失、异常等问题[74]。因此需要对采集的数据进行数据清洗,数据清洗一般包括去除异常值、缺失值填充等步骤。
数据集的异常值可能是由于数据的采集或数据的录入的错误而导致的,不合理的异常值处理可能会导致模型的准确率下降,影响到模型预测结果的可靠性。对于异常值的检测主要有计算属性值的标准差或四分位数范围等[75]。
缺失值一般是因为数据集中某些变量的观测值缺失而造成的,对缺失值进行填充,可以保证数据的完整性。缺失值的处理一般采用均值替换、中位数替换等方法。
3.1.2.2数据规范化
数据规范化指的是将数据的数值范围按照比例进行放缩,调整到1个期望的范围,以消除由于不同特征尺度差异的影响。在实际的城市内涝模拟预报中,涉及到的数据可能尺度差异较大,如气象数据的降雨量和地形地貌数据的地形坡度,直接使用可能会使得某些特征对模型影响过大,因此,一般会进行数据规范化或者标准化,使得所有特征尺度保持一致。常见的方法有最小-最大规范化和Z-score规范化[76]。见式(1)、(2)。
x'=ma(x)xX(-)-mmi(in X)nX(new_maxX-new_minX)+new_minX(1)
式中:minX、maxX分别为属性X的最小值和最大值,属性X上的值x通过最小-最大规范化映射到区间[new_minX,new_maxX]上的x'。
Z=(2)
式中:μ和S分别为属性X的平均值和标准差,属性X上的值x通过Z-score规范化后变为Z。
3.1.2.3特征提取
在采集到的大量数据中,不是所有的特征对于模型训练和预测都是有效的,有些特征可能存在高度线性相关的关系,此时需要对数据进行特征提取,得到有效信息和关键特征。通过分析数据特点和认为需求,从原始数据中提取或生成有用的特征,为模型提供高质量的输入数值,使数据更适合模型的训练与预测,提高模型准确率,降低过拟合风险。
首先,需要从原始特征集合中选择出最有价值的一部分特征,用于训练模型,以减少过拟合的风险和提高模型的性能效果。选择与城市内涝相关性高的特征,比如降雨量、排水系统的类型和状况等特征,可以构建精度更高的模型,因为这些特征可能会直接影响到城市内涝的发生。常见的特征选择方法有过滤法、包装法和嵌入法等[77]。然后,从原始数据集中提取出一些能反映数据本质的特征。特征提取可以有效地提高算法的性能,并有助于降低所需处理数据的维度。特征提取的方法一般包括主成分分析(Principal Component Analysis,PCA)[78]、线性判别分析(Linear Discriminant Analysis,LDA)等[79]。城市排水系统数据、城市内涝点数据、气候数据、地形地貌数据等对于城市内涝的产生有重要影响,对这些数据的处理和分析需要具体的特征提取技术。例如将地理信息系统数据,如高度、坡度、河流分布等转变为易于模型处理的数值特征。
3.2模型选择与建立
模型选择与建立是机器学习模型的核心环节。选择与数据特性相匹配的模型,能够更精确地捕获到数据的模式和规律,从而提高模型的性能表现。这不仅有助于提升预测结果的准确性,还能增强模型在实际应用中的可靠性和有效性。此外,选择合适的模型也能提高计算效率,降低计算成本和计算时长。图3所示是城市内涝领域中一些常见的机器学习模型、深度学习模型和集成学习方法。
3.2.1统计学习理论模型
机器学习模型是一种能够自我学习并优化其性能的算法模型,它通过数据对现实世界中的现象进行建模,并通过学习这些数据中的规律与模式,进行预测或决策任务[80]。统计学习理论模型是机器学习模型的一个重要分支,其利用统计学原理对数据进行预测和分析。在机器学习模型中,常见的统计学习理论模型有线性回归[81]、决策树[82]、随机森林[83]、支持向量机[84]、K-近邻算法[85]和朴素贝叶斯[86]等。
3.2.2深度学习模型
深度学习模型是一类受人脑神经网络启发的机器学习算法,它们通过构建类似于人脑的分层模型结构,对输入数据进行逐级提取从底层到高层的数据[87],通过这种方式能够有效地建立从底层信号到高层语义的映射关系,使得模型在处理复杂数据时表现出优异的能力。深度学习模型通常由输入层、多个隐藏层和输出层组成,每一层都包含多个神经元。这种多层结构使得模型能够学习数据中的复杂模式和特征。常见的深度学习模型有卷积神经网络[88]、循环神经网络及其变体长短期记忆网络和门控循环单元网络[89]、注意力机制模型[90]、强化学习模型[91]、图神经网络[92]和多层感知器[93]等。
3.2.3集成学习
集成学习指的是将多个模型的预测结果结合起来,以此提高模型的预测性能和稳定性的方法。集成学习作为一种组合优化的学习方法,不仅能通过集成多个简单模型来获得一个性能更好的优化模型,而且还允许研究者针对具体的问题设计特定的组合方案,从而得到更为强大的解决方案[94]。常见的集成学习方法有Stacking[95]、Boosting[96]、Dagging[97]等。
3.3模型训练与优化
机器学习模型的关键在于模型的训练与优化,对模型进行优化可以有效减少模型的过拟合或欠拟合现象,从而提升模型在新数据上的预测能力和泛化能力。图4所示,这一过程涉及数据的划分、模型的训练、模型的评估以及模型的优化等环节。
3.3.1数据划分
数据的划分过程会将原始数据集划分为3个部分,分别为训练集、验证集和测试集。训练集的作用是训练并建立模型,验证集则用于调整模型参数,进而优化模型性能,测试集的目的在于评估模型的泛化能力与整体性能。
3.3.2训练模型
通过选择合适的损失函数、优化器、学习率等参数来开始模型的训练过程。损失函数用于度量模型预测的准确性,优化器则用于更新和调整模型参数以减小损失函数,而学习率则决定了优化器修改模型参数的步长。
3.3.3模型评估
在模型训练之后,使用多项指标来评估模型的泛化能力和其整体性能。每个评估指标在不同的场景下都有其特定意义,能够从不同的角度来反映模型的性能。常见的指标有均方误差(MSE)、均方根误差(RMSE)、决定系数(R²)、F1分数(F1 Score)、召回率(Recall)、精度(Precision)等,公式如下:
式中:yi为第i个实际观测值;y i为第i个预测值;y(ˉ)为观测值的平均值;TP为真正例的数量;FP为假正例的数量;FN为假负例的数量。
3.3.4模型优化
为了进一步提高模型的准确率,将会采用超参数调整、模型结构调整、集成学习等策略对模型进行精细调优。超参数调整指的通过调整学习率、迭代次数等参数来提升模型的性能。模型结构调整是通过改变模型的基本结构,如模型的层数、每层的节点数等来提高模型的效果。而集成学习则是通过结合多个模型的预测结果,以此提高模型的准确率。
4技术瓶颈与解决方案
机器学习模型在城市内涝的模拟与预报中具有巨大的潜力和价值,它能够通过分析大量复杂的相关数据来识别潜在的洪水风险区域,预测洪水发生的可能性和严重程度,并为决策者提供及时的预警信息。但是其在当前的应用场景下仍然存在着一些需要解决的技术瓶颈与挑战。以下是目前存在的一些困难与可能的解决方案。
4.1数据质量与可用性问题
城市内涝模拟预报需要大量的气象、地理信息等数据,高质量、可靠、实时的数据是一个高准确性模型的基础[98]。但是收集这些数据往往需要投入大量的财力、人力和物力,对于大多数城市而言,尤其是发展中国家的城市,长期连续的降水和积水数据可能难以获得,这限制了模型训练的深度和广度。此外,不同类型传感器在不同区域收集的数据在时间分辨率、空间覆盖和精度上存在差异,从而导致数据格式上产生了差异。
对于上述问题,可以采用数据融合、数据共享等技术来解决,以确保数据的高质量和可用性。为了提高城市内涝模拟与预报的准确性和效率,可以采用更先进的数据融合算法。这些算法能够整合来自不同来源的异构数据,包括但不限于气象数据、地形地貌数据以及社交媒体数据等。此外,可以推动跨地区、跨行业建立数据共享协议,确定数据的格式与精度,从而提高数据的收集效率和覆盖范围。这些措施不仅可以在一定程度上解决数据质量与格式问题,还可以提升模型预报的准确性。
4.2模型泛化与计算性能
城市内涝模拟预报的准确性受到多种因素的影响,其中包括气候条件、地理特征和城市规划系统的多样性。不同的城市具有不同的气候条件、地理特征和城市规划系统,现有的模型往往很难应用到不同的场景中去。即使在同一城市中,不同流域的水文情况也有所不同,这对于模型的泛化能力来说是一个挑战。为了获得高精度、实时的预报结果,往往需要建立一个高度复杂的模型,这就需要消耗大量的计算资源,也会导致高额的计算成本[99]。例如,高度复杂的模型可能需要大量的训练数据和计算时间,这在资源有限的情况下难以实现。
为解决上述问题,可以在模型设计方面,尽可能地将不同场景下的特性融合到模型中去,以此提高模型的泛化能力。例如,可以采用特征选择的方法从原始数据中识别出最有价值的特征,从而减少模型的复杂程度。或者通过调整模型层数等方法来优化模型结构,以适应不同场景的应用需求。通过运用这些方法可以有效提高模型的性能和泛化能力。此外,也可以通过分布式计算或者云计算技术等方法来提升计算性能和降低计算成本。分布式计算允许模型在多个处理器上并行训练,而云计算提供了按需扩展的计算资源。两者都有助于优化计算资源的分配和利用,从而降低计算成本并提高计算效率。
4.3模型的不确定性和可解释性
模型的不确定性指的是模型预测结果的可信度和一致性问题。在模型的训练过程中,输入数据中可能包含着不确定性,如测量误差、建模假设或模型参数估计。这些不确定性可能在整个算法中传播,从而影响模型的预测能力,导致模型的不确定性[100]。此外,模型的不确定性还可能来源于未来事件的不可预测性以及外部环境的动态变化。例如,气候变化导致的降水变化、城市排水系统和相关基础设施的更新与维护等因素都可能导致模型的不确定性。许多机器学习模型由于缺乏可解释性而被称为黑盒。在城市内涝模拟预报领域中,相关决策者和管理者需要了解模型的预测原理,才可以理解预测结果并采取相关的行动,模型缺乏可解释性对于应急决策来说十分不利。
模型的不确定性问题可以采取交叉验证、敏感性分析和贝叶斯方法等解决。例如,可以通过应用贝叶斯统计来量化模型参数的不确定性,帮助处理与气候、地形和其他影响因素相关的不确定性。对于模型的可解释性问题,可以采用简化模型、可视化等方法来提高模型的可解释性。例如,使用解释性更强的模型,如线性回归或决策树等,或者开发可视化工具来展示模型的决策边界和特征交互,并且允许用户通过调整参数来观察模型预测的变化。
5结论
5.1机器学习模型技术优势
随着机器学习技术的快速发展,该技术已经逐渐应用于城市内涝模拟预报中。机器学习模型可以对历史降水数据和积水数据进行深入分析,获取容易发生内涝的区域信息。通过与物联网技术结合,机器学习模型可以对收集到的大量的城市数据进行数据融合,从而提升模型的准确率,并且可以实时监控和预测城市内涝情况,为城市防灾减灾策略提供更为及时、准确的信息。目前已经有多种机器学习算法应用于城市内涝模拟预报中,例如长短期记忆网络、卷积神经网络和循环神经网络等,通过这些算法构建的预测模型,可以进行更复杂的内涝情况模拟,从而对城市内涝情况进行更高精度的模拟预报。
相对于传统的城市内涝模拟预报模型,基于机器学习算法的城市内涝模拟预报模型可以分析和处理更大规模、更高维度的数据,这在传统的模型中往往很难实现。此外,基于机器学习算法的模型拥有模式识别和自我学习能力,能够从历史数据中学习到各种复杂的模式和通过迭代学习不断自我优化,从而提升模型的准确率。基于机器学习算法的模型不仅可以通过数据增强、特征提取、集成学习等技术提高模型的泛化能力,使其能在不同条件下提供较为准确的预测;而且还能够处理大量的输入变量和复杂的非线性关系,从而更好地模拟城市内涝。
5.2发展方向与应用展望
随着机器学习技术的不断发展和进步,未来其在城市内涝模拟预报中的发展方向和应用前景可能有以下3个方面。
a)多元数据融合。随着城市化进程的不断推进和传感技术的不断发展,未来机器学习模型可以处理和分析更大规模的数据,例如城市排水系统数据、城市内涝点、气象数据和城市地形地貌数据等,以此提升模型的准确性和可靠性。同时,机器学习模型也可以融合不同来源的数据,例如社交媒体数据、社区数据等,实时监测和分析城市内涝情况,为城市管理者提供更为全面、细致的数据,从而能更好地应对城市内涝灾害。
b)大模型的运用。借助大模型,机器学习模型不仅能模拟预报城市内涝,而且还能辅助城市决策者制定防灾救灾策略和应急行动方案,从而减少灾害所带来的经济损失。例如,通过城市内涝模拟预报,可以为管理者优化城市排水系统,提前发现可能存在的隐患点,也可以为决策者提供更为具体的建议,如优先实施救援的地区等。
c)优化排水管网。在未来城市排水系统管理中,机器学习模型将逐渐占据更为重要的地位。通过运用机器学习模型,城市管理者能够快速识别城市排水系统中存在的隐患和问题,并及时做出调整,优化城市排水系统。此外,机器学习模型的应用,可以推动智慧城市的建设,建设自动化、智能化的城市排水系统,例如自动化排水系统、智能雨水收集系统等。
参考文献:
[1]徐宗学,陈浩,任梅芳,等.中国城市洪涝致灾机理与风险评估研究进展[J].水科学进展,2020,31(5):713-724.
[2]张冬冬,严登华,王义成,等.城市内涝灾害风险评估及综合应对研究进展[J].灾害学,2014,29(1):144-149.
[3]王伟武,汪琴,林晖,等.中国城市内涝研究综述及展望[J].城市问题,2015(10):24-28.
[4]中国气象科普网.浅谈城市内涝[EB/OL].[2024-04-25].http://www.qxkp.net/zhfy/byhl/202103/t20210301_2789223.html.
[5]WANG L H,CUI S H,LI Y Z,et al.A review of the flood management:from flood control to flood resilience[J].Heliyon,2022,8(11).DOI:10.1016/j.heliyon.2022.e11763.
[6]何昕宇,田文翀,张智宇,等.基于数据驱动的洪涝风险评估方法研究进展[J].人民珠江,2022,43(5):60-67.
[7]宋晓猛,徐楠涛,张建云,等.中国城市洪涝问题:现状、成因与挑战[J].水科学进展,2024,35(3):357-373.
[8]黄华兵,王先伟,柳林.城市暴雨内涝综述:特征、机理、数据与方法[J].地理科学进展,2021,40(6):1048-1059.
[9]连悦辰,高路,马苗苗,等.基于自然灾害系统理论的2020年鄱阳湖流域1号洪水灾害分析[J].人民珠江,2022,43(1):19-27.
[10]中华人民共和国水利部.中国水旱灾害防御公报2023[M].北京:中国水利水电出版社,2024.
[11]中华人民共和国水利部.中国水旱灾害公报2012[M].北京:中国水利水电出版社,2013.
[12]周清树,孟祥超,贾世煜.台风袭粤25人亡多地海水倒灌漫堤[EB/OL].[2024-05-05].http://epaper.bjnews.com.cn/html/2013-09/24/content_467315.htm?div=-1.
[13]李佳赟,徐小勇.台风致宁波经济损失27亿葡萄园成“池塘”[EB/OL].[2024-05-05].https://www.chinanews.com/gn/2015/07-12/7400052.shtml.
[14]LIU X Y,YANG S N,YE T,et al.A new approach to estimating flood-affected populations by combining mobility patterns with multi-source data:A case study of Wuhan,China[J].International Journal of Disaster Risk Reduction,2021,55.DOI:10.1016/j.ijdrr.2021.102106.
[15]SMITH A B.2017 U.S.billion-dollar weather and climate disasters:a historic year in context[EB/OL].[2024-05-07].https://www.climate.gov/disasters-2017.
[16]SINGH G P,KHOLE M,SHINDE A,et al.A study of extremerainfall events and urban flooding over Hyderabad,October 2020[J].MAUSAM,2024,75(2):443-460.
[17]新华社.河南郑州“7·20”特大暴雨灾害调查报告公布[EB/OL].[2024-05-07].https://www.gov.cn/xinwen/2022-01/21/content_5669723.htm?eqid=d58efa4100289e8900000004646dc 1bc.
[18]MATA P,CULLANO R A,TIU A M,et al.Public satisfaction with the government's disaster response during Typhoon Odette(Rai)[J].International Journal of Disaster Risk Reduction,2023,84.DOI:10.1016/j.ijdrr.2022.103483.
[19]中华人民共和国应急管理部.国家防灾减灾救灾委员会办公室应急管理部发布2023年全国十大自然灾害[EB/OL].[2024-05-07].https://www.mem.gov.cn/xw/yjglbgzdt/202401/t20240120_475696.shtml.
[20]郑澍,陈惠婷.广东平远县强降雨已造成38人死亡、2人失联[EB/OL].[2024-06-22].https://content-static.cctvnews.cctv.com/snow-book/index.html?item_id=8679422292202537235.
[21]李艳富,韩昌海,李子祥,等.琴键堰泄流能力影响因素与计算分析研究[J].水利水运工程学报,2022(6):16-24.
[22]YANG Q,ZHENG X Z,JIN L H,et al.Research Progress of Urban Floods under Climate Change and Urbanization:A Scientometric Analysis[J].Buildings,2021,11(12).DOI:10.3390/buildings11120628.
[23]邓晓斌.城市内涝形成原因及解决措施探讨[J].价值工程,2019,38(23):104-105.
[24]谷桂华,李学辉,余守龙,等.气候变化和人类活动对南盘江上游径流的定量影响[J].人民珠江,2020,41(2):21-27.
[25]BERNDTSSON R,BECKER P,PERSSON A,et al.Drivers of changing urban flood risk:A framework for action[J].Journal of Environmental Management,2019,240:47-56.
[26]夏军,张印,梁昌梅,等.城市雨洪模型研究综述[J].武汉大学学报(工学版),2018,51(2):95-105
[27]谢映霞.从城市内涝灾害频发看排水规划的发展趋势[J].城市规划,2013,37(2):45-50.
[28]ZHOU Q Q,LENG G Y,SU J H,et al.Comparisonofurbanization and climate change impacts onurban flood volumes:Importance of urban planning and drainage adaptation[J].Science of The Total Environment,2019,658:24-33.
[29]郝天文,孔彦鸿.城市排水系统的困局与重构[J].城市规划,2019,43(8):103-107.
[30]卢健涛,侯贵兵,李媛媛,等.城市内涝决策支持系统的研究及展望[J].人民珠江,2020,41(2):134-139,146.
[31]王峰,颜正惠,黄伟乐,等.城市雨水内涝成因及对策[J].中国给水排水,2012,28(12):15-17,20.
[32]代鑫,黄弘,汲欣愉,等.基于机器学习的城市暴雨内涝时空快速预测模型[J].清华大学学报(自然科学版),2023,63(6):865-873.
[33]李智星.基于机器学习的城市内涝快速模拟预报方法研究[D].西安:西安理工大学,2023.
[34]刘媛媛,刘洪伟,霍风霖,等.基于机器学习短历时暴雨时空分布规律研究[J].水利学报,2019,50(6):773-779.
[35]张莉.基于雨洪仿真和机器学习的城市内涝快速预测研究[D].深圳:深圳大学,2022.
[36]NGUYEN D H,BAE D H.Correcting mean areal precipitation forecasts to improve urban flooding predictions by using long short-term memory network[J].Journal of Hydrology,2020,584.DOI:10.1016/j.jhydrol.2020.124710.
[37]KIM H I,HAN K Y.Urban Flood Prediction Using Deep Neural Network with Data Augmentation[J].Water,2020,12(3).DOI:10.3390/w12030899.
[38]PUTTINAOVARAT S,HORKAEW P.Flood Forecasting System Based on Integrated Big and Crowdsource Data by Using Machine Learning Techniques[J].IEEE Access,2020,8:5885-5905.
[39]WU Z N,ZHOU Y H,WANG H L,et al.Depth prediction of urban flood under different rainfall return periods based on deep learning and data warehouse[J].Science of The Total Environment,2020,716.DOI:10.1016/j.scitotenv.2020.137077.
[40]KIM H I,KIM B H.Flood Hazard Rating Prediction for Urban Areas Using Random Forest and LSTM[J].KSCE Journal of Civil Engineering,2020,24:3884-3896.
[41]ZHAO G,PANG B,XU Z X,et al.Urban flood susceptibility assessment based on convolutional neural networks[J].Journal of Hydrology,2020,590.DOI:10.1016/j.jhydrol.2020.125235.
[42]LI Z F,LIU H X,LUO C B,et al.Assessing Surface Water Flood Risks in Urban Areas Using Machine Learning[J].Water,2021,13(24).DOI:10.3390/w13243520.
[43]DARABI H,HAGHIGHI A T,RAHMATI O,et al.A hybridized model based on neural network and swarm intelligence-grey wolf algorithm for spatial prediction of urban flood-inundation[J].Journal of Hydrology,2021,603.DOI:10.1016/j.jhydrol.2021.126854.
[44]PANAHI M,JAAFARI A,SHIRZADI A,et al.Deep learning neural networks for spatially explicit prediction of flash flood probability[J].Geoscience Frontiers,2021,12(3).DOI:10.1016/j.gsf.2020.09.007.
[45]MOISHIN M,DEO R C,PRASAD R,et al.Deep-Based Learning Flood Forecast Model With ConvLSTM Hybrid Algorithm[J].IEEE Access,2021,9:50982-50993.
[46]RAFIEI-SARDOOI E,AZAREH A,CHOUBIN B,et al.Evaluating urban flood risk using hybrid method of TOPSIS and machine learning[J].International Journal of Disaster Risk Reduction,2021,66.DOI:10.1016/j.ijdrr.2021.102614.
[47]LEI X X,CHEN W,PANAHI M,et al.Urban flood modeling using deep-learning approaches in Seoul,South Korea[J].Journal of Hydrology,2021,601.DOI:10.1016/j.jhydrol.2021.126684.
[48]HOU J M,ZHOU N,CHEN G Z,et al.Rapid forecasting of urban flood inundation using multiple machine learning models[J].Natural Hazards,2021,108:2335-2356.
[49]MOTTA M,NETO M D C,SARMENTO P.A mixed approach for urban flood prediction using Machine Learning and GIS[J].International Journal of Disaster Risk Reduction,2021,56.DOI:10.1016/j.ijdrr.2021.102154.
[50]KILSDONK R A H,BOMERS A,WIJNBERG K M.Predicting Urban Flooding Due to Extreme Precipitation Using a Long Short-Term Memory Neural Network[J].Hydrology,2022,9(6).DOI:10.3390/hydrology9060105.
[51]TAROMIDEH F,FAZLOULA R,CHOUBIN B,et al.Urban Flood-Risk Assessment:Integration of Decision-Making and Machine Learning[J].Sustainability,2022,14(8).DOI:10.3390/su14084483.
[52]ZHAO J,LI Y,MATGEN P,et al.Urban-Aware U-Net for Large-Scale Urban Flood Mapping Using Multitemporal Sentinel-1 Intensity and Interferometric Coherence[J].IEEE Transactions on Geoscience and Remote Sensing,2022,60:1-21.
[53]LIU Y Z,ZHANG W T,YAN Y,et al.An Effective Rainfall-Ponding Multi-Step Prediction Model Based on LSTM for Urban Waterlogging Points[J].Applied Sciences,2022,12(23).DOI:10.3390/app122312334.
[54]SELEEM O,AYZEL G,DE SOUZA A C T,et al.Towards Urban Flood Susceptibility Mapping Using Data-Driven Models in Berlin,Germany[J].Geomatics,Natural Hazards and Risk,2022,13(1):1640-1662.
[55]SAMPURNO J,ARDIANTO R,HANERT E.Integrated machine learning and GIS-based bathtub models to assess the future flood risk in the Kapuas River Delta,Indonesia[J].Journal of Hydroinformatics,2023,25(1):113-125.
[56]ZHOU Q Q,TENG S,SITU Z X,et al.A deep-learning-technique-based data-driven model for accurate and rapid flood predictions in temporal and spatial dimensions[J].Hydrology and Earth System Sciences,2023,27:1791-1808.
[57]ZHU W,TAO T,YAN H,et al.An optimized long short-term memory(LSTM)-based approach applied to early warning and forecasting of ponding in the urban drainage system[J].Hydrology and Earth System Sciences,2023,27:2035-2050.
[58]ZHANG W T,HU B,LIU Y Z,et al.Urban Flood Risk Assessment through the Integration of Natural and Human Resilience Based on Machine Learning Models[J].Remote Sensing,2023,15(14).DOI:10.3390/rs15143678.
[59]HAYDER I M,AL-AMIEDY T A,GHABAN W,et al.An Intelligent Early Flood Forecasting and Prediction Leveraging Machine and Deep Learning Algorithms with Advanced Alert System[J].Processes,2023,11(2).DOI:10.3390/pr11020481.
[60]CHEN J,LI Y W,ZHANG C H,et al.Urban Flooding Prediction Method Based on the Combination of LSTM Neural Network and Numerical Model[J].International Journal of Environmental Research and Public Health,2023,20(2).DOI:10.3390/ijerph20021043.
[61]LI Y,OSEI F B,HU T G,et al.Urban flood susceptibility mapping based on social media data in Chengdu city,China[J].Sustainable Cities and Society,2023,88.DOI:10.1016/j.scs.2022.104307.
[62]HOP F J,LINNEMAN R,SCHNITZLER B,et al.Real time probabilistic inundation forecasts using a LSTM neural network[J].Journal of Hydrology,2024,635.DOI:10.1016/j.jhydrol.2024.131082.
[63]EL BAIDA M,BOUSHABA F,CHOURAK M,et al.Real-Time Urban Flood Depth Mapping:Convolutional Neural Networks for Pluvial and Fluvial Flood Emulation[J].Water Resources Management,2024,38.DOI:10.1007/s11269-024-03886-w.
[64]BURRICHTER B,KOLTERMANN DA SILVA J,NIEMANN A,et al.A Temporal Fusion Transformer Model to Forecast Overflow from Sewer Manholes during Pluvial Flash Flood Events[J].Hydrology,2024,11(3).DOI:10.3390/hydrology11030041.
[65]SHAO Y,CHEN J R,ZHANG T Q,et al.Advancing rapid urban flood prediction:a spatiotemporal deep learning approachwith uneven rainfall and attention mechanism[J].Journal of Hydroinformatics,2024,26(6):1409-1424.
[66]刘新,赵宁,郭金运,等.基于LSTM神经网络的青藏高原月降水量预测[J].地球信息科学学报,2020,22(8):1617-1629.
[67]ZHANG B L,OUYANG C J,CUI P,et al.Deep learning for cross-region streamflow and flood forecasting at a global scale[J].The Innovation,2024,5(3).DOI:10.1016/j.xinn.2024.100617.
[68]李海辰,冯文文,张少恺,等.城市洪涝灾害防御中的前沿信息技术应用[J].中国安全科学学报,2022,32(9):137-143.
[69]解智强,杜清运,高忠,等.GIS与模型技术在城市排水管线承载力评价中的应用[J].测绘通报,2011(12):50-53.
[70]YAN Z Y,GUO X G,ZHAO Z L,et al.Achieving fine-grained urban flood perception and spatio-temporal evolution analysis based on social media[J].Sustainable Cities and Society,2024,101.DOI:10.1016/j.scs.2023.105077.
[71]唐炉亮,赵紫龙,杨雪,等.大数据环境下道路场景高时空分辨率众包感知方法[J].测绘学报,2022,51(6):1070-1090.
[72]汤国安.我国数字高程模型与数字地形分析研究进展[J].地理学报,2014,69(9):1305-1325.
[73]王曰芬,章成志,张蓓蓓,等.数据清洗研究综述[J].现代图书情报技术,2007(12):50-56.
[74]胡昊,孙爽,马鑫,等.基于图注意力网络的城市内涝积水预测与研究[J].人民黄河,2024,46(4):43-48.
[75]李晓菲.数据预处理算法的研究与应用[D].成都:西南交通大学,2006.
[76]彭高辉,王志良.数据挖掘中的数据预处理方法[J].华北水利水电学院学报,2008,29(6):61-63.
[77]李郅琴,杜建强,聂斌,等.特征选择方法综述[J].计算机工程与应用,2019,55(24):10-19.
[78]LEVER J,KRZYWINSKI M,ALTMAN N.Principalcomponent analysis[J].Nature Methods,2017,14:641-642.
[79]崔自峰,吉小华.基于线性判别分析的特征选择[J].计算机应用,2009,29(10):2781-2785.
[80]杨剑锋,乔佩蕊,李永梅,等.机器学习分类问题及算法研究综述[J].统计与决策,2019,35(6):36-40.
[81]汪奇生.线性回归模型的总体最小二乘平差算法及其应用研究[D].昆明:昆明理工大学,2015.
[82]杨学兵,张俊.决策树算法及其核心技术[J].计算机技术与发展,2007(1):43-45.
[83]方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38.
[84]丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10.
[85]毋雪雁,王水花,张煜东.K最近邻算法理论与应用综述[J].计算机工程与应用,2017,53(21):1-7.
[86]CHEN J N,HUANG H K,TIAN S F,et al.Featureselection for text classification with Naïve Bayes[J].Expert Systems with Applications,2009,36(1):5432-5435.
[87]余凯,贾磊,陈雨强,等.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804.
[88]李彦冬,郝宗波,雷航.卷积神经网络研究综述[J].计算机应用,2016,36(9):2508-2515,2565.
[89]杨丽,吴雨茜,王俊丽,等.循环神经网络研究综述[J].计算机应用,2018,38(S2):1-6,26.
[90]任欢,王旭光.注意力机制综述[J].计算机应用,2021,41(S1):1-6.
[91]刘全,翟建伟,章宗长,等.深度强化学习综述[J].计算机学报,2018,41(1):1-27.
[92]马帅,刘建伟,左信.图神经网络综述[J].计算机研究与发展,2022,59(1):47-80.
[93]MURTAGH F.Multilayerperceptrons for classification and regression[J].Neurocomputing,1991,2(5/6):183-197.
[94]徐继伟,杨云.集成学习方法:研究综述[J].云南大学学报(自然科学版),2018,40(6):1082-1092.
[95]周星,丁立新,万润泽,等.分类器集成算法研究[J].武汉大学学报(理学版),2015,61(6):503-508.
[96]于玲,吴铁军.集成学习:Boosting算法综述[J].模式识别与人工智能,2004,17(1):52-59.
[97]YARIYAN P,JANIZADEH S,VAN PHONG T,et al.Improvement of Best First Decision Trees Using Bagging and Dagging Ensembles for Flood Probability Mapping[J].Water Resources Management,2020,34:3037-3053.
[98]WU W Y,EMERTON R,DUAN Q Y,et al.Ensemble flood forecasting:Current status and future opportunities[J].WIREs Water,2020,7(3).DOI:10.1002/wat2.1432.
[99]KUMAR V,AZAMATHULLA H M,SHARMA K V,et al.The State of the Art in Deep Learning Applications,Challenges,and Future Prospects:A Comprehensive Review of Flood Forecasting and Management[J].Sustainability,2023,15(13).DOI:10.3390/su151310543.
[100]汪卫,廖杰林,朱少坤.机器学习在大坝渗流预测中的应用、挑战与展望[J].人民珠江,2024,45(4):1-10.
(责任编辑:高天扬)