基于优化深度学习的西南地区极端降雨事件预测模型构建
2024-05-21李遥
李 遥
(重庆市水利电力建筑勘测设计研究院有限公司,重庆 401121)
近年来,随着极端气候的发生,极端降雨事件在区域内的发生频率也逐渐增加,这在很大程度上限制了区域经济发展,严重危害了居民的人身安全[1-2]。为分析极端降雨事件的发生规律,国内学者在不同区域做了相应研究,并取得了一定的研究成果。王卫平等[3]分析了新疆地区极端降雨事件的时空分布特征,研究表明,区域多年极端降雨事件呈增加趋势;杜颖恩等[4]分析了西安市极端降雨的发生规律,同样指出了西安市极端降雨事件呈现逐渐增加趋势;苗正伟等[5]研究了京津冀地区极端降水事件分布特征,也得出了相同的结论。
为进一步分析区域极端降雨事件的变化规律,相关学者构建了区域极端降雨事件预测模型。沈黎[6]基于高斯回归模型、梯度提升树模型等4种机器学习模型构建了浙江省极端降雨事件预测模型,并得出了精度最高模型;李春宇[7]基于优化的支持向量机模型构建了重庆极端降雨事件预测模型,并取得了较高的精度。截至目前,针对大尺度区域极端降雨事件的研究仍然较少。因此,本文以西南地区为研究区域,基于混合深度学习理论构建大尺度区域极端降雨事件预测模型,为区域防汛抗旱政策的制定提供参考。
1 研究区域概况及数据来源
1.1 研究区域概况
西南地区主要包括四川、贵州、重庆、云南、广西5省(自治区、直辖市),区域地形复杂,气候多变。为寻找区域极端降雨事件的最优预测模型,本文选择了西南地区共计113个气象站点的逐日气象数据进行研究,研究区域基本情况及站点分布见图1。
图1 研究区域概况
1.2 数据来源
本文共选择西南地区113个气象站点1961—2018年的逐日气象数据,包括日降雨量、最高温度、最低温度、日照时数、风速和相对湿度等数据,数据均来自国家气象中心,数据序列质量良好。为构建区域极端降雨事件预测模型,本文选择了中雨日数R10、大雨日数R20、湿日降雨量PRCPTOT、1日最大降雨量RX1共4种极端降雨指数进行研究,不同指数的具体含义可见文献[8]。
2 研究方法
2.1 卷积神经网络模型
卷积神经网络模型(CNN)是深度学习算法的一种[9],该模型具有卷积层和池化层结构,可实现对数据的卷积、提取和采样压缩。该模型通过对输入数据的逐层卷积和池化,提取数据特征,从而提高模型计算精度。
2.2 长短期记忆神经网络模型
长短期记忆神经网络模型(LSTM)是一种考虑了时间序列的循环神经网络模型,其主要特点可通过门结构实现对数据的处理和计算,从而提高模型训练速度[10]。
2.3 CNN-LSTM模型
为综合运用以上两种模型的优点,本文将CNN模型和LSTM模型进行组合,采用CNN模型结构分析训练数据的内在规律,采用LSTM模型进行极端降水事件预测,从而进一步提高模型精度。
2.4 孔雀优化算法
为进一步提高算法精度,本文采用孔雀优化算法(POA)对CNN-LSTM模型进行优化。POA算法主要通过模拟雌雄孔雀的求偶、觅食行为来实现种群位置的更新,算法具体步骤可见文献[11]。
2.5 模型精度比较
为验证POA-CNN-LSTM模型的精度,采用粒子群算法(PSO)和遗传算法(GA)对CNN-LSTM模型进行优化,同时将模型精度与随机森林模型(RF)和广义回归神经网络模型(GRNN)进行比较。选择均方根误差RMSE、相对均方根误差RRMSE、纳什系数NS、决定系数R2来综合评价模型精度,具体公式如下:
(1)
(2)
(3)
(4)
3 结果与分析
3.1 不同模型模拟精度对比
不同模型模拟R10的精度箱线图见图2。由图2可知,优化后的模型和组合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,该模型模拟R10的RMSE和RRMSE分别为1.503d和1.544%,NS和R2分别为0.981和0.973,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未组合的模型精度较组合模型有所降低,但仍高于传统模型,其中POA-LSTM模型的精度较高,表明POA算法的性能优于PSO算法和GA算法,该模型模拟R10的RMSE和RRMSE分别为3.422d和6.931%,NS和R2分别为0.905和0.879。传统模型中,LSTM模型精度最高。
图2 R10精度箱线图
不同模型模拟R20的精度箱线图见图3。由图3可知,优化后的模型和组合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,该模型模拟R20的RMSE和RRMSE分别为1.997d和1.867%,NS和R2分别为0.983和0.976,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未组合的模型精度较组合模型有所降低,但仍高于传统模型,其中POA-LSTM模型的精度较高,表明POA算法的性能优于PSO算法和GA算法,该模型模拟R20的RMSE和RRMSE分别为5.548d和8.309%,NS和R2分别为0.910和0.869。传统模型中LSTM模型精度最高。
图3 R20精度箱线图
不同模型模拟RX1的精度箱线图见图4。由图4可知,优化后的模型和组合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,该模型模拟RX1的RMSE和RRMSE分别为2.642mm和1.272%,NS和R2分别为0.980和0.978,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未组合的模型精度较组合模型有所降低,但仍高于传统模型,其中POA-LSTM模型的精度较高,表明POA算法的性能优于PSO算法和GA算法,该模型模拟RX1的RMSE和RRMSE分别为5.556mm和5.309%,NS和R2分别为0.865和0.879。传统模型中,LSTM模型精度最高。
图4 RX1精度箱线图
不同模型模拟PRCPTOT的精度箱线图见图5。由图5可知,优化后的模型和组合模型均可提高模型精度,在所有模型中,POA-CNN-LSTM模型的精度最高,该模型模拟RX1的RMSE和RRMSE分别为7.599mm和1.726%,NS和R2分别为0.976和0.975,PSO-CNN-LSTM模型和GA-CNN-LSTM模型精度次之;未组合的模型精度较组合模型有所降低,但仍高于传统模型,其中POA-LSTM模型的精度较高,表明POA算法的性能优于PSO算法和GA算法,该模型模拟PRCPTOT的RMSE和RRMSE分别为15.746mm和9.145%,NS和R2分别为0.823和0.869。传统模型中,LSTM模型精度最高。
为进一步验证不同模型精度,本文绘制了4种极端降水指数不同模型模拟值的泰勒图,结果见图6。可知POA-CNN-LSTM模型与标准值最为接近,表明该模型计算结果的一致性最高,误差最低,可作为区域极端降水事件的推荐模型使用。
图6 不同模型模拟值泰勒图
3.2 POA-CNN-LSTM模型普适性分析
为进一步验证POA-CNN-LSTM模型的精度,对该模型的普适性进行分析。在模拟4种指标时,随机选择四川、贵州、云南、广西4省(自治区)5个站点,随机以其中4个站点为训练站点,第5个站点为预测站点,模拟的4种极端降水事件精度见表1~表4。从中可知,在模拟4种极端降水事件时,误差较低,且一致性指标均在0.9以上,表明POA-CNN-LSTM模型具备较好的普适性,进一步证明了该模型的精度。
表1 POA-CNN-LSTM模型模拟R10普适性分析
表2 POA-CNN-LSTM模型模拟R20普适性分析
表3 POA-CNN-LSTM模型模拟RX1普适性分析
表4 POA-CNN-LSTM模型模拟PRCPTOT普适性分析
4 结 论
本文基于组合模型思想,构建了CNN模型和LSTM模型的组合深度学习模型,并基于POA算法对CNN-LSTM模型进行了优化,与其余模型精度进行了对比,结果表明:POA-CNN-LSTM模型在所有模型中精度最高,在泰勒图中与标准值最为接近;且具备较高的普适性,可推荐其用于估算西南地区极端降水事件。