APP下载

人工神经网络在月降水量预测业务中的研究和应用综述

2021-04-12覃卫坚陆芊芊

气象研究与应用 2021年1期
关键词:降水量广西神经网络

何 慧,陆 虹,覃卫坚,陆芊芊

(广西壮族自治区气候中心,南宁 530022)

引言

我国地处季风气候区,受低纬度热带天气系统和中高纬度天气系统的交替影响,降雨量时空分布严重不均,尤其是夏季,各月降雨量的年际变率很大,常因强降雨的集中发生,导致河水暴涨、洪水泛滥、城市内涝、滑坡泥石流等,造成巨大的经济损失,甚至危及人民生命。另一方面,由于月、季降水量年际变化差异极大,致使干旱也频繁发生,对农业、林业、江河航运、旅游、水力发电及人民生活造成不同程度影响。然而,月、季降水量的年际变化具有显著的非线性、时变性特征,影响其变化的因素很多、很复杂,因此预测难度大,历来为重大气象灾害预测的重点和难点问题。

目前国内外大气学科研究和业务,从不同角度出发,开展月、季时间尺度的降水量短期气候预测,主要预测方法研究可分为数理统计预报方法、动力模式方法,以及动力统计预报三种方法。然而,所涉及的气候异常变化因子具有多样性和复杂性,以及这些因子相互作用的不确定性,相互作用的机理的认识还远远不够等实际问题,困扰了月、季降水量预测准确性的提高。因此,如何改进和提高月、季降水量预报准确性,一直受到国内外大气学科学者的广泛关注[1-6]。

如何深度挖掘隐藏在海量数据中的天气气候变化的物理机制,探索对其演变规律有指示意义的信号和建立新的短期气候预测方法,人工智能技术可以提供一种新的重要途径。人工智能技术为如何从海量数据中发掘有用的特征信息,提高数据核心信息的利用率,更有效的发掘提取模型,数据集的有效预报信息,提供了新的有效方法,已逐渐成为各行业专家和学者们关注的热点[7-11]。目前大气学科中采用神经网络,支持向量机,遗传算法,深度学习等非线性智能计算技术方法,在月、季降水量预报建模研究中,取得了很好的应用和研究成果。本文将从月、季降水量的BP 神经网络预测研究和业务应用等方面分别进行综述,以期为气象工作者开展继续深入研究提供有益参考。

1 月降水量预测的BP 神经网络方法

Back propagation(BP)神经网络具有高度的非线性映射能力,可以以任意精度逼近任意的连续函数,是目前应用较广的网络模型,特别适合于求解内部机制复杂的非线性问题,因此在气象学科的实际应用问题中获得了成功[7]。BP 算法由输入层、输出层和若干隐层组成,主要设计思想是采用有导师的学习训练方式,将输入信号通过隐层和输出层节点的处理计算得到的网络实际输出与期望输出相比较,利用前馈网络的误差逆传播学习算法,反复修正输入层到隐层、隐层到输出层的连接权系数,直到网络实际计算输出与期望输出的误差达到预先设定的误差收敛标准,则停止训练,从而获得泛化能力较好的网络模型[7]。

21 世纪以来国内外广泛开展了BP 神经网络的气象预报预测研究,并取得了较好的成果。在降水量预测研究和应用中,BP 神经网络结合了多种算法,取长补短,使其不断完善,其中应用较广的主要有PCA-BP 神经网络模型、遗传算法优化的神经网络、RBF 神经网络预测模型、小波神经网络模型、粒子群神经网络模型等。

1.1 PCA-BP 神经网络模型

主成分分析(Principal Component Analysis,PCA)是通过正交变换将一组可能存在相关性的变量,转换为一组线性不相关的变量,转换后的这组变量叫主成分。PCA 是一种降维方法,可以将多维向量空间场资料压缩到几个主要模态的特征提取方法,可以从随机噪声干扰的气象场有效提取主要信号特征。刘婷婷等[12]通过对PCA 和自然正交(Empirical Orthogonal Function,EOF)展开两种分析方法推导过程的比较,认为当变量是距平或标准化距平时,两者分析方法相同。胡江林等[13]用前期500hPa 月平均高度场、海平面气压和太平洋海温场的扩展EOF 展开的前几个主成分作为神经网络模型的输入,建立了汛期降水的神经网络短期气候预测模型。王业宏和金龙[14]从前期500hPa 高度场、海温场查找月降水量的初选预报因子,并作EOF 展开,然后选取与预报量相关程度高的主成分作为预测模型的输入,建立一种新的神经网络月降水量气候预测模型。该模型能有效地利用神经网络方法的非线性映射能力、且稳定性好,预测效果显著提高。吴有训等[15]采用PCA 分析方法,构造网络学习矩阵,降低矩阵维数,提高网络预测模型泛化性能,建立汛期降水神经网络预测模型,该模型对历年样本拟合精度高,试报效果较好。而牛志娟等[16]应用BP 神经网络、PCA-BP神经网络和偏最小二乘(PLS)算法建立了三种月降水量预测模型,通过比较发现PLS 模型的预测能力优于其它两种模型,PCA-BP 神经网络预测能力次之。

1.2 RBF 神经网络预测模型

径向基(Radial Basis Funtion,简称RBF)神经网络是BP 神经网络的一种特例,具有最佳逼近、训练简洁、学习收敛速度快以及克服局部最小值问题的性能,可从根本上解决BP 网络的局部最优问题,因此被广泛应用于模式识别、非线性控制和图像处理等领域。薛宇峰等[17]以湛江地区月降水量为时间序列,建立了一种智能型的RBF 神经网络预测系统,并进行了测试预报和独立样本预测。结果显示,该模型预测效果明显优于线性自回归预测模型,可为本地区提供一种客观化、自动化的短期气候预测方法。闭祖良等[18]应用RBF 神经网络与马尔可夫相结合,建立R-M 降水量预测模型,实例验证结果令人满意。冯亚文等[19]运用反向传播神经网络、RBF 神经网络、广义回归神经网络和多元线性回归法,建立月降水预测模型,用以预测长江上游各站未来一个月的降水量,总体上,人工神经网络模型优于多元线性回归。季刚等[20]综合运用RBF 神经网络建立月降水量预测模型,预测结果明显好于传统BP 神经网络。郭皓等[21]构建了基于K-均值算法的RBF 降水预测模型用于汛期月降水量预报中,有较好的预测效果。

1.3 小波神经网络模型

小波神经网络(Wavelet Neural Network,WNN)是在小波分析研究获得突破的基础上提出的一种人工神经网络,它作为国际上新兴的一种数学建模分析方法,充分继承了小波变换良好的时频局部化性质及神经网络的自学习功能和极强的非线性能力等优点。崔屾等[22]通过建立WNN 模型的方法,预测锦州市年降水量,结果表明该模型在对降雨量数据进行预测分析时具有较大优势。侯泽宇等[23]选择BP网络建立降水量预测模型,隐含层激发函数选取Morlet 小波,利用月降水资料对模型进行训练、检验,进而对降水量进行预测研究。结果表明,WNN 预测模型结构简单,收敛速度快,对降水量的变化趋势预测准确,具有较高的实际应用价值,但其对于降水量具体值的预测精度有待提高。董海彪等[24]运用WNN 方法预测吉林西部月降水量最大值、最小值和平均值,该方法精度较高、结果可靠。张帅等[25]选取了前馈神经网络模型、WNN 模型和整合移动平均自回归模型进行验证比较。结果表明,WNN 模型训练结果与实际值接近,预测精度较高。但熊海晶等[26]建立的BP 神经网络和WNN 月降水量预测模型,实例预测结果表明WNN 模型在某些年份预报误差较大,需要在实践中将多种预报方法相互验证和校核,以提高预报精度。

1.4 基于遗传算法的BP 网络模型

遗传算法(Genetic Algorithms,GA)是一种不依赖于梯度信息的群体搜索计算方法,可以获得较佳的网络结构,对于复杂非线性问题的求解十分有效,可以进一步提高神经网络方法的预报精度和增强预测模型的稳定性。吴建生和金龙[27]针对BP 神经网络在实际气象预报应用中,网络结构难以确定以及网络极易陷入局部解问题,用GA 优化神经网络的连接权和网络结构,建立GA-BP 网络模型,并以广西的月降水量进行实例分析,表明该方法预报精度高、而且稳定。吴有训等[28]以安徽宣城市汛期降水为例,建立GA-BP 网络预测模型,该方法计算稳定,预报误差小,可在实际预报中应用。胡邦辉等[29]建立了长江中下游汛期降水短期气候预测GA-BP模型,并对汛期的降水量进行预测试验,结果表明用竞争选择法、自适应交叉、变异和精英策略法组合构成的遗传算子方案预测值与观测值较为接近。

1.5 粒子群—神经网络模型

粒子群优化(Particle Swarm Optimization,PSO)解决了BP 神经网络易陷入局部极小,收敛速度慢和易引起振荡的固有缺陷,其基本思想是:首先采用改进粒子群优化算法,反复优化BP 神经网络模型的权值参数组合,再用BP 算法对得到的网络参数进一步精确优化,最后用精确的最优参数组合进行预测[30]。徐以山等[31]建立一种基于改进粒子群算法的人工神经网络(PSO-ANN)模型,通过对比表明,该模型具有较高的准备预报能力和稳定性。吴有训等[32]用PSO-ANN,建立降水量短期气候预测模型,对安徽宣城夏季各月降水预报检验,结果表明PSOANN 收敛速度快,迭代次数少,预测精度高,具有很好的推广应用前景。蒋林利和吴建生[33]对PSO-ANN模型、GA-神经网络模型和时间序列模型方法进行对比,认为PSO-ANN 模型学习能力强、泛化性能高和有效提高系统预测的准确率。王汉涛等[34]引入遗传、粒子群和蚁群3 种仿生算法,用于优化BP 神经网络初始权值和阈值,试验结果显示,3 种仿生算法都降低了BP 神经网络陷入局部最小以及过拟合的风险,但PSO 模型在月降水预测中误差并非最小。

2 神经网络在广西月降水量预测的应用

BP 神经网络以其自学习、自适应和容错性等一系列优点,在广西短期气候预测业务中得到广泛应用,并取得了较好的效果。在广西月降水量的神经网络建模预测中,结合的算法或统计方法,主要有均生函数、EOF 展开、遗传算法、粒子群算法等。

在结合均生函数(Mean Generating Function,MGF)的神经网络预测方面,金龙等[35]利用人工神经网络方法结合MGF 和多元分析方法,提出了一种同时考虑预报量自身显著变化周期和外生变量因子对预报量未来变化影响的混合预测模型,该模型比单纯采用时间序列统计预报方法或多元分析统计预报方法具有更好的预报效果,且具有更好的物理基础和预报能力。李永华和金龙[36]采用奇异谱分析(SSA)方法进行准周期信号分量重建,将重建序列构造MGF 延拓矩阵作为输入因子,原样本序列作为输出因子,得到基于SSA-MGF 的BP 神经网络多步预测模型,该模型具有较高应用价值。吴建生和金龙[37]采用基于SSA-MGF 的BP 神经网络对广西全区6 月份降水量进行实际预测建模,并与其它方法进行对比预测试验,结果表明,该预测模型预测精度高、效果稳定,可用于实际业务。

在结合EOF 降维技术的神经网络预测方面,金龙和况雪源等[38]针对神经网络预报建模中,预测模型容易出现“过拟合”和学习能力好而泛化性能差的关键问题,采用降维处理技术,可防止神经网络预测模型在学习训练时,出现“过拟合”现象和提高神经网络的泛化性能。覃志年等[39]采用EOF 方法将众多具有一定物理意义的环境场预报因子和序列周期因子进行降维去噪处理,并结合前馈网络模型,进行了夏季(6—8 月)降水量预测研究,该方法对于广西夏季降水具有很好的预报能力。何慧等[40]利用月动力延伸集合预报产品及其派生变量,对广西6 月降水量作BP 神经网络降尺度释用预报,结果表明,利用同期综合因子建立的预测模型,拟合精度优于利用前期综合因子建立的模型,但预测效果依赖于月动力延伸集合预报产品。

在RBF 神经网络预测方面,农吉夫等[41]采用RBF 神经网络与PCA 相结合的方法,得到预测结果较准确的广西中部5 月平均降水预测模型。蒋林利和吴建生[42]采用二分搜索密度峰聚类算法找到数据中心值及数据簇类个数,作为RBF 神经网络的初始参数和隐藏层节点数,建立广西月降水量预测模型,预报性能良好。

在GA 优化神经网络方面,金龙等[43]以广西全区4 月份平均降水作为预报量,建立基于GA 的神经网络预测模型,该模型具有预报精度高,稳定性好等特点。吴建生等[44-45]建立旱涝灾害的GA-BP 网络模型,并以广西的月降水量进行实例预测分析表明,该方法预报精度高、而且稳定。农吉夫等[46-47]建立GA-BP 神经网络模型,对广西北部地区5 月平均降水量进行预测,通过与逐步回归模型比较,表明该方法的预测精度较高。

在PSO-ANN 模型预测方面,吴建生等[48-49]用多样性粒子群算法优化神经网络的网络结构和连接权,获得神经网络集成个体,进一步用二次规划方法,生成神经网络集成的输出结论,进行短期降水预报建模研究,以广西全区的6 月降水量实例分析,PSO-ANN 模型预测的10a 平均相对误差为10.92%,其预测能力远远好于BP 模型的31.03%和PLS 模型的27.34%,同时也对广西全区的7 月、8 月降水量进行预测,结果同样表明,PSO-ANN 模型的预测效果优于传统的PLS 模型和BP 模型。覃卫坚等[50]利用PSO-ANN 建模预测华南夏季降水量,预测效果略好于国家气候中心第二代海-陆-冰-气耦合的气候系统动力模式。从7a 华南出现异常降水年份的预报试验来看,预报与实况同号率高达到85.7%。另外,PSO-ANN 预测方法在延伸期暴雨预报中也得到初步应用,覃卫坚等[51]利用该方法对广西延伸期定量化暴雨综合强度进行预报,预报误差明显小于逐步回归方法。由于粒子群-神经网络模型学习能力强、泛化性能高,能有效提高月降水预测的准确率,因此将该模型编入“广西气候预测智能化格点业务平台”,成为广西月降水趋势预测的主要工具。

未来3~5a,广西将在月降水量的深度学习方面,进行协同进化支持向量机短期气候混合预测模型研究。针对月降水量的非线性变化特征,以及降水量未来变化受众多外生变量影响因子和自身重要周期变化的综合影响的特点,探索采用深度学习结合小样本机器学习理论和多种非线性智能计算优化算法,进行新的短期气候预报建模理论方法应用研究,不仅可以改进和提高旱涝气象灾害的防灾减灾能力,也是开拓月降水预测与信息学科、人工智能技术交叉学科的创新研究。

3 小结与讨论

由于多数气象灾害的变化受多重因素的综合影响和随时间变化等特点,大多具有显著的非线性、时变性特征,因而大气学科中也越来越重视人工智能、机器学习和非线性智能计算的气象预报建模研究应用。BP 神经网络方法具有很好的处理非线性问题的能力,是目前应用较广的网络模型,特别适合于求解内部机制复杂的非线性问题,因此在气象学科的实际应用中获得了成功。在降水量预测研究和应用中,BP 神经网络结合多种算法或统计方法,取长补短,不断完善,目前应用较广的主要有PCA-BP 神经网络模型、遗传算法优化的神经网络、RBF 神经网络预测模型、小波神经网络模型、粒子群-神经网络模型等,这些方法也在广西月降水量预测业务中得到很好的应用,对提高月降水量预测能力有较大帮助。

同时在利用支持向量机、深度学习、分类树、随机森林等机器学习方法建立的气象预报预测模型研究中,不少的研究结果都表明,非线性智能计算预报建模方法比线性的多元统计预测模型具有更好的效果[52-53]。鉴于人工智能在气象预报预测中的明显优势,未来广西气候预测业务中,将采用神经网络、支持向量机、深度学习等非线性智能计算技术方法,开展各种月、季尺度的不同气象灾害预报建模研究,满足防灾减灾服务需求。

在神经网络建模预报中,输入样本数的多寡,会关系到泛化能力等诸多问题,所以我们希望得到尽可能大的样本规模,然而目前月降水量和多数气象观测资料长度最多只有几十年,这是神经网络在短期气候预测中的一个不足之处。另外,在不同的气候区域,受不同的气候、地理条件影响,不同区域的月、季时间尺度的降水短期气候预测,需要面对不同的空间区域和随时间变化的平均环流场、平均海温场以及气候系统监测指数等多种数据源。而要建立适合不同气候区月降水量的人工智能技术短期气候预报建模理论新方法,不仅需要解决如何从影响月降水量变化的多元数据集中,进行预报信息的数据挖掘分析计算和特征提取计算处理,挖掘真正有效的预报信息,来提高预测模型的泛化性能。如何改进和选择更合理的深度学习网络模型和非线性智能计算方法,避免预测模型出现“过拟合”和“欠拟合”问题[38],客观计算确定预测模型的关键参数,也是获得更好预报效果的重要条件。

猜你喜欢

降水量广西神经网络
神经网络抑制无线通信干扰探究
降水量是怎么算出来的
黄台桥站多年降水量变化特征分析
1988—2017年呼和浩特市降水演变特征分析
广西尼的呀
基于小波变换的三江平原旬降水量主周期识别
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
广西出土的商代铜卣