一种基于RBF神经网络的大气温度及水汽密度廓线反演方法∗
2019-05-07吕新帅谭玉霖刘圣良
吕新帅 田 斌 梁 翔 谭玉霖 刘圣良
(1.中国人民解放军海军工程大学 武汉 430033)(2.中国人民解放军91668部队 上海 200083)
1 引言
微波辐射计作为一种被动微波遥感技术的典型应用,是遥感探测温度、湿度、水汽以及云液态水等大气参数的有力工具,已被广泛应用于天气预报以及气象变化监测等诸多领域。微波辐射计通过实时探测大气微波辐射信号,形成亮温数据,利用大气参数剖面反演算法模型对亮温数据进行反演处理,从而得到大气温度廓线、水汽廓线、相对湿度廓线、液态水廓线、积分水汽含量及云液态水含量等参数[1]。
目前,国内很多学者利用研究构建的逆向传播(Back Propagation,BP)神经网络反演大气参数廓线,得到了比较好的反演效果。王小兰等[2]利用研究构建的BP神经网络反演大气温度和水汽密度,其反演效果优于辐射计自带的BP-mp网络,其所构建的训练样本具有较好的代表性,很好地表征了所研究问题的特性,而且其研究构建的BP神经网络的网络结构和归一化方法是经过多次实验计算而确定的,合理的网络结构确保了BP神经网络的泛化能力。张北斗等[3]利用改进BP神经网络计算模型,发展了一套大气温湿及液态水廓线反演算法,也取得了较好的反演效果。然而,国内利用径向基函数(Radial Basis Function,RBF)神经网络反演大气廓线的研究文献相对比较缺乏,RBF神经网络在微波辐射计反演算法领域并没有得到足够的关注。
RBF神经网络是一种局部逼近网络,结构简单,只具有一个隐含层,其隐含层神经单元采用径向基函数,具有坚实的数学基础,已经证明它能以任意精度逼近任意连续函数。RBF神经网络与BP神经网络相比有很多独特的优势,它在逼近能力、分类能力和学习速度等方面均优于BP神经网络[4]。因此,若能利用RBF神经网络构建算法模型应用到大气廓线反演上来,可能会得到比BP神经网络算法模型更好的反演效果。
本文提出了一种基于RBF神经网络的大气温度廓线及水汽密度廓线反演方法,利用地基16通道微波辐射计在武汉地区的观测资料和对应的探空资料作为训练数据以及测试数据,对研究构建的RBF神经网络反演算法模型进行训练和测试,将反演结果和BP神经网络反演算法模型的反演结果进行对比,主要从反演准确度、运算速度以及泛化能力三个方面对RBF神经网络反演算法模型的反演性能进行评价。
2 资料选取及样本构建
实验所用的地基16通道微波辐射计在水汽敏感的K波段(20GHz~30GHz)设置了8个通道,分别为 22.24GHz、23.04GHz、23.84GHz、25.44GHz、26.24GHz、27.84GHz、30.00GHz、31.40GHz,在温度敏感的V波段(50GHz~60 GHz)设置了8个通道,分别 为 51.26GHz、52.28GHz、53.86GHz、54.94GHz、55.50GHz、56.66GHz、57.30GHz、58.0GHz。该辐射计还带有测量温度、湿度和气压的地面气象传感器。该辐射计观测的时间频率约为每4s一组,仪器接收微波辐射产生电压信号,通过辐射计的标定模块将电压信号转化为亮温数据,然后利用辐射计的BP神经网络反演模型可以连续反演获得从地表至10km的温度、水汽密度的垂直分布廓线。在地表至10km的垂直高度范围内,将其划分为38个高度层,具体划分方法如表1所示。
表1 垂直高度层划分方法
辐射计观测得到的16个通道的亮温数据及地面气象信息(包括地面温度、气压和相对湿度)构成其反演软件的输入数据,即对于该辐射计来说,BP神经网络的输入节点个数为19。该辐射计反演得到的从地面到10km范围内的温度、水汽密度廓线各为38层,即每个BP神经网络的输出节点个数为38。本研究建立在该辐射计的实验基础上,所构建的RBF神经网络反演模型采取19个输入节点和38个输出节点的网络结构,以便和该辐射计自身所带的BP神经网络反演模型对比反演性能。
2017年10 月~11月,利用该地辐射计在武汉地区进行大气观测实验,从获得的观测资料中抽样选取1000组观测数据作为样本资料,结合对应的探空廓线数据分别构建RBF神经网络的训练数据样本和测试数据样本。关于训练数据样本的构建,从抽取的1000组观测数据中选择800组作为训练RBF神经网络的输入数据样本,每组输入数据由16个通道的亮温数据以及地面气象信息数据(包括地面温度、气压和相对湿度)构成,对应的800组探空数据作为训练RBF神经网络的输出数据样本,每组输出数据由38个高度层的温度以及水汽密度数据构成。关于测试数据样本的构建,将另外200组辐射计观测数据作为输入数据测试训练后的RBF神经网络,对应的200组探空数据作为测试输出数据的比照标准值。
3 RBF神经网络反演算法模型
本文研究构建的RBF神经网络反演算法模型基于K-means聚类的学习法,该算法使用广泛并且较为成熟,在这里不做详细叙述,具体可参考文献[5~13]。RBF神经网络的输入层神经元个数为19,包括地基微波辐射计的16通道观测亮温和地面气象信息(包括地面温度、气压和相对湿度)。RBF神经网络的输出层神经元个数为38,分别为探空的温度和水汽密度廓线对应于从地面到10km高度划分的38层的数值,与地基微波辐射计的反演结果分层一致。
反演算法模型的RBF神经网络的拓扑结构如图1所示,其中,输入层节点共19个,输出层节点共38个,隐含层节点数k小于输入样本数。
图1 RBF神经网络的拓扑结构图
样本中经常存在异常数据,称为奇异样本数据,这些数据与样本中的其他数据相比明显偏大或偏小。它们的存在使得神经网络的训练时间增加,还有可能使得神经网络无法收敛,这将会严重限制神经网络的学习速度及学习效能。为避免这种情况的发生,就需要对样本进行归一化处理。在本文研究构建的RBF神经网络反演算法模型中,先利用归一化函数对RBF神经网络的输入数据或输出数据进行归一化处理,再对神经网络的训练输出结果或测试输出结果进行反归一化,得到实际值。
利用构建的输入、输出样本,并进行神经网络训练,随后将测试样本输入到训练好的RBF神经网络模型,即可得到温度廓线及水汽密度廓线。比较RBF神经网络反演廓线与探空资料的均方根误差(RMSE),就可以对反演精度做出评价。由第1节可知,整个0~10km高度范围内的大气廓线被分为了38层,那么反演精度应当在每层中进行计算才有意义。作为真值的探空测量值记为Vi,RBF神经网络反演值记为Ui,这里i表示第i个样本,样本数记为n,则反演值对真值(探空测量值)的均方根误差(RMSE)表示:
反演算法模型流程图如图2所示。
图2 反演算法模型流程图
4 仿真结果及分析
仿真实验在 Matlab2015a,处理器为 Intel(R)Core(TM)i5-4200M CPU,2.50GHz,RAM为4.00GB的Windows7系统的软硬件环境中完成。地基16通道微波辐射计所采用的反演算法是采取19-40-38三层结构的BP神经网络。
4.1 大气温度廓线反演结果及分析
首先利用训练样本对两个神经网络分别进行训练,再利用测试样本对训练后的两个神经网络的反演性能进行测试,反演结果如下。
图3是分别利用训练后的RBF神经网络和BP神经网络对测试样本进行大气温度廓线反演,反演的温度廓线和探空温度廓线的均方根误差随高度的变化对比。由图3可知,RBF神经网络对于测试样本的反演精确度性能要优于BP神经网络。图4是两个神经网络利用测试样本反演的温度廓线和探空温度廓线对比。图4中的实际廓线反映了探空温度廓线在地面到1km高度范围内的垂直分布规律,可以粗略看出大约在1.4km高度至2km高度范围内大气温度变化很缓慢,这一高度范围作为整个研究范围的局部就分布规律而言是非常关键的转折过渡阶段,因此能否抓住这个关键局部特征也是体现神经网络反演性能的一个指标。就图4反映的结果来看,两个训练后的神经网络对于测试样本的反演性能都很不错,上面提到的关键局部特征也都得到了较好的体现。
图3 RBF和BP利用测试样本反演的温度廓线和探空温度廓线的均方根误差对比
综合图3和图4分析可知,经过训练后的RBF神经网络在反演测试样本时,依然能够给出较小误差的合理输出结果,反演的温度廓线和探空温度廓线的均方根误差大体落于0.7K~2.5K的范围内。然而对于经过训练后的BP神经网络而言,对于测试样本的处理适应能力相对较弱,反演的温度廓线和探空温度廓线的均方根误差大体落于1.8K~3.9K的范围内。这证明,RBF神经网络对于新鲜样本的适应能力亦即泛化能力要强于BP神经网络的泛化能力。泛化能力是评价神经网络性能的重要指标,它反映了神经网络对于新鲜样本的适应能力,体现了神经网络的深度学习能力与程度。在对两种网络进行训练时,收敛误差均设置为0.0001。设置BP神经网络的学习率为0.1,迭代次数为10000。为了对比两个神经网络在运算速度方面的性能,分别对两个神经网络进行100次运算,计算两者的平均运行时间,结果如表2所示。
图4 RBF和BP利用测试样本反演的温度廓线和探空温度廓线对比
表2 两个神经网络反演温度廓线的运算速度性能对比
从表2可以看出,RBF神经网络的平均运行时间明显比BP神经网络短,这说明RBF神经网络在进行大气温度廓线反演时较BP神经网络有着更快的运算速度。
4.2 大气水汽密度廓线反演结果及析
两个神经网络经训练后对测试样本反演大气水汽密度廓线的结果如下。
图5是利用测试样本分别对本研究构建的RBF神经网络和地基微波辐射计所带的BP神经网络进行训练后,得到的反演的水汽密度廓线和探空水汽密度廓线的均方根误差随高度的变化对比。由图5可知,RBF神经网络反演精确度性能要优于BP神经网络。图6是两个神经网络利用测试样本反演的水汽密度廓线和探空水汽密度廓线对比,该图反映了大气水汽密度在地面到10km高度范围内的垂直分布规律比较复杂,尤其是在2km高度以下范围内的垂直分布呈现出具有较大跳跃性的局部特征。从反演结果对于局部特征的体现来看,两个神经网络的反演性能都很不错。
图5 RBF和BP利用测试样本反演的水汽密度廓线和探空水汽密度廓线的均方根误差对比
综合图5和图6可知,RBF神经网络利用测试样本反演的水汽密度廓线和探空水汽密度廓线的均方根误差大体落于0.2g/m3~0.6g/m3之间,反映出其对测试样本的适应能力比较强。然而BP神经网络适应测试样本的能力相对较弱,反演的水汽密度廓线和探空水汽密度廓线的均方根误差大体落于0.4g/m3~1.3g/m3之间。这也再次证明,RBF神经网络的泛化能力强于BP神经网络的泛化能力。与反演大气温度廓线类似,在对两种网络进行训练时,收敛误差均设置为0.0001。设置BP神经网络的学习率为0.1,迭代次数为10000。为了对比两个神经网络在运算速度方面的性能,分别对两个神经网络进行100次运算,计算两者的平均运行时间,结果如表3所示。
图6 RBF和BP利用测试样本反演的水汽密度廓线和探空水汽密度廓线对比
表3 两个神经网络反演水汽密度廓线的运算速度性能对比
从表可以看出,神经网络的平均运行时间也明显比BP神经网络短,这说明RBF神经网络在进行大气水汽密度廓线反演时较BP神经网络同样有着更快的运算速度。
5 结语
本文利用地基16通道微波辐射计在武汉地区的观测资料(包含16个通道的亮温数据及地面气象信息数据)和对应的探空资料(包含温度廓线及水汽密度廓线)组建神经网络训练样本和测试样本。地基16通道微波辐射计所带的BP神经网络反演算法作为本研究构建的RBF神经网络反演算法的比较对象,通过比较RBF神经网络与BP神经网络的训练结果以及测试结果,验证了RBF神经网络在不确定条件下的预测准确性和可行性。实验结果表明:RBF神经网络在反演大气温度廓线及水汽密度廓线方面拥有比BP神经网络更快的运算速度,更准确的反演能力和更强的泛化能力。