基于BP神经网络算法的对流层湿延迟计算
2013-09-17李剑锋吴林弟胡伍生王永前朱明晨
李剑锋 吴林弟 胡伍生 王永前 朱明晨
(1成都信息工程学院资源环境学院,成都 610225)(2江苏省吴江经济技术开发区,苏州 215200)(3东南大学交通学院,南京 210096)(4江苏镇江新区房产管理处,镇江 212114)
基于BP神经网络算法的对流层湿延迟计算
李剑锋1吴林弟2胡伍生3王永前1朱明晨4
(1成都信息工程学院资源环境学院,成都 610225)
(2江苏省吴江经济技术开发区,苏州 215200)
(3东南大学交通学院,南京 210096)
(4江苏镇江新区房产管理处,镇江 212114)
摘 要:为了提高对流层湿延迟的计算精度和全球定位系统水汽反演的准确性,结合BP神经网络算法的自主学习、记忆、计算和智能处理功能,利用气象探空数据建立了计算对流层湿延迟的BP神经网路模型,其模型结构为4×15×1.分别利用霍普菲尔德模型、多元线性回归模型及BP神经网络模型计算对流层湿延迟.对比分析了3种模型的对流层湿延迟计算结果,得到结论:霍普菲尔德模型存在系统误差,精度较低;多元线性回归模型和BP神经网络模型的精度都优于霍普菲尔德模型;BP神经网络模型精度较霍普菲尔德模型改进约50%,较多元线性回归模型学习中误差改进约71.7%,检验中误差改进约2%.
关键词:BP神经网络;对流层湿延迟;精度分析
利用GPS技术反演大气可降水量是近年来飞 速发展的一门大气探测技术,因其具有实时性、连续性、精度高、成本低、不受天气影响等特点而备受关注.GPS大气水汽反演是利用GPS信号在对流层中传播产生的路径延迟反算大气中水汽含量,因此准确求得对流层湿延迟是反演大气可降水量的关键.目前计算对流层湿延迟的方法主要有两类:一是利用GPS信号延迟来计算,二是利用探空数据计算.
影响对流层湿延迟的水汽是一个非线性的物理量,对非线性的物理量难以用一个固定的函数模型去准确表达,而BP神经网络模型属于自适应非线性动力学系统,它具有学习、记忆、计算和智能处理功能,特别是在处理一些复杂的非线性问题上,有着其独特的优势[1].也正是基于该原因,本文采用第二类方法,研究如何运用BP神经网络算法计算对流层湿延迟.
1 BP神经网络的基本原理
人工神经网络是由大量神经元互相连接组成的复杂网络系统,具有感知、记忆、学习和联想等功能,能模仿人脑处理信息的物理过程,具有大规模并行模拟处理分布式存储信息的能力及很强的自适应自学习和容错能力等特点[1].BP神经网络模型则是一种应用最广泛的人工神经网络模型.常用的单隐含层的BP神经网络模型结构如图1所示.
图1 单隐含层BP神经网络模型结构图
图1中,第1层为输入层转换层,第2层为输入层,第3层为隐含层,第4层为输出层,第5层为输出层转换层.其基本原理为:输入向量首先经过输入转换层及输入层向前传播经连接输入层和隐含层之间的权重作用后到隐含层节点,然后经激活函数把隐含节点的输出信息经过连接隐含层和输出层之间的权重作用后传播到输出节点,经输出转换层后输出结果[2].BP算法是在导师(样本真值)的指导下,经过学习训练,调整权值从而使输出向量与样本真值的误差达到人们的要求,从而保存此时的权值,建立预测模型.
2 计算对流层湿延迟BP神经网络模型建立
用于计算对流层湿延迟BP神经网络的建立分为以下2个步骤:
1)网络结构的确定
建立BP神经网络模型在工程应用中的网络结构,需要确定的内容如下:
①输入层节点个数
输入层节点的数目多少取决于数据源的维数以及其对样本值影响度的大小.另外,人工神经元网络只能处理数值型数据,如果源数据中有非数值类型的数据,首先要将外部信息变换或编码.一般需要先将输入数据“归一化”到限定范围[0,1]之间[3].
由于采用第二类对流层湿延迟计算方法,源数据为气象探空数据,考虑到源数据的维数以及各种气象参数对对流层湿延迟的影响因素,确定BP神经网络模型的输入层为:测站的地面气压P0、绝对温度与T0、测站海拔高度h0及测站的地面水汽分压e0.因此BP神经网络模型的输入层节点数为4.
②输出层节点个数
一般工程中输出层节点的个数为1;若有多个输出也可构造多输出网络或多个单输出网络分别研究.本文用于计算对流层湿延迟的网络模型输出层节点数为1,其物理意义为对流层湿延迟.
③隐含层节点数的选取
常见的神经网络模型均为单隐含层模型,选取隐含层节点数是一个复杂的问题.隐含层节点数太少,可能导致网络不收敛,而隐含层节点数太多,可能导致样本学习时间过长或计算结果不稳定.本文采用经验试算法,最后确定隐含层节点数为15.
至此传统BP神经网络结构已经确定,其模型结构为4×15×1.
2)网络参数的设置
BP神经网络模型的网络参数包括:学习速率η、平滑因子α、学习误差E,网络参数的设置合理与否会影响到网络学习训练的速度.
①学习速率η:通过试算建议取值范围为[0.5,2.5].试验发现,学习速率的选择要和平滑因子综合考虑才有利于网络模型的优化.
②平滑因子α:平滑因子的引入使学习速率不再是恒定的值,而是随着迭代误差的变化而变化,但平滑因子也不宜过大,通过试算建议取值范围为[0.5,0.9],若取值过大容易进入饱和区.
③学习误差E:学习中误差的大小会对检验中误差造成影响,一般学习中误差越小,检验中误差也越小.但学习中误差越小,学习速度也越慢,甚至不收敛,若学习中误差太小,会造成过拟合现象,即使网络能够收敛,检验中误差也会产生回弹[2].通过大量试算,采用学习中误差控制在[0.005,0.01].
通过以上2个步骤,完成了用于对流层湿延迟神经网络模型的建立.
3 两种传统对流层湿延迟计算模型
为了对比分析BP神经网络模型的优劣性,这里介绍2种传统的对流层湿延迟计算模型.
1)霍普菲尔德模型
霍普菲尔德模型是Hopfield在1969年用全球18个站台一年的平均资料得到的,该模型将大气层分为对流层和电离层2层[4].在对流层中,其主要分析对流层中各个气象参数与海拔高度之间的关系,然后经过推导分别得出折射率干分量和湿分量与高程之间的关系,进而通过地面气象参数来推演整个对流层延迟[5].其函数表达式为
式中,前半部分为干延迟;后半部分为湿延迟;h0为测站高度;e0是地面的水汽分压;P0与T0分别为测站的地面气压与绝对温度;Hw为对流层顶,一般取Hw=11 000 m;HT为折射率为0处的大气层高度.霍普菲尔德模型形式简单,仅需要地面的气压、温度及水汽压就能很好地估计对流层天顶干延迟,但是其湿延迟的精度不理想[6].
2)多元线性回归模型
由于对流层湿延迟受测站的地面气压、绝对温度、测站海拔高度及测站地面水汽分压等诸多因素影响[7],即有多个影响因素作为自变量来解释因变量的变化.当多个自变量与因变量之间是线性关系或近似线性关系时,所进行的回归分析即为多元线性回归[4].在某一项工程中,若采集到n组p维的自变量和一个因变量的数值.假设因变量用Y表示;而自变量可以表示为 X1,X2,…,Xp.那么多元线性回归模型整个数据可表示成一个n(p+1)的排列,即
式中,a0,a1,…,ap表示未知参数;Y表示因变量;Xi1,Xi2,…,Xip表示自变量[8].
在多元线性回归的过程中,我们主要关心的是通过n组观测值,利用最小二乘原理来求解未知参数a0,a1,…,ap,然后可以通过求解出来的参数并利用式(2)来建立预测模型.
4 对流层湿延迟计算的算例分析
在利用多元线性回归模型和BP神经网络模型计算对流层湿延迟时,并非将所有样本带入计算,而是将样本分为学习样本和检验样本2部分.由于这2部分样本分别能得出学习中误差和检验中误差.通过学习中误差可以看出模型学习的精度,而检验中误差则可以得出模型用于预测的精度.为使学习样本具有代表性,其选取原则是在综合考虑整个探空数据的区域内的经度、纬度以及海拔高度三维之后随机、均匀的选取.为方便比较,所有模型均选取2010年5月1号晚上8点的探空数据所计算出来的延迟中的200个样本来进行建模.表1为部分探空站3不同模型计算结对流层湿延迟结果.
为便于比较分析,选取相同的探空数据利用霍普菲尔德模型、多元回归分析模型及BP神经网络模型进行计算.经大量试算,最终确定BP神经网络模型中的参数设置为:学习速率η=1.5,平滑因子 α =0.7,E=0.001.分析计算结果,霍普菲尔德模型的湿延迟误差较大,平均中误差σHw=±0.2 m,多元线性回归模型的学习中误差为±0.046 m,检验中误差为±0.050 m.BP神经网络的学习中误差为 ±0.013 m,检验中误差为 ±0.049 m.为直观地分析3种模型计算得到的对流层湿延迟的优劣性,分别绘制出残差图.其中图2、图3和图4分别为200个样本霍普菲尔德模型、多元线性回归模型以及BP神经网络模型残差图.
通过图2可以看出,霍普菲尔德模型计算湿延迟误差主要分布在0.02~0.47之间,误差均大于0,可见其含有一定的系统误差.霍普菲尔德模型作为一个全球范围的对流层湿延迟计算模型,虽适用范围广,但很难满足局部地区的高精度对流层湿延迟计算的精度要求.
将图3与图2相比可知,多元线性回归模型不存在系统误差,从残差图上可以明显看出,其误差基本分布在-0.1~0.1 m之间,精度较之霍普菲尔德模型有较大提高.
分析图4,由中误差这个指标来看,BP神经网络模型精度较之多元线性回归模型稍有提高,由残差图可以看出,其误差值除少数站点外,基本与0刻度重合,若剔除少数几个较大残差后,BP神经网络结果将明显优于多元线性回归.对比图2、图3和图4,可以看出多元线性回归模型和BP神经网络得到对流层延迟的精度高于霍普菲尔德模型,分析原因,霍普菲尔德模型作为适用全球范围的普适模型,在局部地区的对流层延迟计算上,存在较大的误差.霍普菲尔德模型湿延迟剔除其系统误差后仍有约10 cm的误差.多元线性回归的精度较高,达5 cm,较剔除系统误差霍普菲尔德模型提高了约50%,传统BP神经网络的精度最高可以精确到4.9 cm,较多元线性回归模型仅改进2%,但是BP神经网络模型剔除粗差后,其精度将明显优于多元线性回归模型.
表1 三种模型对流层湿延迟计算结果(部分)
图2 霍普菲尔德模型湿延迟残差图
图3 多元线性回归模型湿延迟残差图
图4 BP神经网络模型湿延迟残差图
5 结论
本文在分析BP神经网络模型工作原理基础上,结合气象探空数据建立了计算对流层湿延迟的BP神经网络模型,并对比分析了霍普菲尔德模型和多元线性回归模型得到的对流层湿延迟结果,得到以下结论:
1)对流层湿延迟计算的BP神经网络模型的结构为4×15×1.即输入层有4个:测站的地面气压、与绝对温度与、测站海拔高度及测站的地面水汽分压.输出层有1个:对流层湿延迟.隐含层数量为15.
2)对比分析3种模型计算得到的对流层湿延迟结果,霍普菲尔德模型湿延迟平均中误差为±0.20 m,多元线性回归模型学习中误差为±0.046 m,检验中误差为 ±0.050 m.BP 神经网络模型的学习中误差为±0.013 m,检验中误差为±0.049 m.其中,霍普菲尔德模型存在明显的系统误差.若剔除系统误差和粗差,BP神经网络模型精度较霍普菲尔德模型提高约50%,较多元线性回归模型学习中误差改进约71.7%,检验中误差改进约2%.
[1]胡伍生.神经网络理论及其工程应用[M].北京:测绘出版社,2006:63-83.
[2]朱明晨.基于神经网络的对流层延迟研究[D].南京:东南大学交通学院,2012.
[3]青盛.地基GPS水汽反演的研究[D].成都:西南交通大学地球科学与环境学院,2009.
[4]盛裴轩,毛节泰,李建国,等.大气物理学[M].北京:北京大学出版社,2003:48-56.
[5]陈澍,熊永良,张绪丰,等.GPS水汽反演技术在四川地区的应用研究[J].全球定位系统,2011,36(1):32-37.
Chen Shu,Xiong Yongliang,Zhang Xufeng,et al.Application of GPS water vapor inversion technology in Sichuan area[J].GNSS World of China,2011,36(1):32-37.(in Chinese)
[6]刘爱梅,胡鹏,尹承美,等.GPS水汽反演资料在济南地球的应用[J].气象科学,2010,30(4):555-558.
Liu Aimei,Hu Peng,Yin Chengmei,et al.The application of GPS—PWV computing data in Jinan area[J].Scientia Meteorologica Sinica,2010,30(4):555-558.(in Chinese)
[7]陈笑娟,扈成省,王占伟.国内外GPS气象学的若干研究应用进展[J].测绘科学,2010,35(3):216-218.
Chen Xiaojuan,Hu Cheng,Wang Zhanwei.Research and application progress of national and international GPS meteorology[J].Science of Surveying and Mapping,2010,35(3):216-218.(in Chinese)
[8]杨小磊.基于CORS系统的区域大气水汽含量的研究[D].昆明:昆明理工大学国土资源工程学院,2010.
Calculation of tropospheric wet delay based on BP neural network algorithm
Li Jianfeng1Wu Lindi2Hu Wusheng3Wang Yongqian1Zhu Mingchen4
(1College of Resources and Environment,Chengdu University of Information Technology,Chengdu 610225,China)
(2Wujiang Economic and Technological Development Zone,Suzhou 215200,China)
(3School of Transportation,Southeast University,Nanjing 210096,China)
(4Estate Management Office of Zhenjiang City,Zhenjiang 212114,China)
Abstract:In order to improve the calculation accuracy of the tropospheric wet delay and the precision of the global positioning system water vapor inversion,a back propagation(BP)neural network model with the structure of 4×15×1 is introduced to calculate the tropospheric wet delay.The model establishment involves the combination of the functions such as self-learning,memory,calculation and intelligent processing of the BP neural network algorithm as well as the usage of radiosonde data.Three models are taken to calculate the tropospheric wet delay,which are the Hopfield model,the multiple linear regression model and the BP neural network model,respectively.Analysis results show that the Hopfield model is relatively low in precision because of its systematic error,whereas the other two are superior in this respect.The accuracy of the BP neural network model is improved about 50%compared to the Hopfield model,while both the learning error and inspection error are increased by 71.7%and 2% ,respectively,compared to the multiple linear regression model.
Key words:back propagation neural network model;tropospheric wet delay;accuracy analysis
中图分类号:P228
A
1001-0505(2013)S2-0355-05
doi:10.3969/j.issn.1001 -0505.2013.S2.030
收稿日期:2013-08-20.
李剑锋(1986—),男,硕士,讲师,lijianfeng_ljf@126.com.
基金项目:国家自然科学基金资助项目(41101314,41274028).
引文格式:李剑锋,吴林弟,胡伍生,等.基于BP神经网络算法的对流层湿延迟计算[J].东南大学学报:自然科学版,2013,43(S2):355-359.[doi:10.3969/j.issn.1001 -0505.2013.S2.030]