人工神经网络在大气污染预测中的应用*
2015-04-02郭庆春杨旭寇立群
郭庆春,杨旭,寇立群
(陕西广播电视大学,陕西 西安 710119)
【管理科学】
人工神经网络在大气污染预测中的应用*
郭庆春1,杨旭2,寇立群3
(陕西广播电视大学,陕西 西安 710119)
对大气污染进行预测具有十分重要的科学意义。人工神经网络模型在大气污染预测预报领域广泛应用,可以通过选择不同算法,设置学习率和动态系数等参数使基于神经网络的大气污染预测模型的精度得到提高,说明神经网络模型应用于大气污染预报具有较高的预测精度和良好的泛化能力。
人工神经网络;大气污染;算法
环境空气质量密切关系到人们的生产、生活,历史上很多关于大气污染的“公害事件”给人类带来了惨痛教训,随着人们生活水平的提高,对于大气质量有了更高要求,世界各国普遍重视大气质量问题。我国正处在经济迅速发展的时期,同时由主要污染物造成的大气环境污染问题日趋严重,给人民生活和健康造成严重影响[1]。大气污染对资源和环境的冲击日益威胁着可持续发展的基础。
近年来应用较为广泛的非线性方法主要有人工神经网络。人工神经网络的研究与应用正成为人工智能、认知科学、神经生理学、非线性动力学等相关专业的热点。神经网络是一个高度复杂的非线性动力学系统,特别适合处理需要同时考虑许多因素和条件的、不精确和模糊的信息处理问题。由于这些特性,在一定程度上避开了“假定”,从数据本身找出规律性的、基于特定问题的解。神经网络在污染预测方面的应用较为广泛[2-3]。
一、人工神经网络原理
人工神经网络系统是由大量简单的处理单元(或称神经元)广泛地相互连接而形成的复杂网络系统,是一种非线性的动力学系统。它具有大规模的并行处理和分布式的信息存储能力、良好的自适应性、自组织性及很强的学习、联想、容错及抗干扰能力,迄今为止,人们提出许多神经网络模型。较典型的有BP网络、Hopfield网络及CPN网络等,其中应用较多的是具有非线性传递函数神经元构成的前馈网络中采用误差反向传播算法作为其学习算法的前馈网络(Back Error Propagation,简称BP网络)。误差反向传播网络(BP模型)是一种多层结构的映射网络,它是目前应用最为广泛的一种人工神经网络,在各门学科领域中都具有极其重要的实用价值,其学习能力和容错能力对于具有不确定性模式识别具有独到之处。BP算法的中心思想是调整权值使网络总误差最小。BP模型学习过程的算法由正向传播和反向传播两部分组成。通过反复的正向传播和反向传播,不断地修改各层神经元的权值和阈值来减少误差函数,直到与某一相当小的正值或进行迭代运算时误差函数不再减少。学习过程的实质是求误差函数的最小值,它通过反复训练已知样本集,在没有达到设定的误差最小值之前,每训练一次,权值将沿误差函数的最速下降方向改变,最终收敛到最小点,然后将多个样本训练所得的各层间连接权值及各层神经元的偏置值(即阈值)信息保存起来,以便对未知样本进行处理。
标准的BP算法是基于梯度下降法,通过计算目标函数对神经网络阈值和权值的梯度进行修正。改进算法多数是在标准梯度下降法的基础上发展起来的,它们只是用到目标函数对阈值和权值的一阶导数(或者梯度) 信息。标准的BP 算法虽然为训练网络提供了简单而有效的方法,但是由于训练过程中学习速率为一较小的常数,因而存在收敛速度慢和局部极小问题。为解决这些问题,研究人员提出很多改进的算法。主要有:附加动量法、弹性BP算法(RPROP)、自适应学习速率法、共轭梯度法、拟牛顿算法(BFGS)、一步割线(OSS) 算法、Levenberg-Marquardt 优化方法等。
二、大气污染预测
人工神经网络在大气污染预测中已经得到广泛应用。朱国成通过对反向传播人工神经网络的算法和网络结构的研究,发现拟牛顿算法训练速度较快,能够较好地接近误差目标值,同时建立了包括输入层、隐含层、输出层的人工神经网络三层拓扑结构。通过对街道峡谷人工神经网络的训练,模拟计算了街道峡谷NOx浓度分布值。结果显示训练误差和测试误差比为1.11,训练样本的模拟值与实测值的相关系数为0.93,测试样本的模拟值与实测值的相关系数为0.87,模拟值与实测值的相关系数均高于显著水平为α=0.05与α=0.01所对应检验性表的相关系数临界值。该模型能够用于街道峡谷污染物浓度的模拟计算,具有较好的泛化能力[4]。郭庆春等利用宝鸡市2005年~2009年的逐日空气污染指数作为神经网络模型的训练样本,进行训练,分别建立了相应的神经网络模型。因为不同季节的大气污染规律有所不同,所以用2005年(6月1日)~2009年(8月31日)春季(3~5月)、夏季(6~8月)、秋季(9~11月) 、冬季(12~2月)的4组数据分别建立了4个季节的日空气污染指数的预报模型,并用2009年(9月1日)~2010年(8月31日)春季、夏季、秋季、冬季的数据作为非训练样本进行预报检验(注意此处不能过分地要求误差很小,否则会造成过度训练,那样,虽然能够很好地拟合学习样本,但是会造成预测能力差)。仿真实验结果表明:训练样本的日空气污染指数的拟合值的平均相对误差分别为15.4%、9.3%、10.1%、14.2%,非训练样本的日空气污染指数的预测值的平均相对误差分别为25.3%、15.4%、21.1%、23.2%,非训练样本的日空气污染指数的预测值与真实值的线性相关系数分别为0.867、0.886、0.874、0.864。仿真结果表明改进BP算法的神经网络经有效训练后应用于大气污染预报具有较高的预测精度和良好的泛化能力[5]。郭庆春等利用西安市2005年~2010年逐日空气污染指数,建立了一个空气污染指数的非线性时间序列神经网络模型。实验结果表明:独立样本的日空气污染指数的预测值的平均相对误差分别为27.4%、23.2%、12.2%、25.7%,独立样本的日空气污染指数的预测值与真实值的线性相关系数高。该模型应用于大气污染预报具有较高的预测精度和良好的泛化能力[6]。郭庆春等以北京市为例,综合考虑BP网络的逼近能力和泛化能力,将时间序列作为BP神经网络的输入,对空气污染指数的预测做了建模研究。实验结果表明,BP神经网络的输出值与实际值之间的误差在可以接受的范围,特别是对骤升骤降趋势也能得到准确度较高的预报结果。因此在实际应用中,可以将BP网络方法作为一种考虑采用的方法[7]。郭庆春等利用石家庄市2005年~2009年春季、夏季、秋季 、冬季的4组数据分别建立了4个季节的日空气污染指数的预测模型,并用2009年~2010年春季、夏季、秋季、冬季的数据作为独立样本进行预测检验,实验结果表明:通过设置初始权重、学习率、动态系数等参数使基于BP神经网络的大气污染预测模型的精度得到提高,预测值与实际值之间的平均相对误差小,预测值与实际值的相关系数高,得到了较好的预报效果,说明该模型应用于大气污染预报具有较高的预测精度和良好的泛化能力,它为信息社会的城市空气污染预报工作提供了一种全新的思路和方法[8]。
三、结论和展望
由于神经网络方法与传统的统计方法相比具有自适应学习,非线性映射和容错性等多种优良性能,因此随着人工神经网络理论和技术的不断发展,它在大气污染预测的应用研究领域也越来越广泛,已成为国际上学科发展的竞争热点。但是神经网络方法在大量的实际问题应用中,也存在不少亟待解决的问题。特别是神经网络方法在大气污染预测领域的应用研究中,关于如何确定适宜网络结构,如何提高网络的收敛性,防止网络训练出现振荡和收敛于局域最小等问题都需要进一步深入研究。而目前有关进化计算的遗传算法与人工神经网络相结合的研究,小波分析与神经网络的结合以及模糊系统理论与神经网络方法的结合研究,已成为神经网络研究的重要方向,也为克服神经网络方法在大气污染预测应用研究中存在的问题提供了思路和方法。
[1]刘玲,张金良.我国大气污染与儿童肺功能的关系[J].环境与健康杂志,2007,24(7):471-476.
[2]朱国成,方明建,郑旭煦.基于人工神经网络的街道峡谷NOx浓度的数值模型研究[J].环境工程学报,2010(4):875-880.
[3]王芳,程水源,李明君,等.遗传算法优化神经网络用于大气污染预报[J].北京工业大学学报,2009,35(9):1230-1234.
[4]朱国成,方明建,郑旭煦.基于人工神经网络的街道峡谷NOx浓度的数值模型研究[J].环境工程学报,2010(4):875-880.
[5]郭庆春,何振芳,李力. 人工神经网络在大气污染预测中的应用研究[J]. 工业仪表与自动化装置,2012(4):18-22.
[6]郭庆春,何振芳,李力. 西安市空气污染指数的神经网络预测模型[J]. 河南科学,2011(07):863-868.
[7]郭庆春,何振芳,寇立群,李力,张小永,孔令军. BP神经网络在北京市API预报中的应用[J]. 环境工程,2011(04):106-108.
[8]郭庆春,何振芳,李力,袁春莹,寇立群. 人工神经网络在API预报中的应用[J]. 陕西农业科学,2011(02):124-126.
[责任编辑 王爱萍]
Application of Artificial Neural Network in Atmosphere Pollution Forecast
Guo Qingchun, Yang Xu, Kou Liqun
(Shaanxi Radio & TV University, Xi'an 710119)
.Forecasting the level of air pollution has great significance. Artificial neural network forecast method is widely introduced in air pollution prediction. By choosing different algorithms, setting learning rate,and dynamic coefficient parameters, the precision of the model based on artificial neural network is improved,and the average relative errors of air pollution between forecasting and the monitoring are small therefore.Artificial neural network model is a simple and effective algorithm.
artificial neural network; atmospheric pollution; algorithm
2015-09-14
1.郭庆春(1979— ),山东省聊城市人,陕西广播电视大学教务处讲师,大气污染预测在读博士研究生。2.杨旭(1989— ),女,陕西省安康市人,陕西广播电视大学财务处助教,大学本科。3.寇立群(1966— ),陕西省礼泉县人,陕西广播电视大学工程管理系副处长,副教授。
本文为陕西广播电视大学 2013-2014年度科研课题“基于神经网络的大气污染预测”(课题编号:13D-08-B01)、“陕西电大课程教学资源建设研究” ( 课题编号:13DJ-A12)、2015年陕西省教育厅科研计划项目 “陕西省主要城市大气污染预报模型研究”(项目编号:15JK1058,项目负责人:郭庆春)阶段性成果之一。
P49
A
1008-4649(2015)04-0092-03