神经网络模型在北海市空气日报污染指数计算中的应用
2012-12-14韩波黄雄巍
韩波,黄雄巍
(1.北海市环境监测中心站,广西北海536000;2.防城港市港口区环境监测站,广西防城港538001)
神经网络模型在北海市空气日报污染指数计算中的应用
韩波1,黄雄巍2
(1.北海市环境监测中心站,广西北海536000;2.防城港市港口区环境监测站,广西防城港538001)
根据空气质量日报的实际需要,引入了Excel软件神经网络技术建立空气质量日报污染指数计算模型,采用LM算法提高了计算精度,并将模型应用于北海市空气日报。结果表明:此法较之实际公式计算法更加快捷方便,并且计算结果相当吻合。
神经网络模型;空气污染指数;空气质量日报;计算模型
近年来有人提出用Excel计算API[3~4]。该法在工作表空间采取“填埋单元格”形式计算,这种计算方式不仅效率低,而且需要依附在同一个工作表的日报数据中进行,这样当日报数据量不断增加时,计算公式占用单元格的数量随之增加,且占用工作表大量的内存空间,这种现象将导致计算速度显著降低,甚至会造成计算无法进行的后果。为了寻求简捷、可靠且准确的计算API的方法,该研究引入了人工神经网络模型。该模型首先利用污染物日均值的历史数据,通过网络学习来抽取和逼近隐含的污染物日均值与API非线性关系,并建立神经网络的API计算模型,将API模型通过检验样本进行精确度及准确度验证,合格后方能推广与应用。应用结果表明:神经网络API值计算结果与API公式计算结果相当吻合。
1 模型的建立
1.1 模型结构
BP网络结构是一种多层网络结构,由输入层、一层或多层隐含层和输出层组成[5~6],各层之间采用全互连接,但同一层单元间不相互连接。理论已证明,三层BP网络可以逼近任何复杂的非线性函数,为此,采用三层BP网络模型建模,其结构如图1所示:
图1 空气污染指数计算网络模型
1.2 神经网络LM的算法
在用传统BP网络学习中,网络逼近非常慢,且逼近误差达不到理论要求值时,很容易陷入局部最小,导致网络无法学习下去。鉴于此,这里用LM算法改进BP神经网络。
LM算法是用平方误差代替均方误差,使误差平方和最小。误差平方和为:
其中:E为误差平方和;p是第p个样本;ε是以εp为元素的向量;假定当前位置ωn,向新位置ωn+1移动,如果移动量ωn+1-ωn很小,则可将ε展开成一阶Tailor级数:
其中:ωn表示当前的权值或阙值,J为误差对权值或阙值微分的Jacobian矩阵:
其中,ωi表示第i单元的权值或阙值。于是误差函数可写为:
对ωn+1求导以使E最小,可得:
口语交际是一个生活性的概念,命题理所当然应该考虑到话题的生活性,并且要贴近被评价对象的生活,这样才能准确地评价学生的口语交际能力。本学期我班口语交际试题就是这样一个贴近学生生活的题目:
观察式(5),步长偏大,所以把误差表达式改写为:
λ为正常数,式(6)中,对ωn+1求极小值点,可得:
其中,I为单位矩阵。当λ足够大时保证(JTJ+λI)-1总是正数,从而保证其可逆。算法的每一次迭代都要对λ进行自适应调整。当λ很小时,权值的调整类似于牛顿法;λ很大时,又类似于梯度下降法。所以,LM算法同时具有牛顿法和梯度下降法两者的优势。
1.3 网络结构的实现
借助Excel link插件将Excel和Matlab集成开发了Excel软件BP神经网络计算程序(有关Excel神经网络计算软件另文介绍,在此不再赘述)。该程序通过mlevalstring函数来调用matlab指令:
net=newff(PR,[S1,S2,…,Sn],{TF1,TF2,…,TFn},BTF,BLF,PF)
创建Excel软件BP神经网络。PR为输入向量的取值范围;Si为第i层的神经元个数,共有n层;TFi为第i层的传递函数;BTF为BP网络的训练函数;BLF为BP网络权和阈值学习函数;PF为性能函数。本模型采用各函数为:
net=newff([minmax(P)],[14,4],{'tansig,'purelin'},'trainlm','leamgdm','mse')。
2 实例应用
2.1 选取学习样本
采用神经网络方法建模的首要和前提条件是有足够的典型性好、精度高的样本,为提高网络模型的性能和泛化能力,必须收集到大量的空气日报历史资料。自2001年实施空气日报以来,北海市环境监测站保存了历年以来的空气日报资料。这里以2010年空气日报数据作为训练样本,全年共有365(天)条记录,记录形式见表1。
表1 2010年北海市城市空气日报数据
将上述样本通过训练函数训练后,结果如图2。可见,经过438次训练,网络误差达到设定值(0.08)0.0799738最小值。
图2 网络训练结果
2.2 选取检验样本
检验样本应该选取与学习样本不同的空气日报资料,这里选用2011年1月的空气日报数据作为检验样本,其数据记录形式如表2所示。通过网络的仿真函数sim,输出各污染物污染指数、综合污染指数及相应误差计算结果,如图3和图4。
表2 神经网络检验样本
2.3 测试样本(待计算样本)
测试样本即待计算样本,选取将需要计算的空气日报数据,即可以选取任何一个月或几个月的污染物日均数据。这里选用北海市2011年6月份监测数据进行神经网络API值的计算,其数据形式和神经网络计算结果如表3、图5和图6。
图3 各污染物污染指数及误差计算结果
图4 2011年1月北海市综合污染指数API及误差计算结果
图5 2011年6月各污染物污染指数API分布
图6 2011年6月综合污染指数API分布
表3 北海市2011年6月空气日报数据与神经网络计算结果
3 结语
(1)应用神经网络方法,不用建立污染物浓度与污染指数API之间的函数关系,而通过训练网络学习,建立起污染物与污染指数之间的非线性映射关系。
(2)神经网络法计算简捷,准确可靠。上述计算2011年6月空气污染指数只需要几秒钟就能完成,计算结果与API公式结果完全吻合。
(3)神经网络API计算模型依据的历史空气日报资料,符合实际工作的要求。模型是通过训练典型的空气日报样本学习得到的,没有人为因素影响,有效地提高了神经网络的泛化能力,使神经网络计算结果更稳定、可靠。
(4)采用Excel开发的神经网络API计算软件易于实现,在空气日报污染指数计算中,该方法比其他的计算方法具有更高的推广和应用价值。
[1]国家环境保护总局.HJ/T 193-2005环境空气质量自动监测技术规范[S].北京:中国环境科学出版社,2006.
[2]万黎,李彦,崔志伟,等.空气自动监测网运行率和准确率统计自动化实现的探讨[J].中国环境管理干部学院学报,2010,20(2):51-53.
[3]黄战胜,薛平.Excel软件在计算空气污染指数中的应用[J].中国产业,2011(2):40-41.
[4]李月娥,贺晓蕾,李昌平.利用Excel软件计算空气质量日报污染指数API[J].四川环境,2005,24(2):81-83.
[5]韩波,孙利,黄勇.水质评价模式识别的BP神经网络方法[J].广州环境科学,2005,20(4):40-43.
[6]韩波.T-S模糊神经网络在水质评价中的应用[J].当代环保,2011,3(4):18-21.
Application of Neural Network Model in Calculating Daily Air Pollution Index in Beihai City
Han Bo1,Huang Xiongwei2
(1.Beihai Environmental Monitoring Center,Beihai Guangxi 536000,China;2.Environmental Monitoring Station of the Port Area of Fangchenggang City,Fangchenggang Guangxi 538001,China)
According to the actual needs of the daily report of air quality,introduced the Excel software neural network technology to establish air quality daily pollution index calculation model.LM algorithm improved the calculation accuracy,and the model is applied to Beihai air quality daily report.The results show that the method is much more fast and convenient,and the calculated results are identical with that of the formula calculation.
neural network model;air pollution index;daily air quality report;calculation model
TP183
A
1008-813X(2012)03-0055-05
10.3969/j.issn.1008-813X.2012.03.016
2012-03-19
韩波(1956-),男,河北巨鹿县人,毕业于湖北理工学院环境监测专业,高级工程师,主要从事环境监测与研究工作。