基于遗传算法和BP网络的造纸废水处理预测研究
2010-12-31李伟奖马邕文
李伟奖 马邕文
(华南理工大学环境科学与工程学院,广东广州,510006)
造纸废水处理系统由于存在复杂性、非线性、时变性、不确定性和滞后性等特点[1],尚不能用机理分析和数学推导的方法来获得精确的数学模型,因此传统的控制方式很难对其处理过程提出很好的控制方案。智能控制系统不依赖系统的精确数学模型,能够逼近任意非线性函数,克服了传统控制过分依赖精确数学模型的缺点[2],近年来在废水处理领域得到了广泛研究[3-6],如Punal提出了一种针对厌氧消化器的诊断和管理化学的模糊专家系统[7],国内田禹等人对基于BP人工神经网络的臭氧生物活性炭系统建模进行了研究[8]。
BP算法的优点是寻优具有精确性,但同时存在一些缺点,最主要的是易陷入局部极小、收敛速度慢和引起振荡效应等。由于遗传算法(Genetic Algorithm—GA)具有很强的宏观搜索能力,且能以较大的概率找到全局最优解,所以用它来完成前期的搜索能较好地克服BP算法的缺点。将两者结合起来,形成一种混合训练算法——GA-BP算法,可达到优化网络,更好地实现造纸废水处理的目的。
1 废水处理的实验系统
1.1 废水来源
本实验的废水为某造纸厂处理OCC的废水,其水质参数为CODCr620~2200mg/L、BOD5250~510mg/L、SS 500~1100mg/L、pH值6.5、色度50。
1.2 指标测量及设备配置
实验过程中进出水的COD采用法国AWA公司的在线COD仪测定;加药泵采用兰格BT00-100M型蠕动泵,通过调节蠕动泵转速来改变絮凝剂流量;进水泵为直流水泵,通过改变泵的转速调节进水流量,并将废水打入一体化反应器;泥位计使用西门子公司的InterRangerDPS300,用来测定反应器的泥位高度;智能控制模块为台湾研华公司(Advantech)的ADAM 4000、ADAM5000模块系列,通过RS485协议单独与PC相连,用于信号的转化和采集;PLC为西门子S7-200 226 AC/DC/RELAY,用于控制本实验中的开关;一体化反应器由华南理工大学研制开发[9],模型体积为140L(直径0.70m,总高度1.10m,下部锥体高度0.30m,锥度45°),废水在高效反应器的停留时间为2~4h,设计处理能力为36~72L/h。附带的调节池和清水池体积均为125L的立方体容器(边长均为50cm)。
1.3 废水处理实验系统
废水处理工艺流程如图1所示。废水在调节池中经搅拌器搅拌后通过进水泵打入一体化反应器。絮凝剂PAC(聚合氯化铝)经1#蠕动泵在进水泵前加入废水中,助凝剂PAM(聚丙烯酰胺)经2#蠕动泵从一体化反应器上部加入反应器,废水在反应器中与药剂混凝沉淀,清水一部分回用到车间中,一部分进入生化池进行生化处理。混凝过程中产生的污泥聚积在反应器底部,当污泥泥位高度高于设定高值时电磁阀自动打开排泥,到达设定低值时电磁阀自动关闭,从而使反应器的污泥高度保持在合适位置。
图1 实验室条件下废纸造纸废水处理工艺
本实验采用自动检测控制方法完成水质的在线检测以及加药量的自动控制,其监测系统如图2所示。监测系统采用IPC作为上位机,PLC作为下位机的控制系统。COD仪自动检测原水和出水COD,检测频率通过PLC控制电磁阀实现,COD经ADAM4017+模块转换成数字信号,实时显示在安装于IPC的MCGS组态软件中;进水量和加药量通过ADAM 4024模块输出电压控制蠕动泵和直流泵的工作电压以改变流量来实现;高效反应器中的污泥通过泥位计实时监测,再结合PLC控制排泥阀保证反应器中的泥位保持在一定高度;ADAM 4024和ADAM4017+经总线转换模块ADAM 4520连接IPC机COM1口;PLC通过PPI通信电缆连接IPC机COM2口,IPC机上装有西门子公司提供的STEP7 Micro WIN32软件,可以在IPC下对PLC编程,然后把编好的PLC程序通过PPI电缆下载到PLC实现其对电磁阀的控制功能。
图2 废纸造纸废水处理自动控制系统
2 废水处理预测过程中BP网络预测模型
2.1 参数选择
影响造纸废水处理过程出水COD的因素很多,根据废水处理工程的实际情况,检测参数获取的方便性及与出水COD相关程度,选取的参数如下:通过t时刻的原水COD、加药量、进水流量以及出水COD,预测废水处理系统t+Δt时刻的出水COD,数学表达式如下:
式中,各变量x(t)、v(t)、u(t)、y(t)分别表示t时刻的进水COD、加药量、进水流量和出水COD;y(t-Δt)和y(t-2Δt)分别表示t-Δt和t-2Δt时刻的出水COD;y1(t-Δt)=y(t)-y(t-Δt)和y2(t-Δt)=y(t)-2y(t-Δt)+y(t-2Δt)分别表示出水COD在t-Δt时刻的一阶、二阶导数,代表出水COD的变化趋势;y(t+Δt)表示t+Δt时刻废水处理系统的出水COD预测值,在此Δt取0.5h。
2.2 预测模型结构
本实验造纸废水处理过程出水COD的预测模型结构采用3层BP网络结构,以上8个选择参数为网络的输入神经元,出水COD预测值为输出神经元,中间隐含层的神经元个数根据经验选择17个。构造该模型的推理网络如图3所示。
图3 预测模型示意图
2.3 样本数据的获取
训练样本数据是影响网络学习和泛化能力(即对于同一样本集中的非训练样本,网络仍能给出正确的输入输出关系的能力)的重要因素,应具备致密性、遍历性和相容性[10-11],结合实验室具体条件,在此采用正交实验法获取样本数据。考虑原水COD、进水流量、加药量3个因素,每个因素选取4个水平,考察这些变量与出水COD的相互关系。
将获得的64组样本数据分成两部分,32组训练数据用来训练网络,使其具备预测功能,而另外32组测试数据用来检验训练好的网络泛化能力,鉴于篇幅,在此只列出部分样本数据(见表1)。
表1 部分样本数据
3 基于遗传算法的神经网络训练方法(GA-BP法)
遗传算法是一种基于自然选择和基因遗传学原理的优化搜索方法。它将“优胜劣汰,适者生存”的生物进化原理引入待优化参数形成的编码串群体中,按照一定的适配值函数及一系列遗传操作对各个体进行筛选,从而使适配值高的个体被保留下来,组成新的群体,新群体中各个体适应度不断提高,直至满足一定的极限条件[12]。此时,群体中适配值最高的个体即为待优化参数的最优解。正是由于遗传算法独具的工作原理,使它能够在复杂空间进行全局优化搜索,并且具有较强的鲁棒性。
遗传算法应用于神经网络的一个方面是用来优化人工神经网络(ANN)的结构,另一个方面是用遗传算法学习ANN的权重,也就是用遗传算法取代一些传统的学习算法。考虑到BP算法寻优具有精确性,但易陷入局部极小、收敛速度慢的缺点,而遗传算法具有很强的宏观搜索能力,可避免局部极小,若将两者结合起来就会发挥各自的优势。
3.1 混合GA-BP算法原理及步骤
GA-BP算法就是在BP算法之前,先用遗传算法在随机点集中遗传出优化初值,以此作为BP算法的初始权值,再由BP算法进行训练。GA-BP算法的步骤:
(1)初始化种群P,包括交叉规模、交叉概率Pc、突变概率Pm以及各层之间权值的初始化;在编码中,采用实数进行编码,初始种群取30。
(2)计算每个个体评价函数,并将其排序,可按下式概率值选择网络个体。
其中,fi为个体i的适配值,可用误差平方和E来衡量,即:
f(i)=1/E(i)
其中,i=1,…,N为染色体数;k=1,…,4为输出层节点数;p=1,…,5为学习样本数;Tk为教师信号。
(3)以概率Pc对个体Gi和Gi+1交叉操作产生新个体Gi′和Gi+1′,没有进行交叉操作的个体进行直接复制。
(4)利用概率Pm突变产生Gj的新个体。
(5)将新个体插入到种群P中,并计算新个体的评价函数。
(6)计算ANN的误差平方和,若达到预定值εGA,则转(7),否则转(3),继续进行遗传操作。
(7)以遗传算法遗传出的优化初值作为初始权值,用BP算法训练网络,直到指定精度εBP(εBP<εGA)。
BP算法通过反向传播的调整网络层之间的权值,权值调整量按[权值修正量]=[学习步长]·[局部梯度]·[单元的输入信号]进行,即,对输出层,有Δwjk=η·δk·yj;对隐层,有Δvij=η·δj·xi,从而得到新的输出层和隐层的权值为
wjk=wjk+Δwjk,vij=vij+Δvij
3.2 网络训练与仿真分析
将其中32组实验数据进行训练,用GA-BP算法训练图3的BP网络,其遗传算法误差平方和曲线、适应度曲线和BP算法的训练目标曲线分别见图4和图5。遗传算法的初始种群Pop=30,目标精度εGA=5.0;BP算法的目标误差err_goal=0.02,学习率lr=0.01。可以看出,GA进行了80代的遗传操作达到了目标值εGA;BP算法进行了1952步收敛到指定精度εBP。利用训练好的网络模型对这32组数据进行仿真,结果如图6所示。从图6可以看出,网络的仿真输出与期望输出非常接近,说明此网络具有很强的学习能力。
3.3 GA-BP模型预测废水处理过程
利用训练好的GA-BP网络模型对另外32组完全不同于训练数据的实验数据进行预测仿真,并与实际期望输出进行比较,同时计算出相对误差,其结果分别如图7和图8所示。计算得出最大相对误差为2.56%,平均相对误差为0.88%,结果表明,GA-BP模型可以实现对造纸废水处理过程的预测。
4 结论
4.1 利用训练好的GA-BP网络模型对实验数据进行仿真,网络的仿真输出与期望输出很接近,最大相对误差为2.56%,平均相对误差为0.88%,这表明GA-BP网络具有较强的学习能力。
4.2 传统BP网络的优点是寻优具有精确性,但是易陷入局部极小、收敛速度慢和引起振荡效应等缺点;而遗传算法具有很强的宏观搜索能力,且能以最大的概率找到全局最优解;将遗传算法和BP网络两者结合起来形成一种混合训练算法——GA-BP算法,能达到优化网络的目的,可以实现对废水处理过程的预测,且泛化能力很好。
4.3 GA-BP算法可以运用到废水处理过程中COD的预测,网络模型能够较好地反映出各个因子与出水COD的非线性对应变化规律,仿真结果表明,预测的结果很理想。
[1]ZhangQ,Stanley S J.Real-time water treatment process controlwith artificial neural network[J].Journal of Environmental Engineering,1999,125(2):153.
[2]马邕文,吴 娇,万金泉,等.废纸造纸废水的水解酸化处理[J].中国造纸,2006,25(10):22.
[3]白 桦,李圭白.混凝投药的神经网络控制方法[J].给水排水,2001,27(11):83.
[4]Zhu J.An on-Line wastewater quality predication system based on a time-delay neural network[J].EngineeringApplications ofArtificial Intelligence,1998(11):747.
[5]Meyer U,Popel H J.Fuzzy control for nitrogen removal and energy saving in wwt-plants with pre-denitrification[J].Wat Sci&Tech,2003,47(11):69.
[6]Baeza J A,GabrielD,Lafuente J.I mproving the nitrogen removal efficiency ofA2/O basedWWTP by using an on-line knowledge expert system[J].Water Research,2002,36:2109.
[7]Punal A.Adcanced monitoring and control of anaerobic wastewater treatment plants:Diagnosis and supervision by a fuzzy based expert system[J].Water Sic&Tech,2001,43(7):191.
[8]田 禹,王宝贞,周 定.基于BP人工神经元网络的臭氧生物活性炭系统建模研究[J].中国给水排水,1998,14(3):24.
[9]万金泉,马邕文,王 艳,等.废纸造纸废水特点及其处理技术[J].造纸科学与技术,2005,24(5):58.
[10]Zhang J,Ou J,YuD.Real-timemulti-step prediction control forBP network with delay[J].Journal of Harbin Institute of Technology(New Series),2000,7(2):82.
[11]Jang S R.ANFIS:Adaptive-network-based fuzzy inference systems[J].IEEE Trans.on Systems,Man&Cybernetics,1993,23(3):665.
[12]王智平,刘在德,等.遗传算法在BP网络权值学习中的应用[J].甘肃工业大学学报,2001,27(2):20.