污水出水水质的SVR建模
2015-01-06刘帮秦斌彭小玉
刘帮,秦斌,彭小玉
(湖南工业大学 电气与信息工程学院,湖南株洲 412007)
污水出水水质的SVR建模
刘帮,秦斌,彭小玉
(湖南工业大学 电气与信息工程学院,湖南株洲 412007)
针对污水处理过程中关键水质参数如生化需氧量(BOD)在线测量难的问题,利用Libsvm工具箱建立BOD的支持向量回归机(SVR)的软测量模型,并与文献[2]中所用神经网络的方法进行了比较,仿真结果表明:相对于神经网络算法结构性不足,SVR预测模型泛化性更好,预测精度更高,表现出更好的泛化性和预测精度。
支持向量回归机;生化需氧量;Libsvm;软测量
0 引言
随着序批式活性污泥法(SBR)自动化程度要求越来越高,在污水处理过程中获取准确的过程参数尤为重要。然而,目前污水处理过程中只有一些物理、化学参数能够实现在线测量,对一些关键过程参数如出水TN、TP、BOD等参数不能进行准确和有效的在线测量,使污水处理过程难以实现闭环控制[1]。虽然许多污水处理厂对污水指标参数的检测可以依靠人工化验得到的,但其化验结果具有一定程度的滞后性,尤其是BOD5指标,需要五天后才有结果,等知道水质不合格时,早已排出了大量的不合格水,造成了“二次污染”[2]。因此污水处理出水水质预测成为被广泛研究的重要问题。由于水处理过程中的高维非线性、时变、大滞后等问题,工艺机理和回归分析建模不仅需要完全掌握工艺机理,遵循严格的线性化假设条件,而且所需的基础资料与数据较多,所以很难建立精确的模型对其进行准确描述。近年来,神经网络在污水处理领域得到了较为广泛运用[2-4],但因为神经网络固有的缺陷[5-6],如容易陷入局部极小、推广能力差等,导致其在实际应用中受到了一定的约束。
支持向量机(Support Vector Machines,简称SVM)是基于统计学习理论的机器学习算法, 针对解决小样本、非线性系统的问题中有一定的优势,克服了神经网络易陷入局部最优、泛化能力差等缺点[7]。本文在已有的研究工作基础上深入探讨与研究支持向量回归机在污水处理系统水质预测研究中的应用,设计了一种支持向量回归机BOD预测模型,将预测结果作为指导污水厂运行的依据,动态的调整污水处理过程中各工序运行状态。通过仿真结果表明,该模型具有较好的BOD回归预测能力,泛化性更强。
1 支持向量机回归原理
描叙多元非线性回归模型一般形式为:y = f(x1, x2,…, xL),其中,(i = 1, 2, …, L)表示多核支持向量机回归预测模型的输入量,y表示模型目标输出量。映射函数。使用核函数将原始输入空间的样本映射到高维特征空间据进行线性回归。其回归估计函数为:中,在特征空间中利用映射函数对样本数
式中:ω 为权重向量;b为偏置项。可以通过求解最优化问题得到系数 ω 和b。
式中:常数C>0,为惩罚系数,用来平衡模型的复杂度和训练误差;为导出式(2)的对偶形式,求解凸二次规划问题,引入 Lagrange 函数,表示如下:
将式(4)代入式(2)就得到对偶优化问题[9]:
式(2.23)中SV表示训练样本集对应的支持向量的集合,因此最终决策函数为:
通过分析SVM回归原理可知,在利用支持向量回归机解决实际问题时,惩罚系数 C 和相应核函数参数决定了SVM回归性能。根据相关文献描述,高斯径向基核函数的回归能力强,预测效果好。因此,本文采用高斯径向基核函数作为核函数,其表达式为:
2 支持向量回归机BOD建模
采用文献[2]里面的数据,为了并与文献2中对BOD建模方法进行比较,本文支持向量回归机模型使用的训练集与测试集与文献2相同。确定10个过程参数:进水化学需氧量(COD)x1、进水生化需氧量(BOD5)x2、进水悬浮固体浓度(SS)x3、进水总磷(TP)x4、进水氨氮(NH3-N)x5、进水水量(SQ)x6、水温(T)x7、污泥量(NQ)x8、曝气池溶解氧溶度(DO)x9、曝气池酸碱度(pH)x10作为支持向量回归机模型输入,出水BOD作为模型输出。利用公式(7)建立SVR生化需氧量的预估模型,即:。给定数据集;xi为10维样本输入量,yi为生s化需氧量实际值。
3 仿真结果与分析
本实验以Matlab2013为平台,采用专门用于支持向量机模式识别和回归的软件包libsvm3.1进行仿真研究,在此声明本文实验所用支持向量机程序是以台湾大学林智仁教授的SVM程序为基础,在此基础上进行相应的修改而实现的。其中参数设置为:g=0.3,其他参数取默认值。根据均方误差式(9)来评价模型的优劣。
对应的仿真结果如图1、2所示。
分析图1、2和表1可知,本文提出的SVR方法的均方误差为0.0089,最大/小相对误差为0.1452/0.0033;文献4中均方误差为0.0193,最大/小相对误差为1.27/0.07。本文所采用的支持向量回归机的预测模型相对于文献4中的模型在均方误差和相对误差上都有较大的改善,模型的回归预测精度及泛化能力都有所提高,较好的跟踪了BOD的变化趋势,验证了模型的有效性。
4 结论
针对污水处理重要水质参数难于在线测量的问题,本文提出了一种基于支持向量回归机的污水水质预测方法,并将该算法应用于对BOD的预测,试验结果表明:相对于神经网络算法结构性不足,SVR的预测模型泛化性更好,预测精度更高;并且其预测结果的变化趋势可以为污水处理厂实际运行提供理论支持,从而实现污水厂高效、经济的运行,具有较高的实用价值。
图1 BOD浓度支持向量回归机检测样本仿真结果Fig. 1 The results of BOD concentration for test samples on SVR
图2 BOD浓度检测样本相对误差Fig. 2 The relative error of BOD concentration for test sample
表1 SVR算法与文献2改进BP网络算法预测性能比较Tab. 1 SVR algorithm compared with BP network algorithm to predict performance in literature 2
[1] 穆秀春. 基于统计回归的污水处理出水水质的软测量研究[D]. 浙江工业大学, 2005.
X C Mu. Study on soft measuring for sewage disposing effluent quality based on statistical regression methods[D]. Zhejiang University of Technology, 2005.
[2] 罗腾飞. 基于改进BP神经网络的污水处理出水指标预测[D]. 内蒙古农业大学, 2012.
T F Luo. Predictive indicators of water in waste water treatment based on improved BP artificial neural network[D]. Inner Mongolia agricultural university, 2012.
[3] 王瑞. 基于遗传优化BP神经网络的污水处理水质预测研究[D]. 华南理工大学, 2012.
R Wang. Prediction of wastewater treatment based on genetic algorithm optimization BP artificial neural network[D]. South China University of Technology, 2012.
[4] 郭鹏飞. 基于改进RBF神经网络算法的水质预测模型研究[D]. 南昌: 华东交通大学, 2013.
P F Guo. Research on the optimized prediction model of water quality based on RBF neural network[D]. East China Jiaotong University, 2013.
[5] 肖晓, 徐启华. 基于SVM 与BP 的分类与回归比较研究[J]. 新型工业化, 2014, 4(5): 48-53.
X Xiao, Q H Xu. A Comparative Research on the Classification and Regression Based on SVM and BP[J].The Journal of New Industrialization, 2014, 4(5): 48-53.
[6] 王沥, 邝育军. 一种基于蚁群算法的BP 神经网络优化方法研究[J]. 新型工业化, 2012, 2 (4): 8-15.
L Wang, Y J Kuang. Research of BP neural network optimizing method based on Ant Colony Algorithm[J]. The Journal of New Industrialization, 2012, 2(4): 8-15.
[7] 梁勇. 基于支持向量回归的水质预测研究[D]. 武汉理工大学, 2012.
Y Liang. Research on water quality prediction based on support vector regression[D]. Wuhan University of Technology, 2012.
[8] 黄细霞, 石繁槐, 顾伟. 加权支持向量回归在线学习方法[J]. 上海交通大学学报, 2009 (6): 927-930.
X X Huang, F H Shi, W Gu. Weighted on-line support vector regression[J]. Joural of Shanghai Jiaotong University, 2009 (6): 927-930.
[9] 周威, 金以慧. 利用模糊次梯度算法求解拉格朗日松弛对偶问题[J]. 控制与决策, 2004, 19 (11): 1213-1217.
Zhou Wei, Jin Yihui. Fuzzy Subgradient Algorithm for Solving Lagrangian Relaxation Dual Problem[J]. Control and Decision, 2004, 19 (11): 1213-1217.
Modeling of Wastewater Effluent water Quality on Support Vector Regression Machine
LIU Bang, QIN Bin, PENG Xiaoyu
(School of Electrical and Information Engineering, Hunan Uniνersity of Technology, Zhuzhou 412007, China)
Aiming at sewage treatment process in the key water quality parameters such as biochemical oxygen demand (BOD), the difficulty of on-line measurement, using Libsvm toolbox establish BOD support vector regression machine (SVR) of soft measurement model, and compared with the literature [2] the method of neural network used in the comparison, the simulation results show that the structural deficiencies compared with the neural network algorithm, the SVR forecasting model generalization is better, higher prediction precision, better generalization and precision.
Support vector regression machine; biochemical oxygen demand; Libsvm; soft measurement
10.3969/j.issn.2095-6649.2015.01.07
国家自然科学基金(61074067, 21106036), 湖南省科技计划重点项目(2014FJ2018), 湖南省自然科学基金(13JJ3110),湖南省高校科技创新团队资助
刘帮(1988-), 男, 湖南工业大学硕士生, 主要研究方向: 复杂过程建模, 集成优化控制; 秦斌(1963-), 男, 博士, 教授,硕士生导师, 研究方向为复杂工业过程建模与控制和智能调度等; 彭小玉(1991-), 女, 湖南工业大学硕士生, 主要研究方向: 复杂过程建模, 集成优化控制
刘帮,秦斌,彭小玉.污水出水水质的SVR建模[J].新型工业化,2015,5(1):45-48