基于关联向量机的污水处理软测量模型研究
2021-12-23罗隆
摘 要:出水总氮(TN)和总磷(TP)是衡量水质的重要指标,用人工方法分析存在很大的滞后性且难以测量。针对污水处理过程中强非线性、随机干扰等因素带来的一系列问题,运用基于关联向量机(RVM)的软测量方法,通过数据训练建立起水质软测量模型。试验结果表明,基于关联向量机的污水处理软测量模型能起到较好的预测效果,适合工业应用。
关键词:软测量;关联向量机;污水处理
0 引言
当前,污水排放量随着城市化推进和工农业发展而日益增加。我国近年兴建了大量的污水处理厂,来改善水资源环境,以免其进一步恶化[1]。由于污水处理过程机理复杂,为建立良好的监测机制,保证良好的出水水质,必须及时监控污水处理过程中的水质参数。根据国家相关排放标准,总氮(TN)、总磷(TP)是衡量水质好坏的重要指标,但目前大部分检测由人工完成,存在难以在线测量、时间延迟长、无法实时监控调节等问题。而水质在线检测仪的技术尚不完善,存在检测精度不高、维护困难、设备昂贵等问题。为此,近年来兴起了软测量技术,能够代替硬件仪表进行实时测量,针对污水处理过程中难以测量或暂时不能测量的参数,通过建立某种数学模型,对其进行估计。国外在软测量技术研究方面十分活跃,在化工领域已经取得了可喜的研究成果,而在污水处理领域还处于基础研究阶段[2]。
在污水处理水质指标的软测量研究中,国内外专家提出了多种智能建模方法,如神经网络、支持向量机等,其中以神经网络为建模工具的基于知识的方法研究最为活跃[3]。神經网络法采用经验风险最小化的原则,在样本有限的条件下,学习过程容易陷入过学习、维数灾难、局部最小等境地,而支持向量机的支持向量个数随着训练样本的增大而线性增大,导致在线检测时间更长;而且支持向量机的惩罚因子难以选择合适的值,设置不当容易引起过学习问题。关联向量机(RVM)基于贝叶斯框架构建,其泛化能力优于支持向量机,且其测试时间更短,更适用于在线检测。为此,本文提出引入关联向量机(RVM)这一软测量方法,建立水质中重要指标总氮(TN)和总磷(TP)的模型。
1 污水处理工艺
一个典型的污水处理过程如图1所示,该污水处理过程又叫活性污泥法处理过程,它包括初沉池、曝气池和二沉池[4]。初沉池用来除去废水中的可沉物和漂浮物;在曝气池中使污水中的有机污染物与活性污泥充分接触,并吸附和氧化分解有机污染物;二次沉淀池用以分离曝气池水中的活性污泥,并将池中的一部分沉淀污泥回流到曝气池,以供应曝气池赖以进行生化反应的微生物,剩余污泥作为固体废物排出做进一步处理。
2 关联向量机
关联向量机是M. E. Tipping提出的跟支持向量机类似的稀疏概率模型,它是在贝叶斯框架下进行的,基于主动相关决策理论,在先验参数的结构中移除不相关的点,从而获得稀疏的模型。同支持向量机(SVM)相比,关联向量机具有以下优点:(1)避免主观设置误差参数;(2)所用的相关向量少于SVM;(3)核函数不用满足Mercer条件,有更大的选择范围[5]。
3 基于关联向量机的出水TN和TP预测模型和试验
污水处理过程是一个多变量、多目标、多层次、含海量信息的复杂系统,各种参数之间存在强烈的耦合和关联。在本研究中出水TN选择流量、进水浊度、悬浮物浓度SS及NH4+-N、曝气池氧DO、温度T、酸碱度pH、氧化还原电ORP、混合液悬浮固体浓度MLSS、NO3--N及曝气池电导率k、出水悬浮物浓度SS及NH4+-N等13个参数;出水TP选择流量、进水浊度、悬浮物浓度SS及曝气池氧DO、温度T、酸碱度pH、氧化还原电ORP、混合液悬浮固体浓度MLSS、NO3--N及曝气池电导率k、出水悬浮物浓度SS等11个参数。
本文采用广州市某污水厂采集的1 000组数据进行软测量建模,选取250个样本,经过3σ法则预处理后,剩余222个样本,选取200个样本,将其中前170个样本作为训练样本建立模型,后30个样本作为测试样本检验模型的泛化能力,对TN与TP的30个泛化样本的检测结果如图2所示。
从表1可以看出,对比神经网络和支持向量机的建模效果,关联向量机在各项性能上都有提升。基于关联向量机的出水TN模型预测误差平均值0.92,误差最大值2.11,RMSE=1.05;出水TP模型预测误差平均值0.15,误差最大值0.42,RMSE=0.19。其拟合精度高于神经网络和支持向量机建立的模型,体现出关联向量机在小样本情况下具有更好的泛化能力。
4 结语
本文基于关联向量机建立了水质中重要指标总氮(TN)和总磷(TP)的模型,实验例证表明,在小样本情况下,基于关联向量机所建立的模型比神经网络和支持向量机建立的模型具有更好的泛化能力,对于进一步实现污水自动化的实时控制有一定的应用价值。
[参考文献]
[1] 李畅,潘丰.基于XGBoost的出水氨氮和总磷浓度的软测量研究[J].计算机与数字工程,2021,49(5):1003-1008.
[2] 刘勇.基于关联向量机建模方法及化工软测量应用研究[D].杭州:浙江工业大学,2017.
[3] 李东,黄道平,许翀,等.基于协同训练的集成自适应GPR-RVM多输出模型研究[J].华南理工大学学报(自然科学版),2021,49(6):100-108.
[4] 杨吉祥.污水处理软测量技术研究进展[J].净水技术,2020,39(4):12-18.
[5] TIPPING M E.Sparse Bayesian Learning and the Relevance Vector Machine[J].Jonrnal of Machine Learning Research,2001(1):211-244.
收稿日期:2021-09-03
作者简介:罗隆(1976—),男,湖南邵阳人,博士,副教授,主要从事自动化控制研究和教学工作。