基于高斯过程的污水脱氮过程的软测量方法
2010-07-25田宇阎威武
田宇,阎威武
0 引言
在工业过程控制中,由于工艺技术和检测技术的限制,存在着许多无法或难以直接测量的,导致了控制难以有效实施。例如,在污水处理过程中,许多控制参数不能实现在线检测。这些反应工业过程信息的重要变量通常是由在线测量或离线的实验室分析得到。然而在线分析仪表进行检测需要很大投资,且需要高昂的维护费用。离线的实验室分析结果存在很大的延时,分析结果无法用作控制系统的反馈信号。这些限制将会造成产品质量和安全方面的问题。因此软测量方法在复杂工业过程控制中得到了广泛的应用。
软测量技术起源于20世纪70年代Brosillow[1]提出的推断控制,它将工艺机理与控制理论有机地结合起来,在一定程度上解决了过程工业某些重要质量指标的在线控制问题。然而由于工业过程十分复杂, 机理模型很难得到。所以经验方法常常被用来建立软测量模型。基于经验数据的建模方法就是在给定的经验数据下,寻找最佳模型,使之能够有良好的泛化能力和预测能力。
高斯过程是近些年提出的一种监督的机器学习方法,并在机器学习领域得到了很高的关注度。高斯过程中的随机变量即为输入样本点。它利用标记样本更新协方差矩阵,并在此基础上求得对测试样本的估计。在对协方差矩阵的计算中,核方程可以选择不同的形式。而且高斯过程中对概率的计算还提供了模型选择的理论框架。因此高斯过程可以称得上是一种既有应用前景,又有完整的理论框架的机器学习方法。
污水处理过程的生产条件恶劣,随机干扰严重,具有强非线性、时变、大滞后等特点,难以建立精确的数学模型,且关键水质参数无法在线监测,是一类典型的复杂过程。而污水处理过程又要求连续的工作以及严格的指标控制。
针对污水脱氮过程复杂,状态难以测量的问题,以及高斯过程的特点,本文将高斯过程用于复杂工业过程建模。并在BSM 1模型生成的数据上进行了验证。结果表明高斯过程软测量模型在精度、可靠性等方面较好,可满足工业现场应用要求。
1 污水处理过程及其软测量技术
废水处理过程[2]一般包括一级处理,二级处理,三级处理以及消毒等过程。每一级处理过程中又分别包含了不同的处理过程。随着天气状况的变化,污水流入量及污物程度还展现很大的波动。这都给污水处理带来了很大的困难。因此废水处理工厂(WWTPS)是一个典型的大型非线性系统。而 WWTPS是一类与日常生产生活以及环境保护相关的重要设施,其重要性又要求连续时间的工作以及严格的指标控制。
因此,近年来水处理过程控制成为国内外的研究热点。一些列的控制方法先后应用在了污水处理过程中。但是,由于目前许多重要的污水指标还不能够实时检测,许多方法只能采用开环控制,或者选择其他间接指标进行控制。例如,由于测量手段不成熟,对某些变量,现有传感器还达不到足够的精确性和可靠度,无法进行准确和有效的在线测量。所以致使一些关键水质控制效果还没能够达到要求。
软测量就是根据某种最优准则,选择一组与主导变量关系密切而又容易测量的变量,通过构造某种数学关系,以实现对主导变量的估计。软测量技术其实就是一种对复杂系统的建模技术。通过选取合适的辅助变量在线地估计主导变量,就能够解决污水处理过程控制中存在的一系列问题。
软测量模型的设计一般包括[3]:
1)辅助变量的初步确定:包括变量类型,变量数量和检测点位置的选择;
电力输送是能源发展与配置工作开展的基础。在规模较大、距离较远的输电技术应用过程中,与交流输电方式相比,直流输电方式更具有输送容量大、输送距离远的优势,其单位容量的造价以及相应的能源损害程度也比较低,但同时,该输电方式的技术要求也比较高。鉴于此,针对柔性直流电网串联直流潮流控制器及其控制策略这一课题进行深入研究具有重要的现实意义。
2)现场数据采集及预处理:包括主导变量和原始辅助变量的历史数据的采集。
3)辅助变量复选:对辅助变量进行降为以减少数量及冗余信息;
4)建立软测量模型:包括机理模型和数据驱动模型;
5)离线训练:通过把数据分为训练样本和测试样本来检验模型的有效性,可以采用交叉验证的方法进行样本分类;
6)在线矫正:根据工况的变化对软件进行调整,包括结构优化和参数优化两个方面。
一系列的控制方法先后应用在了污水处理领域。但是由于废水处理过程的自身特性,对不同的控制方法的比较非常困难。IWA 就此建立了国际评价基准1号模型(BSM1)[4]。该模拟环境包括装置构造、模拟模型、进水负荷、测试程序和评价标准。BSM1以污水处理厂实际的运行操作数据为基础,设计了3个关于进厂污水情况的输入文件,对应于天气的不同状况。组分分为时间,易生物降解基质,易养活性生物量,慢速可生物降解基质,惰性颗粒有机物质,溶解性氨氮等等13种成分。本文在由BSM1仿真模型生成的数据上对高斯过程软测量技术进行了验证。
2 高斯过程回归[5]
可见,一个高斯过程可由其方差和均值完全确定。可以把高斯过程可以看成是联合高斯分布的一个推广,每一个输入样本都是高斯过程中的一个随机变量。由于不同的输入样本通过计算可得不同的均值及协方差矩阵,在高斯过程中就规定了不同的函数空间。
其中k(x,x')为由k(x,x')计算得到的协方差矩阵。由高斯过程的定义,测试样本与训练样本的联合概率分布仍然是一个高斯分布,为,
把(3)式带入贝叶斯公式,得:
即为高斯过程回归的预测方程。
可见,选定协方差方程,均值以及噪声的分布,并利用已知样本去更新高斯过程的分布参数,就可以得出对预测样本的估计。
3 实验验证
在污水处理过程中总克氏氮(Total Kjeldahl Nitrogen—TKN)不能在线检测,但是在污水处理控制过程中又是很重要的一个指标。所以令其作为实验的预测量以进行检验。实验共取1345组数据。采用了BSM 1在Matlab上的仿真模型,取原始数据为晴天和雨天时的数据。结果是由算法多次的平均值得到的。图1,图2为原始数据分别为雨天和晴天时得到的仿真结果图。较雨天数据,晴天时污水流入量及污物程度等指标波动小,污水处理过程运行更为平稳,展现的非线性程度更小,所以从直观上晴天仿真结果曲线略好。
图 1 雨天数据预测曲线及实际值(虚线)对照图
图 2 晴天数据预测曲线及实际值(虚线)对照图
表1 总克氏氮预测误差(RMSE)
GPR指高斯过程回归(Gaussian Process Regression)。由表1数据可知,通过数据驱动的方法,通过训练高斯过程回归软测量进而对总克氏氮预测是可行的。
4 结束语
本文针对污水脱氮过程复杂,状态难以测量的问题,引入了高斯过程回归的方法对其建模。并在BSM 1模型生成的数据上进行了验证,取得了良好的效果。是在污水处理过程软测量的一次有益尝试。
[1] 冉维丽.基于神经计算学的污水水质软测量研究[D] .北京:北京工业大学 ,2004.
[2] Brosillow C B. Inferential control of process[J] . A ICH E,1978,24 (3):485-509
[3] 任敏,王万良,李探微,等.基于神经网络的污水处理软测量系统的研究[J] .自动化仪表,2001,22(10): 10-11.
[4] Alex J, Benedetti L, Copp J, Gernaey K, Jeppsson U,Nopens I, Pons M, Rieger L, Rosen C, Steyer J,Vanrolleghem P, and Winkler S, Benchmark Simulation Model no. 1 (BSM1) [M] , Dept. of Industrial Electrical Engineering and Automation. Lund University,2008
[5] Carl Edward Rasmussen and Christopher K. I.Williams[M] .Gaussian Processes for Machine Learning.The MIT press,2006.