数据驱动的工业过程运行监控与自优化研究展望
2018-12-05刘强卓洁郎自强秦泗钊
刘强 卓洁 郎自强 秦泗钊
1 工业过程全流程运行监控系统的内涵与行业现状
1.1 工业过程全流程运行监控的内涵
工业过程包括以石油、化工、钢铁、有色、建材等基础原材料行业为主的流程工业和以机械、电子、汽车、航空航天、轨道交通、海洋工程等装备制造行业为主的离散工业.现代工业过程通过控制与决策系统向大规模和集成化方向发展,通常是由多个工业装备组成的生产工序,其功能是将原料加工为下道工序所需要的中间产品,多个生产工序构成了全流程生产线.现代工业向精细化、集约化发展,对安全、高效、节能、高质生产提出了更高要求,需要对生产全流程进行有效监控[1].
工业生产要求全流程在安全运行的前提下,使反映加工半成品的质量和效率的运行指标尽可能高,反映资源消耗和加工成本的运行指标尽可能低[2],而且与上下游工序的过程控制系统协同.生产任务不只是局限于底层输出跟踪设定值,而且要求生产运行向上层要满足用户需求和原料状况,向下层又要综合考虑底层控制性能和设备状态、运行环境等生产条件.流程工业生产连续程度高、设备众多、变量间耦合严重、产品固定、产量大,具有复杂能量和物质回流、机理不清等典型特点;离散工业结构复杂、工艺过程长、产品工艺和设备柔性、产品和物料品种规格多,具有非标定制需求、多单元柔性加工、多/变约束运行等典型特点.在上述复杂工业环境和需求中运行的生产全流程控制与运行管理系统,因生产条件的频繁变化和恶劣环境,还可能造成运行指标、过程控制系统设定值的决策失误带来的异常工况,影响生产全流程的安全运行和产品质量[1].因此,除了要对常规的部件异常进行实时监控外,还需要能够实现监控生产全流程生产条件和运行环境变化、决策不当等引起的异常工况、运行指标异常和协同控制异常等.
工业过程全流程运行监控的内涵是利用相关物理资源和信息资源(例如设备状态数据、过程数据、图像、振动声音、巡检记录文本、决策信息等),综合控制理论、统计计量学、机器学习等理论技术以及人员经验实现工业过程监控与异常运行状况预测,判定待监控对象(包括决策和管理执行状况,产品质量、能耗物耗、排放等运行指标,控制系统性能,生产与人员安全,生产环境与关键设备)是否符合预期或标准,将结果在监控周期内(实时、定期巡检与抽样)反馈给实施监控的对象(管理人员、操作人员、工艺人员、设备维护人员等).在运行监控基础上诊断异常发生时间、原因和位置等,并根据评价结果进行生产决策、控制与维护,从而保障生产及人员安全、提高产品质量和生产效率、降低生产成本、节能减排,实现安全、绿色、高效生产的目标.
1.2 工业过程全流程运行监控的行业现状
目前,工业过程大多按企业资源计划(Enterprise resource planning,ERP)、制造执行系统(Manufacturing execution system,MES)、过程控制系统(Process control system,PCS)三层结构组织生产,需监控管理与计划决策、运行指标(产品质量、能耗物耗、排放)、控制系统性能与状态、人员安全与行为、环境与关键设备状态.
现有的监控与数据采集(Supervisory control and data acquisition,SCADA)的一类系统主要是PCS层数据的采集与监测.对于典型的流程工业而言,利用集散控制系统(Distributed control system,DCS)数据对执行器、传感器故障、控制系统组件失效或设备状态异常而引起的变量超限进行监控,虽然具有异常报警功能,但只是根据输入输出数据是否超过限制值,瞬间的超限因控制系统的作用而消失,且由于决策与控制的闭环反馈作用和系统各单元间的耦合作用会使输入输出互为因果关系,容易造成误报和异常溯源困难;对于离散工业而言,主要是通过单源特征参数来监控关键加工设备的局部运行状态.该类监控系统因忽略了数据的相关关系与因果关系,导致监控结果不可靠且不能全面监控全流程运行和中间产品质量.为提高过程监控和异常定位的准确性,工业界国内外一些先进企业特别是石化和钢铁行业逐渐开始采用统计过程监控技术对关键设备和生产流程进行监控.美国Aspen公司开发的统计过程监控软件已被石化企业广泛采用.在钢铁行业,加拿大Dofasco钢铁公司二号连铸机组成功采用统计过程监控技术实现了开浇阶段断浇故障的监控与预防[3],以及不同钢种切换过渡过程的监控[4].
对于管理与计划决策、运行指标、控制系统性能与过程运行状态、环境和关键设备状态、人员决策与操作尚缺乏有效的监控.管理与计划决策监控主要是对ERP和MES执行结果的监控,无法分析异常原因、监控不及时,无法实现决策、控制、设备一体化监控;对于产品质量和能耗物耗、排放等运行指标的监控主要是根据控制图(例如休哈特控制图、累加和控制图、指数加权平均控制图)等抽样检验,属于事后监控、实时性差;环境和关键设备状态的监控通过人员持检测仪表在生产线的巡检完成,无法实时监控原料及用户需求、系统运行环境、设备状态等生产条件的异常变化.现有运行优化与控制算法通常没有识别生产条件和运行工况变化的功能,不能适应工业过程的这种动态变化,在生产条件发生非期望变化时,如果处理不当就会导致系统性能变坏,使系统运行处于异常工况[1].
上述异常工况发生时,由于异常工况机理不清导致难以利用现有监控系统来诊断,通常由运行工程师靠耳朵和眼睛来观测运行工况表征以及利用ERP,MES,PCS获取的子系统/单元的短时运行数据凭经验判断与处理.由于诊断与处理具有主观性、滞后性和非优性,造成诊断与处理结果的差异大,无法保证最优且处理不当可造成严重的灾难性后果,难以安全优化运行.
2 工业过程运行监控的研究现状
2.1 工业过程运行监控方法
目前,工业过程安全运行监控的研究主要是基于模型的单元内控制系统故障诊断与容错控制方法[5−12],以及数据驱动的异常工况诊断与自愈控制方法[13−45].
2.1.1 基于模型的控制系统故障诊断与容错控制方法
对于可以获得系统模型的工业过程或生产单元,基于模型方法利用可测信号估计系统状态或残差进行监控,包括参数估计方法、观测器方法、对偶关系方法等对预先定义的传感器、执行机构、被控对象故障实现单元级控制系统故障的诊断[5−7].近年的主要进展是针对复杂工业过程参数不确定、时变干扰、未建模动态、非线性等导致故障特征难以辨识,提出了基于模型的一系列故障诊断方法.例如,为了解决了故障信息与外部干扰以及不确定性难以区分的问题,文献[8]提出了基于极大/极小优化理论的有限频故障诊断方法;针对非线性被控对象,文献[9]使用非线性模糊建模方法将原系统描述为T-S系统,基于集合论的模型描述和借鉴集合等价类技术的执行器故障的估计和分离方法.
容错控制是利用系统模型设计容错控制器,实现传感器、执行机构、被控对象故障情况下通过一定程度降低系统性能来保证稳定性和安全[10].近年的主要进展是针对现有容错控制技术难以在全局范围内对未知动态非线性系统进行故障补偿,提出了鲁棒自适应容错控制和基于多项式优化技术的非线性容错控制方法,解决了系统模型未知情况下根据系统输入输出数据设计容错控制器的难题.例如,文献[11]针对一类具有已知控制方向的严格反馈非线性系统,提出基于反推方法的执行器故障、非线性和外部扰动完全未知下的自适应容错控制方法;针对一类具有未知控制方向的不确定非线性系统,文献[12]引入新误差转换函数和通过构造新自适应机制,提出了一种低复杂度的状态反馈容错控制方法.
上述方法均以精确数学模型描述的过程模型为基础,仅限解决单元内控制系统故障的监控与诊断,性能的好坏很大程度上依赖于模型的准确程度,不能解决机理不清的复杂工业过程全流程的运行监控与异常工况诊断问题.
2.1.2 数据驱动的异常工况诊断与自愈控制方法
对于机理不清的难以获得精确数学模型的工业过程而言,运行异常原因不仅包括传感器故障和执行机构故障等控制系统故障,还包括原材料波动、运行环境变化、过程设备磨损老化、操作不当等原因引起的异常运行工况和产品质量不合格,难以采用传统基于模型方法进行诊断.
近二十年,随着工业过程普遍采用DCS采集了直接反映生产全流程运行工况的数据,数据驱动的监控与故障诊断方法通过各种数据处理与分析方法(例如多元统计方法、聚类分析、频谱分析小波分析等)挖掘数据中隐含的异常工况相关信息进行诊断.研究和应用最多的是以单一层面的主元分析(Principal component analysis,PCA)和独立元分析(Independent component analysis,ICA)以及多层面的偏最小二乘(Partial least squares,PLS)算法等为代表的多变量统计过程监控方法[13−20].该类方法利用正常工况数据建立潜结构模型,将由多变量构成的高维空间投影到低维来建立数据间的潜结构,在此基础上通过比较正常和故障条件下数据相关结构的变化来监控和诊断故障.故障监控一般根据故障检测指标超过其控制限来实现;在此基础上,常使用贡献图[14−15]或基于重构的贡献图[16,18,21]来识别故障变量以及结合过程知识分析故障原因,或利用历史故障数据提取故障方向并采用重构方法诊断故障原因[15,17,22].该类方法因其具有降维、便于可视化的优点,已在化工、薄膜制造、医药、微电子制造、钢铁生产等多种流程工业中取得成功应用.
目前,国内外学者在数据驱动的工业过程监控方面已经发表了大量研究成果,主要是针对具体的工业过程具有的大规模、间歇时段性、多层面运行、动态性、强非线性等过程复杂性,从提高过程监控结果的解释性和准确性的角度提出的过程监控与故障诊断方法.本文主要从过程复杂性出发,对已有成果进行分类和总结.
1)针对薄膜制造和钢铁冷轧连退过程这类典型的大规模连续生产过程,因其具有大规模变量和多单元串联加工特点,为了提高过程监控结果的解释性,学者提出利用过程知识或变量选择方法等对过程变量进行分块来建立多块潜结构模型,在此基础上实现对生产全流程的集散监控与诊断[22−28].例如,学者提出基于多块主元分析[23−25]和多级主元分析的集散诊断方法[28],成功应用于薄膜制造和钢铁冷轧连退过程的集散监控与诊断.近年来,学者还提出多块监控结果融合的集散监控方法[26]和大数据条件下的用于过程监控的并行PCA方法[27].
2)针对注塑过程、发酵过程、半导体加工过程等成批次多时段生产的间歇过程,会采集到批次、时间、变量三维数据.为了实现上述间歇过程的监控,Nomikos和MacGregor提出多向主元分析和多向偏最小二乘方法[29−30],首先将三维按照变量展开或批次展开成二维矩阵,再采用多元统计建模方法进行建模,从而分别监控间歇过程变量间关系的非期望变化和不同操作批次间的异常.近年的研究热点,主要是针对间歇过程的多时段提出考虑批次间过渡状态的软时段划分与监控方法[31−33],针对各批次数据不等长问题提出的过程监控方法[35],以及基于重构的间歇过程故障诊断方法[34].
3)复杂工业过程通常多层面运行,企业管理人员和工程师往往更关心过程故障是否会导致最终产品质量或运行指标的异常.但PCA一类方法只能检测到过程变量的异常状况,无法建立过程变量与产品质量或运行指标间的关系.如果检测到的故障不会造成产品质量或运行指标异常,会导致误诊断.基于PLS或基于典型相关分析的过程监控方法在滤除误报警方面更有效.例如,文献[36]将数据划分为过程数据与质量数据两层结构,采用PLS模型描述过程数据与质量数据间的潜结构关系,实现运行层故障和过程层故障的分离.但上述潜结构分解是面向质量预测的,在用于过程监控时会包含输出无关的变化以及对预测质量无用的大变化[37−38].针对上述问题,多位学者从过程监控角度对数据空间进行了更完整的划分,提出了运行层和过程层联合监控的一系列方法[38−44],包括基于全潜结构[39]和并发潜结构[40]的异常工况诊断方法以及非线性和集散扩展方法[41],为解决运行层与过程层异常工况的分离提供了有效途径.但上述方法并没有改变基本PLS模型对质量变量的预测能力,只是根据质量变量空间进一步分解过程数据空间.为此,文献[45−46]提出改进潜结构投影和高效潜结构投影方法,将过程数据空间分解为质量相关的子空间和质量无关的子空间并分别进行监控,并在钢铁热连轧机组进行分析比较和应用验证[47].上述建模与监控方法通常采用偏最小二乘算法,存在建模效率低、与质量有关的过程异常工况的诊断精度低等不足.针对该问题,文献[48]提出了基于并发典型相关分析的联合监控方法.但上述方法都属于监控工业过程稳态工况的监控方法.
4)复杂工业过程实际运行时通常具有动态运行特点,即由储能环境、动态操作、底层回路控制和运行控制的反馈作用会引入动态,采用上述稳态工况运行监控方法定义的正常范围往往过大,导致漏报率过高.针对该问题,学者提出了动态过程监控方法.文献[49]利用时间窗构造变量的增广矩阵并进行奇异值分解提出基于动态主元分析的异常监控方法,文献[50−53]提出基于子空间建模的方法(例如主元分析子空间辨识方法[52]),和同时考虑过程噪声和测量噪声的条件下的间接动态主元分析方法[54].如何面向工业过程运行监控对高维动态多时空数据建模和压缩一直是国际上尚未解决的难题,为了同时提取变量间的动态自相关和互相关,文献[55]提出一种基于动态潜变量模型的异常工况诊断方法.但该方法以潜变量估计方差最大为目标,可能提取出方差较大的静态变化,而非动态变化.针对上述问题,有学者提出动态内在主元分析方法[56],以动态潜变量及其预测值的协方差最大为目标,实现了依据动态性强弱依次提取时间序列低维数据特征和多时空大数据降维可视化和特征提取.从而,可以由降维的动态潜变量提取特征与预测未来,由动态和静态建模误差监控当前状况,为异常工况的监控与预测提供了新的解决思路.
5)绝大多数复杂工业过程严格意义上都是非线性过程,导致线性的潜结构建模与监控方法不能取得满意效果.为此,学者提出了一系列以主元分析、偏最小二乘、典型相关分析等潜结构建模算法为基础的非线性变形方法[57−59],例如与神经网络相结合的偏最小二乘方法[57]和基于核投影的非线性过程建模和监控方法.基于核投影的监控方法的基本思想是通过核函数将原始变量的低维空间投影到高维空间,采用传统的线性潜结构方法对高维空间数据建模,再利用核机制通过对高维空间的线性分解和监控实现对原始非线性空间的分解和监控.文献[42]提出了全核偏最小二乘方法,并成功应用于典型非线性过程钢铁热连轧生产过程带钢厚度相关故障的监控与原因诊断.
6)还有一些针对过程数据非高斯性提出的基于ICA的过程监控方法[19,60−61],以及针对数据采集和传输过程中引入的离群点、缺失点等数据复杂性提出的鲁棒建模与监控方法[62].
故障预测是早期发现异常并预测其发展趋势,现有故障预测的研究主要是面向设备视情维护,根据设备疲劳动力学模型[62]或异常发生概率演变模型[63]来预测装备或部件的剩余寿命.基于模型方法需要精确的机理模型,限制了应用范围.数据驱动方法通过分析过程数据来近似跟踪异常工况过程的退化特性.文献[64]利用逻辑回归分析和极大似然方法建立性能模型,利用滑动自回归模型估计设备剩余寿命.振动信号[65]的幅度、频率等特征也被用于异常工况预测.工业过程运行异常工况的预测仍是有待研究的难题.
工业过程运行监控的最终目标是通过维护与控制操作等手段使过程从异常工况或非优工况恢复到正常工况或优化工况.针对该问题,学者针对难以建立模型的复杂工业过程开展自愈控制方法研究.国内外自愈控制早期研究解决的是故障发生后采用网络化切换等调控手段恢复系统功能,例如自愈电网、集散控制系统的热后备智能切换系统、自愈军事卫星通信系统等.对于工业过程而言,自愈控制的含义有所不同,主要是在工业过程偏离安全运行的异常工况下,通过主动控制手段调整控制回路输入输出、操作指令等,使系统远离故障工况,从异常工况恢复到正常工况,并使实际运行指标尽可能接近目标值,从而改善系统安全性和运行品质[66−67].文献[68−69]针对竖炉焙烧过程和超高温电熔镁炉过程由于控制回路设定值不合适而导致的异常工况,提出了以调整改变控制回路设定值为手段排除异常工况的自愈控制方法.
迄今为止,上述大多针对具体工业过程的方法研究,尚未形成工业过程安全运行与自优化系统,特别是未能综合利用声像和过程数据多源异构动态信息实现准确监控,尚未解决运行决策故障和协同故障的远程移动可视化监控,尚不能通过评估系统运行动态性能、识别运行环境变化、量化原料与用户需求,通过自适应、自学习、自动调整控制结构和控制参数实现自优化运行.通过信息资源与工业过程物理资源相结合建立信息物理系统(Cyber-physical systems,CPS)来建立安全运行监控与自优化系统成为新的发展方向.
2.2 CPS时代安全监控与自优化的机遇
由ERP,MES,PCS三层结构组织的工业过程生产的企业目标、资源计划、调度、运行指标、生产指令与控制指令的决策处于人工状态,ERP,MES,PCS三者无法实现无缝集成.针对该问题,文献[2]指出下一代工业过程生产系统将发展为由智能自主控制系统、智能协同控制系统、智能优化决策系统、虚拟制造系统、安全运行监控系统组成的智能优化决策系统,如图1所示.其中,工业过程安全运行监控与自优化系统利用工业互联网和大数据管理云平台来获取智能自主控制系统、智能协同控制系统、智能优化决策系统、虚拟制造系统所产生的历史运行工况数据,建立各系统/单元内和系统/单元间协同的运行工况的模型,在此基础上以人机交互的方式监控整个生产全流程的决策和协同,保障系统安全、可靠、优化运行.其主要新特征是将工业互联网的计算资源与工业过程的物理资源紧密结合与协同,采用智能手段并充分利用优化决策系统、协同控制系统、智能化控制系统获得的多层面多源异构动态数据,从而将工业过程安全监控与自优化发展为CPS.
近几年大数据、云计算和人工智能技术的迅猛发展为实现下一代智能化运行监控与自优化系统创造了条件.一方面,大数据和云计算技术提供了必要的数据资源和计算资源;另一方面,以深度学习为代表的人工智能技术从基于逻辑推理和概率统计的传统范式向大数据驱动的新范式转变,通过解析多源异构动态数据中隐含的复杂结构特征来处理异常运行状况的不确定性和模糊性,为研究工业大数据条件下异常工况诊断与自优化系统和新方法奠定了基础.
图1 工业过程运行监控系统的作用Fig.1 Role of operational monitoring system
3 数据驱动的工业过程智能监控与自优化系统的研究展望
3.1 数据驱动的工业过程智能化运行监控与自优化系统的发展愿景
工业过程智能化安全运行监控与自优化系统(如图2所示)集运行状况感知与特征提取、运行状况监控、动态性能评价、异常运行状况预报、自愈控制/自优化于一体,采用智能手段利用大数据对系统动态运行状况、运行目标、运行环境进行远程移动实时准确的可视化监控,具有远程移动可视化、异常运行工况监控和自优化三大类功能.其愿景功能是智能自主感知与监控整个过程的决策和协同控制.在此基础上,评价系统动态性能,预报异常运行状况,在系统运行环境变化导致的异常工况下,通过自愈控制和自优化使系统恢复安全优化运行.目标是实现运行监控的精准性、实时性、预测性、远程移动可视化性,以及动态运行性能与运行指标的自优化,保障其安全优化运行.
图2 复杂工业过程智能化安全运行监控与自优化系统的架构Fig.2 Intelligent operational monitoring and self-optimization of complex industrial processes
具体功能包括:1)智能优化决策运行的监控,包括对决策控制一体化的监控、协同优化的监控、协同控制的监控、过程运行工况的监控、控制系统的监控、关键设备状态的监控;2)运行环境指标的监控与溯源;3)人员安全与操作行为的监控;4)产品质量、安全、排放、泄露等安全优化运行指标的监控与溯源;5)智能优化决策系统运行动态性能评价,实现智能优化决策系统一体化优化运行的动态性能评价、协同控制的动态性能评价、底层控制的动态性能评价;6)异常工况的智能预测;7)自愈控制与自优化控制:采用自愈控制/自优化手段对决策和控制进行调整,使系统从异常工况/非优工况恢复安全优化运行,实现运行指标(经济指标、能耗、物耗、加工精度等)自优化运行.
3.2 数据驱动的工业过程智能化运行监控与自优化研究的新方向
为实现上述发展目标和功能,解决动态机理不清的工业过程异常工况与决策故障等的监控,需要重点研究如下五个新方向.
3.2.1 数据驱动的决策、协同控制、底层控制多层面联合监控
生产资源制约因素难以量化与可视化,中间/最终产品质量难以测量,上层对工业过程中的异常难以实时响应.针对工业过程智能决策协同控制按照决策层、协同控制层、底层控制层多层面运行,产生多层面大数据[70−71]的情况,不仅通过DCS采集到过程数据,而且通过大数据平台获得与上层产品质量相关的用户评价数据以及下层设备级的特征数据.正常的产品质量等指标数据和过程运行数据通常占有特定的运行数据子空间,而不是任意占满全维空间.通过对各类层间共有的和层内特有的数据异常进行联合监控,为多层面联合监控提供决策支持.工业过程多层面数据的集成和融合扩展了用于异常工况监控的数据类别.
然而,面向多层面联合监控的潜结构建模通常难以考虑底层运行动态,这是因为多层面的PLS和典型相关分析(Canonical correlation analysis,CCA)一类潜结构模型由内模型和外模型组成,所以动态建模有更多可能性.对过程变量增广成含有很多迟延项再进行多层面联合监控是最直接的方式.但其缺点与动态主元分析方法类似,模型的目标函数不明确,而且矩阵维数人为增高导致潜在的动态关系难以解释.文献[72]提出一种偏最小二乘的修改算法,但只将动态项引入内模型,而外模型沿用静态PLS模型,形成内外不一致的动态偏最小二乘模型.文献[73]提出相似的方法建立动态内模型关系.然而,上述两种方法的动态内模型与静态外模型不一致.文献[74]采用过程变量延迟量加权组合作为输入,建立与指标变量得分间的内模型,实现了紧凑的内模型与外模型.然而,其内模型是不显现的且难以解释,难以用于故障监控.有学者提出基于动态内在偏最小二乘[75]和动态内在典型相关分析[76]的动态潜结构建模方法以及在此基础上的监控方法,通过使质量预测潜变量及其估计值的协方差或相关系数最大化,得到内外一致具有最精简动态结构模型.主要优点是具有最大输出预报能力,而且按预报能力对提取的潜变量排序,从而实现对质量相关异常的监控与预报.
上述多层面联合监控方法,需要利用同步均匀采样的过程数据与质量数据,而实际工业过程多层面运行采集到多尺度不均匀采样的工业大数据,主要是决策层采集到的指标数据或质量数据,往往是稀疏不均匀采样且具有延迟的,通常与高维过程数据具有动态强关联和潜结构.通过建立二者间的动态潜结构模型,就能够预测指标状况.已有学者取得了一些初步进展,文献[77]提出了将动态窗口与并发典型相关分析算法相结合的不均匀数据潜结构建模与异常工况诊断方法,利用动态窗口技术实现了慢速率质量与快速率过程数据之间动态潜结构的提取,通过多层面动态过程不均匀采样数据实现跨尺度质量预报与多层面联合监控方法.
运行工况和运行指标的标记数据通常难以获得,无法实现实时动态信息到异常运行状况的端到端学习,这方面的关键问题是研究基于稀疏标记数据与高维未标记数据的运行状况智能预测方法.特别是基于动态时间窗口与半监督集成学习方法,包括:
2)异常运行状况的征兆期预测与未来预测.以历史异常工况标记数据为输出,通过异常工况的模式匹配[79]实现征兆期异常的预测;利用高维动态数据提取的动态潜变量来预测未来数据特征,研究基于向量时间序列的异常工况趋势预测方法[75−76,80].
3)异常运行状况时空传播溯源.针对异常运行状况时间和空间双重传播性,研究异常时空传播溯源算法.特别是针对多层面的控制引入的闭环反馈可以改变故障的方向和贡献,造成故障根本原因的误诊断[81−82],重点研究多层面闭环数据去反馈影响的故障溯源方法.
3.2.2 基于机理、数据、知识多源异构动态信息融合的异常工况诊断与预测
现代工业过程的故障从设备级向上层运行扩展,包括设备级的单元故障、控制层控制系统故障、运行层物料及设定值操作不当引起的异常工况等.故障发生时,可从运行内部状态、外在表现、历史经验三个方面,利用机理、数据、知识多源动态信息进行运行工况诊断.
1)机理模型特征直接反应了运行内部状态,基于模型的故障诊断方法都需要利用运行的机理基准模型或其结构.然而,复杂工业过程的基准模型或基准模型结构可随时间改变,难以预先确定.为了解决这类问题,学者们提出了一种新的面向故障诊断的系统建模和模型特性分析方法[83],通过线性/非线性黑箱模型辨识和模型特性分析实现故障检测和诊断.文献[84]提出利用输入输出数据建立非线性自回归滑动平均模型,然后应用非线性输出频率响应函数对建立的模型进行频率分析,进而实现故障诊断.上述基于机理模型特征的故障诊断方法,其基本思想是利用过程模型的频率响应特性的非期望变化来识别故障.
2)针对热像、声像可直接描述运行工况的特点,已有研究利用图像数据进行异常工况的监控,主要是采用摄像机或红外热成像技术获得图像,再利用图像的色彩、亮度、几何特征、形状特征等判定运行工况[85−86],结合机器学习方法建立特征与运行工况间的关系,实现运行工况监控与预测.现有方法主要是利用静态图像判定当前工况,且属于“黑箱”建模,使用其进行异常工况特征提取与预测,需要进一步研究学习过程及中间结果的可解释性问题.
3)运行工况的知识通常是专家理解多源异构数据得到的规则,为异常工况诊断提供了标签知识和推理手段.例如,文献[69]提出了一种基于电流数据异常工况规则提取方法.但专家知识通常难以应对生产全流程及实时响应生产条件的频繁变化,易发生漏报和误报.人工智能驱动的深度学习等中间结果,也需要被专家所能解释和理解.
上述机理、图像、过程数据单一方面的信息均无法全面反映或理解整个生产过程的运行工况,有必要结合常规过程数据与新型传感获得的更长时段高维动态数据,进行运行工况的状态感知.另外,现有的异常监控方法主要是故障发生后的诊断.通过利用高维动态数据潜结构模型,由降维的动态潜变量提取特征与预测异常工况预测是一种可行的思路.文献[80]针对多变量过程的异常工况预测问题,提出向量滑动自回归模型可以联合表征多变量下的动态特征,建立多变量异常幅度的动态模型,进而进行异常工况预测.然而,现有方法未融合更高维的新型热像、声像传感信息,且属于短时间段的动态预测和长时间段的静态模态匹配.短时间段的动态预测不具备长时间段记忆功能,长时间段的静态模态匹配不具备对未来的动态预测性,有必要研究基于机理、数据、知识多源异构动态信息融合的异常工况预测方法,包括:
1)综合利用图像、声音等多源异构传感器动态数据,研究面向异常工况诊断的提取原始数据中的共有信息和特有信息的深度学习方法.以多源动态数据间动态潜变量投影相关系数最小为目标,建立全视角共有特征提取方法;针对多源动态信息具有时间和空间双重关联性、高维和非线性的特点,研究考虑时间关联约束的基于函数型数据分析的粗糙度惩罚正则化流形学习、基于张量分析和基于慢特征分析的高维多变量时间序列特征提取方法.
2016—2017年利用高压分离技术共开展20井次放空气回收,共回收天然气超4.37×108m3,减少碳排放量75.15×104t,节约标煤28.68×104t,实现节能减排。
2)恶劣开放环境下,常规传感数据和声场图像大数据强干扰,不确定性强,难以利用单一特征准确监控异常运行状况,需要研究面向异常工况诊断的数据与声像的特征级融合和决策级融合方法,例如研究基于模糊熵[87]的多源动态信息特征级融合机制和基于模糊积分[88]的多源动态信息决策级融合机制,将图像、声音、过程数据特征转换为向量并归一化到合理区间,再将各特征串联为长向量作为学习方法的输入,实现多源特征的有效融合.在此基础上,以异常工况标记为输出,通过异常工况模式的匹配实现征兆期微小异常的智能预测.
3)基于动态扭曲等时间序列建模方法[89−90],利用长时间尺度的动态数据,研究异常工况动态预测方法.
3.2.3 专家知识与控制手段相结合的协同层自愈控制
自愈是在异常工况监控、预测与溯源的基础上,针对异常工况原因,采取调控手段防止异常发生或消除异常影响的一种技术.基于定性的专家知识和定量的设定值优化调节已成为自愈控制的有效途径.现有的以调整控制回路设定值为自愈控制手段的自愈控制方法针对的是控制回路设定值不当引起的异常工况[68−69],故障后再去调节,属于被动的自愈手段,且自愈知识库仅利用专家经验构建.利用更全面涵盖决策、过程和新型传感数据来获得最佳的决策手段给自愈控制带来新的机遇和挑战,这方面有待研究的关键问题包括:
1)针对复杂工业过程多层面多单元协同优化控制决策,研究以改变控制器结构、参数、设定值与操作指令为手段的的协同调控方法,建立局部补偿与全局补偿互相配合的底层回路设定在线修正算法,实现非优与异常运行状况自愈.
2)针对复杂工业过程运行状况多变和异常运行的复杂性,研究数据和专家知识相结合实现自动自愈决策,且在执行时能够实时反馈和调整检验的策略.
3)研究基于判别分析和变量选择的类间差异性分析算法来实现异常原因溯源,其核心是基于大数据的决策与运行指标的监控与溯源.
3.2.4 数据驱动的运行动态性能分析与自优化
运行监控与诊断系统通常是在异常较严重时发现异常并诊断原因,但做到防止异常发展或自动消除异常影响才是最终目的.为此,需要对过程运行动态性能进行分析.对于多个单元协同的多层面生产全流程高维强相关的过程变量与运行指标变量的动态性能分析而言,难以建立相应的数学模型.针对难以建立动态性能评估模型的生产全流程,文献[91−93]提出数据驱动的控制系统性能监控方法,仅需标称的优化运行工况数据来实现控制系统的动态性能评估.对于实际工业过程,其动态性能评估与优化往往是面向上层运行指标相关的经济效益最大化.为此,文献[94−95]结合湿法冶金过程面向经济效益最大化的运行状态自优化,提出了过程运行状态在线评价和非优原因识别方法.尚有待研究的问题是针对实际生产中频繁出现稳态工况与动态过渡工况交替的变工况现象.全工况涵盖了稳态工况和动态过渡工况.动态过渡工况中,某些特征参数上的正常变化与异常变化有一定程度的重合.为此,需要研究实时精细化感知与分析全工况运行状态评价的方法.
工业过程运行通常按照多层面组织,各层以不同时间尺度运行.优化决策由操作员根据经验通过调整控制器设定值实现,难以优化.针对过程运行的目标是产生效益,Skogestad于2000年首先提出自优化是以运行指标优化为目标,对系统的控制结构进行干预,通过选择(设计)合理的被控变量等方式自动实现运行指标的优化运行.主要实现策略是以过程运行的经济花费、能源效率或间接控制目标为代价函数来设计被控变量,通过控制被控变量跟踪设定值实现不确定性与变化扰动对于经济目标最优化影响最小[96−99],离线使用模型研究优化的控制结构,设计简单的控制结构使过程在变化扰动存在的情况下近优运行.
智能决策协同控制系统运行时会出现稳态与动态过渡交替的变工况现象.随着系统复杂性的增大,系统模型难以获得,开放环境下不确定性大干扰未知,系统运行伴随多运行工况,造成以系统模型为基础的自优化方法对未知干扰的鲁棒性差、对多工况切换下的自适应差、局限于控制系统层.数据驱动的自优化成为新的发展方向,利用系统的已知输入输出数据信息,建立系统运行指标与输入动态数据之间的关系,再建立相应的自优化控制方法.文献[100]在动态性能评估基础上,提出了基于数据的操作量优化设定补偿方法,通过利用历史数据在当前工作点附近建立操作量补偿值和经济效益增量的实现过程运行自优化.
尚有待研究的问题是:
1)针对复杂工业过程会出现偏离安全运行的异常工况和偏离最优运行的非优工况,将动态性能分析、自愈控制、自优化相结合,建立由异常工况判别、非优工况判别、自愈控制补偿和自优化补偿组成的自愈控制与自优化结构.
2)多运行状况自优化.研究提高自优化控制的应对多运行状况的自适应性方法,设计最优设定值、控制变量和控制结构,实现系统不同运行状况切换时的自优化切换.
3)协同的自优化.针对具有多个独立子系统的系统,每个子系统在设计自优化控制时,其代价函数考虑对整体系统的影响,其约束条件需考虑子系统之间的协调,在完成自身控制的同时完成整体的任务指标.研究通过操作指令与控制回路设定值协同调控,实现非优工况的自优化.
3.2.5 支撑运行监控与自优化系统的实现技术
目前,工业过程数据采集分析系统普遍以DCS为基础构建,采用的实时数据库难以与高级运行数据库集成,传统系统架构不能有效管理和利用多源异构数据.现有的以数据为中心的大数据计算架构用于工业过程监控时,存在以下问题:
1)现有面向批处理的并行计算模型数据处理的实时性不强,难以满足工业过程监控实时性的要求.
2)现有的大数据分析框架是通用的体系结构,长于查询和分类聚类等简单建模[101−103],难以满足工业过程多层面联合监控和异常工况诊断等复杂的需求.
为此,工业过程运行监控与自优化难以直接应用现有大数据计算架构来实现.工业过程全流程运行监控需要感知市场需求变化、资源属性变化和生产条件变化,对原有的基于DCS的计算机控制系统提出挑战.工业大数据技术、工业互联网技术和工业云的发展支撑了研制生产制造全流程远程、移动与可视化安全运行监控系统.有待研究的问题包括:
1)远程和移动监控系统实现技术.基于云的多源异构大数据的实时采集、传输、查询、存储;基于云计算技术的感知信息提取方法,实现云端服务化;基于大数据分而治之思想的MapReduce分布式计算技术[104−107]的在线建模和异常监控技术.
2)异常运行状况监控过程与结果的可视化技术.为了有效实现“人在回路中”的监控与决策,增强深度学习算法[108−109]的中间结果可解释性,通过虚拟现实与增强显示技术直观显示关键运行状态的动态变化,图像特征、模型特征、数据特征显示技术.
3)人机交互的多维可视决策监控技术.实现多个维度不同视角下对决策进行实时监控,具体包括:宏观维度对决策影响的系统整体运行趋势实时可视化监控,细观维度对同一组决策指标间的关联关系人机交互可视化,微观维度对某个具体决策指标信息及其动态特性可视化.
4)基于移动云计算的决策监控云服务,包括决策监控涉及的计算和信息存储等密集消耗型资源通过云端服务化实现,决策监控涉及的可视化展示与人机交互等通过移动智能终端实现.
5)支撑技术与平台,包括多源异构数据远程移动获取与存储技术和大数据监控方法的分布式计算技术.另外,对于高耗能、高污染、高风险的工业过程,实际过程操作不当易产生危及生命安全的故障,采用仿真技术建立虚拟的运行监控与自愈控制半实物仿真实验系统,是相关研究必不可少的工具.
4 结论
本文对工业过程运行监控系统的行业现状和研究现状进行了较为全面的综述和梳理,将现有研究成果划分为基于模型的控制系统故障诊断与容错控制方法和数据驱动的异常工况诊断与自愈控制方法.指明了利用大数据、云计算和人工智能技术将工业过程信息资源和物理资源相结合来建立安全监控与自优化系统的发展趋势.面向动态机理不清的工业过程异常工况与决策故障的监控,给出了下一代智能化运行监控与自优化系统的新研究方向.
针对工业过程运行于开放不确定和信息不完全的环境中,需要应对复杂多变的运行工况,其运行监控下一步需要攻克的难点是将人工智能的机器学习算法与机理分析方法相结合,实现可解释的运行工况特征学习,以及在此基础上的人机协同运行监控.特别是在运行指标与决策的远程移动可视化监控、异常工况智能预测和自愈控制、系统动态特性评价和自优化等方面取得进展,使其具备智能主动监控和多智能体协同自优化能力.