基于贝叶斯网络的盐化工生产中固液比预测
2019-10-21王奎清
王奎清
(淮阴工学院计算机与软件工程学院,江苏淮安 223003)
近年来盐化工产业突飞猛进,我国已成为全球重要的盐化工生产大国。随着我国实施的新能源战略和大力发展循环经济的政策,提倡绿色化工和低碳生活,盐化工产业也将步入一个新的调整和发展期。课题以江苏井神4号生产线的控制系统(DCS)和人工采集的日常实践数据为研究数据来源。通过实际调研得知该生产线真空蒸发制盐产工艺流程是通过采集原卤进行蒸发、结晶、洗涤最终获取氯化钠和一定浓度的制盐母液。固液比是影响盐的质量关键要素,蒸发罐中固液比达标才可下料进入干燥床烘干包装。影响固液比的因素很多,如蒸发罐温度和压力、循环泵电流和盐腿实际值排出量等。怎样更加准确地预测盐卤在液蒸发罐中固液比的变化,对提高其生产线产量与质量从而提高企业效益有重要作用。
当前,在盐化工生产中固液比预测方面主流的预测法为定量预测法,主要分为两类:时间序列分析预测法、因果分析预测法。时间序列分析预测法如支持向量机与指数平滑法等,靳培飞和周莉等人[1]综合考虑支持向量机在检测行人时表现出的特点,提出一种基于支持向量机提取感兴趣区域的行人检测算法。利用支持向量机对图像进行初检并提取出置信度较高的检测框,先后在水平和竖直方向统计这些检测框的置信度叠加并根据统计结果提取出行人感兴趣区域,在提取的感兴趣区域内进行行人的检测[1]。该类方法主要根据上期历史数据的固液比实际数来预测当前节点的固液比,由于只考虑时间因素不考虑外界因素(当生产线突然断电、机器调试、人为干扰和天气温湿度等)对预测对象的影响,所以有时预测结果偏差很大。因果预测分析法如神经网络、如多元回归分析法和神经网络。谢家智和车四方等人[2]考虑到地震灾害损失的评估和预测是地震风险管理的重要环节。利用随机权神经网络(NNRW)对我国地震灾害直接经济损失进行了评估和预测,并将其与传统的BP神经网络进行了比较。研究结果表明,在训练时间、训练精度和预测精度上随机权神经网络都优于BP神经网络,并且随机权神经网络不易发生过拟合现象。因此,随机权神经网络为地震灾害直接经济损失的快速而精准评估和预测提供了一种新方法[2]。此类分析预测方法通过系统分析盐化工生产线各节点,揭示因果关系和相互作用,从而预测固液比的走势。时间序列分析法需求对盐化工生产线各节点有完整的历史数据(如蒸发罐固液比、蒸汽压力、蒸汽温度、循环泵电流和盐腿实际值排出量),因果分析预测法则需要分析综合各个影响因素,都不适合某一特定时刻的对蒸发罐内固液比预测。
贝叶斯网络优点在于处理事件之间不确定关系且有因果关系的问题。2018年李寒霜和赵忠盖等人发现实际工业生产过程存在各种干扰因素,会导致被建模系统呈现随机性及模型参数的不确定性。该算法首先给定参数相应的先验分布,通过最大化目标函数的下界,从而估计得到参数的后验分布。不仅可实现对参数的点估计,同时可以量化了估计值的不确定性[3]。佘玉轩等人[4]发现目前的多数故事线挖掘研究侧重新闻文献和事件的相似性分析,忽略了故事线的结构化表述及新闻具有的延时性,无法直观地从模型结果看出不同新闻话题的发展过程。为此,提出一种基于贝叶斯网络的无监督故事线挖掘算法。将故事线看成日期、时间、机构、人物、地点、主题和关键词的联合概率分布,并考虑新闻时效性。在多个新闻数据集上进行的实验和评估结果表明,与K-means、LSA等算法相比,该算法模型具有较高的故事线挖掘能力[4]。以江苏井神盐化股份有限公司4号生产线蒸发罐固液比预测为研究对象,再经过系统分析影响罐内固液比因数的基础上,描述盐化工生产中固液比预测的贝叶斯网络建模过程,结合调研过程中收集的数据利用pycharm结合scikit-learn 建模,将贝叶斯网络、支持向量机、神经网络三种预测模型进行实验对比。
1 盐化工生产中固液比预测贝叶斯模型构建
盐化工生产中固液比预测贝叶斯模型构建包括分析涉及相关变量因素,模型推理。从该企业获得的生产实践数据进行清洗,在此过程中指发现并纠正数据文件中可识别的错误,包括检查数据一致性,处理无效值和缺失值等。由于这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的数据是错误数据,有的数据相互之间有冲突,这些错误的或有冲突的数据视为“脏数据”。再经过属性分析即从众多属性中理解各参数的含义以及其功能,从中挑选对固液比影响可控的关键参数进行分析研究之间的联系研究其分布状况。利用对样本的数据集训练,调整相关参数,确定影响蒸发罐中固液比参数之间的条件独立关系。研究路线见图1。
图1 研究路线图Fig.1 Roadmap of research
模型搭建:(1)确立在贝叶斯网络预测模型中影响因素。假设t时刻下的生产线蒸发罐中固液比(控制变量)与t-1、t-2和t-3时刻的蒸发罐中固液比(条件变量)有关联。为了分析其他因素对当前固液比是否有影响,同时考虑在t时刻下蒸发罐固液比(gybt)与对应的t时刻蒸汽压力(pet)、温度(tet)、循环泵电流(mpt)和盐腿实际值排出量(fict)之间的关联性。
(2)算法训练和网络构建。建立一个控制变量和7个条件变量建立条件概率如公式(1)。假设存在某子集∏i⊆{ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3}使gybt与{ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3}是条件独立的,对于任何x都有f(gybt|ptt,tet,mpt,fict,gybt-1,gybt-2,gybt-3)。
(1)
(3)模型推测。在相关条件因素处于离散状态下,相关因素各个状态都需要一个图谱分布(图2~图4)。通过确立的网络结构进行推测,通过系统分析,结合调研实际最后进行条件概率估计(图5)。
图2 蒸汽温度分布图Fig.2 Distribution map of steam temperature
图3 蒸汽罐电流分布图Fig.3 Distribution map of steam tank current
图4 蒸汽压力分布图Fig.4 Distribution map of steam pressure
图5 固液比Fig.5 Solid-liquid ratio
2 案例分析
以江苏井神盐化股份有限公司4号生产线蒸发罐固液比预测为研究对象,利用pycharm结合scikit-learn 建模。如表1通过三种模型进行对比三种模型的平均绝对差、平均平方差和方均根差。发现基于贝叶斯网络建立的固液比预测模型效果最佳,横型性能对比图见图6。
表1 模型回归预测评估Tab.1 Regression prediction and evaluation of model
图6 模型性能对比图Fig.6 Contrast diagram of model performance
3 结语
通过pycharm软件结合scikit-learn分别利用贝叶斯网络、神经网络、支持向量机建模对盐化工生产线的固液比进行预测对比,发现贝叶斯网络模型更适合对该企业盐化工生产线固液比的预测。