基于深度学习的聚合化学反应不确定热力学参数智能控制新法
2023-03-09潘多涛袁德成
唐 帅,潘多涛,袁德成
(1.沈阳化工大学 辽宁省化工控制技术重点实验室,辽宁 沈阳 110142;2.沈阳化工大学 信息工程学院, 辽宁 沈阳 110142)
随着深度学习方面的知识和运用越来越广泛和成熟,例如:自动驾驶、人工智能、无人机等方面[1];当然,现在也用于其他工业方面,例如:化工过程控制方面。本文以聚合反应为例,研究深度学习在聚合反应过程中不确定参数估计方面的应用。传统测定热力学参数的方法有直接量热法、燃烧热法和热力学平衡法[2]。然而,由于聚合过程的复杂性、非线性、易变性和不确定性,难以估算聚合过程中不确定的参数[3]。有学者引入一种改进的智能优化算法,该方法以云模型理论为基础,采用了一套新型建模和采样方法,与原算法相比能够有效地提高收敛速度和搜索精度[4];还有提出了一种基于遗传算法(GA)技术的替代进化算法方法,该方法可以有效地解决非线性参数估计问题,以高概率找到全局最优,结果表明了所提出方法的有效性和鲁棒性。Glass提出了一种估计参数的方法,该方法受制于必要和充分的热力学稳定性标准,这些方法都存在着复杂性和条件限制性,有一定的困难。鉴于此,本文提出使用深度学习的方法来测定不确定热力学参数估计的问题。运用模型预测控制方法将结果运行出来,记录运行时间,将4个热力学参数作为输入,运行时间作为输出,由于是非线性的,使用深度学习BP神经网络的方法训练它们,将训练的结果与代入目标函数的值进行比较,得到的结果大致一致。从而使聚合反应过程中由于不确定的热力学参数导致的测量不便变得更加便利。
1 深度学习的概念
深度学习概念来自于人工神经网络的(ANN)研究。多层感知器中设置有若干个隐藏层,即为深度学习结构。深度学习这一理念于2006年被引进,着重介绍了基于深度置信网络的无监督贪心逐层训练算法,并给深度结构中相关优化问题的解决带来了希望。从而给出了一个多层的自编码器深层架构。此外,后来人们又发展了卷积神经网络[5]。而深度学习则把底层特性和高层特征相结合,建立了更为抽象的属性类型和属性,从而找到了训练数据中分布式的特征表征。深度学习作为机器学习研究中的新领域,它模拟了人类大脑对图形、音频、文字及其他数据进行理解的机制。与机器学习方式相比,深度学习方式也有监督与非监督之分。深度学习的不确定估计也是一个热门的话题,下面将介绍深度学习的不确定方向[6]。
2 深度学习的方法计算不确定的值
本文使用Python在深度学习上的应用的方法来对模拟仿真结果进行训练。通过Uncertainty Toolbox这个工具箱来实现训练的过程,那么将选择机器学习什么样的具体监督方法呢?监督有很多种方法,例如:决策树、逻辑回归、线性回归、K临近、神经网络、朴素贝叶斯等。上述的实验结果为连续型的,数据量也很小,对模型的准确性和效率较高,综合上面因素考虑,可选择决策树、线性回归和随机森林、神经网络等。在此,本文具体采用非线性回归来实现该过程。
2.1 深度学习的不确定估计
不确定性下的推理方法是精确可靠的机器学习系统的关键组成部分,贝叶斯方法为量化不确定性提供了通用框架[7]。在不确定性下进行推理和决策的方法是精确、可靠和可解释的机器学习系统的重要组成部分。在许多应用中,从供应链规划到医疗诊断再到自动驾驶,精确地评估不确定性可能与获得高精确度一样重要。贝叶斯方法提供了一个处理不确定性的一般框架,贝叶斯方法对模型参数概率分布进行界定,并通过对所有可能的模型权重的积分得出不确定性估计。变分推断的最新进展大大提高了这些方法的可扩展性和实用性[8]。
2.2 不确定性的分类
在贝叶斯理论这个类型中,主要有2个不确定性问题:模型不确定性和数据不确定性问题[9]。模式不确定性(又称为认知不确定性):主要体现的是模型参数的不确定性,这种不确定性往往源自我们对为训练收集的数据的无知(Ignorance),因此,当训练资料集没有给定形式的信息时,模式中与该情形相应的参数的不确定性将会增大,所以,如果在测试阶段给予了这样的信息,模式的效果也会差。由于推理和预测的后验方法都非常复杂,使得一些更深层的网路并不能考虑模型的不确定性,因此变分推理就成为了现有统计样本的一个主要使用方式,它通过驱动的方法来拟合实际后测分布,利用这个模型拟合了指数变换的许多尚未知道的分布,,并且变得可计算。Gal等发表的论文表示,神经网络训练过程可以看作为基于伯努利分布为假设分布的变分分布拟合过程。(当然,为了达到拟合的效果,必须调整损失函数和其他结构,本文正是如此。)可以通过添加数据集来避免模型的不确定性[10]。模型的不确定性可以从模型的预测分布,特别是预测分布的方差得到。为了得到预测结果的后验分布,我们利用贝叶斯定理,可以发现:
(1)
数据不确定性(亦称偶然性不确定性、任意不确定性):其不确定性主要表现为观测到的影响,例如对传感器的工作影响。由于数据的不确定性在神经网络中的应用大于在理论预测中的应用。人们一般通过研究产出的数量状态来判断这种不确定性。但信息不确定性无法克服。在神经网络中,对信息不确定性的预测比在现实模拟中更为普遍(例如Social LSTM的二维高斯分布假设),通过对这些数据的分析,得到了高斯分布的参数,然后考虑数据的不确定性[11]。与估计模型不确定性不同,我们将模型指向输出数据的不确定性,而不是分析输入相同的多个模型样本输出的统计特性[12]。本文的热力学参数估计属于模型不确定性,下面介绍热力学参数的问题。
3 深度学习在聚合反应中的应用
在其他工作方面,如化学工程,热力学也要根据某个体系或事件的物理或化学反应机理、动态变化规律和传递特征等构建数学模型,便于模拟和实验研究。由于在数学模型的构建过程中常常存在未知参数,因此要通过使用合理、优化过的实验设计,获取到了计算过程中的关键数据的真实信息,进而采用优化与计算的手段估算出未知参数。参数估计实质上是一种优化过程[13],在这个问题中,基于实验或工艺数据搜索未知参数的最佳值,使模型的计算值尽可能接近实测值。
聚合是一个复杂的过程。为了优化聚合物生产研究中的聚合工艺,目前还大多采用反复实验的方法,寻找控制反应过程的最佳工艺参数,如反应温度、反应时间、升温速率等。在聚合反应中,人们需要知道包括体系的物理性质,如比热容和密度的导热系数、反应热,以及涉及反应设备的一些参数在内的几十个参数的大小,以便进行聚合物生产的放大和控制。但这些参数有很多属于不确定的参数,一般的方法难以测量。它们对反应控制条件有直接影响,但由于不容易测定其大小,也就无法由这些参数决定反应中控制的工艺参数。反应条件改变后,只能通过重复实验确定新的工艺条件。利用深度学习的知识可以方便的解决难以测定的热力学参数问题。
3.1 聚合反应的模型
聚合反应,该系统由一个反应器组成,单体被送入其中,单体通过非常放热的化学反应变成聚合物。反应器配有夹套和外部热交换器(EHE),二者都可用于控制反应器内部的温度。该模型包括水、单体和产品滞留物的质量平衡以及反应器、容器、夹套、外部热交换器中的混合物和离开外部热交换器的冷却剂的能量平衡。可用的控制输入是进料流量,夹套入口处的冷却液温度和外部热交换器入口处的冷却液温度。
在建立的热-化学模型中有很多未知参数,如聚合反应体系的导热系数、比热等[14]。这些参数在聚合反应过程中用现有的测试手段直接测定非常困难。这些参数性质不同,不能同时测量。该方法的实质是建立反应聚合反应真实过程的数学模型,将聚合反应参数的不确定性转化为聚合反应温度的测量。通过在计算中逐步减小理论空间-时间温度数据和实测空间-时间-温度数据的偏差,将偏差最小时的难测参数设定值作为测量结果。聚合是在平模中进行的,用热电偶在聚合反应中在线测量温度,得到实测的空间-时间-温度曲线。模型中难测参数值是未知的,在计算机程序中可以为这些待定参数任意设定初值。初值设定越接近真实值,逼近难测参数真实值的速度越快。这样由程序即可计算出反应体系某点在反应中某时刻的温度,即理论空间-时间-温度曲线。按一定的参数评价方法,修正待测参数的设定值,重新代入程序,算出理论值,求出新的水平偏差值;重复这个过程,直到偏差达到最小值,这时即可认为难测参数的设定值代表了该参数的真实值。
3.2 不确定热力学参数分析
热力学在聚合物化学和工艺中的作用越来越明显,它可以检验聚合物的生产,聚合物加工和实际应用物理化学条件的选择。由于用于聚合的单体阵列不断扩大,因此常常有必要从原则上预测在给定的物理化学条件下将一种或另一种单体转化为聚合物的可能性。确定各种因素对聚合-解聚平衡位置和聚合物热力学性质的影响仍然是最重要的问题。由于缺乏有关化合物性质和相应反应的热力学数据,往往无法对聚合反应进行热力学分析。在实际系统中,通常无法准确确定模型参数,这是不确定性的一个重要来源。在这项工作中,认为模型的4个最关键参数并不精确已知,并且相对于其标称值而变化,给这4个不确定的热力学参数上下50%取值,这样就有10几组实验。
3.3 模型预测仿真
这个实验中有4个不确定的热力学参数,以这4个不确定的热力学参数为例,开展实验过程。由于4个不确定的热力学参数不确定,那么给这4个不确定的热力学参数按照合理的实验要求上下各取50%的值,进行10几组实验,4个不确定热力学参数的正交实验有14组,实验运行结果如图1所示。由于运行结果图片较多,这里就不一一展示。
图1 预测的结果图Fig.1 Prediction result graph
用机器学习之监督的方法把它们进行训练,从而能够给定一个结果找到对应的热力学参数,求出不确定的参数。
3.4 将结果用深度学习进行训练
由于这是根据不确定的热力学参数来估计它的性能指标,这里将运行时间作为输出,不确定的热力学参数作为输入,这是一个非线性的问题,使用非线性回归不好拟合数据,为此将使用深度学习神经网络的方法。神经网络是由大量的节点(或“神经元”)和节点组成的操作模型。每个节点表示一个称为激活函数的特定输出函数[15]。2个节点之间的每个连接表示通过连接的信号的一个加权值,称为权重,这相当于人工神经网络的记忆[16]。网络的输出随着网络的连通方式、权值和激励函数变化而改变。网络本身也往往是算法或函数的近似值,或是逻辑策略的表达式。
由于我们这里的输入是4个不确定的热力学参数,所以这是一个多元非线性回归的问题[17]。面对多元化的非线性回归问题,使用BP神经网络比较和处理,将4个热力学参数作为输入,运行时间作为输出。数据处理,将数据标准化; 标准化方程:
(2)
式中:x′表示标准化后的值;x表示原始值;xmean表示平均值;xmax表示最大值。
使用α=0.01的学习速率,将遍历14个数据块1 000次,每10次输出一个成本函数的值,结果如图2所示。
图2 梯度下降图Fig.2 Gradient descent diagram
从图2可以看出,损失值正在下降,表明学习速度更好(几次中更好)。
预测结果于实际结果对比,将14个数据样本作为横坐标,运行时间作为纵坐标。数据样本的实际结果是红色散射,预测结果是蓝色散射,散点图如图3所示。
图3 散点图Fig.3 Scatter plot
从图3可以看出,预测结果与实际结果基本一致,表明模型近似正确。我们在程序中随机输入一组数据,用来验证其准确性,分别是950、5、25、3,输出的值为0.373 6,对应上面模型大致正确。原来的目标函数:
(3)
将上述的数据代入目标函数得出的结果与运行的结果进行比较,其结果大致相同。为了清楚的表示程序运行的情况,将用一张表来表示输出的结果以及预测值与真实值和计算值的比较,结果如表1所示。
表1 数据结果比较Tab.1 Comparison of data results
从表2可以看出,有几组数据是非常不同的,这可能受到其他因素的影响所致。如噪声等,这些数据可以去除,这些输出的结果是根据前面的数据处理式(1)换算来的,所以它显示0~1的数字。预测的结果虽然良好,但也有一些缺点,比如受其他因素的干扰,还有数据量不足导致的预测不准确,这是今后需要改进和完善的方面。
4 结语
通过聚合反应过程中不确定热力学参数的研究,不确定热力学参数在反应釜内部难以测量,通过仪表数据的显示,对4个不确定的热力学参数进行上下50%赋值,通过正交实验的方法得出10几组实验,用模型预测工具箱进行模拟仿真,得出每组的运行时间。将4个不确定的热力学参数作为输入,运行时间作为输出,通过观察发现这些数据呈非线性的关系,属于多元非线性的回归,当使用深度学习BP神经网络的方法对这些数据进行预测处理,将实际结果和预测结果进行比较,结果基本一致。这说明深度学习BP神经网络对处理这类问题确实有效果,深度学习处理化工类的研究多;但对处理热力学参数的问题较少。本文针对热力学参数的问题用深度学习进行预测;但还有不足的地方,数据量少,易受噪音等其他因素影响,这在今后还要改善。