APP下载

基于改进FCM聚类算法的混合建模方法在苯酚浓度预测中的应用

2023-12-25周达左陶洪峰

化工自动化及仪表 2023年6期
关键词:支持向量机

周达左 陶洪峰

基金项目:常州纺织服装职业技术学院(批准号:51800222107)资助的课题。

作者简介:周达左(1982-),实验师,从事自动控制方面的研究,94186619@qq.com。

引用本文:周达左,陶洪峰.基于改进FCM聚类算法的混合建模方法在苯酚浓度预测中的应用[J].化工自动化及仪表,2023,50(6):000-000.

DOI:10.20030/j.cnki.1000-3932.202306000

摘  要  为了解决单一模型无法满足复杂化工生产过程预测精度要求的问题,引入混合建模方法。首先,考虑到模糊C均值聚类(FCM)算法在初始聚类中心选择上存在的缺陷,采用SA算法和GA算法对其进行优化,以选择最合适的初始聚类中心,提高聚类精度;然后,基于支持向量机建立各子类预测模型;最后,将测试样本划分到各子类中,采用各子类模型仿真得到预测值。采用混合建模方法和单模型方法预测苯酚浓度并与真实值对比,结果表明:笔者所提混合模型得到的平均相对误差(MRE)和最大相对误差(MXRE)均小于单模型的。

关键词  混合建模  改进FCM聚类算法  支持向量机  相对误差  苯酚浓度

中图分类号  TP18               文献标识码  B                文章编号  1000-3932(2023)06-0000-00

在复杂化工生产过程中,由于受到工艺和技术的限制,一些化学成分的质量指标很难直接在线检测,因此,以经验数据为基础的软测量建模方法[1]得到了广泛应用。此外,由于化工生产过程具有非线性、可控性低、工况范围广等特点,单一模型根本无法满足建模要求。而混合建模方法可从原理上解决这一问题,它先将复杂经验数据划分为若干个子区间,再分别对每个子区间建立模型,最后根据特定准则获取该化工生产过程的全局模型。

在混合建模领域中,模糊C均值(Fuzzy C-means,FCM)聚类方法一直是学者们研究的热点[2]。虽然FCM聚类方法具有较高的搜索速度,但是其作为一种局部搜索算法,聚类中心的初值一旦选择不当,将导致聚类结果很不理想。为此,笔者将模拟退火算法(Simulated Annealing,SA)与遗传算法(Genetic Algorithm,GA)相结合用于改进FCM聚类算法,通过改善其聚类效果,从而更好地应用于复杂化工生产过程中关键变量的测量。

1  改进FCM聚类算法的基本原理

1.1  FCM聚类算法

FCM聚类算法是对K均值聚类算法的一种改进[3,4],它采用柔性的模糊划分法将数据样本进行分类,最终实现相同类样本数据之间的相似度最大、不同类数据样本之间的相似度最小的目标[5]。

设数据样本的容量为,将其划分为个类别,每个类别各自的数据样本为,是模糊划分矩阵,每个类别相应的聚类中心为,对于的隶属度为,则FCM聚类算法的目标函数可定义为:

(1)

其中,是加权参数;dik表示第个样本与第类中心之间的距离;表示数据样本的特征数。

FCM聚类算法是为了寻找到一种最佳分类,使得式(1)的值最小。因此它要求隶属度的总和为1,具体表示为:

(2)

个类别的聚类中心表示为:

(3)

则对于的隶属度表示为:

(4)

通过式(3)、(4)反复修改聚类中心和隶属度,最终在算法收敛时,可得到该数据样本的最佳分类。

通过上述对FCM聚类算法的推导可以看出,每个类别相应的聚类中心的初始选择值在整个推导过程中有很大影响,一旦选择不当,将导致最终的聚类结果很不理想。

1.2  算法的改进

针对FCM聚类算法初始聚类中心难选择的问题,采用SA算法和GA算法[6~8]优化初始聚类中心,从而避免最终算法收敛到局部最小的问题,改进后的聚类算法步骤如下:

a. 将SA算法、GA算法中用到的控制参数先进行初始化操作,其中包括初始温度、终止温度、冷却系数、最大进化次数、变异概率和交叉概率。

b. 随机生成c个初始聚类中心和初始种群,使用式(4)为每个聚类中心计算每个数据的隶属度和每个个体的适应度函数值。

c. 定義初始循环次数变量。

d. 采用GA算法对种群进行选择、交叉和变异操作产生新个体,对新个体采用式(4)计算隶属度,采用式(3)计算聚类中心,并计算新个体的适应度函数值。若,则用新个体代替旧个体;否则,以概率接受新个体,去除旧个体。

e. 若,则,转步骤d;否则转步骤f。

f. 若,则程序结束,返回全局最优解;否则,转至步骤c。

为验证算法的有效性,分别采用改进前后的FCM聚类算法对二维平面上随机生成的500个点(共分成4个类别)进行聚类,结果如图1所示。可以看出,算法改进后,目标函数值Jb从4.278 4变成了4.033 6,而且改进后的算法每次计算所得的目标函数值都是最优的。

2  混合模型建模方法

2.1  支持向量机

作为统计理论在机器学习中的延伸,支持向量机(Support Vector Machine,SVM)可以在少量样本的情况下,统计出样本数据的特征,提高模型回归分析的准确性[9~11]。

给定数据样本集,其中。在SVM模型中引入松弛因子和从输入空间到Hilbert空间的变换,将,其中b为映射参数,则原始的回归问题转化为优化函数:

(5)

其中,为权重向量;为惩罚因子,且;为两个约束条件下的松弛变量。优化函数的约束条件为:

(6)

其中,为损失函数,且。

若对应的变换为,则最终得到的优化后的回归函数为:

(7)

其中,为两个约束条件下的拉格朗日乘子。

考虑到径向基核函数(Radial Basis Function,RBF)[12,13]的非线性映射能力较强,笔者采用RBF作为核函数。

2.2  混合模型的构成

混合模型[6]的构成过程为:首先通过聚类算法,将样本数据分成若干个子空间,然后对每个子空间建立模型(笔者采用SVM建立子模型),最后获取全局模型。子模型的连接一般采用“开关切换”方式或者“加权组合”方式[14,15]:前者操作简单,混合模型的输出仅取决于测试数据对应的子模型输出,且独立于其他子模型;后者操作复杂,混合模型的输出是将每个子模型的输出结果加权求和,而加权组合的前提是要默认建立的子模型之间必须是线性关系,但是在实际应用中很难满足这一要求。因此,笔者采用开关切换方式(图2)实现混合模型子模型之间的连接。

3  应用实例

3.1  工况介绍与数据描述

将笔者提出的混合建模方法应用于双酚A生产装置中对精馏塔C303塔底的苯酚浓度实现在线估计。通过对C303精馏塔的工艺流程和现场情况进行分析,选择塔中6个变量(塔内温度、塔底部的排放温度、塔内液位、来自前一单元V304估算出的3个变量(苯酚、BPA、BPA-24)的浓度)作为输入变量,输入变量的样本数据通过现场DCS获得;选择C303精馏塔底部的苯酚浓度作为输出变量,输出变量的样本数据通过每天人工分析获得。

在现场采集的数据样本集中随机选择200组数据作为训练样本,100组数据作为测试样本。采用平均相对误差(MRE)和最大相对误差(MXRE)两个指标用于评估混合建模方法的性能,具体定义如下:

(8)

(9)

其中,和分别为模型的预测值和真实值。

3.2  模型参数设置

设置为120 ℃,为0.8,为10 ℃,为10,为100,为0.5,为0.01。

3.3  结果分析

基于训练样本建立混合模型后,采用测试样本对该混合模型进行测试,得到预测值和真实值的对比曲线如图3所示。可以看出,采用笔者所提混合模型得到的预测值与真实值接近,跟踪效果较好。

表1给出了混合模型与支持向量机(单模型)预测结果的MRE与MXRE。可以看出,笔者所提混合模型的MRE和MXRE均小于支持向量机(单模型),证明了笔者所提模型的有效性,可以实现变量的准确预测。

4  结束语

针对高维度、多工况的复杂化工生产过程,从聚类方法优化的角度,提出一种改进FCM聚类方法的混合模型软测量方法。利用SA算法和GA算法对传统的模糊聚类算法进行改进,有效解决了模糊聚类方法初始聚类中心难选择的问题。实际应用结果表明,笔者所提的混合模型建模方法在苯酚浓度预测中具有良好的预测效果,相对误差较小,可以实现难测量变量的较准确预测,具有一定的工程实际应用价值。

参  考  文  献

[1]刘鸿斌,吴启悦,宋留.变量选择在废水处理过程软测量建模中的应用[J].山东大学学报(工学版),2020,50(3):133-142.

[2]张和平,李俊武.基于模糊c均值聚类算法的控制图模式识别[J].工业工程,2021,24(5):108-116.

[3]李江,杨润冰,于文双,等.基于模糊C均值聚类及学习向量量化神经网络的负荷同时系数预测模型[J].南京理工大学学报,2020,44(5):567-574.

[4]张林平,李风军.基于主成分分析和优化聚类算法的行驶工况研究[J].华南师范大学学报(自然科学版),2021,53(2):121-128.

[5]肖连杰,郜梦蕊,苏新宁.一种基于模糊C-均值聚类的欠采样集成不平衡数据分类算法[J].数据分析与知识发现,2019,3(4):90-96.

[6]李元香,项正龙,张伟艳.模拟退火算法的弛豫模型与时间复杂性分析[J].计算机学报,2020,43(5):796-811.

[7]李建国,贺云鹏,常立丹.基于改进模拟退火算法的立体车库车位分配优化[J].重庆理工大学学报(自然科学),2020,34(4):183-191.

[8]赵明琳,吴嘉瑶,童荣景,等.基于模拟退火-蚁群变步长优化算法的椭偏数据反演分析[J].江苏科技大学学报(自然科学版),2021,35(3):108-113.

[9]林浩,李雷孝,王慧.支持向量机在智能交通系统中的研究应用综述[J].计算机科学与探索,2020,14(6):901-917.

[10]邱維蓉,吴帮玉,潘学树,等.几种聚类优化的机器学习方法在灵台县滑坡易发性评价中的应用[J].西北地质,2020,53(1):222-233.

[11]周方明,潘华亮,周奉翔,等.基于支持向量回归的焊接变形预测系统开发研究[J].江苏科技大学学报(自然科学版),2017,31(3):282-287.

[12]邹强,田颖,李红松,等.基于支持向量机的燃料电池发动机氢气泄漏检测方法[J].北京交通大学学报,2020,44(1):84-90.

[13]刘涵,王月岭,王晓,等.基于支持向量机与概率输出网的深度学习模型[J].系统工程理论与实践,2018,38(8):2147-2154.

[14]张金环,王超群,张彤,等.基于高斯混合分布模型的风电功率预测误差统计分析研究[J].智慧电力,2020,48(7):59-64;72.

[15]双翼帆,顾幸生.基于改进的快速搜索聚类算法和高斯过程回归的催化重整脱氯前氢气纯度多模型建模方法[J].化工学报,2016,67(3):765-772.

(收稿日期:2023-03-26,修回日期:2023-10-17)

猜你喜欢

支持向量机
基于支持向量回归机的电能质量评估
基于智能优化算法选择特征的网络入侵检测
数据挖掘技术在电厂经济性分析系统中的应用Q
基于改进支持向量机的船舶纵摇预报模型
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究
管理类研究生支持向量机预测决策实验教学研究