APP下载

燃煤电站热工过程异常数据处理方法研究

2023-06-01张暄博张雨蓉赵洪岗

科技与创新 2023年10期
关键词:热工适应度神经元

张暄博,张雨蓉,杜 伟,赵洪岗

(1.国电双维内蒙古上海庙能源有限公司,内蒙古 鄂尔多斯 016200;2.国能智深控制技术有限公司,北京 102209)

随着中国电力信息化和人工智能技术的飞速发展,以机器学习和深度学习为基础的智能发电技术的相关研究也在不断进步。热工过程数据特征鲜明,其中蕴含着大量机组运行状态信息,基于数据驱动的智能电力系统建模方法与数据的深度利用密切相关[1-3]。而针对基于数据驱动的建模方法,在模型建立前的异常值检测工作是后续精确建模的基础。

随着燃煤电站整体容量和参数数目的不断增多,各类传感器采集的机组数据被储存在各个数据库中,大量热工过程历史数据为数据驱动建模提供了研究基础。机组中重要变量的测量传感器一般长时间处于高湿度、高温度、高压力和大量粉尘污染的环境中,同时测量传感器往往也会受自身故障、信号干扰、通讯受阻和执行器扰动等一系列问题的影响,从而导致收集到的各类热工过程数据出现大量异常值和缺失值问题,对后续系统模型的建立带来困难[4-5]。数据驱动建模方法通常被理解为一种“黑盒”建模方法,在建模过程中不考虑对象的自身机理,主要依赖于采集到的工程数据[6]。基于数据驱动建模的原理,收集到的热工历史数据如存在异常值或缺失值都会对建模效果产生影响,因而数据预处理工作是数据驱动建模的基础性环节。即在模型建立前,需对热工过程的建模数据集进行异常值检测,筛选出数据集中的异常数据值,并通过自适应校正方法补全缺失数据[7-8]。

本文在分析燃煤电站现场历史数据特点的基础上,提出了PSO-PNN 异常值检测方法,该方法能够较快地获取到最优平滑因子参数,降低了异常值检测的误判率。通过实际电厂的历史运行数据验证了所提异常值检测方法的有效性,为后续的异常缺失值填补和数据驱动的建模工作打下坚实基础。

1 热工过程历史数据异常值检测

1.1 异常值检测问题分析

热工过程异常数据主要指原始数据集中偏离大部分数据的个别单一数据点,又称为孤立点、异常值等。经归纳分析,异常值的产生原因[9]主要包括数据采集设备发生故障导致数据传输错误、数据输入过程中出现人为失误、记录过程中造成数据项不一致和数据实时性不佳。

目前燃煤机组的异常值检测方法主要基于阈值判断、统计预测、数字滤波、距离、密度和机器学习方法研究单点异常检测法[10]。

1.2 基于PSO-PNN 的异常值检测方法

1.2.1 PNN 原理

PNN是在RBF神经网络的基础上进行改进所提出的一种前馈型神经网络。PNN 的基本结构如图1 所示。

图1 PNN 内部结构示意图

由图1 可以看出,PNN 共由4 层结构组成,从左到右分别是输入层、隐含层、求和层和输出层。输入层的神经元个数与输入的向量长度相等,用来接收训练样本的值并将数据并传给隐含层。隐含层神经元的个数与输入训练样本个数一致,每个神经元都具有一个中心,每个中心对应一个样本数据,隐含层在神经元内计算每个输入变量与样本的欧氏距离,最后返回一个标量值。假定一组训练样本,状态类别总共有m类,向量XT=[X1,X2,…,XP]输入到隐含层,第i(i≤m)类状态的第j个神经元对应的输出即为返回距离的标量值,计算公式为:

式(1)中:Xij为第i类状态的第j个神经元的中心,是平滑因子。

在实际计算过程中,输入层的向量X需要先和第i个模式的连接权值Wi相乘,然后再到隐含层中的径向基函数中进行运算。

式(2)中:Zi=XWi,Wi为第i个模式的输入层与输出层之间的连接权值。

假定输入层的向量X和加权系数Wi都标准化成为单位长度,式(2)可化简为:

求和层的个数与训练数据中状态类别数目m保持一致,其作用是把隐含层中的某一同类模式的概率进行累加计算,也就是将隐含层中同类神经元的输出进行加权平均,求和神经元的输入/输出公式为:

式(4)中:Vi为求和层第i个神经元的输出;N为隐含层第i类神经元的个数。

输出层由m个竞争神经元组成,同时与求和层的神经元保持一一映射关系,输出层接收求和层的输出,各个模式的Vi互相竞争,将求和层中计算结果最大的作为输出类别,隐含层最大输出对应的输出层竞争神经元置为1,其余置为0,输出层的输出公式为:

在求和层中,第i类模式只与隐含层中对应分类的神经元存在映射关系,而与隐含层中其他分类的神经元没有连接,求和层的输出与各类基于内核的概率密度成正比,所以通过输出层的归一化处理,就能得到各类的概率密度估计函数f(Xi)。

1.2.2 PSO 算法原理

PSO 算法是一种用于寻找全局最优解的经典算法,被广泛应用于算法的参数寻优和求取函数最值的问题。每个粒子单独搜寻到的使适应度值最小的解被称为个体历史最优解,当前所有个体粒子的历史最优解中适应度最小的解为全局历史最优解。每个粒子都会根据已知信息不断更新自己的位置和速度,向个体历史最优解和全局历史最优解靠近。

设在N维工作区内,设定粒子数目为M个,第i个粒子当前位置Xi=(xi1,xi2,…,xiN),当前速度Vi=(vi1,vi2,…,viN),粒子个体历史最优解为Pi=(pi1,pi2,…,piN),当前全局历史最优解Pg=(pg1,pg2,…,pgN),更新速度和位置的公式为:

式(6)(7)中:i=1,2,…,M(M为粒子数目);d=1,2,…,N(N为粒子工作区维数);ω(ω≥0)为惯性权重系数,其大小决定了寻优能力的强弱;c1与c2分别为个体粒子学习的加速常数因子和社会粒子学习的加速常数因子;rand(0,1)为在区间[0,1]上的随机数。

强制粒子在约定范围内搜索最优解。为了使个体粒子在一个适当的速度内搜索,不至于跳过最优解,设定一个速度区间,如果求得的速度越过设定的速度边界,则取对应的边界速度。粒子个体最优解的更新公式为:

式(8)中:f(Xi)为适应度函数。

设训练样本数据个数为n,将粒子解代入PNN,其输出训练样本预测值和实际值的误差概率作为适应度函数:

式(9)中:Diff[tj,Yj(Xi)]为预测值向量与实际值向量中对应位置元素不同的个数;Yj(Xi)为将Xi作为平滑因子参数值代入PNN 输出的预测值;ti为PNN 输出的实际值。

PSO 算法的寻优过程如图2 所示。根据PSO 的思想,鸟类种群个体的飞行过程可看作单个粒子的位置和速度不断更新的过程。可将待选解集合代入到适应度函数中来求得粒子的适应度值,从而根据适应度值来进行粒子解合适程度的判定。

图2 粒子群算法寻优流程图

考虑到热工过程数据及PNN 中平滑因子参数σ的特点,本文尝试将PSO 算法用于PNN 的参数优化中,用PSO 算法对PNN 中的σ进行寻优,克服常规参数寻优方法不能完整表示整体空间概率特性的缺点,将训练数据输出的预测值和实际值之间的误差概率作为当前粒子的最佳适应度值。

1.2.3 算法整体流程步骤

PNN 非线性描述性能优越、神经元扩充性能高且容错性强,具有良好的非线性逼近特性和网络扩充属性,但其中的平滑因子的参数值选取是难点之一。PSO算法是一种用于寻找全局最优解的经典算法,被广泛应用于算法的参数寻优和求取函数最值的问题。结合燃煤机组热工过程数据集的特点,采用PSO 算法寻优求解PNN 最优平滑因子,使模型达到最佳的异常检测效果。

PSO-PNN 的热工过程异常检测算法的具体实现步骤如下:①初始化PNN 的参数。结合热工过程数据集合特性,确定输入层、隐含层、求和层和输出层的层数,设定最大迭代次数、种群数量M、粒子最大速度Vmax、动态惯性因子参数ωstart和ωend、粒子学习因子c1和c2等参数。②确定粒子群算法适应度。将平滑因子参数以粒子解的形式导入PNN,通过计算训练数据输出的预测值和实际值之间的误差概率得出粒子当前的适应度值。对比各个适应度数值的分布,选出每个粒子的历史最优解Pbest和种群全局最优解Gbest。③确定粒子更新位置及速率。④以Pbest和Gbest为基准,将当前粒子的适应度值与它们进行比较,如当前粒子的适应度小于Pbest的适应度,则将当前粒子的位置替换为新的;如当前粒子的适应度大于Pbest的适应度,则当前粒子的历史最优解不变。进一步将当前粒子的适应度与Gbest作比较,如当前粒子的适应度更小,则将当前粒子位置作为新的Gbest,否则全局最优解不变。⑤当适应度值满足最小误差要求,或目前迭代次数达到最初设定的最大迭代次数时,迭代算法停止。否则返回步骤二继续进行迭代计算。⑥输出当前PNN 模型的最优平滑因子参数,建立异常检测模型。

2 热工过程数据实例

以1 000 MW 超超临界燃煤机组烟气SCR 脱硝系统出口NOx质量浓度某时间段的历史运行数据集作为实验数据。数据集总数据量为1 000,数据点采样间隔为5 s,总采样时长为5 000 s。在实验数据集特定位置添加±2%、±5%、±8%和±10%4 种误差模拟工业生产中所出现的误差情况,每种误差下的异常数据总计60 个。模型性能评价指标用漏检率和误判率进行评判,具体定义表达式为:

误差设定位置如表1 所示。

表1 实验数据集异常数据设定表(单位:%)

首先进行参数初始化处理。模型中各参数设置如下:M=25、ωstart=0.8、ωend=0.5、Maxgen=80、Vmax=0.8、Vmin=-0.8、c1=c2=3,同时将PNN 中的平滑因子参数设定为每次的粒子解,适应度为将粒子解代入到PNN中得出的输出预测值和实际值的误差概率,参数迭代结果如图3 所示。

图3 PNN 平滑因子参数寻优迭代过程

由图3 可知,最终PSO 算法通过45 次迭代即可得到最优解。由此得到全局平滑因子最优参数为0.81,误差概率为0.057。在PSO 算法对PNN 中平滑因子的迭代中,收敛速度快,经过较短的迭代过程即可获得全局最优解,具有良好的算法收敛性能。

参数寻优完成后,将最优参数输入PNN 中进行热工过程数据集的样本训练与测试,实现异常数据的定位与筛选。图4 和图5 分别为误差为±5%和±8%下的异常检测结果图,表2 为实验数据集异常检测结果表。

表2 实验数据集异常检测结果

图4 ±5%误差下SCR 脱硝系统出口NOx质量浓度异常值检测

图5 ±8%误差下SCR 脱硝系统出口NOx质量浓度异常值检测

由图4、图5 和表2 可知,在1 000 组实验数据中,具有±2%、±5%、±8%和±10%等4 种误差的数据集异常检测结果准确率分别为85.0%、90.0%、96.7%和100%;当误差大于±5%时,误判率均为0。

3 结论

本文针对燃煤电站热工过程异常数据,提出利用PSO-PNN 异常检测算法进行数据预处理。相较于传统的PNN 异常检测方法,利用PSO-PNN 算法能够较快地获取到最优平滑因子参数,并且异常值检测的误判率有一定程度降低,具有优越的异常值检测性能,为后续燃煤电站热工过程的数据驱动建模工作奠定了良好的基础。

猜你喜欢

热工适应度神经元
改进的自适应复制、交叉和突变遗传算法
《从光子到神经元》书评
热工仪表自动化安装探讨的认识
智能控制在电厂热工自动化中的应用
跃动的神经元——波兰Brain Embassy联合办公
基于空调导风板成型工艺的Kriging模型适应度研究
智能控制在电厂热工自动化中的应用
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制
提高火电厂热工管理精细化水平探索