基于静电法联合长短时记忆神经网络的入炉煤质辨识方法
2022-08-31黄孝彬林锴翔李永生
黄孝彬,杨 萱,林锴翔,许 琦,李永生
(1.华北电力大学控制与计算机工程学院,北京 102206;2.清洁高效燃煤发电与污染控制国家重点实验室,江苏 南京 210023)
入炉煤质是影响燃煤机组安全经济运行的重要参数[1],当入炉煤质发生变化时,能及时检测到煤质情况,则可根据不同煤质特性及时调整制粉及配风系统的运行参数,使锅炉燃烧性能得到优化。
根据应用技术的不同,目前电厂常用的煤质在线检测方法有:瞬发γ射线中子活化分析法[2]、激光诱导击穿光谱(laser induced breakdown spectroscopy,LIBS)技术、低能X射线技术、近红外光谱分析技术等。蒋蓬勃[3]根据LIBS技术在煤炭行业及火电行业的应用进行分析,提出煤质在线监测一体化应用系统;杨振华等[4]利用低能X射线散射荧光法测量煤灰和炉渣中的残碳量,证明了低能X射线散射荧光法对测量煤质中Ca、Fe等元素的可行性;杨策[5]采用近红外光谱分析技术检测煤的水分、灰分、挥发分和固定碳。总结这些检测方法存在问题有:1)瞬发γ射线中子活化分析法现场应用较为广泛,但因使用了放射源存在污染和安全问题;2)其他基于无放射源的检测技术的设备普遍价格昂贵、维护麻烦,且现场应用的可靠性、准确度仍有待进一步研究验证;3)各类在线检测技术的煤质采样点大多设置在输煤皮带上,经过采样、制样、化验分析后,被检测的煤质还需储于煤仓等待磨制,并非直接进入锅炉内燃烧,这会对入炉煤质改变时调整燃烧方案产生滞后性。
近年来,大型火电厂广泛采用静电传感器相关的检测仪器系统[6-7]检测管道内煤粉流量等参数,从而进行锅炉燃烧调整优化[8-9],这种方法优势在于无外部能量注入、价格相对较低、现场测量效果较好等。不同煤质的煤粉在通过一次风管道时产生的静电信号强度不同[10-11],结合给煤量等特征信息,可以对煤质进行一定的辨识。但由于各参数测量传感器的位置不同,特征信息间存在一定迟延。本文提出一种静电法联合长短时记忆(long short-term memory,LSTM)神经网络的入炉煤质辨识方案,以某600 MW机组的2号锅炉实测数据为例,使用不同模型进行对比仿真实验,结果表明静电信号与煤质之间具有较强相关性,且利用LSTM神经网络有较高的煤质辨识精度。
1 静电法煤质辨识原理
1.1 煤粉带电原因
煤粉在通过一次风管道时,会在颗粒之间或颗粒与管壁出现碰撞或摩擦产生静电,静电的强度与煤粉的自身性质和运动过程中流动及环境有关[12],如图1所示。
图1 煤粉颗粒带电情况示意Fig.1 Schematic diagram of pulverized coal particles charged
1.2 静电法煤质辨识原理
煤粉在管道中流动时产生静电强度的影响因素有以下几方面:
1)煤质 不同煤质的含碳量、挥发分、含水率等参数存在差别,使得煤质的介电常数不同,导致产生的静电强度不同[13-16]。文献[13]整理了按照国家标准《库仑法微量水分测定仪》(GB/T 26793—2011)使用水分测定仪以及电磁法驻波传感器等工业分析仪器对不同煤化程度的煤种进行常规分析,得到不同煤质中各成分质量分数,结果见表1。
表1 不同煤质成分参数Tab.1 Quality analysis for different coals
2)风煤比 风煤比表征管道内煤粉的浓度大小,当煤粉浓度增大使得颗粒碰撞、摩擦概率增加且更加剧烈,煤粉产生的静电强度会随之增大[17]。
3)煤粉流速 一次风风速增加,煤粉流速增大,煤粉颗粒的碰撞、摩擦的次数随之增加,煤粉产生的静电强度也就增大[18-19]。
4)其他因素 磨煤机出口管道内温度会影响煤质的介电常数,煤质介电常数的变化从而影响煤粉的静电强度[20]。
根据煤粉静电强度的影响因素可知,在实际电厂运行时入炉煤质、风煤比、煤粉流速、磨煤机出口温度等会同时影响煤质静电强度的变化。故可以建立静电强度E与煤质M、风煤比C、磨煤机出口温度T、煤粉流速V的映射关系为:
根据式(1),基于静电法进行煤质辨识机理可表示为:
2 煤质辨识方案设计及实施
本文以某电厂600 MW机组2号锅炉为研究对象。该锅炉共有5台磨煤机,每台磨煤机出口有4根一次风管道,具体辨识方案如图2所示。
图2 静电法煤质辨识方案流程Fig.2 Flow chart of coal quality identification scheme by electrostatic method
2.1 静电传感器选取与安装
选用北京华清茵蓝有限公司生产的全截面非接触式煤粉测量系统[6],该系统主要基于非接触式阵列静电感应技术,根据煤粉在外加电场下存在带电能力的特性,可以实现对流经管道的煤粉截面进行感应测量,测量主要包括一次风管道内煤粉的流速及流量分配等参数。传感器采用非接触式结构设计,煤粉与传感电极不接触即可实现测量;传感器与管道内径一致,安装后相当于煤粉管道的一部分,对煤粉流动无任何扰动,提高了测量的可靠性,其测量原理[11-12]如图3所示。
图3 静电传感器测量煤粉流动参数的基本原理Fig.3 Basic principle of measuring pulverized coal flow parameters by electrostatic sensor
静电传感器安装于磨煤机出口每个一次风管道的直管段(图4),传感器连接静电信号处理器,再经通信总线连接系统配套信号分析中心机柜,可获取静电强度以及管道内风粉流速等数据。系统采样间隔设置为30 s,每天可获取约2 856组数据。
图4 静电传感器安装位置Fig.4 Installation position of the electrostatic sensor
2.2 现场数据获取
排除不同传感器存在的系统误差以及管道设计带来的影响,以2号锅炉A磨煤机出口的1号管道为例。使用该电厂2020年5月数据,排除停机时间后最终采用5月3日至5月24日的现场数据进行研究。将该时间段A磨煤机的煤质加仓情况整理成统计表,并对其加仓的不同煤质进行人工编号,得到具体情况见表2。
表2 2号锅炉A磨煤机加仓情况统计Tab.2 Statistics of feeding of mill A of No.2 boiler
根据煤质辨识方案的机理和该时间段内A磨煤机的煤质加仓情况,从全截面非接触式煤粉测量系统机柜获取不同煤粉的静电强度和风粉流速数据,并从电厂DCS得到磨煤机给煤量、风量以及磨煤机出口温度的数据,将不同参数按时间形成所需辨识4种煤质的特征数据组。然后对采集原始数据进行预处理,基于Python编程语言进行数据清洗程序编写,功能包括数据整合,缺失值、异常值等数据清洗,其中异常值的判定依据各参数中与均值相差超过3倍标准差的数据定义为离群值,最后将不同煤质数据整合形成煤质数据库。
对煤质的辨识需要在采集数据后,建立模型来实现。在煤质数据库中,4种煤质各随机选取1 500组数据,共计6 000组作为分类模型训练集样本;另各取300组数据,共计1 200组作为验证集进行实验分析。
2.3 数据分析
2.3.1 数据相关性分析
首先对特征参数的数据做相关性分析,判断根据机理所选参数对静电强度的相关情况。以煤质1的数据为例,对其各项特征参数进行Spearman相关性分析,计算公式为:
式中:di为2组数据之间等级差;n为变量中数据个数。
得到特征数据间的相关性,结果如图5所示。图5中红色代表正相关,蓝色代表负相关,颜色越深相关性越大,数字为相关系数。由图5可见,静电强度与其他4项参数均存在不同程度的相关性,故可以证明煤质辨识机理的可行性。
图5 特征参数相关性分析Fig.5 Correlation analysis of characteristic parameters
2.3.2 数据迟延性分析
对数据做迟延性分析:分别移动4个特征参数的时序,计算其与煤质标签的基尼系数。基尼系数主要表示同一个样本集合中随机抽取到错分样本的概率。其作用和信息增益相同,主要用于表达样本特征与目标分类之间的相关性。特征与目标分类相关性越强则分类效果明显,得到的基尼系数越小,当分类完全准确时,基尼系数为0。基尼系数计算公式为:
式中:p(x)表示某一分支中属于某一分类的概率。
计算Spearman系数较大的4个特征变量与煤质的最优基尼系数,结果如图6所示。
图6 特征参数基尼系数Fig.6 Gini coefficient plot for feature parameters
由图6可见,静电和风粉流速取得最优基尼系数时延迟时间为0,证明风粉流速与煤质在同一时刻采样点存在对应关系。而风粉流速和煤量取得最优基尼系数时明显超前其他变量,主要由于一次风量和给煤量测点都在磨煤机出口,其采集数据超前属于合理现象。可以证明:数据样本中同一时刻采集的数据点部分存在较强迟延。
2.3.3 数据范围及均值分析
对各项参数进行特征分析,对数据进行最小最大归一化处理,将参数的范围及均值情况绘制成箱型图,结果如图7所示。由图7可见不同煤质各特征参数的数据范围均有不同程度的重合:1)从风量分析,煤质2与煤质4的数据均值接近且重合度高;2)从给煤量分析,煤质2、煤质3与煤质4的数据均值接近且重合度高;3)从静电强度分析,煤质2与煤质3的数据均值接近且重合度高;4)从磨煤机出口温度分析,煤质2与煤质3的数据均值接近且重合度高,煤质1与煤质4数据重合度也较高;5)从风粉流速分析,煤质2、煤质3与煤质4的数据均值接近且重合度高。
综上数据情况可以得出,将不同的特征变量进行有效的组合,可以实现对不同煤质的辨识。
3 模型构建与算例分析
根据采集的特征数据,利用LSTM神经网络提取不同特征信息间相关性以及同一特征数据的时序相关性,构建煤质辨识分类模型并进行仿真实验。利用支持向量机(support vector machine,SVM)模型[21]、随机森林(random tree,RF)[22]模型和循环神经网络(recurrent neural network,RNN)[23]进行对比实验。
3.1 LSTM神经网络模型
LSTM神经网络[23-24]是为解决RNN存在的梯度消失和梯度爆炸问题的一种改进,LSTM神经网络中加入了记忆门、遗忘门等结构,使得其具有长期时序信息提取能力,并广泛应用在时间序列预测当中。从传感器设备及DCS获取数据呈现时间序列数据形态,且考虑到现场数据可能存在迟延,故选用LSTM神经网络来训练数据进行辨识。
为适应煤质辨识的需求,在LSTM神经网络中使用softmax激活函数(又称归一化指数函数)[25],该函数是二分类函数sigmoid在多分类问题的发展,可将多分类的结果以概率的形式展现出来。
softmax激活函数公式为:
式中:ak为输出层中第k个输入信号;exp(ak)为ak的指数函数;yk为第k个神经元输出。
3.2 算例分析
3.2.1 LSTM神经网络测试及辨识结果
LSTM神经网络模型参数设置情况见表3。LSTM神经网络模型隐含层层数和神经元个数较少易导致模型学习不充分,过多则易导致模型训练过拟合,因而分析LSTM神经网络模型隐含层层数和每层神经元数对辨识结果准确率影响,结果见表4。
表3 LSTM模型参数设置Tab.3 Parameters setting for LSTM model
表4 模型准确率实验Tab.4 Model accuracy experiment result
根据表4结果,模型辨识结果的最佳准确率为86.84%,选择最佳的参数为2层隐含层,每层神经元个数分别为16和8。图8为煤质的辨LSTM神经网络模型辨识结果。
图8 LSTM神经网络模型辨识结果Fig.8 Identification result of the LSTM model
为了更进一步判断模型辨识的有效性,分别以4种煤质为正样本引入混淆矩阵(表5),并绘制操作特征曲线(receiver operating characteristic curve,ROC)。同时为衡量分类模型性能,进一步计算ROC曲线下的面积AUC值和正负样本累计分布间的差值KS值,应用这2个指标进行评价。
表5 混淆矩阵Tab.5 Confusion matrix
其中,分类正确的正样本占比δTPR和分类错误的负样本占比δFPR根据分类阈值的设定而改变,其计算公式为:
以δFPR为横轴、δTPR为纵轴,在所有阈值条件下取得的(δFPR,δTPR)数对构成的曲线即为ROC曲线。ROC曲线与δFPR轴包围的面积大小则为AUC值,δTPR和δFPR的误差绝对值最大的则为KS值,AUC和KS数值越接近1,表明分类模型效果越准确。分别以4种煤质为正样本,构建ROC、AUC、KS曲线,图9为模型评估结果,其中黑色为ROC曲线,红色为KS曲线,蓝色为AUC曲线。
图9 模型评估结果Fig.9 Evaluation results of the model
由图9可以看出,针对4种煤质的分类结果ROC曲线都距离对角线较远,且AUC值基本稳定在0.9以上,证明建立基于静电信号联合LSTM神经网络的煤质辨识模型有一定效果。其中煤质1的ROC曲线上升最快且KS值最高,煤质2和煤质4相近,辨识度相对煤质1较低。
3.2.2 对比实验
为了更近一步验证LSTM神经网络在煤质辨识中的效果,使用SVM模型、RF模型和RNN模型分别进行了对比实验。其中SVM模型和RF模型是常见的机器学习模型,RNN模型也具有时序特征提取能力,但理论上不具有长期记忆能力。
选取和LSTM神经网络模型同样的训练集和测试集数据,对不同模型进行实验,得到的AUC值和KS值见表6。由表6可见,不同机器学习模型在基于静电信号对煤质进行分类的试验上均有一定效果,证明基于静电信号建模对煤质分类具有一定辨识度。其中时序网络LSTM模型和RNN模型分类效果明显高于常规SVM模型和RF模型。而相对于RNN模型,基于LSTM神经网络进行建模分类AUC值和KS值明显提高,主要由于部分特征变量有较高迟延性,RNN模型无法进行长时序数据间特征提取。
表6 模型对比评价结果Tab.6 Model comparison and evaluation result
4 结 论
1)提出一种基于静电法联合LSTM神经网络的入炉煤质辨识方法,并在某电厂600 MW机组的2号锅炉进行实测实验。
2)提出静电法入炉煤质辨识机理,煤质与静电强度、风煤比、磨煤机出口温度、风粉流速存在非线性映射关系;对各参数数据进行相关性及迟延性分析,得出所选特征参数与煤粉静电信号强度存在较强相关性,且同一时刻采集的数据点部分有较强迟延。
3)仿真实验,LSTM模型得到的辨识准确率为86.84%,对不同煤质分类结果的ROC曲线都距离对角线较远,且AUC值基本稳定在0.9以上,证明建立基于静电信号联合LSTM神经网络的煤质辨识模型有一定效果。
4)分别使用SVM模型、RF模型和RNN模型进行对比实验并计算各模型AUC值和KS值,得出不同模型对煤质辨识均有一定效果,LSTM模型效果明显优于其他模型,同时证明了基于静电信号与其他相关特征建模对入炉煤质分类辨识的可行性。