APP下载

基于长短期记忆的煤炭含水率智能预测与实验研究

2022-08-06张崇进2b

实验室研究与探索 2022年4期
关键词:煤堆堆场预测值

李 娜, 刘 强, 张 淼, 张崇进, 张 帆,2b, 李 昊

(1.国能黄骅港务有限责任公司,河北 沧州 061000;2.中国矿业大学(北京)a.机电与信息工程学院;b.智慧矿山与机器人研究院,北京 100083)

0 引 言

煤堆扬尘跟处理粉尘的含煤污水一直是煤炭港口环保治理的难点。如何做好煤炭港口的粉尘治理和含煤污水处理,提高清洁生产水平,促进港口绿色健康发展,已成为煤炭港口发展必须解决的问题之一。露天堆场的粉尘来源一般由两部分组成:一是煤垛处于静止状态下由风蚀作用而造成的静态扬尘;二是煤炭处于装卸、中转等作业模式下产生的动态起尘[1]。研究表明,由于以上原因引起的煤堆起尘和洒水降尘产生的含煤污水是造成港口污染的主要来源。为了解决上述问题,目前港口在堆场煤尘治理方面采取了一些基本措施,但这些传统的抑尘方式,无法从根本上解决扬尘污染防治的问题。

国外较早重视港口的绿色发展,并取得了阶段性成果[2]。我国绿色生态港口建设开始较晚[3],国内煤炭港口主要采取堆场喷枪洒水、堆场防风网和单机洒水等措施控制煤尘,采取“哪里起尘哪里洒水”的思路,在翻车、皮带、堆场等各个环节进行洒水除尘。该方式不仅造成洒水除尘设备多、成本高、管理复杂等问题,而且很难做到水与煤均匀混合,除尘效果一般。为了抑制港口静置的煤堆扬尘,需要对煤堆进行洒水来抑制起尘。由于传统的洒水方式是由人工控制,有经验的工作人员凭借他们多年的工作经验来判断是否需要洒水,但是这种人工控制的方法经常不够精准、智能,如果洒水过少会造成煤炭含水率过低,煤堆扬尘;洒水过多会造成水资源浪费,而且会产生大量的含煤污水,造成二次污染,洒水过多或过少都会对环境造成污染,很难掌握一个度来使洒水既不会使煤堆起尘又不会产生过量含煤废水。

本文以神华黄骅港为例,研究煤炭含水率变化的规律和智能洒水降尘的方法,旨在提高污染预防能力,改善港口环境质量。

1 问题描述

黄骅港智能洒水抑尘主要通过建立堆场含水率预测模型、堆场起尘预测模型和智能洒水模型,利用实时数据驱动实现智能洒水抑尘。其洒水抑尘分为三步:①通过从黄骅港露天堆场的粉尘监测仪的数据库中获取露天堆场周围的实时气象数据,然后测得堆场中煤堆表层初始的含水率,将气象数据和初始含水率数据传入建立好的数据模型中,预测出下一时刻煤堆的含水率。②将预测的下一时刻含水率的起动风速[4]与实时风速对比,如果此时的实时风速≥当前含水率的起动风速,说明当前风速会导致煤堆起尘,需要洒水,将数据反馈给现场的洒水系统,洒水系统开始洒水抑尘。③通过洒水量计算出煤炭含水率变化,将变化后的含水率再当作此时的含水率跟气象数据一起输入到模型中继续预测下一时刻含水率。如此循环,便可以自动调节煤炭含水率,降低煤堆扬尘量和污水量,达到智能洒水降尘的目的。堆场含水率预测与智能洒水抑尘的流程如图1 所示。

图1 含水率预测与智能洒水抑尘流程图

2 模型建立

智能洒水方案的制定关键在于煤炭含水率变化模型。露天堆场煤炭的含水率变化主要与气象条件有关,包括风速、温度、湿度、风向等。这些气象数据可以在粉尘监测仪中直接获取,所以研究的重点就是建立煤炭含水率和风速、温度、湿度、风向之间的关系的模型,从而根据气象数据来通过模型预测煤炭的含水率变化。由于煤炭含水率随温度、湿度、风速、风向等气象历史数据量的增加而不断变化,传统的预测方法复杂且计算耗时,难以预测和推断过去值和未来值之间的随机依赖关系。但由于用来测量煤炭含水率而采取的煤炭样本是固定时间间隔的,所以适合采用时间序列预测模型来对煤炭的含水率进行预测处理。

2.1 预测模型

时间序列预测(Time Series Forecasting,TSF)[5]是一种利用历史数据预测给定序列的未来值的方法[6]。本文使用了一种LSTM 模型的深度学习方法,可以克服传统预测模型的局限性,做出准确的预测[7]。LSTM是一种特殊的循环神经网络(Recurrent Neural Network,RNN)模型[8]。图2 为基于LSTM 状态的计算模型[9]。

图2 基于LSTM状态的计算模型

LSTM有两种传递状态,一种是ct(单元状态);另一种是ht(隐藏状态)。利用LSTM 的当前输入xt和前一状态传递下来的输入ht-1进行拼接训练,得到状态时步t的输入门it、遗忘门ft、输出门ot和候选记忆单元分别计算如下:

式中:W为权重参数;b为偏差参数。

隐藏状态下的信息流动可由输入门、遗忘门和输出门控制,其元素范围为[0,1]。当前时间步长t将前一个时间步长记忆细胞的信息与当前时间步长候选记忆细胞的信息结合,通过遗忘门和输入门控制信息流动:

遗忘门控制上一时间步长的记忆单元ct-1中的信息是否被传输到当前时间步长ct的记忆单元,而输入门控制当前时间步长的输入xt通过候选记忆单元流入当前时间步长的记忆单元如果遗忘门总是约为1,而输入门总是约为0,那么过去的记忆单元将总是存储在时间中,并传递到当前的时间步长。因此,LSTM在设计架构上解决了循环神经网络的梯度衰减问题,更好地捕捉了时间序列中时间步距的依赖性。

2.2 数据采样

建立模型需要的数据包括气象数据和煤炭含水率数据。黄骅港在每个堆场周围都会有对应的粉尘监测仪,实时监测天气状况和空气质量等数据,并将数据存到数据库中,所以温度、湿度、风速、风向等气象数据可以在数据库中实时调用。煤炭含水率数据是通过堆场现场采样,然后取定量的样本放进干燥机中干燥,直至煤炭恒重,然后通过干燥前后的重量变化计算出煤炭含水率,其含水率公式为

式中:M为煤炭含水率;m1为煤炭干燥前的质量;m2为煤炭干燥后的质量。

数据采样以天为单位,每天从8:00 ~20:00 每小时采样一次,每次采样5 个不同的煤种,每天共65 个数据样本。

2.3 算法流程

根据上文中的LSTM 模型,本文构建了一个预测煤炭含水率的深度学习算法框架。此深度学习模型的算法工作流程如下:

锌是植物、动物和人体必需的微量元素。植物缺锌就表现为植株矮小、生长受到抑制;人体缺锌会引起许多疾病,如侏儒症、糖尿病、高血压等,但摄入过量的锌也会有不利的影响[21]。

(1)数据预处理。获取数据之后,由于含水率数据有可能测量错误,所以画出含水率数据的箱线图,把箱线图中的离群值当作异常值剔除。然后由于煤堆作业等其他因素,会暂停采样一次,这样就会使数据缺少一个数据样本,失去连续性,但是为了保证模型的准确性,需要每天的数据尽可能的连续,时间间隔相同,所以需要填充缺失值,本文使用的方法为插值法,取前后两个时刻的含水率平均值作为缺失数据当前时刻的含水率数据。预处理之后的部分数据如表1 所示。

(2)数据标准化。标准化之后数据的分布趋向于正态分布,就不会因为各个数据不同的值域分布而对模型训练造成影响。这种方法基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化,

式中:μ为数据的均值;σ为数据的标准差。

表1 预处理后的数据

标准化后的部分数据如表2 所示。

表2 标准化后的数据

(3)划分数据集。由于获取的数据集是按天采样的,所以把数据集以天为单位划分为若干个序列,以天为单位随机取出其中80%的数据作为训练集,剩下的20%作为测试集。

2.4 网络模型

(1)本文使用均方误差(Mean-Square Error,MSE)作为损失函数,MSE 是衡量“平均误差”的一种较方便的方法,MSE 可以评价数据的变化程度。均方误差MSE:

式中:L为MSE 损失值;yt为样本期望值为样本预测值。

(2)优化算法使用Adam (Adaptive moment estimation)[10]优化算法,此优化算法可以代替传统的随机梯度下降法更有效的更新网络权重。Adam 优化算法公式:

式中:gt为梯度;β1为一阶矩衰减系数,一般取0.9;β2为二阶矩衰减系数,一般取0.999;mt为梯度gt的一阶矩;vt为梯度gt的二阶矩。

为了参数的正常更新,需要做如下的偏置矫正:

更新网络权重参数的公式:

式中:θt为要更新的参数;α 为学习率,默认为0.001;ε为通常取10-8,防止分母为0。

(3)训练模型。经过(1)~(4)步的准备,可以开始训练模型。把处理好的训练集数据输入到模型中,对模型进行训练,通过不断修改和调整学习率和隐含层神经元个数使loss值收敛到一个较低的值。

(4)测试模型。神经网络模型学习的效果需要通过误差大小来衡量,本文中采用平均绝对误差MAE(Mean Absolute Deviation)、平均绝对误差百分比MAPE(Mean Absolute Percentage Error)和决定系数R2(Coefficient of Determination)来对模型训练的效果做出定量的评价:

模型训练完成之后,把测试集数据输入到训练好的模型中进行测试,通过模型输出的预测值与真实值的比较,判断模型训练的效果,预测值与真实值之间相差越小模型精确度越高。

(5)优化模型。为了提高模型的准确性,需要对模型的学习率和权重等各个参数进行不断地调整,并可以使用L1正则化、L2正则化[11]、Dropout 等来防止过拟合。深层神经网络的参数量大,模型比较复杂,容易出现过拟合现象,而Dropout 方法就是一种用来防止过拟合的技术,在2012 年由Hinton 提出[12],即在训练时以一定的比例随机使部分神经元失去活性,不会向前传递任何信息。本文使用的就是Dropout 方法来防止过拟合。应用Dropout 方法的神经网络结构示意图如图3 所示。建立模型的工作流程图如图4所示。

图3 应用Dropout方法的神经网络结构

图4 建立LSTM模型的工作流程

3 实验结果与分析

神经网络模型学习的效果需要通过误差大小来衡量,通过对训练集进行训练,模型的均方误差(MSE)的收敛曲线如图5 所示。

图5 LSTM模型的MSE收敛曲线

由图5 可以看出,经过大量训练之后模型的均方误差逐渐降低并稳定到较低值。模型训练完成之后,需要对模型进行测试,把测试集输入到模型中,通过模型计算出预测值,比较预测值和真实值之间的误差,来判断模型的准确率。通过测试,得到的模型预测值和真实值之间的MAE 为1.03,MAPE 为15%,R2为0.83。

表3列出了LSTM模型得到的预测值与真实值的部分数据,以及它们之间的AE(绝对误差)和APE(绝对百分比误差),图6 进一步给出了LSTM模型的含水率预测值与真实值的比较。

表3 LSTM模型的预测值、真实值和误差

图6 LSTM模型的预测值与真实值的比较

由图6 可以看出,LSTM 模型对煤炭含水率的预测较为准确,对含水率变化趋势的预测与实际相符,没有出现位移偏差,预测值与真实值的误差较小,绝对误差的最大值与最小值分别为4.68 和0.01,绝对百分比误差的最大值与最小值分别为107%和0.1%,而且没有出现波谷过低和波峰过高,对波峰和波谷的预测较为准确。

为了进一步验证使用LSTM模型在煤炭含水率预测的广泛性,将本文建立的LSTM 煤炭含水率预测模型和其他方法建立的煤炭含水率预测模型进行了对比,LSTM、RNN、MLR[13]、SVM[14]模型的预测值和真实值的对比如图7 所示。

图7 LSTM、RNN、MLR和SVM模型对煤含水率预测结果的比较

由图7 可以看出,MLR 和SVM 模型对煤炭含水率变化的预测出现了向后位移偏差;RNN 和LSTM 模型的预测结果较好,总体趋势符合实际,且没有位移偏差。而RNN绝对误差的最大值和最小值分别为5.37和0.03,绝对百分比误差的最大值和最小值分别为192%和0.2%,误差与LSTM 模型相比较大,由此可见,4 种模型中LSTM模型预测精度更高。

4 种预测模型预测煤炭含水率的精确度统计结果如表4 所示。根据表4,预测精确度由高到低为:LSTM、RNN、SVM、MLR。其中,LSTM 模型的MAE 为1.03,分别比RNN、SVM、MLR 低了0.42、0.79、1.3;MAPE为15%,分别比RNN、SVM、MLR低了5%,8%,15%;R2 为0.83,分别比RNN、SVM、MLR 提高了0.09、0.21、0.37[15]。根据统计结果表明,LSTM 模型对煤炭含水率的预测效果最佳。

表4 不同预测模型预测煤炭含水率的精确度统计

通过上文建立的LSTM 模型,根据当前煤炭含水率和气象数据可以预测出下一时刻煤炭的含水率,通过下一时刻含水率对应的起动风速和实际风速进行对比,如果实际风速大于当前风速,那么控制洒水设备进行洒水抑尘,洒水之后,通过洒水量可以计算出煤炭含水率变化后的值为多少,把此含水率当作当前含水率跟气象数据一起继续使用模型进行预测,就可实现自动洒水调节煤炭含水率,抑制煤炭起尘,实现智能洒水降尘。

4 结 语

本文通过建立基于LSTM循环神经网络的煤炭含水率变化模型,提出了制定露天煤场智能洒水的方法,据此方法实现了煤堆含水率根据温度、湿度、风速、风向变化的自动调整,从而实现智能洒水降尘。研究表明,与传统的人工控制洒水相比,本文提出的方法预测模型精准,对露天堆场实现智能洒水抑尘,自动调节煤炭含水率,降低露天堆场的扬尘量,具有实用意义,为建设绿色生态港口提供了理论方法借鉴。

猜你喜欢

煤堆堆场预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
大型煤堆自燃特征及其影响因素试验研究
两种不同形状煤堆自燃升温特征的数值模拟
AI讲座:ML的分类方法
共享堆场协议下海铁联运集装箱堆场分配优化
煤堆上的一朵小花
露天煤堆群自燃特性的数值模拟
大地调色板
集装箱码头堆场布置形式比较