基于RNN的多模块大型生产设备的能耗分析
2021-11-28吕逸夫王美林
吕逸夫 王美林
摘要:有效的能耗预测方法对智能制造有着重要的意义。传统的能耗预测主要基于单台设备各种指标和机器学习算法来进行能耗状态的判断,虽然预测效果在不断地提高,但是对需要多个模块协同作用的大型生产设备的能耗的预测效果时有不佳。提出了一种基于Pearson相关性分析、RNN算法的多模块的大型生产设备的能耗预测方法,该方法首先计算不同模块能耗的Pearson相关系数,对不同模块进行分组,再为各个分组收集多种异常状态下的数据,使用LSTM、GRU等RNN算法進行预测。实验表明,提出的方法有较高准确度、召回率、F1-score,对多模块的大型生产设备的能耗预测具有显著优势。
关键词: 多模块生产设备;能耗分析;Pearson相关系数;RNN算法
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2021)28-0004-04
开放科学(资源服务)标识码(OSID):
Energy Consumption Analysis of Multi-Module Large-Scale Production Equipment Based on RNN
Lv Yi-fu,WANG Mei-ling
(School of Information Engineering, Guangdong University of Technology, Guangzhou 510000,China)
Abstract:Effective energy consumption prediction methods are of great significance to intelligent manufacturing. Traditional energy consumption forecasting is mainly based on various indicators of a single device and machine learning algorithms to judge the energy consumption status. Although the forecasting effect is constantly improving, the energy consumption of large-scale production equipment that requires the synergy of multiple modules is predicted The effect is sometimes poor. Proposes a multi-module energy consumption prediction method for large-scale production equipment based on Pearson correlation analysis and RNN algorithm. The method first calculates the Pearson correlation coefficient of the energy consumption of different modules, groups the different modules, and then collects for each group Data under a variety of abnormal conditions are predicted using RNN algorithms such as LSTM and GRU. Experiments show that the proposed method has high accuracy, recall rate, F1-score, and has significant advantages in energy consumption prediction for large-scale multi-module production equipment.
Key words:multi-module production equipment; energy consumption analysis; pearson correlation coefficient; RNN algorithm
1 引言
在智能生产中,能耗运行状态是大型生产设备的重要的监控指标。能耗高于正常指标会导致能源浪费或设备过载,进而直接或间接地给企业带来损失;能耗过低又会带来产能不足,产品质量不高等问题。在智能制造飞速发展的背景下,已有一些传统企业针对大型设备进行智能化改造实现能耗数据的采集,用于实现造智能化能耗监控。针对采集的能耗数据,人们开始尝试使用大数据分析技术对设备电机能耗的状态预测。
针对PVC大型压延生产设备进行智能化设备改造,实时采集电流、转速等能耗数据进行相关分析。PVC压延设备主要用于生产PVC压延薄膜和装饰材料,其生产设备的主要包括有搅拌机、开炼机、过滤机等模块。在生产工作中,不仅需要单个模块的正常工作,还需要生产设备的各个模块的协调工作。因此,各设备模块的能耗状态的关联性分析,是多模块大型设备能耗分析的一个难点。
目前已有许多机器学习技术被应用于能耗分析,并取得了不错的成果。程亚豪等人使用随机森林、梯度提升机来进行住宅能耗的预测,并在相应数据集中有最小的均方根误差RMSE(9.99)和RMSE(77.07)[1]。陈俊等使用LSTM、SVM、MLP、K近邻等算法进行虚拟机的能耗预测[2],刘建财等采用集成建模的思想把LR和SVR做集成经样本训练后得到 SLS 模型,进行嵌入式设备能耗的预测[3]。近几年,机器学习技术在能耗预测方面取得了长足的发展。这些研究多以一台设备的数据进行能耗分析实验,没有对需要多模块协同工作的大型生产进行深入研究。
总结现有的研究成果的同时,实验团队针对PVC大型压延生产设备,通过计算不同模块能耗的Pearson相关系数,对不同模块进行分组,再使用LSTM、GRU等RNN深度学习算法对各个分组中的所有模块的能耗进行综合分析,并使用BP神经网络、随机森林、LightGBM等传统机器学习算法进行试验与对比,讨论RNN算法的多模块的大型生产设备的能耗预测性能。
2.1 原始数据概况及数据来源
实验团队所使用的实验数据来源于工厂所使用的五辊PVC压延机生产线,该生产线包含多个模块:轧轮机模块(包含轧轮机A、轧轮机B)、过滤机模块、辊轮模块(包含五个滚轮,分别记为1#轮至5#轮)、引取设备模块(包含三个引取轮分别记为1号引取设备至3号引取设备)、压花机模块、冷却轮模块(包含五个冷却轮,分别记为1#冷却轮至5号冷却轮)、带料轮模块、卷取轮模块。
通过设备改造,PVC压延设备使用内置或外接的传感器,实时采集各节点的运行状态数据,包括各模块多个采集节点的所采集的开关量、温度、电流、转速、压力。原始数据样式包含数据采集点、数据类型、数据值,数据采集频率为1ms采集一次数据,其样式大致如下:
2.2 数据预处理
针对大型设备的能耗关联系分析,实验团队筛选出所有模块采集节点电流变量进行分析和处理。由于传感器采集数据的频率为1ms一次,导致数据量异常庞大,所以首先以1min为时间窗口进行数据的聚合,统计每分钟内变量的平均值,通过与额定电压相乘来获取各模块功率值。然后将聚合后数据组成全局状态向量:SG<时间,轧A功率,轧B功率,过滤机功率...>。
该PVC压延生产线共包含19个模块,所以该实验数据包含20列,第一列是时间变量、剩下19列为每个设备的在该时刻的功率变量。其部分数据如下:
2.3 基于相关性分析进行分组
获得SG以后,计算各模块功率间的相关系数,并利用相关系数对变量进行分组。该实验使用Pearson相关系数确定不同变量间的相关性,Pearson通过考察变量X、Y的线性关联程度来分析变量的相关性[4],其公式为:
Cov(X,Y)表示变量X、Y的协方差:
计算得到各模块的相关系数后,基于此分析结果对设备进行分组,并获得各分组状态向量:Sn<时间变量,Sn节点1功率,Sn节点2功率,Sn节点3功率...>,其中Sn表示第n组的分组状态。
实验中,相关性分析的结果如下图所示:
由该结果可知各模块功率相关性如下:
① 由轧轮机A、压花机、带料轮、卷曲轮、冷却1#~5#轮等模块的功率相关程度高,可以组成一个分组;
② 1#~5#轮及取引1#~3#轮等模块的功率相关程度高,组成一个分组;
③ 由于轧轮机B功率和别的模块的功率相关性较低,可以单独分析其能耗状态;
④ 由相关性分析结果得出,过滤机功率与其他模块的功率相关性较低;然而可以看出过滤机的功率虽然起伏较大,但其状态与轧轮机A所处的第一组设备功率走势高度相似,所以仍然将过滤机放在轧轮机A所在组。
2.4 对数据进行标注
在进行实验之前,还需要为数据做标注工作与特征工程。首先是标注工作:根据每个数据所代表的生产健康状况,为数据标上相关标注,形成新的状态向量。
2.4.1 标注数据来源
PVC压延机中,卷取轮是整个生产过程的最后一个模块,用于卷曲压延膜成品,其状态可反映出该时刻整个设备的产出的健康状态[5];日常生产期间,卷曲轮主机开关在约95%的时间处于持续开启状态,1.5%的时间处于持续关闭状态,另1.5%的时间处于间断性开启,开启呈现周期性。在卷曲轮主机开关处于相应状态时,其转速、电流有以下规律:
借助上面三种情况作为数据的健康程度初步判断依据。将处于上表三种情况的数据标注为健康状态,与之有明显差异的数据标注为非健康状态;收集大量健康的数据与部分非健康的数据,简单构建机器学习算法并训练。使用该算法预测未标注的实验数据,可得到各数据是健康的状态的置信度,代表该数据为正常状态的可能性[6],置信度低的数据可能有异常;分别获得置信度高与置信度低的数据,对比各时间分区内的所有模块电流平均值、方差并加以分析,以某次测试结果为例,进行数据标注的详细讲解。
测试以第一组的轧轮机A为例,从本次对比可以看出,置信度高的数据中,约有80%的时间内轧轮机A电流在120~150之间,平均值约为126,其方差约为15.0,表示大部分时间轧轮机在平稳工作,有较小的波动;而与之对比,置信度低的数据中,约有80%的时间内轧轮机A电流在175~250之间,平均值约为189.3,其方差约为309.5,平均值和方差都偏高,可看出此数据波动异常巨大,且電流整体偏高,其他时间区间的对比也有类似的情况。以高置信度数据为标准,通过对比低置信度数据各模块功率的平均值,判断该模块的异常类型是功率偏高亦或是偏低。
2.4.2 对数据进行标注
基于上一步的分析,为每个数据标上相应的健康状态向量,其中健康状态向量如下,其中每个状态可取值-1、0、1,分别代表电流过高、正常、过低:
Sn健康状态向量
最后使用一个月的数据进行初步检测,选取所有低置信度的数据进行,经分析得到所有错误类型。以第1组为例,部分异常状态标注如下:
3 使用算法进行训练与测试
使用RNN算法对数据进行实验,RNN是循环神经网路(Recurrent Neural Network),它以序列数据为输入,并且在演进方向进行递归的递归神经网络[7],可以记忆前面的数据信息,并应用于当前时刻输出的计算中,从而产生了一个序列当前的输出与前面的输出也有关的效果,所以RNN特别适合应用于时间序列数据的预测。LSTM和GRU是目前最流行应用最广泛的RNN算法[8]。
实验涉及3个分组,选取了生产过程中三组都处于正常生产状态的2020年7月10日和11日此2天的数据做为正样本,选取若干处于异常状态的生产数据作为负样本,由此得到训练集。并将同样处于正常生产状态的2020年7月12日此1天的数据,按照1/50的比率抽取数据作为测试集中的正样本,再选取若干数据作为测试集负样本数据。
4 实验结果
该实验所解决的问题属于分类问题,可使用Precision、Recall、F1-score这三个指标来评估实验的好坏[9],其公式如下:
其中TP:预测答案正确的次数,FP:错将负类预测为正类的次数,FN:错将正类预测为负类的次数[10];precision是准确度,指被分类器判定正例中的正样本的比重,recall是召回率,表示正类被预测出来的概率,F1-score用于平衡两者的关系。
而在该实验中,由于需要预测出异常状态,所以将所有异常汇总,并以其作为正例,而将处于正常状态的样本设为负例。获得如下结果:
由上表可以看出,在三组中LSTM、GRU都有较高的准确度和召回率和F1-score,表示这两种RNN算法不仅能较为准确地分类,且能保证异常情况能够较好地被判断出来;BP神经网也有较高的准确度和召回率,但对比RNN算法稍有逊色;另外随机森林和LigthGBM等传统机器学习算法的成绩比起上面三种算法更低,且召回率并不高,表示这两种算法可能会漏掉不少异常情况,导致没法对生产线发出正确的预警。通过对比可以看出,RNN在本次实验中取得了相对较好的成绩。
5 结束语
此次实验结合了PVC压延机等多模块大型生产设备中,不同模块需要协同工作的特点,提出了使用相关性分析为模块进行分组的分析手段。并且结合设备能耗等指标的时序性,采用了RNN算法来进行相关实验。并借助了大数据技术获得了大量的实验数据,从而得以汇总出大量不同的能耗异常情况,进而获得更好的实验成果。可以看出此次实验所提供的思路具有一定的科学性。
参考文献:
[1] 程亚豪,陈焕新,王江宇.基于机器学习的住宅能耗预测[J].制冷与空调,2019,19(5):35-40.
[2] 陈俊,张芥,田红珍,等.一种LSTM循环神经网络建立虚拟机能耗模型的方法[J].传感器与微系统,2020,39(9):16-19,23.
[3] 章蓬伟,贾钰峰,刘强,等.基于数据挖掘技术的文本情感分析技术研究[J].信息通信,2020,33(1):77-78.
[4] 蔡静,张明辉,朱宇婷,等.基于Pearson相关系数的货运车辆能耗模型研究[J].交通运输系统工程与信息,2018,18(5):241-246.
[5] 李国利.斜交轮胎三辊压延生产线自动卷取设备改造[J].轮胎工业,2019,39(5):306-307.
[6] 郭剑,林俊延,董树龙,等.基于置信度得分模型的深度学习手势肌电信号识别方法:CN110598676A[P].2019-12-20.
[7] Greff K,Srivastava R K,Koutník J,et al.LSTM:a search space odyssey[J].IEEE Transactions on Neural Networks and Learning Systems,2017,28(10):2222-2232.
[8] Fu R,Zhang Z,Li L.Using LSTM and GRU neural network methods for traffic flow prediction[C]//2016 31st Youth Academic Annual Conference of Chinese Association of Automation (YAC).November 11-13,2016,Wuhan,China.IEEE,2016:324-328.
[9] Wang W X,Fu Y T,Dong F,et al.Semantic segmentation of remote sensing ship image via a convolutional neural networks model[J].IET Image Processing,2019,13(6):1016-1022.
[10] Chiarugi F,Sakkalis V,Emmanouilidou D,et al.Adaptive threshold QRS detector with best channel selection based on a noise rating system[C]//2007 Computers in Cardiology.September 30 - October 3,2007,Durham,NC,USA.IEEE,2007:157-160.
【通聯编辑:唐一东】