基于数据驱动的卷烟制丝设备“靶向治疗”运维管理研究与应用
2023-03-20李文亮
吴 悦,李文亮,王 翔,朱 帅
(红云红河烟草(集团)有限责任公司新疆卷烟厂,乌鲁木齐 830000)
近年来,烟草行业新一轮技改使大多数卷烟厂的烟机设备实现了实时数据采集系统,但将大量的工业现场数据转换成有用的信卢依然存在诸多困难[1],烟草行业基于数据驱动进行设备运维工作尚处于起步阶段。
对于制丝生产来说,烟草行业的普遍共识是制丝工艺质量的稳定与设备状态密不可分,一次微小的设备停机也会造成较大的经济损失和质量风险。在实际生产中,即使快速解决了设备故障问题,也会经历一个从非稳态逐步变成正常的过程。因此,尽可能避免设备故障停机是当前制丝设备运维管理的一大挑战。
近20 年来,烟草行业在设备运营维护管理方面经历了纠正性维护、计划性维护和预防性维护3 个阶段。其中纠正性维护主要是指当设备出现故障时,对设备故障进行恢复而采取的维护措施;计划性维护主要指基于时间的维护(TBM)[2]主要是根据设备设计维修时间制订维护计划;预防性维护主要指基于状态的维护(CBM)[3],各卷烟生产企业广泛采用三级点检的方法监控设备状态从而进行维护。当前,有一些企业又提出了预测性维修的概念[4],然而准确、实时且在线的异常检测对于检测设备的潜在故障和制定预防性维修计划至关重要[5]。然而,要实现异常检测在当前来说存在一些问题[6]。
1)将从系统收集的大量数据传输到数据处理组件。
2)使用历史数据训练有效检测模型和应用实时、在线数据进行异常检测。
国内一些学者针对这2 个挑战作出了有益的尝试,尤其是在烟草行业的应用上。王伟等[7]针对卷烟制叶丝段批次过程中待机运行阶段存在监测盲区及不同设备并发异常对整体监测模型的相互干扰等问题,采用PCA 分解后构建T2 和SPE 统计量的方法,取得了良好效果。顾茜等[8]使用时序数据库InfluxDB 对实时生产数据进行存储、查询统计及分析告警,使用三次指数平滑算法、长短期记忆网络(LSTM)和序列到序列学习(Seq2Seq)对生产过程数据建模预测,实现精度良好、准实时的叶丝出口含水率趋势预测。
本文的创新点包括如下几方面。
1)在设备管理方面,优化管理流程,用数据带动工作流,提高设备运维效率。对在用设备进行数据分析和建模,建立提前预警机制,同时采用科学的、智能的方式对设备完好性、维修保养与运行情况等检查和反馈整改,将设备诊断、设备完好等相关管理流程和工作措施进行完善优化。
2)推行以“挤泡沫、挤水分”为核心的运维管理模式,使操作、点检、诊断和检修几方面密切配合,建立完备的设备运维标准体系。强化预防为主、设备诊断、日常维护和改善维修并存的设备运维管理,系统性、科学性和智能性地改进设备运行现状。
3)将工作流管理思想引入设备管理系统,以数据化、网络化和智能化的理念、方法与机制融入到设备日常运维中。
1 方法的提出
1.1 设备运维管理系统(EMS)和边缘层设备健康状态监测管理平台相协同
设备运维管理系统(EMS)为B/C 架构(客户端/服务器),客户端使用办公计算机浏览器登录指定IP 地址进行操作,服务端由一台计算机担任服务器响应客户端的各项操作,使用国产南大通用数据库GBase 提供数据存储服务,如图1 所示。采用开源软件python通过ODBC(开放数据库互联)连接南大通用GBase 数据库,进行数据库查询,完成对设备实时数据和历史故障数据的清洗、解析、分类、补全与标注;人员对操作日志、维修记录、备件记录、设备信卢、数据诊断和靶向治疗等记录进行实时更新,每次规范操作必须有章可循,后台审查是否存在违规操作。数据质量对于后续的建模、分析至关重要,因此对各项操作及自动采集的数据进行了统一编码;数据转发到数据存储区域后,根据数据的使用需求分别存储至分布式存储、时序数据库或实时缓存与关系型数据库中,如图1 所示。
图1 设备运维管理系统(EMS)和边缘层设备健康状态监测管理平台相协同
在边缘层设备健康状态监测管理平台信卢模块中选用历史数据服务器、通信协议与现行系统一致;预警模块中计算方式选择每增加一个数据进行一次计算、预警方式采用边沿计算法,在更接近数据生成的位置来处理、分析和存储数据,从而实现工艺参数快捷且近乎实时的分析和响应;输出模块采用主画面强提醒和声光报警方式。
后台集成统计分析、特征处理与机器学习建模,并实时根据生产真实数据对模型进行验证、评价,之后将模型部署到数据平台中,提供微服务接口向应用层用户提供服务,使用者在使用时,不需要在乎模型实现的细节、算法,只需要关注业务本身。
用户登录使用Cookie 和Session 确保授权用户登录访问,用户密码使用Hash 算法加密保存。网络安全使用厂内部网络资源,在厂内完全运行,不对外开放,确保数据安全。这样数据不会轻易被破坏,不让管理人员以外的人删改设备信卢,对断电、死机和系统崩溃等问题有措施来保障数据不受损失。
1.2 数据驱动的边缘层制丝设备健康状态监控
边缘层制丝设备健康状态监测系统主要功能是对制丝设备运行过程产生的各类数据及设备传感器采集的各类数据进行清洗、筛查、标记,以及对人工干预行为产生的各类数据进行系统分析,通过建立数据模型和故障模型,进行设备导演检测[9],迅速响应设备的各类故障预警[10],提高设备保障水平、降低零备件费用、增强工艺质量稳定性、减少意外停机造成的损失,以及提高设备运维的科学性和敏捷性。实现关键系统/部件的实时状态监控、故障判别(故障检测与隔离)、健康预测、辅助决策和资源管理及信卢应需传输与管理。并能够将应用内的数据通过图表等形式直观展示给企业管理人员。当监测数据超出阈值或者平台故障预警模型测算出设备故障时能够及时通过短信等方式通知管理人员。
在边缘层设备健康状态监测管理平台通过专业的信号分析技术进行信号预处理和特征提取,形成设备故障特征数据库,通过数据挖掘、技术专家人工分析和神经网络机器学习方法,建立设备故障诊断模型,形成故障诊断知识库,为设备运行提供基于工业互联网的远程监测、故障诊断专业技术服务和运维服务,如图2所示。
图2 边缘层设备健康状态监测流程
1)设备部件的衰退过程及其故障机理,通过高应力加速劣化实验可以在短时间内获取全生命周期的衰退过程,与此同时,多方面、全周期的数据采集能够从不同的角度更全面地描述其衰退形态。
2)以松散回潮为例,通过在多传感器的环境下学习,对不同类型的信号进行预处理和特征提取,来自每个传感器或者控制器信号所能反映出的特征只能反映本体的特定片面信卢,因此通过信卢融合的方式则能更加全面地去诠释本体的整体健康状态和故障模式。
3)随着卷烟设备机械设计复杂性的提高,外加传感器变得越来越困难,但是复杂机械的控制系统能够提供更加丰富的信号,如烘丝机设备设计时就提供了大量的在线数据。因此,能够从多传感器逐步转向无传感器的战略,应用5G 技术安装所需的传感器,直到能够通过控制器提供的数据找出与设备健康状态相关的信号,即使设备无法新安装传感器,按照历史生产的工艺数据,也能够分析出设备的劣化趋势,其模型如图3所示。
图3 基于设备历史生产数据的故障诊断模型
1.3 制丝设备运维管理
基于数据驱动的设备监控管理,结合精准全面的设备运维管理,通过数据采集、通信、网络、安全、服务器和数据库等,并将人工智能、大数据等数字技术作为基础能力为设备监测和故障预警应用提供丰富的支撑;设备运维管理系统(EMS)基于SOA(面向服务的架构)的层级架构,使系统各功能、模块之间松耦合,为用户提供服务,同时结合生产、业务场景,支撑多种形式的部门系统对接,方便管理系统的整体能力扩展,更加灵活地应对复杂的需求。支持现场部署、本地部署等多种部署,支持多种智能终端,可实现远程数据采集、监控、数据管理与应用和设备运维管理与应用。
通过生产现场设备的数据驱动和精准运维信卢,对设备采用精准的“靶向治疗”管理模式,最终实现智能任务规划及基于设备状态(历史、当前及未来状态)的智能维护,以取代传统基于事件的事后维修或基于时间的定期检修,从而提高设备保障水平、降低零备件费用和增强工艺质量稳定性,减少意外停机造成的损失,提高设备运维的科学性和敏捷性,为企业提质增效和高质量发展提供技术保障。
为了巩固好这次运维管理模式,部门组织相关技术人员、维修人员和操作人员,全面梳理制丝设备运维管理流程,完善制丝设备的运维管理制度。讨论目前制丝设备管理中的漏洞和不足,结合目前设备运维管理的新方法、新理念,对设备运维管理的以下几个方面进行完善。
将设备状态监控和故障诊断信卢中可能出现的影响人身安全、产品质量和运行参数等故障高发的部位信卢,按片区划分为若干点,制定新的点检周期,并且每周片区小组长制订周点检计划,按照点检项目内容、检查方法和判断标准实施检查,通过点检及时发现设备故障隐患,起到预防维修的目的,并由设备组班长和维修主管检查签字是否完成相应的点检,通过该细则的实施,避免设备巡检维修出现盲区,同时可避免巡检维修的重叠。
2 实施案例
2.1 实施前设置
本次实验选取的数据为某卷烟厂2017 年1 月至2022 年1 月制丝线叶片加料设备所生产的某牌号产品132 批次,故障数据为叶片加料2017 年1 月至2022 年1 月的故障及维修信卢,将生产数据与维修数据建立联系,生产数据作为X,维修信卢作为Y。假设叶片加料设备有Jx个测量变量,假设其在一次批次操作周期内对每个过程变量采集K 个测量数据,这样一次批次的数据可以组成一个二维过程数据阵X(Jx×K),如果该牌号重复I 批次,就可以得到I 个二维过程数据矩阵。将这些二维数据矩阵在批次方向进行扩展,得到了三维数据表示形式X(I×Jx×K)。这三维分别指的是批次数(Ii=1,…,I),过程变量数J(j=1,…,Jx)和每一次运行周期内测量点的个数K(k=1,…,K),形成Jy个质量变量。
132 个批次的叶片加料设备生产数据,每批次有11 个过程变量和300 个采样点,通过王伟等[11]所使用的方法整理为三维过程变量数据X(132×11×300),三维数据按照变量展开的方法和标准化预处理获得二维建模数据X(39 600×11)。在模型上,采用吴悦等[12]提出的基于历史生产数据监控制丝加料系统设备状态的方法,如图4 所示,对叶片加料设备进行状态监控。
图4 加料设备状态监控方法
2.2 案例实施
设备运维管理系统(EMS)以机电维修工的日常维修工作记录为核心,如图5 所示,每次维修工作必须按要求填写详细的维修记录,通过维修记录中各个字段与其他数据表进行关联,由维修记录扩展出其他设备管理方面的功能,该系统包括如图6 所示的设备台账、设备维修、设备备件、设备计划性维修、设备委外维修、设备技术标准、设备安全知识和设备维修人员8 个管理创新模块。
图5 设备运维管理系统的日常维修界面
图6 设备运维管理系统(EMS)的模块组成
2.2.1 设备台账信卢管理
设备台账信卢管理模块包括主机设备、计量设备、特种设备和安全阀等台账信卢管理。主机设备以表格的形式展示主机设备清单,包括设备名称、型号、工位号、使用位置、进厂日期和设备编码等主要信卢。通过设备工位号与维修记录中对应的设备故障位置关联,可以查找出单台设备的所有维修记录,形成单台设备的“维修档案”,通过对“维修档案”的整理找出设备故障出现的规律,在故障出现前发出预警,并在增加至计划性维修中,要求维修人员按要求及时进行处理,真正做到有根据、有计划的预防性维修。
计量设备以表格的形式展示车间所有计量设备,包括设备名称、型号、规格量程、分度值、计量参数、使用位置和下次检定日期等。根据检定日期向计量员发送提醒,在检定结束后更新检定日期数据。
特种设备和安全阀以表格的形式展示车间所有的特种设备和安全阀,包括设备名称、用途、使用地点、使用日期、额定容积、下次检验日期和生产厂家等,根据检定日期向设备员发送提醒,在检定结束后更新检定日期数据。
2.2.2 设备维修信卢管理
制丝设备种类较多,绝大部分设备处于工作时间长、温度高、粉尘多和湿度大的工作环境中,造成设备局部部件腐蚀严重。加之制丝设备随着工作时间的增加,器件逐步老化,经常出现突发性故障。现有的设备维护、维修还处于传统应答式维修,预测性、预防性维修开展进程缓慢,存在经验性大于理论的问题。维修、维护项目日渐增多,整体设备运维监控差,从而导致设备故障增多,造成设备停机时间长、生产效率低、设备维修与维护上工作强度大。
设备维修管理作为整个系统的核心,要求维修人员在每次维修工作结束后,按要求详细记录故障部位、故障描述、维修内容、处理方法、修复状态、现场照片、换件情况和维修耗时等关键信卢,维修结束后由班长对维修工作进行评价,把每一次的维修记录按系统的提示录入,比如:故障描述、处理方法、修复状态、换件型号和数量等,其就自动存到系统中。
在设备维修管理界面,提供日常维修查询功能,比如烘丝机的薄板渗漏和焊修比较频繁,现在输入“烘丝机”进行检索,就可以查询到什么时间对薄板进行过焊修。这种功能带来很多好处,第一,查询设备历史故障、处理方法和修复状态等;第二,可以借鉴其他维修人员的维修方法,缩小维修人员之间的技能差异;第三,新来的后备维修工可以从该系统中学习维修技术;第四,根据维修记录,制订相应的维修计划,完善维修措施。
2.2.3 设备备件信卢管理
对车间内部的备件申报工作进行规范化操作,由维修人员填写备件品牌、型号、数量、使用位置、备件照片和备注等信卢,还需要经过片区小组长、班长、维修主管和设备员的层层审核(审定申报合理性和数量,如有重复申报则进行阻止,对原因进行说明并更改该条记录状态为不批准),审核后按厂内流程进行采购,采购到货后由申报人和设备员共同确认,确认满足申报后流程结束。
备件管理模块可以查看设备备件型号、数量,成功地避免设备检修时拆卸后再备件现象,造成过程的浪费。通过车间备件明细进行总结,有效地改善了通用件过多、专用件过少的现象,有效降低了备件库存积压的不利局面。
备件申报管理是通过备件型号与车间内部的备件申报工作进行关联,形成备件申报的数据库,及时掌握申报、批准和到货情况,明确整个流程中人员的责任。包含备件的申报管理和备件查询功能,通过该界面查询备件的历史申报情况,既保障备件申报的准确性,又避免了重复申报,等到数据量足够大时,还能支持预防性维修和备件预算的把控。
备件申报过程中,若录入错误,还可以进行修改。在备件申报清单界面,还有备件查询功能,点击备件查询即可进入相应的备件库。
目前,已完善机械临时库、电气临时库和厂级备件库电气查询功能。为什么要增加3 个库房的备件查询功能?以往只能在ERP 上查询备件情况,一是输入比较烦琐,二是查询出来的结果包含了整个企业的备件情况,查找起来就比较麻烦,不直观。通过自行开发的EMS 系统,查询备件简单明了,目前制丝的备件分别存放在3 个库房里,系统提供了3 种查询方式,电气和机械备件均分开,电气维修工到电气库查询,机械修理工到机械库查询,可以快速有效地查询到车间所需要的备件情况。
2.2.4 设备计划性维修信卢管理
设备的保养计划信卢包含设备的保养,设备的点检、巡检、周检和月检,设备的维修、维护等。由于烟草企业中制丝设备种类多,设备保养、设备检查、设备维修维护通用性和实用性较少,保养计划项目较多。设备的保养周期存在“拍脑门”的主观现象,想起来就实施。设备保养计划周期没有数据支撑,保养周期不精确,存在过度维护或欠缺维修问题,监控实时性差,导致人力、物力的浪费。
计划性维修包括周计划、月计划和年计划等计划性维修计划,根据日常设备运行数据和日常维修数据整理出不同时长的计划性维修计划,有针对性地进行计划性维修。
2.2.5 设备委外维修信卢管理
对车间内部的委外维修工作进行规范化操作,由维修人员填写维修位置、种类、技术要求、数量、现场照片和备注等信卢,由维修班长或设备员进行审核(审定申报合理性和数量,如有重复申报则进行阻止,对原因进行说明并更改该条记录状态为不批准),审核后按厂内流程进行维修,委外维修完成后由申报人和设备员共同确认,确认满足申报后流程结束。
2.2.6 设备技术标准信卢管理
该系统模块中,有积累维修技师多年维修、维护的经验及设备部件保养手册、检修计划和部件组装等档案资料,利用已经掌握的开发技术,形成内部使用的技术标准库和设备知识库,方便对维修人员工作中对标准和知识的检索。该系统模块包括内部标准、企业标准、中烟&集团标准及国家标准和标准维护。
2.2.7 设备安全知识信卢管理
安全知识分为内部知识、外部知识。将各级安全知识收集存入数据库内,方便维修人员查阅。内部知识是车间内部制定并使用的安全知识,安全知识由车间安全管理员负责维护。
2.2.8 设备维修人员信卢管理
维修人员信卢管理包括维修人员清单、维修人员添加和维修人员地图。维修人员清单包括全体维修人员的姓名、工号、技术等级、操作岗位、操作岗级、责任区域、班次、角色和状态等信卢,通过表格形式展示维修人员的基本情况。
设备运维管理系统作为企业信卢系统中一个重要组成部分,其主要作用是实现对企业生产设备的全面信卢化管理,从设备的基本属性到运行属性、从运行到维护,进行全员化统一的标准的设备运维跟踪管理,以提高生产设备的管控能力和保障生产效率,降低企业的管理和维护成本,保障企业的生产能够正常顺利地进行,减少停机时间和次数,保障产品质量。
2.3 实施效果
通过基于数据驱动的制丝设备“靶向治疗”运维管理研发与应用一年的实施,设备方面实现了设备性能参数、生命周期、维修状态、维修经验和状态监测等可视化,能够实时地进行设备状态监测,及时发现设备的故障和预防设备恶性事故的发生。采用提前预测诊断,结合精准全面的设备运维管理系统,可以找出设备中的事故隐患从而减少设备停机的次数,预防质量隐患和巨大的经济损失。
在EMS 系统的辅助下,维修班组按照设备运维管理的总体安排,把设备点检、产品质量和维修服务质量等因素直接与绩效挂钩,对设备日常维护、设备修理做得好及停机率少的片区维修工进行加分和绩效奖励。这样能够充分调动各个片区小组的积极性,充分发挥设备的功效。营造一个良好的争先创优的维修氛围,减少故障带来的影响和损失。全面规范化运维管理体系,由事后维修的模式向预测性维修模式转变。
在具体指标上,万箱停机时间从2020 年的27.8 min/万箱下降至2021 年的15.6 min/万箱;在制丝生产过程能力指数上,由2020 年的3.55 提升到2021 年的4.58。
3 结束语
本文以思想变革驱动技术变革,应用边缘计算和大数据技术,构建了1 个设备运维管理平台、1 个设备健康监测平台、8 个设备运维管理模块,建立了“1+1+8”设备运维管理体系。
在当前数字化转型的关键时期,以技术变革驱动业务变革,以8 个运维管理模块为基础,设备运维管理平台和设备健康监测平台打破信卢壁垒,推动设备管理从被动维修向积极维修、从事后维修向预防维修转变,通过流程协同提升管理效能。
在具体的实施上,以业务变革驱动管理变革,不断深化企业维修管理的职能、方式、流程和组织等变革,建立健全设备运维管理的一系列配套制度,将制度转化为流程,固化进平台,推动组织管理集约化、扁平化和柔性化,实现信卢化与企业管理同频共振、互相促进。
在烟草行业数字化转型的关键时期,为了解决企业面对新的环境、在传统以职能为中心的管理模式下产生的问题,本文对设备运维管理流程进行重整,结合信卢化手段从本质上优化工作流程,利用人工智能、边缘计算等先进技术改进工作方法,使设备运维管理在质量、成本、效率与服务上均取得突破性的改变。