在线监测系统在港机运行维护中的应用
2020-09-03杨晓华陈创业魏新乾朱国和王传存
杨晓华 陈创业 虞 华 魏新乾 朱国和 王传存
上海振华港机重工有限公司
1 引言
目前港口起重机械主要沿用传统的“定期保养,事后维修”的运维模式[1]。这种模式存在以下不足:数据管理系统不完善,简单的统计分析无法充分利用历史数据;人工巡检缺乏专业工具,效果差;设备出现异常时,无法辅助判断故障原因及位置,待机排查时间长。
在线监测系统融合了物联网、人工智能领域的发展成果,已经初步具备解决上述问题的能力[2-3],并朝着监测网络化、系统集成化方向不断取得新的突破。通过对机组传感器信号数据分析,经人工智能算法赋能的监测平台可以对港机装备的运行状态进行实时监测评估,为港机柔性检修计划的制定提供决策依据。在线监测系统已经在军工、电力、轨道交通、环保等领域相继落地[4-5],虽然仍面临一定挑战,但其在港口起重机械运行维护领域的推广已经成为必然的发展趋势。
2 在线监测系统的设计要求
着眼行业发展的迫切需求,对港机设备在线监测系统的可行性进行了系统性研究。调研结果显示,在线监测系统主要需要满足以下设计要求。
(1)数据采集及传输要求。在线监测系统运行过程中,远程监控点采集港机设备运行数据并与边缘计算设备及监控中心进行实时不中断通信,代替人工巡检监测设备运行效能。设备历史运行数据要能够留存,以建立装备运行日志及状态判别式模型的训练、部署及持续优化。数据采集传感器的选择和安装,需要充分考虑港机机组设备工作特点、部件协同传动原理及传感器组件物理特性的差异,才能稳定、有效地监测设备运行状态,还要兼顾不同类型传感器对设备服役工况耐受能力以及工作原理差异性对整个系统负载均衡的影响。
(2)系统化的数据访问权限管理。对于监测网络留存或服务器备份的系统运行日志数据及异常警告信息,普通用户只有在系统的人机交互界面浏览机组的实时运行数据或特定时长内的机组状态运行日志的权限,具有规定等级权限的用户才能对留存数据进行数据读写及维护。
(3)起重机械运行状况智能监测要求。除了实时收集设备状态的运行状态数据,还要求在线监测系统能够实时对设备运行健康状态进行模式识别,为柔性检修维护及预测性维护的制定提供决策依据。
3 港机在线监测系统的实现
在线监测系统的整体框架分为边缘层、平台层和应用层(见图1)。边缘层采集港口设备运行数据,经边缘计算设备处理后传回控制中心。作为监控系统的神经中枢,平台层结合不同监测工况具体的数据处理要求,对应用场景进行数字化建模,基于异构数据层级之间内在的逻辑关联性,借助机器学习、深度学习等智能技术探索内在函数映射关系,从而对网络产生的各类数据进行一体化的分析[6],进而实现对数据资源深度整合、信息挖掘,为实现对监测系统整体网络高效、准确的分析与管控奠定基础。借助提前建立的关于检修维护的知识图谱,应用层可结合具体的现有作业、管理条件对设备保养管理给出合理的指导建议。
图1 监测系统总体架构图
在线监测系统通过安装在起重电机驱动轴附近的震动、温度等传感器,采集港机设备的车轮和滑轮运行数据后,上传至安装在控制室内的边缘计算设备,以进行预处理、分析、存储,并将这些数据通过无线传输方式上传至企业监测云平台。利用人工智能技术赋能平台对起重设备及车轮滑轮的运行状态进行实时监测,及时或提前发现运行异常,并提前安排检修或更换计划,可有效减少车轮和滑轮事故造成的计划外停机时间,提高设备利用率,降低运行维护成本。
3.1 数据采集及传输
该在线监测系统主要通过转动轴的振动信息判断起重电机及车轮、滑轮等部件运行过程中的健康状况,传感器安装在起重电机的主、从动轴附近位置(见图2)。
图2 传感器安装位置示意图
远程在线监测系统的数据传输模块一般包括两个部分,一是由单位监测区域内的传感器节点汇聚组成的子网;二是传感器将数字信号传输到监测子站后,按照既定协议传回监控中心的信号线路称为骨干网[7]。子网的数据传输采用有线无线传输方案均可。对于骨干网而言,有线传输方案不仅线路架设成本高,通信线缆及信号传输设备还容易受到自然灾害破坏;而无线网络进行数据传输只需要架设天线,不仅提高了系统安全系数,还提高了系统的可扩展性,降低了系统维护难度。以在电力系统中已取得较为成熟应用的监测系统为例,其集成了Linux内核低功耗芯片的监测子站,支持子网ZigBee、骨干网IEEE802.1的通信协议,将收集到的数据传送至汇聚节点后接入互联网,或者通过高增益天线远距离传输接入内部网络,在监控中心对数据进行分析处理实现故障诊断。
随着无线通信技术的不断发展,利用GPRS、4G网络所提供的公共平台实现数据传输的解决方案也越来也越显现出竞争力[8-9]。早期监测系统的数据传输方式也多是利用以太网专线或者专用网络,将传感器采集到的设备运行状态数据按约定协议传回监控子站,再通过支持FD-LTE、GPRS等无线终端远程传回监测中心。本项目监测系统的传感器采集运行状态数据,按照约定格式通过支持Modbus协议的RS-485总线接口传输到监测子站,再通过4G无线通信终端传回数据处理中心的云计算平台。
3.2 在线监测系统的远程故障检测
在线监测系统能极大缩短故障检测与维修时间,增加设备正常运转时长,从而提高设备整体运行效率。起重机械轴类传动部件故障会实时体现在其振动信号时域和频域谱峰的分布特征,保障了设备预测性维护的可行性。故障检测在机床、大型电站等机械设备运行状态监测领域已经有了较为广泛的应用[10-11],从传感器硬件到故障检测分析算法都积累了一定的经验。
监测系统传感器将采集到的设备运行状况数据在边缘计算设备滤波、解调后,传输到监控中心进行存储、分析,监测系统的服务器从震动信号时域和频域谱线中提取能够表征设备运行状态的特征集,用于机组设备运行状况的模式识别算法诊断,进一步在线或离线训练,并提供规定权限内的运行日志数据查询、异常报警及故障诊断等功能在应用层反馈检修指导建议。
图3为起重电机振动传感器监测到的一组故障样本,分别为驱动侧(MIH)监测波形和从动侧(MOH)波形。电机从动端测点震动趋势波动较大,但整体震动幅值较小,时域波形有冲击峰,震动幅值正常,包络谱中可见7.2 Hz频率,接近仿真试验台预先测试标定的轴承保持架损坏特征频率;电机驱动端振动幅值正常,趋势有间隙跃升,时域波形较平稳,但包络谱中发现33.6 Hz频率峰,几乎达到转子自有转动频率的2倍,由此判断轴承保持架有磨损。最近的设备保养周期检修结果也验证了分析的准确性。
图3 机组故障监测信号波形
该系统虽然能够及时发现机组运行异常隐患,但对于少部分非典型故障的确定,仍需现场人工检修或者具备相关知识背景的专家对数据进行进一步量化分析。由于滚动轴承故障振动信号不稳定、故障特征提取效果不理想等原因,仍需要进一步提高现有故障诊断的模式识别算法准确率。
4 在线监测系统的发展趋势及面临的挑战
4.1 智能化发展趋势
在线监测系统基于无线通信网络的数据采集传输的模块已经有相对成熟的解决方案,随着基于微内核全场景分布式操作系统的推广,基于高性能AI推理芯片云服务器的上线及剪枝、量化、蒸馏学习等模型压缩技术的长足发展,均为系统利用更多维度数据分析,为实现监测系统的智能化发展奠定了基础。
除了进一步提高故障诊断模型的准确率以减少人工参与诊断工作量,在线监测系统还要能够利用更多维度传感数据,实现对港机设备运行状况更多维度的监控。借助预先建立的设备检修维护的知识图谱模型,并结合具体机组的知识库以及既定生产转运计划,对不同故障给出具体的预测性检修维护建议。
以往监测系统信息处理的“专家系统”,基于系统动力学原理对应工况场景进行建模,并依托最佳平方逼近等数学方法实现函数逼近。而机器学习负梯度下降的迭代型搜索算法没有沿用这种解析解的思路,将“实践论”引入了建模领域,数据驱动的基于误差反向传播算法和链式法则的深度学习,在处理非线性可分分类问题时,相较于传统SVM等机器学习的核函数方法又进一步提高了处理准确率,并进一步降低了对模型特征集选取的敏感性及实况应用场景对于建模能力的要求。这种端到端的建模理念已经极大提高了模型准确率,且相较于传统建模方法,对复杂应用场景也展现出更强的泛化能力。震动信号也具备明显的自然语言时间序列特征,可以根据业务的实际需要选择合适的框架接入相应的API进行模型训练及上线部署。
为了保障港机设备运行故障诊断模型的准确率和召回率,充足的训练和验证数据集需要提前采集,并根据选用模型对设备正常运行的历史日志数据及筛选的故障样本数据进行数据标注,选用网络模型训练以实现对故障的诊断。半监督训练算法可以极大降低数据标注工作量并达到与监督训练相近的准确率,对类工业高噪声环境也展现出更高的耐受性。但截止目前,在监测系统及其他物联网相关领域还未见公开的成熟应用,除了图像数据标签“增广”技术仍需结合时间序列型数据结构特征作进一步改进之外,另一重要原因在于原始故障样本数据积累不充分,从单一仿真试验台上采集的故障样本的概率分布,不利于故障判别模型超分割平面的确定。
4.2 系统面临的挑战
除了操作系统、数据传输,数据实时处理及预警触发均会产生延迟,保障在线监测系统的实时响应是一个系统性工程。
当前阶段监测系统处理的数据多为时序特征较为明显的震动信号,已有神经网络模型用于故障检测但未取得较大幅度准确率提升,对于诊断模型仍可尝试完善特征集适配DNN网络,后期系统优化磨合后,使用数据新标注方式再尝试训练RNN、LSTM等网络模型,且验证后的模型需经剪枝压缩后再移植到系统平台,并持续优化以缩减系统算术运算响应时间。
作为云计算的必要补充,边缘计算可以在港机设备端对运行数据进行存储和预处理,既可以减轻传输网络的带宽压力并降低数据传输能耗,又可以减轻云计算中心的数据处理压力,从而提高系统实时响应能力。值得注意的是,虽然全场景分布式操作系统可以兼容边缘计算,但既有的MapReduce等计算框架在处理高并发嵌入式分布式集群异构数据时仍存在一定的不足[12],因此适宜将滤波、解调、FFT变换及简单规则预警等简单任务部署到边缘计算设备,对于机组部件剩余寿命预测等远景规划任务,仍部署在服务器或者云计算平台均衡监测系统负载,以降低响应延迟。
现在的监测系统需要连续若干次触发下跌或上升判断规则之后才会发出警告,即系统故障后以震动信号频谱特征作为主要诊断依据的模型,需要若干采样时长才能触发警告。RNN等深度学习模型则可以实时对设备运行状况进行判断,只需要适配流数据处理的实时计算引擎。目前相对成熟的实时计算引擎有Storm、Spark Streaming及Flink等,具体筛选过程中,需要综合考虑具体应用及系统维护场景的实际需求。
5 结语
利用机器学习、物联网等技术发展成果,在线监测系统可以实现对机组设备运行状态的实时监测,有效降低巡检等运维成本,对于提升港口科学管理水平具有重要意义,在港口起重机械运行维护领域具有广阔的应用前景。