浅析工业4.0 时代的数据质量管理
2023-06-06石琰美
石琰美
(广东省惠州市大亚湾区中海油惠州石化有限公司,广东惠州 516084)
工业4.0 将信息物理系统引入了生产系统,提升了人工智能、自动化和人机交互的应用水平。这使得价值链中的各个元素得以识别和交互,有利于生产过程中利用信息化技术进行客户化定制。当生产过程可以更有效地使用集成数据,管理人员就能更有效地做出详尽的、由数据驱动的决策。
工业4.0 技术使得制造者通过改善制造过程的灵活性、产率、质量,更快的对客户需求作出反馈,同样也形成了采取新商业模式、生产过程和其他创新的基础。这些益处使得制造者倾向于投资工业4.0 技术,以使产品满足客户需求的水平进一步提升。
本文旨在介绍工业4.0 时代的大数据、信息物理系统和物联网技术,这些技术使得过去无法获取的生产环境信息得以收集,引发了改进生产过程质量的新契机。通过这些技术可以让传统的生产设备变成可自主学习的设备,改进整体性能的同时也减少了设备维护管理。这些变化为工业互联网信息创建了一个开放性的智能制造平台,不但可以进行实时监控,还可以追溯产品的状态和位置。
1 工业4.0 技术和精益管理的结合
精益管理是制造业深入人心的管理理念,许多组织都采用了丰田生产体系,该体系强调减少浪费、准时化、看板和其他问题解决方法。精益生产过程更加标准化和透明化,把活动集中于关键步骤。在工业4.0 技术给制造业带来变革的同时,精益管理工具用以降低变革所伴随的风险如下。
1.1 准时化
准时化通过确保必要的库存以避免生产过剩,送料机器人可以自动进行物流搬运。降低发生人为错误和空车运转的概率,利用信息物理系统和物联网可监控运送货物的状态并指导送料机器人有效工作,建立起自组织的、可靠的生产逻辑网络系统。
1.2 看板
看板促进材料和信息的持续流动。在制造业中,通过保持预定的库存水平来实现连续的物料流动,以保证不间断的供应。通过基于数字孪生的模拟或虚拟实时显示,可以更具前瞻性地规划新的看板周期,并将其无缝集成到现有的生产环境中。因此可以对在制品进行持续监控,同时提高材料流动的透明度。
1.3 全面生产性维护
全面生产性维护TPM:可以使用几种工业4.0 技术来增强运营商的能力。例如,虚拟现实VR、增强现实AR 和头戴式显示器将可视化信息嵌入真实环境,实现实时交互,用于提供清晰、丰富的使用、维护说明[1]。在设备制造与装配场景中,利用VR/AR 技术能够实现对工厂的合理规划,包括对每个部件的运行轨迹、维护及储存,从而重构整个生产流程体系,提高质量与效率。
通过应用现代信息通信技术,充分与网络空间虚拟技术进行融合,实现对企业现代设备管理从以前传统的较为粗糙的管理模式逐渐向智能化方向转型,有助于实现信息化以及全局性管理,充分实现工业化和信息化的深度融合,保障设备管理过程中传统管理和“互联网+”的管理模式结合得更加紧密,从而为企业实现更大的设备投资效益奠定基础且发挥实效[2]。
2 由信息物理系统驱动的智能工厂
信息物理系统CPSS 一个综合计算、网络和物理环境的多维复杂系统。它们嵌入到周围的物理世界及其正在进行的过程中,可以通过服务来访问本地网络或互联网上可用的信息。信息物理系统CPSS 是工业4.0 智能工厂的基本组成部分。
信息物理系统CPSS 通常被描述为“物理和工程系统,其操作由计算和通信核心进行监控、控制、协调和集成”。研究人员将CPSS 概念化为五级架构以指导部署:
(1)智能连接,这是CPSS 的基础。它要求制造商从机器获取可靠的数据。数据可以直接从传感器、数控机床等设备或ERP 在内的软件系统中获取。
(2)数据到信息的转换,从机器的原始数据中获得的有操作性的信息。
(3)连接网络,连接的级别相当于中央信息中心。信息从网络上的每台连接的机器传送到信息中心,通过处理数据得到解析信息,信息中描述了系统中每台机器的状态。
(4)认知,分析信息并用适当的方式呈现给用户以做出决策。因为获得了信息和每台机器的状态,维护任务可以更容易地确定优先顺序。
(5)配置,从网络信息层级向物理设备层级提供反馈,并执行监督控制,以帮助机器自我调整,将认知决策应用于机器操作。
在制造业中采用信息物理系统CPSS 可以改变数据的获取、分析和共享方式,管理者可以根据实时数据分析做出更恰当的决策。智能网络使得CPSS 得以实现,它用数字来描述实物。数字孪生意味着要具备智能水平,以便在操作和程序层面实现自我意识、自我比较、自我管理和自我适应。因此,物理层级和网络层级被整合在一起发挥协同作用。这些系统生成大量数据,需要复杂的技术来处理和传输。当生产过程的所有细节都透明时,就可以更加有效地控制和管理。
数字孪生还实现了智能模拟算法SBO,可用于对设备和决策进行试验,而不会对生产造成负面影响。据此可以找到近似最优的解决方案,减少创建许多不同假设场景的耗时工作。从一开始设计新的制造设施时就采用SBO,支持组织从传统大规模生产向大规模定制生产模式转变[3],同时保持盈利能力。
3 物联网资产与维护优化
更智能化的设备维护可能是将物联网和信息物理系统CPSS 引入制造环境的最大优势之一。当工具、设备和软件直接或通过适配器连接到互联网时,修复性维护、预防性维护和间隔时间都可以得到改善。
有了工业4.0 技术,可以大大减少识别问题和修复性维护所需的时间。在智能工厂中,当设备发生故障时,它可以自动向相关车间和维护人员发送警报,有时还会自动采取行动纠正故障[4]。
预防性维护可以延长设备的使用寿命,降低生命周期成本。通过对大数据进行深入分析,设备能够评估自身的完好状况和失效情况,并可以利用其他设备的数据来避免潜在的维护问题。
工业4.0 强大的连通性将使跨设备收集和分析数据成为可能,从而实现更快、更灵活、更高效的决策。这反过来将降低成本(可以通过价格传递给客户),提高生产力,促进工业增长,增强组织的竞争力[5]。
由于任务的实时性,设备的智能规划和控制需要高质量的数据。特别是对于维护任务,在合理的时间范围内收集、清理、集成必要的高质量数据以制定可执行的操作策略有一定的困难。
4 数据质量管理
对于工业4.0,上述应用场景表明,数据是驱动和维持组织影响力的工具。因此,工业4.0 面临的最大挑战是确保数据本身的完整性。除非从制造系统及其物联网或CPSS 获取的数据是可靠的,否则高度连接的智能系统所带来的任何信息都没有价值。
制造环境中产生的大数据结构可能很复杂。数据错误、信息缺失、不一致、噪声相关问题可能会影响从该数据生成分析报告的质量。数据必须满足用户的需求并符合目的,即具有足够高的质量以产生有用的结论。根据ISO 25012,数据质量被定义为“在特定条件下使用时,数据满足规定和隐含需求的能力”。
因此,数据质量管理变得越来越重要。一种系统的、以质量为导向的数据管理方法将数据视为一种资产,并在从采集到归档和处置的整个生命周期对其进行评估。数据质量管理是一种整体实践,仅从初始数据质量评估开始,如果没有适当的数据质量管理,即使是微小的错误也可能累积,可能导致收入损失、流程效率低下。因此,数据质量管理的重点是为客户提供卓越的价值,同时间接地提高流程效率。对数据质量的过程控制至关重要,最重要的是,为了确保高质量的数据,企业需要在组织的各个层面对数据质量管理原则做出要求,并制定随着时间的推移减少数据缺陷的流程和程序。
5 数据质量管理方法
如果基于特定数据做出的决策要得到信任,那么数据质量必须得到保证。实现这一点有四个关键步骤:
5.1 状态重建和数据分析
确定给定数据集的上下文和元数据的活动和过程。状态重建描述了对观测数据的上下文信息的收集。在进行任何数据质量测量或监测活动之前,数据分析是必不可少的。数据分析过程中收集的信息包括不同或缺失值、属性的数据类型或出现的模式及其频率。
5.2 数据测量或评估
侧重于数据质量工具的评价能力,与用户如何解析结果无关。通过评估测量结果并得出评估结论。此阶段进行数据质量的初步评估和数据质量问题的影响分析。
5.3 数据清理
数据清理是从记录表或数据库中检测和更正错误的、不准确、不相关或格式不正确记录的过程。这可能需要替换、修改或删除数据。目的是检测、消除错误和不一致。
5.4 数据质量监控
根据用户定义的约束条件对数据进行连续监控。
必须在数据可能使用的场景下评估数据的适用性和实用性。由数据驱动的设备因为数据不足和不准确可能会在制造过程中造成严重的故障和产品质量问题,如果没有数据质量评估,组织就无法正确理解数据质量如何影响其满足市场的能力。
这四个步骤的数据质量管理方法对工业4.0 技术非常重要,因为这样才能确保数据和元数据更好地反映工艺和设备的当前状态。通过拥有可靠的信息,可以更方便的主动了解系统内的异常情况,从而提高整体效率和性能。
6 数据质量标准
ISO 25000 系列标准,简称 SQuaRE,即软件产品的质量要求和评估标准,可以用于定义和评估数据产生、获取和集成过程中的数据质量要求,确定数据质量保证标准,评估数据是否符合法律或相关要求。
ISO/IEC 25012中的数据质量模型比较适合制造业大数据,在ISO/IEC 25012 中,固有数据质量是指当数据在特定条件下使用时,数据的质量特征具有满足规定和隐含需求的内在潜力程度,依赖于系统的数据质量解决了在给定过程中使用的适应性问题。
作为扩展,ISO/IEC 25024 提供了一些措施来量化数据的外部和内部质量,由于数据的业务价值只能根据工业4.0 中的使用环境进行评估,有学者提出使用三条准则来评估大数据集的使用质量,即上下文一致性、操作一致性和时间一致性。对于这些准则中的每一条,都应选择适当的数据质量维度来评估。
根据设计,ISO/IEC 25012 中的定义非常通用,为企业的特定使用环境留出了空间,并为进一步的具体研究留有空间。
7 结束语
本文研究了工业4.0 技术与数据质量管理之间的关系。探讨了适用于确保现代制造业组织数据质量的关键要素。随着新设备越来越依赖数据来监控和简化运营,优化其资产的性能和寿命,组织应该了解信息是如何获取、处理和用于做出业务决策的。
数据质量管理是一个持续的过程,组织需要在所有层级建立获取数据的原则,随着时间的推移不断减少数据缺陷。确保源头的数据质量,对于提高数据质量至关重要。