工业大数据体系结构设计与分析
2020-07-04苏大鹏
苏大鹏
摘 要:众所周知,大数据平台是以海量数据存储为基础,通过分布式实时计算引擎、在线数据分析以及离线批处理引擎提供数据的计算分析,通过大数据和人工智能技术,帮助用户实现海量数据分析的任务。随着工业互联网的完善,工业大数据作为一种大数据的应用生态,得到了广泛重视。然而,在工业互联网环境下,如何从用户角度出发,设计出技术细节透明、交互操作简单、高效的工业大数据平台及其上层应用,成为工业大数据开发和应用中的关键问题。
关键词:工业大数据;结构;应用
工业大数据是指工业领域相关的海量数据,包括信息化数据、物联网数据以及跨界数据,已成为新工业革命的核心动力。工业大数据是指在工业领域中,围绕整个工业产品全生命周期所产生的各类数据以及相关技术和应用的总称,分为企业信息化数据、工业物联网数据和外部跨界数据等几类,涵盖工业产品研发过程中的设计资料、产品生产过程中的监控与管理、产品销售与服务过程的经营和维护数据,具有数据量大、类型丰富、实时性强。
一、工业大数据的特点
工业大数据本身不仅具有广义大数据的 3V 或4V 特点,还呈现出“多模态”、“强关联”特点。
1、多模态。所謂多模态,是指非结构化类型工程数据,包括设计制造阶段的概念设计、详细设计、制造工艺、包装运输等大类业务数据,以及服务保障阶段的运行状态、维修计划、服务评价等14大类数据。例如,在运载火箭研制阶段,将涉及气动力数据、气动力热数据、载荷与力学环境数据、弹道数据、控制数据、结构数据、总体试验数据等。
2、强关联。所谓强关联,一方面是指产品生命周期的设计、制造、服务等不同环节的数据之间需要进行关联,即把设计制造阶段的业务数据正向传递到服务保障阶段,同时将服务保障阶段的数据反馈到设计制造阶段;另一方面,在产品生命周期的统一阶段会涉及到不同学科、不同专业的数据。例如,民用飞机预研过程中会涉及总体设计方案数据,总体需求数据,气动设计及气动力学分析数据,声学模型数据及声学分析数据,飞机结构设计数据,零部件及组装体强度分析数据,多电系统模型数据,多电系统设计仿真数据,各个航电系统模型仿真数据,导航系统模型仿真数据,系统及零部件健康模型数据,系统及零部件可靠性分析数据等,这些数据需要进行关联。
二、工业大数据体系结构
工业大数据平台包含数据采集、存储、加工、处理、分析等方面的功能,在很多应用场合中,还设置了数据分析及控制系统,以充分发挥大数据在预测、控制方面的作用,更好实现以大数据技术提高工艺精度或良品率的目的,工业大数据体系结构,决策与控制子系统采用数据挖掘、预测分析手段实现对生产的精确控制,是上层决策和控制的技术基础,是实现智能制造的核心部分。数据建模聚焦于为工艺、设备、用户等建立分析模型,设计并部署不同的应用系统,挖掘出特定的模式和知识,最终生成决策指令,实现生产流程的优化与产品生产的智能化。一般来讲,工业大数据的来源涵盖了生产、销售、管理、市场等方面的数据,应根据数据来源的不同,在组建工业互联网的基础上,设计合适的数据采集与交换系统。目前,由于已经有了较为成熟的数据采集与数据预处理及存储技术,工业大数据的主要技术难点在于如何准确采集数据,准确处理结构化、半结构化数据,如何设计和实现成熟的挖掘算法,这是工业大数据走向成熟、实现其应用价值的关键。此外,与企业已有的 ERP 系统进行互联,充分整合和利用现有各类系统的数据,也是工业大数据平台的一个重要功能。
三、工业大数据的功能
工业大数据是配置和利用大数据这一资源的平台及其应用系统,其功能主要表现在如下方面:促进工业大数据应用。构建工业大数据平台来推动数据的融合和应用,有利于通过工业大数据来分析和预测市场需求,整合产业链和价值链,为用户提供定制化产品和服务,实现工业生产模式和服务体系的创新。挖掘工业大数据的潜在价值,实现工业大数据增值,促进工业大数据的应用。工业大数据应用服务平台通过对企业生产过程的优化,引导企业认识和利用数据,逐步培养企业的数据利用意识,不但能够促使企业深入挖掘自身积累的工业数据,而且可以充分利用其它企业的大数据来推进企业自身发展,增强企业应用大数据的动力。通过大数据采集、存储、分析、交易过程中的一系列专业化服务,将有效拓展大数据产业的市场容量,有利于培育出一批专业化的大数据开发和服务公司,吸引第三方数据服务商向工业大数据领域聚焦,更好地体现出工业大数据的应用价值。
提升工业大数据配置效率。很多企业由于规模、资金、人才等方面的原因,缺乏充分利用大数据的技术手段和交易平台,导致对自身拥有的数据采集、存储、分析等处于较低水平。工业大数据平台能够通过提供数据采集、清洗、确权、产品开发等服务,使数据得以资产化,让其价值得到充分体现。
四、工业大数据关键技术
1、多时间尺度数据综合分析,与传统商务智能BI应用场景不同,工业大数据包括秒/小时尺度的机器工况数据、天/周尺度的车间调度数据和月/年尺度的管理决策数据,在工业大数据应用中不同时间尺度的工业数据需要综合使用才能驱动智慧企业。例如,智慧矿山企业需要根据跨界数据预测矿石品质需求,依据品质需求生成装备作业计划,根据装备作业计划实时控制装备操作。
2、专业分析算法与构件。针对时间序列、时空等弱结构化数据,应提供丰富的特征模板库,方便对典型物理事件如风速平稳时段、发电机转速快速下降、环境温度逐渐上升等进行描述;另外,还应提供丰富的时间序列、时空模式、序列模式的深度挖掘算法库,提升工业数据分析的建模效率。
3、实时交互分析。工业大数据分析必须能够满足大规模、分散控制和交互迭代等需求。在实时处理上,传统的商业数据分析系统不能有效支持面向大规模数据状态下的低等待时间复杂事件检测。在离线分析上,查询检索与分析建模应紧密协同,同时前台探索展现与工业大数据平台要无缝整合,支持大数据集上的交互挖掘。
4、遗留算法并行化。针对重要的应用需求,工业企业通常具有一定的分析工具和科学计算软件积累,然而这些工具通常没有考虑大数据架构。如何有效重用这些分析算法工具,是工业大数据分析应用不能回避的技术问题。
5、领域知识自动化。工业大数据中存在着大量的非结构化数据,将当前深度学习、自然语言处理等人工能力融入到工业大数据分析中来,可以有效辅助把专家知识进行有效的沉淀、萃取和自动化。
总之,我国不仅是制造大国更是使用大国,在装备应用过程中产生的海量机器数据正是工业大数据的主体,为我国智能制造创新发展提供了独特而丰富的战略资源;同时,对于国计民生息息相关的装备制造业而言,工业大数据更是事关国家安全与主权。工业大数据是一个正在发展的学科领域,在内涵外延、模型理论、技术方法及其实施策略等方面,我国和国际巨头处在同一起跑线上。必须紧密结合中国国情认真实践,加大投入,快速研发,走出中国工业大数据自主发展之路,实现国产化工业大数据技术。
参考文献:
[1] 贺红燕. 基于大数据的智能电网关键技术研究[J]. 电源技术, 2016,40(8):14.
[2] 冉亮,李炜,孙向聚. 基于大数据技术的智能电网系统应用研 究[J].自动化与仪器仪表,2017,(9): 13.
[3] 孟祥萍,周 来,王 晖. 云计算技术在未来智能电网信息处 理平台中的应用[J].计算机测量与控制,2017,23(10).