工业大数据技术及其应用研究
2021-07-08侯栋恒
侯栋恒
编者按:随着科学技术不断进步,大数据技术在工业领域的应用也越来越广泛。通过大数据技术分析和处理信息数据,能够深入挖掘信息数据中的潜在价值,有利于提高信息数据利用率,从而为工业生产奠定良好基础。基于此,作者结合大数据技术特点进行分析,并总结几种常见的大数据技术分析方法,深入探索其在工业领域具体应用,希望为专业人士提供参考、借鉴。
引言
在“中国制造2025”发展理念不断深入的背景下,将大数据技术引入工业制造已经成为工业革命的大势所趋。在这一背景下,工业大数据概念应运而生。从广义上分析,工业大数据既包括企业在内部制造产生的信息数据,也包括企业外部存在的信息数据。由于数据信息种类多样、数量庞大,所以分析难度较高,加上新时期工业生产对分析精度提出较高要求,因此需要企业善于利用大数据技术,对海量信息进行收集、分析和应用,从而为推动工业产业持续发展奠定基础。
大数据特点分析
大数据的普遍性特点
(1)海量性特点
新时期,我国工业信息化建设水平不断提高,促进数据量呈井喷式状态持续增长,海量性已经成为工业大数据典型特征之一。并且时至今日,大数据规模依然处于不断变化中,单一数据集规模范围不尽相同,从几十TB到数PB不等,各种来源均可能产生数据信息。
(2)多样性特点
受传统数据记录和储存方式制约,导致工业企业记录的数据大多为生产过程中产生的直接数据。随着社会经济飞速发展,检测技术、传感技术等新兴技术应运而生,采用这些技术能够准确记录图像、声音等非结构数据,在一定程度上丰富了数据种类[1]。
(3)高速性特点
近年来,我国工业生产规模不断扩大,生产标准逐渐提高,工艺流程日渐复杂。促进测量、控制技术更新换代速度随之加快。一些装置在运行过程中每秒记录的数据高达几千甚至上万MB,充分体现了大数据的高速性特点。
(4)易变性特点
工业生产过程具有复杂性、系统性特征,其工况一般分为稳态和动态两种,如果生产过程中设备产生故障,那么参数数据也会发生变化,这也突出了大数据的易变性特点。
工业大数据的特点
(1)高维度特点
工业生产结构层次较为复杂,涉及到物理化等多种变化形态,并且产生的数据彼此之间耦合度较高,容易形成一个复杂的系统结构,由于描绘这一过程需要建立在高维度基础上,所以也充分体现了工业大数据的高维度特点。
(2)强非线性特点
过程工业中产生的信息数据之间存在必然联系,但这种联系并非线性关系。例如:热力学中涉及到的温度、压力与反应温度和反应速度之间存在的关系属于非线性关系。也正因如此,使得工业生产中产生的大数据在分析和处理方面存在较大难度[2]。
(3)样本数据分布不均特点
在工业生产中,需要尽可能保证设备参数在规定范围内。但是受温湿度等各种因素影响,不可避免会发生参数波动问题,使得工况产生相应变化。另外,工业生产原料性质是始终不变的,所以操作条件会一致处于波动状态,以上均体现了样本数据分布不均这一特点。
(4)低信噪比特点
随着科学技术不断进步,测量技术、传感技术均得到了一定优化和完善。但受各种客观因素影响,容易导致数据存在较大噪声。例如:工业生产中使用的测量仪表出现故障,导致数据传输失真,容易使数据产生噪声[3],这也为工业大数据分析造成较大难度和挑战。
工业大数据技术分析方法
降维分析方法
以上提到,工业大数据具有高维度特点。而降维分析方法,就是将高维度數据降低到低维度,从根源上减少“维数灾难”的发生。当前,很多专家和学者在研究讨论中表明,降维分析实际上就是聚类与分类分析中的一个分支。然而,由于现阶段我国工业生产中需要处理的数据大多为高维度数据,所以通常习惯将降维分析方法作为数据处理之前的一种分析技术。降维分析方式具体可以分为两类,其一是线性降维,包括局部学习投影、主成分分析等方式。其二是非线性降维,包括局部线性嵌入法、等距映射法等方法。
聚类与分类分析方法
对聚类与分类分析方法进行分析,首先要明确二者定义、相关联系以及主要区别。其中聚类分析方法,是指将工业生产中产生的数据进行分类,使其形成多个自然群体。不同群体的特征不尽相同,有利于获得各群体特征描述。现阶段,聚类分析已经成为工业挖掘数据价值的重要方法,属于一种在没有监督环境下形成的学习方案,能够对数据进行深入探索和挖掘[4]。另外,对数据进行聚类分析,能够为数据预测、数据检索奠定良好基础,有利于提高数据准确率和利用率。常见的聚类分析方法有五种,分别为基于层次、基于划分、基于密度、基于模型、基于网格等聚类。
分类分析方法则是结合工业数据特征来构建分类器,而后通过分类器明确需要分类的样本类别。这种分析方法与上文提到的聚类分析方法相比,最本质的区别在于分类数据在数据归类前,已经明确了数据的分类规则。但聚类分析方法在数据归类之前,则没有相应的分类规则,而是需要在完成数据归类后,才能够了解不同类比的主要特点。现阶段,常见的分类分析方式有多重,结合其分析特点来看,可以分为基于数据库技术的分类方法、Bayes分类方法等。与此同时,不同分类方法的算法也存在明显差异。例如:Bayes分类方法中最常见的两种算法分别为TAN算法和NB算法。可以充分满足不断扩大的工业数据量分析需求。
相关性分析方法
所谓相关性分析,就是对工业生产中产生的数据关系程度进行分析。这种分析方法当前在国内外研究领域受到广泛关注,已经被广泛应用到气象学、心理学、金融学等多个领域。从字面上对相关性进行分析,是指对两个变量存在的关系进行分析,也就是度量二者密切程度。当前,在相关性分析实际应用过程中,最常见的方法有Pearson方法,但是结合分析结果来看,这种方法只能够度量数据与数据之间的线性关系程度,在分析非线性关系时容易产生误差,这也意味着该分析方式不适用于两个变量强非线性关系分析。随着工业大数据种类和数量的不断增多,对多变量相关性分析提出较高要求。在这一背景下,典型相关性分析技术、因果关系分析技术等多种多变量相关性分析技术应运而生。但是这些技术在实际应用中也存在一定不足之处[5]。例如:因果关系分析技术在实际应用中,无法进行定量描述;典型相关性分析技术在实际应用中,无法解决时间序列存在的问题。目前来说,这些缺陷具有短期性特点,在未来随着科学技术不断进步,各种相关性分析技术势必也会得到一定优化和完善,不仅能够提高计算速度,而且使用范围也会逐渐扩大。
预测分析方法
对工业大数据进行预测,实际上是一种基于功能定义的分析技术概念,在工业生产中涉及范围较广。包括工业生产过程对产品质量进行预测,对装置故障诊断进行预测等。现阶段,最常见的数据预测技术,就是将不同优化算法与神经网络算法深度融合,其中较为成熟的算法有BP神经网络、RBF网络等。其优势可以归纳为以下几点:第一,从理论角度进行分析,能够尽可能逼近非线性映射;第二,对数据输入、数据输出等问题进行科学处理;第三,满足数据分布式处理需求;第四,具有较强的自适应性和自学习性;第五,能够对大量定性定量数据进行统一处理。由于我国在预测分析方法研究和应用方面起步较晚,所以目前为止相关技术依然处于发展阶段,很多技术尚不成熟。很多技术都是源于统计学理论发展而来的,其功能包括对工业大数据进行降维分析、分类分析、聚类分析、相关性分析等,并在此基础上准确预测未来发展规律[6]。现阶段,工业领域获取的应用实例,大多是在大数据技术不同功能和不同算法深入融合背景下产生的。
工业大数据技术实际应用
工业生产过程优化方面的应用
新时期背景下,工业领域面临的市场竞争压力不断增加,提高生产能力和生产质量,已经成为工业企业强化竞争实力的必要需求,这就需要企业引入各种先进装置。与此同时,在可持续发展战略背景下,工业领域还要充分考虑节能环保问题,要尽可能将生产过程产生的危害降到最低。面对这一改革创新需求,工业企业可以通过过程优化方式来实现。具体来说,过程优化能够对企业生产进行实时监督,帮助企业寻求最佳生产途径,同时可以从根源上减少工业生产过程的干扰因素,为企业提高生产能力、获取经济效益奠定良好基础。对工业过程优化进行深入分析,可以将其分为两个方面,分别为动态优化方面和静态优化方面。并且可以采取的优化措施有多种,其中利用数据分析技术优化工业过程,就是企业改革创新的一个新思路[7]。
自改革开放后,我国工业发展规模逐渐扩大,社会生产能力逐渐提升,很多生产工艺已经基本达到国际先进水平。然而,由于工业生产过程较为复杂,所以受多种因素影响容易导致数据产生各种差异,在一定程度上增加了数据分析、处理难度。针对这一问题,有专家提出了自组织映射神经网络分析技术及模糊C均值聚类分析技术,通过以上技术对工业数据进行分析和处理,能够对工业生产过程中的数据进行有效监测。在两种技术分别分析基础上,对二者分析结果进行对比,可以发现自组织映射神经网络分析技术精确度更高,但是处理效率相对较差。工业企业可以在分析结果基础上对生产工艺进行优化和改进,从而进一步提高生产质量和效率,为企业持续发展奠定良好基础。
另外,众所周知,石化行业是带动我国经济持续发展的支柱产业,在新时期背景下面临全新发展需求。其在工业生产过程中涉及到催化裂化、催化加氢、焦化等多种工艺技术。常减压蒸馏作为石化企业较为常见的装置,也是石油生产的重要环节。通常在进入该环节前,需要对原有进行电脱盐处理。但结合石油企业生产现状来看,普遍存在电脱盐效果不理想情况。对此,有专家提出采用决策树方法来解决,通过构建决策树模型,对模型中产生的数据进行聚类分析,从而明确影响原油电脱盐效果的根本原因,在此基础上,企业可以通过改进电脱盐装置等方式优化生产工艺,提高生产水平。
故障监测和诊断方面的应用
故障监测及诊断最早出现于美国20世纪中期,当时主要应用到军工、航天方面。近年来,随着工业生产规模不断扩大,加上各种先进技术的广泛应用,各种类型的生产设备应运而生,虽然在一定程度上提高了工业生产质量和效率,但由于设备结构复杂、运行环境多样,加上运行周期较长,所以不可避免存在故障问题[8]。对设备故障进行全过程监测和诊断,已经成为工业提高社会生产力的必要需求。所谓故障监督和诊断,实际上就是对设备信号、特征、状态进行采集、提取和识别,而后对设备故障进行诊断,通过以上步骤不断循环,能够及时发现各种潜在问题和隐患,有利于提高故障监测及诊断精度,从而保证工业安全生产。当前,随着工业生产规模不断扩大,设备故障的原因逐渐增多,并且故障机理也越来越复杂,传统监测手段和诊断技术已经无法充分满足设备维修需求。而应用工业大数据技术能够有效解决以上问题。上文提到,无论是降维处理技术,还是分类聚类技术,均能够对海量数据进行科学处理。将这些技术与故障检测诊断技术相融合,能够突破传统技术存在的不足之处。
例如:钢铁企业在生产过程中离不开高炉炼铁工艺的支撑,只有控制好高炉炼铁工艺,才能够达到理想生产效果。但新时期随着钢铁产品需求量不断增加,以及生产质量要求的不断提高,使得生产工艺也逐渐向复杂化趋势发展,在一定程度上增加了控制难度。在長期发展进程中,专家系统在高炉炼铁工艺控制中广泛应用,并取得了显著成果。所谓专家系统,就是在汲取领域专家经验及知识基础上,通过合理算法开发的一种系统。然而,由于钢铁生产中使用的高炉特点不尽相同,所以仅通过某一专家系统并不能对其进行合理控制。对此,可以将数据挖掘概念引入专家系统中,以此来解决专家系统中结合人为经验获取知识这一弊端。如:将BP神经网络系统与专家系统相结合,能够有效提高高炉故障识别率,而后通过K-Means算法对高炉运行过程中产生的数据进行聚类分析,能够确定立项运行参数值,从而确保高炉炼铁工艺得到有效控制。
产品预测方面的应用
工业产品的生产质量和生产效率,取决于生产装置运行情况。虽然当前工业企业认识到了工业产品产率和质量预测的重要性,但采取的预测方法存在严重滞后性,无法及时反馈结果,不利于优化操作过程。由此可见,想要在提高产品预测准确性的同时提高及时性,就要充分利用工业大数据技术。注塑成型作为工业企业塑料加工的常见方法,能够在较短时间内生产出精度较高、结构复杂的产品,这些产品当前被广泛应用到医疗、电子等领域。但在实际生产过程中,工业企业通常每完成一次生产活动,就要通过抽样检查的方法对产品质量进行检测,由于这种方法效率较低,所以不利于为改进工艺、提高产品质量提供保障[9]。对此,可以在注塑成型过程中引入拉普拉斯特征映射方法,对生产过程产生的高维度数据进行降维分析。而后利用聚类分析方法对实际工况进行分析,从而明确产品分类的具体规则,最后采用基于粒子的群算方法,构建注塑成型过程质量测量模型。结合模型对产品质量进行预测和分析,不仅能够保证预测准确性,还能够提高预测效率,有利于为企业优化生产工艺奠定良好基础。现阶段,大数据技术在工业生产中被广泛应用,为解决工业生产问题提供新思路,随着大数据技术不断发展,势必会进一步扩大大数据技术应用范围,为工业发展奠定良好基础。
结语
综上所述,当前,大数据技术在工业领域应用方面已经取得了显著成就,但由于我国在工业大数据研究和应用方面起步较晚,并且这些技术主要源于原有数据发掘原理基础上产生,所以并未充分发挥其潜在价值。需要研究人员进一步加大研究力度,对工业大数据进行深入研究和开发,使其更好地运用到工业发展的方方面面,为推动工业领域持续发展提供保障。
参考文献:
[1]刘祎,王玮.工业大数据时代技术示能性研究综述与未来展望[J].科技进步与对策,2019,36(20):154-160.
[2]李阳.探讨大数据背景下数字技术在工业电气自动化中的应用[J].信息系统工程,2020(01):63-64.
[3]吴章燕.解析大数据技术在工业经济统计中的应用[J].现代经济信息,2021(18):171-172.
[4]王韵滋,王爽.基于大数据的数据挖掘技术在工业信息化中的应用分析[J].科学与信息化,2020(25):68-69.
[5]张东光,郭辉.浅析数据采集技术在工业大数据平台中的应用[J].科学与信息化,2020(8):22-23.
[6]许宁.基于大数据的数据挖掘技术在工业信息化中的应用探究[J].现代工业经济和信息化,2017,7(22):50-51,54.
[7]赵文博.工业大数据在智能制造中的应用价值[J].造纸装备及材料,2021,50(01):122-124.
[8]吴鸣浩.工业大数据的应用与实践研究[J].数码设计(上),2021,10(5):338.
[9]卓相磊.工业大数据在智能制造中的应用价值[J].科技风,2021(18):85-86.