数字化转型下工业大数据在质量创新中的应用
2021-07-29宗福季
摘 要:进入工业4.0时代以后,数字化转型成为经济发展的普遍趋势。工业大数据是数字化转型的重要载体,其在质量创新中的重要性日益显著。无论是行业还是个人发展,都将面临数字化转型下工业大数据的应用所带来的重要机遇和挑战。大数据在质量创新中的机遇具体表现在通过采集数据、分析数据并建立模型进行质量控制与质量提升。与此同时,大数据在质量创新的应用中也面临着数据完整性、数据质量、数据场景、领域知识、数据隐私、样本稀缺等方面的诸多挑战。此外,质量大数据的思想被应用拓展到社会的各个方面。
关键词:工业4.0; 大数据;质量创新;机遇;挑战
一、引言
2020年新冠疫情的爆发,极大地加速了数字化转型的趋势。数字化转型是在工业4.0的框架下,以客户需求为中心,以数据为资产,以新技术为手段,以人才为依托,突破企业发展瓶颈,解决行业发展痛点的转型升级。工业4.0最早来源于德国战略性方针,又被大家称之为第四次工业革命。第一次工业革命是由瓦特发明蒸汽机所导致的工业化,第二次工业革命是在电气革命背景下引发的大规模生产,第三次工业革命是由于电脑与控制器的介入所产生的自动化。尽管各国都对第四次工业革命有不同的解读与偏向,但是其中心思想就是数字化转型,即利用物联网信息系统,将生产中的供应、生产、销售信息数字化、智能化,最终实现快速、有效、个性化的产品供应。质量创新能够创造和产生新的用户需求,是企业实现从“速度效益型”向“质量效益型”转变的关键(程虹等,2014)。数字化转型则是实现质量创新的重要手段,而工业大数据又是数字化转型中的关键因素(Barchiesi等,2021)。工业大数据可理解为工业领域信息化应用中所产生的大数据,作为互联网、数据科学以及工业产业相互融合的产物,工业大数据除了具备一些传统大数据海量、多变及多样性的特征,还拥有更强的目的性和指导决策性,具备更高的稳定性(王韵滋等,2020)。
通过围绕工业4.0时代背景下大数据在质量创新中应用的介绍,阐明了大数据是质量创新的一种工具,以及大数据在质量创新应用中面临的机遇、挑战,并阐述了大数据在其他方面的一些拓展性应用,以期带来一些研究方向的启发或引起学界的探讨。
二、文献综述
(一)质量创新研究及其在大数据中的地位
质量创新,其实就是利用技术、管理、文化等方法创造新的质量。创造出的新的质量可以更好地满足消费者和用户的需求,帮助企业实现新的目标,创造更加良好的效益(程虹等,2015)。随着对于质量要素投入的增加,经济也在不断地发展。质量创新还包括相关的如对于质量需求的创新、面向质量技术的创新以及质量制度的创新,这些可以称之为一个创新的集合。质量的本质含义,就是要不断地去满足需求。由于人们的需求具有多样性和个性化特点,所以对于质量,其关键在于如何满足用户需求,这也即是进行质量创新的内涵。在现代社会中,人们开始追求个性化,更加关注产品背后的意义,而不仅仅局限于产品的使用功能(Aghion等,1992)。
工业大数据是工业产品和服务全生命周期数据的总称,包括工业领域中各个环节中可能产生和用到的数据(王建民等,2017)。现在的大数据有三个原始特性:高容量、高速度、多种类,其中,特别值得关注的特性是高速度(宗福季,2019)。宗福季(2018)认为大数据的特性可以帮助获取海量数据中的价值,通过对数据的分析和处理,大数据将成为未来进行质量创新的关键。宗福季(2019)还认为软件、硬件、系统的整合非常重要,要真正解决问题还是需要工具。
随着科技的发展,大数据已经在很多方面和质量相结合,在对于宏观质量的管理中,质量管理的地位已经越来越重要,而对于未来宏观质量管理及质量管理等都需要高质量的数据作为支撑,利用大数据来帮助实现更加科学的管理是未来主要的发展趋势,这需要未來在科学管理中更加重视数据的应用和其价值的挖掘,以帮助提高质量管理水平(李国杰等,2012)。
(二)工业大数据的研究及其应用
工业大数据是未来很多产业核心价值的创造者,而云计算技术则是支撑广泛、分散、大量的工业大数据采集、聚合、处理、分析的关键技术(李君等,2019)。随着大数据行业的发展,工业数据收集呈现时间维度不断延长、数据范围不断扩大、数据粒度不断细化的趋势。以上三个维度的变化使得企业所积累的数据量以加速度的方式增加,最终构成了工业大数据的集合,也已经发展成为目前工业中最宝贵的战略资源(吴晓怡,2020)。工业大数据来源可粗略分为内部和外部两类,内部包括生产经营和机器设备信息等数据,外部包括来自市场、政府等的数据。据Gartner报告称, 2019年互联设备数量已超过142亿台,预计2021年将达到250亿台。这是一个巨大的数量,并将产生海量数据。工业大数据在工业控制系统中除提高决策效率和速度外,将大数据整合到工业环境中时还具有以下优势:一是预测流程中涉及的资产故障或问题,提前采取行动;利用数据精准定位问题所在,提高服务质量。二是改善过程中产品的生成或需求平衡。如利用采购和销售数据等,更好地了解用户需求。三是对可能出现的问题进行预警,避免事故发生。四是提高数据使用效率,挖掘海量数据中的价值,从而推动质量创新的发展(施锦诚等,2021)。
从工业大数据的应用场景看,工业大数据是针对每一个特定工业场景,以工业场景相关的大数据集为基础,集成工业大数据系列技术与方法,获得有价值信息的过程(高婴劢等,2020)。工业大数据应用的目标是从复杂的数据集中发现新的模式与知识,挖掘得到有价值的信息,从而促进工业企业的产品创新、运营提质和管理增效(Crosby等,1979)。根据行业自身的生产特点和发展需求,工业大数据在不同行业中的应用重点以及所产生的业务价值也不尽相同。黎勇等(2020)认为工业设计方面和以往相比也发生了巨大的变化,客户需求方面的要求不断提高,其通过研究将大数据技术和工业设计创新相结合的方法来帮助推动我国工业的全面创新发展。Porter 等(2016)认为工业大数据在智能制造中也存在巨大的应用价值。我国经济快速发展的同时,工业企业管理也面临着更加严峻的挑战。王中玺(2020)利用物联网大数据分析对工业企业管理的作用,通过分析物联网大数据在工业企业管理中的有效应用试图弥补以往工业企业管理存在的不足。大数据不仅在工业领域能够发挥很大作用,在企业财务管理方面也有较大价值。对于制造业而言,工业大数据的应用促进了智慧供应链管理、个性化定制等新型商业模式的快速发展,有助于企业提高精益生产水平、供应链效率和客户满意度(王媛媛等,2020)。
工业大数据的应用可以帮助个性化的实现,用以快速生产出符合个性化需求的定制化产品。这其实也正与质量创新中满足用户的理念相一致。基于工业大数据,还可以驱动生产制造的智能化升级,优化生产要素配置和资源利用, 整体提升制造业发展水平,促进经济的高质量发展(沈运红等,2020)。此外,工业大数据还可以创造出产品新的价值,帮助实现制造企业的服务化转型。在工业大数据时代,通过对海量工业大数据的深入挖掘、提炼、建模和封装,进一步服务于各个细分工业领域,将有助于促进大数据价值的有效发挥。
(三)研究的现实意义及贡献
在数字化转型的大背景下,工业大数据在质量创新中的应用日趋广泛,但同时也存在一定的问题,如目前行业中对于工业大数据的应用研究领域虽然较为广泛,针对质量创新的研究领域也已经有较为丰硕的成果,但是将工业大数据应用于质量创新的文献还较为缺乏。文章则首先对质量创新的研究及其在大数据中的地位进行分析,然后分析了工业大数据相关研究及效应,并利用案例形式展示了工业大数据如何应用于质量创新,为后续学者开展工业大数据和质量创新相结合的研究提供新的思路,以期通过工业大数据助力未来高质量发展,同时也为大数据和质量创新研究奠定基础。
三、工业大数据应用于质量创新的案例分析
大数据有三个原始特性:高容量(High-Volume),指的是数据量;高速度(High-Velocity),指的是收集、获取、生成、处理数据的速度;多种类(High-Variety),指的是不同的数据类型,如音频、视频、图像数据(主要是非结构化数据)。质量创新对于企业的竞争力至关重要,质量创新不仅仅需要更先进的机器设备或技术水平,更关键的问题在于能否真正满足用户需求。因此,通过单纯地提升软硬件技术来进行质量创新并不能真正发挥工业大数据的价值。接下来我们将通过具体的企业案例进行说明。
实例A: 航空产业产品质量预测与控制
首先,我们以航空航天公司为例,航空公司生产的一个重要产品是IMU(飞机惯性导航系统)。飞机惯性导航系统就像陀螺仪一样可以控制方向,是一种非常强调精密性的仪器。航空业的公司规模往往非常大,软件硬件也非常齐备,拥有非常好的数据收集系统与传感器系统,可以获得大量的有效实时数据。在制造飞机惯性导航系统时存在许多不同的工序,我们在每个工序中都放置一些传感器。布置传感器的原因是:一方面傳感器是先进科技的结晶,可以对数据进行准确和高效的收集,从而对工序进行实时的监控;另一方面传感器的价格低廉。然而,即便是航空公司获得了海量的实时数据,并且拥有良好的信息系统,产品的质量检测最终还是要仰赖人工。对于飞机惯性导航系统而言,共有(x,y,z)三个维度,且每个维度拥有3个指标,公司要对该产品共计9个指标进行测量,若有一个指标不达标,则判定该产品不符合质量要求。
从这个案例中我们可以得到的启示是,虽然企业拥有了大量数据,最终产品质量检测还是依靠人工方式进行,而不是根据获得的海量数据预测获得,大数据的价值并没有真正得到体现。此外,当产品质量发生问题时,航空公司也没有办法利用获得的海量数据进行诊断或者问题追踪,仍依赖人为判断。
实例B:半导体产业产品质量预测与控制
半导体行业是一个非常追求精密化的行业,它们对数据的应用在所有行业中处于领先地位,在其他行业进行大数据分析之前半导体行业就已经开始进行数据收集。半导体行业中的玻璃面板成膜(PVD)过程包含很多工序,并且数据收集非常完备,有很多实时海量数据。与案例A类似,我们无法通过数据预测产品质量是否过关,而是需要最后进行人工检测。技术人员通常通过测量一整块镀膜玻璃上17个点的厚度,并计算它们的均值和方差,以此检验产品质量是否过关。
在玻璃面板成膜过程中有很多工序,我们目前看到的数据仅包括其中的3个工序。然而,仅仅是这3个工序就已经有高达65个参数,并且目前还没有办法能够识别出65个参数里面哪些是重要参数。对于玻璃面板成膜过程整体而言,工序越多,数据就越复杂,参数就越多,而哪些参数对最后的产品质量有决定性影响是很难识别的。因此,该过程很难根据参数数据来对产品质量进行预测。此外当产品质量出了问题该如何进行调控提升、应该调整哪些参数、如何追踪是哪个环节出了问题等等问题都非常重要,但是目前尚没有解决办法。
这个案例给我们的另一个启示是,尽管现在数据收集环节已经非常完善,仍然无法实现自动化的产品质量预测与监控。
实例 C:服装产业产品质量预测与控制
某制衣公司在制衣业中排名很靠前,其中很大的原因在于他们引进了ERP系统与RFID系统,具备完善的信息系统和数据采集系统。可是他们仍然遇到了挑战:该公司主要客户是快时尚人群,需要快速根据时尚潮流替换他们的产品款式。这对客户方而言是有益的,他们可以很快地替换服装款式并且可以将价格成本压得很低。这给生产方带来了巨大的压力。该制衣企业目前还不能根据大数据信息系统进行很快的工时工序报价,主要原因在于他们对于工序工时报价无法根据数据进行预测建模。因此,最后提供工时工序报价时仍然需要人为判断与经验。
虽然该公司的数据收集系统非常完善,但由于服装款式非常多,其中还包含许多零部件的生产,整体工序非常复杂。而工序数据不仅仅是连续型数据,还包含非常多的定性数据,造成数据维度非常高。虽然公司拥有海量数据,但是在维度非常高的情况下模型很容易拟合失败。另外,在数据采集环节涉及大量人工干预,比如用人工填表等等方式收集数据,这导致公司获得的数据精准度不高。因此,虽然该公司数据量非常大,最终做决策时还是仰赖人的参与。
通过以上三个案例的分析可以发现,无论是人工参与较多的服装行业,还是较为智能化的半导体业,即使公司资金非常充足,信息系统与数据采集系统非常完善,可以通过各种方式获得海量实时数据,但这些数据并不能帮助企业解决实际问题。目前,这些企业仍然无法做到产品质量管理的自动化,产品质量检测问题仍然大量依靠人工方式。因此,大数据是企业质量创新的必要条件而非充分条件。如何根据在生产过程中获得的大数据,对工序进行优化与预测产品质量仍是质量创新亟待解决的问题。
我们想要实现质量创新需要照一些步骤与方法,其中很多步骤与方法是目前已经较为成熟的,比如6 Sigma方法、工艺流程图等。这些方法在实际应用中仍是十分有效的。因此,我們在数字化转型的过程中并不能摒弃它们。然而,这些传统方法也有许多不足之处:
首先,传统方法使用的数据是基于采样得到的,它们并不能反映整体的生产过程。在看不到的地方我们往往是用人为经验进行填补。其次,缺少统一的数据信息平台,质量数据难以共享与追踪。如果数据是一座孤岛的话,往往会孤掌难鸣,效果有限。数据真正强大的地方在于将它们联系起来。最后,工具自动化程度偏低,依赖人员大量参与和主观判断。
进入工业4.0时代后,首先,由于现代传感器行业的发展,我们可以获得更多更实时的数据,可以看到更多更全面的信息。其次,我们拥有了很多数据平台,可以把这些孤立的数据联系起来。最后,由于统计方法的发展,尽管仍然需要人的参与,我们还是可以做到将一些工具自动化与智能化。过去,我们把数据当成金矿,所以尽量存起来,以备之后用。但现在发现,数据不是湖或者海的静态概念,而是数据流,是河流的概念。它是有速度的,所以不要打算存起来;它是实时流动的,所以要重点想想怎么做实时分析。
四、工业大数据在质量创新应用中的机遇
在工业4.0时代,工业大数据为质量创新带来了巨大的新发展机遇。我们可以在数字化转型的趋势下对许多旧方法进行改良。6 Sigma是80年代末进行质量管理的一个很常用的工具,里面有很多手法是统计工具。虽然它是80年代末发展出来的工具,但是它现在仍然是非常有效的。然而其中有一些工具是需要加以更新的。比如,DMAIC方法是6 Sigma管理中流程改善的工具,其中有很多步骤可以根据现代技术的发展加以更新。DMAIC方法主要包含如下五个阶段:
1.定义阶段(Define):在该阶段我们定义需要解决的问题。有时找出、厘清、确认真正的问题,比如何解决更重要。
2.测量阶段(Measure):在该阶段我们对数据进行收集。在数据收集阶段并不是一开始直接进行数据收集,而是需要我们花费大量精力决定收集什么数据。在大数据时代我们有很多方法可以获得海量且各式各样的数据,如传感器数据、不同数据库的数据等。但是,我们并不是盲目收集所有可以获得的数据,而是需要收集与我们目标密切相关的数据。
3.分析阶段(Analyze):在该阶段我们通过数据分析方法找到影响产品质量的关键参数。在工业4.0时代,工具因为机器学习技术的发展而有提升,比如使用愈发强大的Python和R 软件。我们可以各取所长,从而使得建模方法更加多样。
4.改善阶段(Improvement):在该阶段我们寻找优化生产的方法,使得流程缺陷降低到最小程度。在工业4.0时代,除根据以前一些工具进行改善之外,重点是流程的智能化。我们现在的目标并不在于解决某一个问题,而是当再遇到这类问题时我们可以做到某种程度的智能化,以减少人的反复参与。这也是目前的一个研究方向。
5.控制阶段(Control):在该阶段我们使改进后的流程程序化,并通过有效的监测手段,如控制图等,确保流程改进的结果可持续进行。在工业4.0时代,我们可以在该阶段利用许多改进的可视化工具。
收集和分析数据并不意味着问题就能够被完全解决,最终目标是要帮助客户做出决策。创新包含突破性创新,并采用创造性的解决方式,利用以人为本的设计,通过观察等方式,发现用户更加多样化、个性化的需求。同时利用更加发散的思维,提出较多的解决方案,并采用科学的方法解决,如利用统计方法。运用统计思维解决问题很早就已经出现了,是以数据作为基础来进行的新的创新,利用高质量的数据,以客户为中心,最终达到更好地满足客户需求的目的。
在工业大数据的框架下,我们根据对大数据的运用程度将工业大数据分析与应用分成了许多层次:
Level 1. 不用数据,只依赖经验,比如制衣业早期;
Level 2. 收集数据,但只研究数据本身;
Level 3. 将收集的数据用图表进行展示;
Level 4. 收集普查数据并进行描述性统计分析;
Level 5. 收集抽样数据并进行描述性统计分析;
Level 6. 收集抽样数据并进行推断性统计分析;
Level 7. 收集实时异构传感器数据并进行描述性统计分析与可视化;
Level 8. 收集实时异构传感器数据并进行推断性统计分析,给出决策建议;
Level 9. 使用工业人工智能的自主过程控制,将数据分析阶段智能化,减少人为参与。
值得注意的是,以上九个层次并不是按照从差到好的顺序进行排序的。比如有一些日本百年老店,它们完全不用数据,而是靠自己的手艺打败全世界。当然它们不使用数据也有一些缺陷,比如很难在没有数据支撑下去别的城市开分店。从Level 2到Level 3层次涉及了数据的可视化,这是一个很大的进步。数据可视化技术将数据转换成更易被人所接受的图像,这是由于相对于数据,人的研究更易接受色彩和图案。图像可以帮助人们更加方便快捷地识别信息,为人们的日常生活和工作都能带来极大的便利。目前数据的可视化正在形成一门学科。由于人只能看到2D的图表,所以早期的可视化只是画一些简单的图。而在大数据时代数据维度非常高,如何将高维实时数据进行可视化是很重要的一个课题。数据可视化利用计算机的数据和图像处理技术,将数据特征转化为图形图像,在很多领域都有着广泛的应用。
此外,在工业4.0时代(Level 7-Level 9),我们可以获得海量实时异构传感器数据。这些数据往往是基于传感器的高频率采样获得,并且形式多样,不仅仅只是连续型数据,还包含文字、图像、声音等多种类型数据。如何应用实时异构传感器数据进行统计分析、模型建立并最终给出决策建议是工业4.0时代不可绕过的一个议题。我们对数据运用的最终目的是达到Level 9,即使用工业人工智能的自主过程控制。也就是说在之前的例子中使用数据分析帮助商业决策还不是终点,而如何在下次进行同样决策时无需人力介入,自动给出决策建议是我们想要达成的目标。
想要真正做好大数据的分析,需要有科学的统计模型,并要能够根据设定的模型对未来可能发生的事情做出较为准确的推测(宗福季,2020)。目前真正发挥大数据价值的時代已经到来,工业物联网和传感器技术的进步使得采集数据越来越快捷,成本也越来越低,未来企业主要的目标是实现实时的传感器数据采集,并根据采集的数据建立相应的统计模型,用以预测未来并辅助制定决策和政策。
基于上述分析可以发现,工业4.0时代的质量创新面临着重大机遇。不过,大数据隐含着的机遇具有两面性:一方面许多工具以前就已经有了,由于在数据不复杂时并不需要使用机器学习以及统计建模这些工具,大家对它们并不是很重视。例如神经网络虽然提出得很早,但是当时没有适用的数据。因此,单有方法没有数据是没有意义的。另一方面,只有数据没有方法也会存在问题。很多企业可以收集到大量实时传感器数据,但如果没有方法一样无法分析建模,这些数据仍然不能被完全应用。例如,在前面提到的实例中,目前我们所采集到的数据只能做到可视化,并没有发挥数据的全部作用。如今我们处于数字化转型的机遇下,数据能够被轻易采集,用于分析预测数据的工具也很多。在DMAIC方法中的测量、分析、改善、控制阶段,我们可以在如下方面将机器学习与统计建模相结合,对质量数据进行分析建模:
测量阶段:利用分布式传感器系统进行实时数据收集,也包括对机器运行和数据维护、环境数据等类型数据的收集以及异构数据的融合与可视化。
分析阶段:对数据进行描述、诊断与预测;使用机器学习建立过程变量与产品质量之间的关系。
改善阶段:根据分析结果提出过程实时优化方案;过程变量的动态调整;自适应检测。
控制阶段:基于大数据流的实时过程监测、跟踪、警报。
大数据蕴含着巨大的价值,如果能够充分挖掘大数据中的价值,将能够帮助人们更好地决策(Boubaker等,2021)。可以通过学习数据分析方法,利用传感器的工业物联网收集的数据来进行分析,包括数据代表的变量之间的相关性等。如今,随着大数据的快速发展和工业传感器的发展,以前无法实现的对于数据的收集和分析现在得以实现。利用大数据分析方法,可以对当前的质量进行改进,实现对质量的控制(Mary等,2019)。
五、工业大数据应用中的问题
在工业4.0时代,工业大数据在质量创新领域中的应用挑战与机遇并存。
这些挑战虽然与实际应用相关,但是它们不仅仅针对应用学科。很多问题虽然目的很明确且偏向于应用,但是它们的答案包含很多理论部分。具体来看,大数据在质量创新中面对的挑战如下:
第一,数据完整性的挑战。数据给人的感觉是又多又全,但实际上数据并不是完整的。每个产品都有很多的工序,在每个环节收集数据的目的也有所不同,比如为了进行库存管理而进行数据收集等(Robert,2002)。这些数据由于收集的目的不同,往往呈现很零散的状态,并且是不完整的。实际生产过程中并不是为了统计建模收集数据。因此,在大多数情况下,我们无法获得所有的相关数据,而如何根据不完整的数据进行统计建模是一个挑战。
第二,数据质量的挑战。有些数据收集会比较精确,但是很多时候数据的质量无法控制。这是由于在产业中收集数据时,有时需要的数据比较粗略,这时会采用低成本的方法,如利用手填写表格、目测等方式进行数据收集。即便是最先进的工厂,收集到的数据质量也是有差别的。不同质量的数据对统计建模造成的影响是未知的,这也会导致我们无法精确建模。数据的质量直接影响着分析结果的有效性,如果用于企业决策的数据失真,将会导致企业决策与预期目标之间出现偏差。数据质量就像生活中的饮用水,不可或缺地影响着人们的生活。
第三,数据场景的挑战。数据收集的场景包括数据是在何时采集、在哪一生产线采集、采集人是谁、采集机器是哪种、采集状态是什么等一系列问题。比如礼拜一早上收集的数据与礼拜五下午收集的数据就可能有明显的差别。这是由于周一上班的人比较懒散、周五下班前的人想匆忙将事情做完导致的。就算是对于同一个工厂同一个生产线的两台一样的机器,如果买的时间不一样,机器的关键参数也会有所不同。这些问题都会影响到最终的数据判断,进而影响到决策判断。在互联网数据的分析框架下也许对于数据场景并不会分得这么细,但是在工业大数据的框架下我们都有具体的质量问题需要解决。因此,数据场景非常重要,而在大部分数据库中这些数据场景都是缺失的。
第三,领域知识的挑战。在长期发展下,各行各业的专业知识大量累积,如何将专业知识与数据建模相结合仍是一个亟待解决的问题。数据技术驱动着知识主体扮演着数据专家、算法专家以及系统工程师的角色,不仅要熟悉本行业本专业的知识,还需要掌握数据建模及分析能力(黄妮, 2020)。
第四,数据隐私的挑战。数据隐私对于工业大数据特别重要。通常工业大数据并不是某一个单独公司的数据,它包括了许许多多工序的数据,这些数据有些在供应商,有些在客户方。但是由于数据涉及公司机密,有些公司可能不会共享数据。企业数据具有资产性质,能够带来经济价值,并且企业可以通过数据在市场中获取利益。数据隐私不仅仅是道德问题,而是牵涉公司是否愿意和你进行数据共享。比如华为手机,它的制造涉及很多公司,这是一个产业链。如果这些数据不联合到一起的话是很难将工业大数据做到极致的。因此,在收集和共享数据时可以选择对数据进行脱敏处理(徐敬宏、 段泽宁等, 2018)。
第五,样本稀缺的挑战。样本稀缺似乎和目前海量的数据是矛盾的。事实上,看起来海量的数据,在实际应用时面临多重的困难。在真正进行数据分析时,我们会发现数据量是不够的。目前,大多数公司的生产线已经成熟,产品不良率极低,数据分布非常不均匀。以6 Sigma级别为例,在每百万个产品中仅有3个次品。这导致收集的数据中,大多数数据都是合格产品数据,能够用于改善次品信息的不良产品数据极少。而我们建模时针对的恰恰是这些不良产品。因此,看似海量的数据中实际有效数据其实是极其稀缺的。目前针对数据不均衡提出的一些解决方法中,有一些解决如数据样本比例为1:9问题的方法。但是,在实际应用中对于这种数据极度稀缺且数据维度很高的问题还没有很好的解决方案。
上述关于工业大数据的挑战对于产业、对于社会都具有很大影响,如何应对这些挑战也是值得思考和研究的重点。
六、工业大数据应用的趋势
质量大数据的思想已经远远超过了工业生产的范畴,在其他领域得到了广泛的拓展应用。下面介绍3个大数据应用实例,它们在不同程度上运用了质量大数据的思想,并且对实时数据的运用有较高要求,同时存在着部分难以解决的问题。
实例A:地铁客流及拥挤度监控
第一个例子是地铁客流与拥挤度预测。随着智能城市的发展,公共交通服务例如URT系统(城市轨道交通系统),在人们的日常通勤和出行中扮演着越来越重要的作用。众所周知,突发事件可能导致异常人员流动,最坏的情况甚至可能导致人员踩踏事件的发生。这些突发事件可能包括交通事故、交通管制、庆典活动、抗议活动甚至灾难的发生。例如,在2014年12月,上海曾经发生一起严重的踩踏事件,事件造成多人死亡,49人受伤,其中13人重伤。我们不希望有这种事件再次发生,所以需要对人流量与拥挤度进行预测与监控。在这里我们强调一定要进行预测,而不是等人流量到达警戒线之后再进行警告,這时往往为时已晚。因此,我们需要做到在人流量拥挤到警戒线之前进行预警。
拥挤度预测这一环节对于公共交通益发重要。随着智慧城市的发展,公共交通服务例如URT系统(城市轨道交通系统),在人们的日常通勤和出行中扮演着越来越重要的作用。香港地铁每天承运超过五百万名乘客。我们根据乘客流量的数据(进站时间、出站时间、逗留时间等),预测站点发生拥挤的时刻,使得我们可以提前采取调流等措施减缓拥挤。在这个问题中部分站点涉及换乘问题,我们在建模时也应一并考虑。我们在该项目中获得了人流进出地铁口的数据,即我们可以知道所有人在何时何地进入地铁站,在何时何地从地铁站出来。在理论上我们可以知道人在地铁站里如何通行,但是由于隐私关系暂时没有获得这方面数据。我们目前获得的数据是一个网状的结构,这样我们可以分析在什么时间点在哪个地铁站可能造成拥挤。这个问题并不像很多人觉得的那么简单。数据是一个网状的结构,并不是在某一时间点进站的人多就会造成拥挤,其中包含了换乘乘客与出站乘客。因此,单看进站人数是不准确的,这也是一个有趣的建模问题。在这个问题上还有很多内容可以研究,比如如果提供了监视器的数据,我们可以结合不同的数据源对人流量进行预估建模。目前我们所做的只是一个开端。
实例B:大数据驱动的客户满意度指数——在线数据与问卷数据融合
第二个例子是在工业大数据框架下客户满意度调查问题。这个问题起源于早年密歇根大学研发出的顾客满意度指数模型。这一框架沿用至今已二十余年,并广泛应用于企业、国家层级的顾客满意度指数调查。早期,该指数模型数据来源于调查问卷,而现如今顾客满意度不仅仅可以通过问卷获得,还可以通过诸如社交网络、网页平台等途径获得。同时,对于公司的产品不仅仅局限于给出分数,还可以对其进行评论。这些数据是海量实时的,并且问题的数据输入不仅仅是问卷调查形式,也可以是在线评论。
目前存在的问题是我们如何融合问卷数据与在线数据。有些人认为可以不要问卷的数据,只用在线数据。但实际上这在目前是行不通的。问卷获得的数据与在线获得的数据数据源是不一样的,获得的信息也是不同的,用在线数据完全取代问卷数据仍是不可行的。比如对于问卷调查而言,其每个维度的数据都会收集到,而在线数据有些维度的数据是缺失的,如何进行大数据和小数据不同形态数据的融合仍充满挑战。
实例C:山体滑坡安全监测
第三个例子是山体滑坡安全监测。该项目背景是统计过程监控观念的延伸。统计过程控制以前只用于生产线的监控,由于大数据的发展,现在可以用于更广泛的产业。由于香港斜坡管理做得比较好,比如香港专设斜坡管理署管理香港斜坡的安全,导致香港许多房子建在半山上。然而如果斜坡管理不好就会造成土石流,即大量的岩石、泥土和碎石流下山坡,导致重大事故。
传统监测斜坡安全的方法是进行定期(一季、一年)挖深洞,以采集土壤数据,研究土壤松弛程度。其缺点是由于香港斜坡很多,该方法成本很昂贵,而且获得的数据不是实时数据。我们提供的新方法是采用基于加速度计的传感器系统来监测和预测滑坡。具体方法是在现场设置多个传感器,收集传感器的数据,监测有无地面扰动的异常,用于预测滑坡的发生,以提前采取措施减少事故发生和人员伤亡。目前,我们在台湾收集过一些数据,在地震发生时斜坡监控数据有明显不同。如何根据数据监控山体滑坡其实是一个很难的问题,它并不是纯粹的数据监控,涉及土木专业关于土壤建立的一些模型和一些既有的指标。这个案例由于是跟土木专业高度结合的,所以需要将数据与相关人员协作探索与土壤的性质、山体的性质等结合使用。进行滑坡和斜坡监测与预测虽然有困难,但是是非常有影响力的重要项目。
七、结论与展望
在工业4.0时代,质量创新和工业大数据将会是未来持续的研究方向,也必然会对现代产业产生深远的影响,针对上述介绍工业大数据和质量创新的内容可作以下三点总结:
第一,正如之前诸多例子所示,大数据在工业领域被大量使用,并且获取这些数据几乎是“免费”的。但我们对这些数据仅仅做了部分探索,如何运用这些数据是未来所面临的挑战之一。
第二,在数字化转型范式下,质量和质量专业人员都面临着巨大的机遇。我们可以进一步发掘从大数据中创造价值的方法,例如数据质量和安全保证,大数据驱动过程和产品质量监控、改进和优化,故障诊断和风险管理,多种非结构化数据源的融合,客户满意度管理,预期和预测质量等。
第三,尽管工具在不断发展,数据探索智能化不断提升,但人的参与对充分挖掘大数据的潜力还是至关重要的。在数据科学和数据分析领域,尤其是在统计建模和机器学习过程中,人扮演着重要角色。例如,数据可视化、建立决策推断系统、将质量专家和高层管理人员的专业知识与实际数据相结合等,都对数据的充分挖掘起到了重要作用。
以上三点都非常重要,尤其是第三点。现在大家都在不断地讲智能化,而在智能化过程中人的角色在哪里?在目前阶段虽然软件硬件不断进步,但是人还是在两个方面发挥着重要的功能:第一个方面是建立模型,尤其是在统计建模、机器学习方面。如何建立模型、如何进行数据分析,至少在未来二十年之内仍然有很广阔的前景,需要有数据科学专家、统计专家将信息转化为数据。第二个方面在于如何将人的专业知识与模型结合起来?各行各业我们都有过去累积的专业知识。我们使用不同方法解决各种问题,这些知识的底蕴如何和现在的数据进行科学结合,也是一个需要探讨的问题。
在工业4.0时代,我们面临的不仅仅是机遇,也有挑战。质量创新是未来新常态下的新动力,能够创造和释放新的需求,是企业实现从“速度盈利型”向“质量盈利型”转变的关键,数字化转型是实现质量创新的重要手段,工业大数据是该轮转型过程中的重要因素,也是促进数字化转型的重要保障,应充分利用工业物联网和传感器收集的数据,并利用相应的数据分析方法,充分挖掘大数据中的价值。工业大数据的创新发展,必将成为未来提升制造业生产力和竞争力的关键要素。应用和利用大数据是数字化轉型下质量创新的关键,凭借质量大数据来实现科学管理将是未来的趋势。我们应大力发展数字经济,通过充分利用大数据,发掘大数据背后的价值,促进产业的数字化,为经济转型升级提供新动力,助力经济高质量发展。
参考文献:
[1] 程虹,2014:《我国经济增长从速度时代转向质量时代》,《宏观质量研究》第4期。[Cheng Hong, 2014, China s Economic Growth:Transition from Velocity Era to Quality Era, Journal of Macro-Quality Research, 4.]
[2] 程虹、许伟,2015:《质量创新:十三五发展质量提高的重要基础》, 《宏观质量研究》第4期。[Cheng Hong and Xu Wei, 2015, Quality Innovation:The Important Foundation of Improving Development Quality in ‘Thirteenth Five-year Plan, Journal of Macro-Quality Research, 4.]
[3] 高婴劢、王宇霞,2020:《深化工业数据应用赋能数字化转型》,《软件和集成电路》第6期。[Gao Yingmai and Wang Yuxia, 2020, Deepen the Digital Transformation of Industrial Data Applications, Software and Integrated Circuit, 6.]
[4] 工业和信息化部关于工业大数据发展的指导意见[EB/OL]. http://www.cac.gov.cn/2020-05/16/c_1591178516420666.htm/, 2020-05-16.[Guidance on the Development of Industrial Big Data from the Ministry of Industry and Information Technology[EB/OL].http://www.cac.gov.cn/2020-05/16/c_1591178516420666.htm/]
[5] 李君、邱君降、成雨,2019:《工业企业数字化转型过程中的业务综合集成现状及发展对策》,《中国科技论坛》第7期。[Li Jun, Qiu Junjiang and Cheng Yu, 2019, Status Quo and Development Countermeasures of Industrial Enterprises' Business Comprehensive Integration During Digital Transformation, Forum on Science and Technology in China, 7.]
[6] 黎勇、钱杰、金伟,2020:《基于工业互联网和大数据分析的智能控制平台建设研究》,《中国管理信息化》第24期。[Li Yong, Qian Jie and Jin Wei, 2020, Research on Intelligent Control Platform Construction Based on Industrial Internet and Big Data Analysis, China Management Informationization, 24.]
[7] 李国杰、程学旗,2012:《大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考》,《中国科学院院刊》 第6期。[Li Guojie and Cheng Xueqi, 2012, Research Status and Scientific Thinking of Big Data, Bulletin of the Chinese Academy of Sciences, 6.]
[8] 施锦诚、孔寒冰、吴婧姗、王雨洁,2021:《数据赋能工程教育转型:欧洲数字化战略报告分析》,《高等工程教育研究》第1期。[Shi Jincheng, Kong Hanbing, Wu Jingshan and Wang Yujie, 2021, Data Enabled Engineering Education Transformation:Analysis of European Digital Strategy Report, Research in Higher Education of Engineering, 1.]
[9] 沈運红、黄桁,2020:《数字经济水平对制造业产业结构优化升级的影响研究——基于浙江省 2008—2017年面板数据》,《科技管理研究》第3期。 [Shen Yunhong and Huang Heng, 2020, Research on Influence of Digital Economy Level on Industrial Structure Optimization and Upgrading of Manufacturing Industry:Based on Panel Data of Zhejiang Province from 2008 to 2017, Science and Technology Management Research, 3.]
[10]王媛媛、张华荣,2020:《G20国家智能制造发展水平比较分析》 ,《数量经济技术经济研究》第9期。[Wang Yuanyuan and Zhang Huarong, 2020, Comparative Analysis on the G20 Countries Intelligent Manufacturing Development Level, The Journal of Quantitative & Technical Economics, 9.]
[11]王建民、王晨、余晓晖,2017:《中国工业大数据技术与应用白皮书》,工业互联网产业联盟。[Wang Jianmin, Wang Chen and Yu Xiaohui, 2017, China's Industrial Big Data Technology and Application White Paper, Industrial Internet Industry Alliance.]
[12]王韵滋、王爽,2020:《基于大数据的数据挖掘技术在工业信息化中的应用分析》,《科学与信息化》第25期。[Wang Yunzi and Wang Shuang, 2020, Application Analysis of Data Mining Technology Based on Big Data in Industrial Informatization, Kexue yu Xinxihua, 25.]
[13]王中玺,2020:《新时期工业互联网的大数据中心建设研究》,《科技创新与应用》第15期。[Wang Zhongxi, 2020, Research on Big Data Center Construction of Industrial Internet in the New Era, Technology Innovation and Application, 15.]
[14]吴晓怡、张雅静,2020:《中国数字经济发展现状及国际竞争力》,《科研管理》第5期。[Wu Xiaoyi and Zhang Yajing, 2020, An Analysis of the Status Quo and International Competitiveness of China's Digital Economy, Science Research Management, 5.]
[15]Aghion, P. and P. Howitt, 1992, A Model of Growth Through Creative Destruction, Econometrica , (60), 323-351.
[16]Assunta, B. M.and F. C. Andrea, 2021, Big Data and Big Values: When Companies Need to Rethink Themselves, Journal of Business Research, (219), 714-722.
[17]Barro, R. J. , 2002, Quantity and Quality of Economic Growth, Working Papers Central Bank of Chile, 5(2), 17-36.
[18]Crosby P., 1979, Quality Is Free: The Art of Making Quality Certain, New York: Mentor Executive Library.
[19]Colosimo, B., Huang, Q., Dasgupta, T., and Tsung, F., Opportunities and challenges of quality engineering for additive manufacturing, Journal of Quality Technology (special issue on quality engineering in advanced manufacturing), 50:3, 233-252, 2018.
[20]Michael, E. P.,and J. E. Heppelmann, 2016, How Smart, Connected Products Are Transforming Companies. Harvard Business Review, (1/2), 24-24.
[21]Sabri, B., L. Zhenya and Z. Ling, 2021, Big Data, News Diversity and Financial Market Crash, Technological Forecasting and Social Change, (168), 1-15.
[22]Shacklett, M., 2019, How Risk Management Can Help Secure Industrial IoT and Big Data [EB/OL], https://www.techrepublic.com/article/how-risk-management-can-help secure-industrial-iot-and-big-data/, 2019-07-23.
[23]Wang, K. and Tsung, F. Sparse and Structured Function-on-Function Quality Predictive Modeling by Hierarchical Variable Selection and Multitask Learning, IEEE Transactions on Industrial Informatics, early access, 2020. DOI: 10.1109/TII.2020.3041830.
[24]Wang, A., Xian, X., Tsung, F., and Liu, K., A spatial-adaptive sampling procedure for online monitoring of big data streams, Journal of Quality Technology (special issue on statistical process control for big data streams), 50:4, 329-343, 2018.
[25]Yang, H., Kumara, S., Bukkapatnam, S., and Tsung, F. The Internet of Things for Smart Manufacturing: A Review ,IISE Transactions,51, 1190-1216, 2019.
The Application of Industrial Big Data in Quality Innovation in the Context of Digital Transformation
Fugee Tsung
(Hong Kong University of Science and Technology)
Abstract:The strategy of industry 4.0 has ushered in digital transformation as the common trend in economic development. And as a major carrier in digital transformation, industrial big data is increasingly exhibiting its importance in quality innovation. Whether it is in the development of an industry or of a single person, both the opportunities and challenges brought about by the application of big data in the context of digital transformation should be something that no one can avoid confronting with. One of the opportunities made available by big data concerning quality innovation shows concretely the entire work flow of data collection and analysis to build models for quality control and upgrading. Meanwhile, the application of big data in quality innovation is also faced with various challenges, such as data integrity, data quality, data scene, domain knowledge, data privacy and sample scarcity. In addition, the concept of big data in quality and its application extend to all sectors of our social and economic life.
Key Words:Strategy of Industry 4.0; Big Data; Quality Innovation; Opportunity; Challenge
責任编辑 邓 悦