数据驱动未来,但不是一切
2019-09-26李培根
文 李培根
几年前奥巴马在美国国会提交的一份报告里谈道:科技不只是在取代组装流水线上的工作,而是在影响任何可以被自动化的工作。即传统的自动化替代的是人的体力,但未来不一样,简单地讲是指向人的脑力。
最近大众汽车的CEO说:“不远的将来,汽车将成为一个软件产品,大众也会成为一家软件驱动的公司。”很多人听到后都感到不解,汽车是一个硬邦邦的产品,怎么会是一个软件产品呢?我认为这句话有两层意思,一是指汽车未来所应用的软件产品会越来越多,尤其是自动驾驶汽车。二是指影响未来汽车竞争力的主要因素是软件,而不是硬件。我们现在有个话题是“软件定义世界,数据驱动未来”,二者是紧紧联系在一起的,与其相关的大量问题都是处理数据的问题。正如刚才说的汽车是一个软件产品,由于软件产品很多都是和数据紧密联系在一起的,汽车就会和智慧城市里的很多数据关联在一起。
下面我将会说三个话题,首先我们从“自动化”说起,之后会介绍“理念的数据”,最后会说明“数据的理念”。
自动化
传统自动化是替代人的体力的,现在比较完善的自动化可以处理一些结构化的、固定模式的、确定性的问题。目前少数非结构化的问题无法通过自动化处理。未来的自动化不仅包括目前已经完善的自动化,还会像奥巴马所说的替代一切的自动化。
人的脑力包含很多东西,实际上它是非结构化的,没有固定模式,是一个不确定性的问题。这些问题的处理以前没有什么好的手段。实际上,这些问题需要认知自动化来处理。智能自动是另外一种自动化替代人的脑力的技术。所以数字智能时代的自动化替代脑力,没有固定的模式,例如,一个车间里节能的问题并不是一台设备上节能的问题,没有办法用一个固定的模型去表达,此时可能就需要用超越模型来处理。
当然,有时候我们可以通过数据去发现模型、参数化模型等。我们需要超越确定性的问题,从而有办法处理不确定性的问题。
工业中最重要的是制造,其设计效率、质量、成本、绿色等,所有这些问题实际上都存在着大量不确定性,如果我们想清晰地认识,乃至驾驭企业活动,那么认识这个企业的整体联系就会非常重要。
另外,非固定模式不确定性的问题是以前对我们来讲比较困扰的问题,系统到底有多少是相关联的?例如,人就是一个很复杂的系统,到底人有多少因素相互关联,怎么关联?因此,大数据、人工智能等的出现就像开启了一扇大门,有可能促使我们去认识整体联系、非结构化的问题、不确定性的问题等。
我们可以想想中国的传统文化。中国古代的金、木、水、火、土,的确不能说是科学的。但古人的这种认识还是有一定的合理性的,它强调了整体的联系。西医常常是“头疼医头,脚疼医脚”,但中医是联系整体来看的,即头疼可能是由于脚上的某个穴位引起的,只是我们现在无法从解剖学的角度去认识它。
对于一个复杂系统来讲,其整体的联系非常重要。我们强调中国文化里的“大系统观”整体联系,它是有合理解释的,只是以前的现代科学缺乏技术去认识它。古人通过经验、感悟去互联。但现在我们不能通过经验感悟去处理很多问题,只能通过数据科学、人工智能技术等去认识这些整体联系,以及不确定性的问题等。
要认识整体联系或控制一些非固定模式,不确定性问题的基础是数据,但有数据就要互联。我们需要人工智能技术去决策控制一些非模式、不确定性的问题,而且人工智能技术也是以数据为基础。因此有了第三次数字化浪潮。早期的数据驱动过程,比如,企业里的数控机床加工过程就是数据驱动的。现在我们强调数据驱动企业,那么数据化、智能制造、数据驱动——这都是我们从事数据科学的人需要关注的。当然未来将会涉及到更多的关键技术,包括人工智能、5G、区块链等。
理念的数据
所谓理念的数据,就是围绕企业的理念去收集处理数据。例如,像海尔这样的现代企业的基本理念就是“以客户为中心”,因此,海尔建立了一个工业互联网平台,收集了大量的客户数据,从而能够在产品开发阶段通过客户数据把用户的碎片化需求进行整合,与用户交互,实现“以客户为中心”的目标。显然,围绕企业“以客户为中心”的理念整合数据是非常重要的。
所以海尔的研发模式与传统的瀑布式模式不同。瀑布式模式是通过市场调查进行需求分析,之后研发产品,即先有产品再有客户。而海尔的研发模式是在产品开发的过程中通过网络,即互联网平台与用户迭代、交互,根据客户的需求生产产品,即先有用户再有产品。因此,理念的数据引起了研发模式的颠覆。
再如,“绿色”也是现代企业的一个重要的理念。“绿色”不光是指没有污染,也指资源消耗少。虽然美国的用电很便宜,但DeepMind谷歌数据中心的耗电量很大。后来通过改进DeepMind把耗电降低了15%,且实现了设备投资的收回。事实上,他们通过数据中心几千个传感器去收集温度、电量、耗电量等设备及建筑物的结构(不同数据中心建筑物的结构都不一样)数据,之后对数据进行深度学习等处理实现节能效果。显然,该例中数据收集的标准即为节能的理念、绿色的理念。因此,类似这类问题是完全没有固定模式的,我们不可能通过建立模型来解决。
这样的技术也可以被用在其他方面。如减少半导体生产,(半导体耗水很厉害)、帮助企业提高生产效率等。同样,国内也有应用很好的例子,例如酒泉钢铁集团为了节能减排,在高楼上面安装了很多传感器,效果非常好,平均提高劳动生产力5%,降低纯铁成本15元,预期在全行业推广后,直接经济效益70亿元/年。
数据的理念
接下来介绍数据的理念。首先数据里面实际上隐含着另外一种存在,以尿布和啤酒为例,虽然超市专家以前没有意识到,但尿布和啤酒销售存在关联。我们很多观点消失在人们的眼睛中,人们看不到,也湮没在人们的模糊感觉中。
我们有时候可以在相似中发现一些显著的差异,例如,Lexus通过Twitter大数据分析,从伦敦奥运会冠军中筛选广告代言人。无论邀请姚明还是刘翔都具有相似性,他们都是体育明星,但他们还是有差异的,就需要通过数据去分析了解。另外,我们可以在巨大的差异之间发现相似的规律,例如,AlphaGo在所有的围棋对局中,每一个人哪怕是同一个选手,每次对局都很不一样,所以就要从很多的差异中寻找相似的规律,得到新的认识。
大数据分析已经无处不在
对于企业来说,以财务信息和业务信息的融合为例。实际上,很多企业的财务信息和业务信息并没有很好地融合,就车间里一些具体设计业务的工艺来说,生产上方方面面的信息并没有真正地被财务信息所利用,但实际上这个业务流程是和财务信息相关的。我们没有精细的数据收集,所以传统的信息和业务信息相互独立。因此如何从大量的信息中进行挖掘,进行成本控制是非常有意义的工作。
其次,隐含的另外一种存在湮没在人的自以为是中。有人认为AlphaGo这是臭棋,实际上AlphaGo对围棋有新的认识,这是人类没有认识到的。有的紧闭地存在深处,有超越人的智慧,特别的思维过程。所以我认为数据其实是“非人类思维”的种子。像AlphaGo有非人类的思维,人类以前没意识到一样,数据是“非人类思维”的种子,我们如何从数据到信息,到智能,再到非人类思维。这对我们认识自动化是非常重要的。
我们要超越人的感知,例如,我几个月前去台湾一个很普通的大学参观,其中的一个教授说:控制磨床进刀,老师傅通过听模具的声音可以判别出其质量如何,或者应该如何去控制。然而,他们通过测量噪声、测量电流的变化,把数据收集起来和质量等进行深度学习。结果显示数据分析之后的磨床进刀控制要比人的感知好得多。
刚才所说的AlphaGo实际上就是非人类思维。最可怕的不是人类,是非人类思维。在很多情况下,计算机系统,人工智能系统可能比我们的看法或感知更加细致入微。
以我的一个计算机绘画作品为例,它实际上是根据我们拍的树林的照片画出的作品。我们人作画的时候,有的地方透着光,有的地方有阴影;但计算机绘画实际上是计算机对照片的分析,它更加的细致入微,用一种夸张的手法表现了出来。这说明了计算机或者人工智能系统比人的感知更加细致入微。
另外,关于数据的理念,我们需要重视数据收集常常需要跨系统、跨领域、跨媒体的,某一个问题的表征并不一定集中在某一个特定的系统数据之中。例如,美国大选时特朗普当选很意外,美国主流媒体认为特朗普不可能当选。如果跨媒体收集数据,绝对不会得出特朗普败选的结论。因为人们只关注了主流媒体,没有看民间媒体,所以才会感到意外。再如我们要判断经济趋势,判断选民的意向,光看报纸是不行的,还需要我们去跨系统,跨媒体了解相关信息。
我们车间的质量问题不一定只和设备、工具、工人有关系,还会涉及供应商、环境、气候,甚至是某一特定的时期,社会上的特定活动等。就以举行世界杯为例,车间的质量说不定与这些比赛有关。跨媒体也是一个很重要的方面,收集不同媒体的数据,例如facebook、微信、中央电视台等媒体都传递了很多数据,而且这些数据可以从一定的程度上反映经济问题、经济趋势等。
之后,我们介绍数据的工作理念,在企业中,我们常说业务数据化、数据业务化。所谓业务数据化,即企业里每一项工作,每一个活动,每一项业务都要数据化。我们企业远远没有达到业务数据化。所谓数据业务化,即指数据工作是由专门的业务部门来处理。目前政府部门已有专门的部门来处理数据,如大数据局。但是在企业中,我们所有计算机中心或信息中心和数据中心是不同的。专门处理企业数据收集的范围,数据传送的标准等和数据相关的部门才是数据中心。
还有大家熟悉的数字双胞胎的理念,在企业里现在是非常强的。在企业中,数据驱动强调的是无数的流动。企业数据驱动包括在流水线上的。例如,德国巴斯夫企业生产的洗发水、液体肥皂是可以根据香味和颜色等喜好定制的,而且定制过程是根据记录了数据的芯片实现的,体现了数据驱动。而双胞胎强调的是数据从一个程序无缝流到另一个程序的过程。
最后,需要注意的是,不要指望一切都在预测和控制之中。近几年有专家说:大数据、人工智能计划经济成为可能,马云也有这样的观点,认为什么都可以掌握,但我觉得这是不可能的。人是有自由意志的,比如,你一定要我种花生,但我想种别的东西。假如说我是一个农民,除非你规定只能够生产什么、工作什么,否则这是不可能的事情。如果说你有一些预测,而我因为你的预测马上做出改变。显然,经过改变,原来的东西实际上已经发生了变化。因此,很多个体行为是无法预测的,但对一个群体来说,预测又是可能的,因为群体之内的自由意志可能相互平衡抵消。但我们认为一切都在掌控之中、控制之中是不大可能的。
另外不能迷信数字与智能技术,数字与智能技术依然存在漏洞。更复杂的社会,也意味着更复杂的纠错机制、更高昂的纠错成本。正如墨菲定律所说,“如果事情有变坏的可能,不管这种可能性有多小,它总会发生。”我相信这句话还是有一定道理的。
总之,数据驱动不是一切,大数据、人工智能开启了认识整体联系,认识不确定性,认识非固定模式等问题的大门。我们应该围绕企业的理念和目标去收集、处理数据,尝试去深刻地理解数据的一些基本理念。