AlphaGo和大公司的优势没落
2016-04-11霍华德·余,粟志敏
AlphaGo和大公司的优势没落
编者按
最近,谷歌人工智能机器围棋AlphaGo(“阿法狗”)战胜了围棋冠军李世石,引起轰动,成为媒体热点。那么“阿法狗”的胜利会给大公司带来哪些影响?霍华德・余教授在2016年3月的《哈佛商业评论》上发表文章,简要介绍了人工智能机器学习的过去、现在和未来,分析了它们对大公司的影响。霍华德・余博士现任瑞士国际管理发展学院(IMD)商学院的战略管理和创新教授。
2016年3月,谷歌公司的谷歌人工智能机器围棋(AlphaGo)击败世界围棋冠军李世石,人工智能机器学习又往前迈出一大步。围棋是一种古老的中国棋盘游戏,其历史可以追溯到近3000年前。围棋使用的是方形格状棋盘,棋盘上有纵横各19条直线,对弈双方要力争占据更多的地盘。西方的国际象棋可进行近40个回合,而围棋有据可查最多的高达200多个回合,可能的结果达到了骇人的10761种,远远超过了整个可观测宇宙中的原子总数量。人们此前曾经认为至少还需要10年的时间,人工智能机器才能在围棋对弈中战胜人类。
最值得一提的就是,AlphaGo是一台可以每日改进自身表现的机器,无需人类程序员直接的监管。这就像是飞机无需工程师的帮助却可以飞得越来越快。这怎么可能呢?
人工智能机器学习的过去、现在和未来
结构化数据。人工智能机器学习首次出现时,被用于预测我们将如何点击鼠标、购买东西、撒谎和死亡。人工智能机器改进了公司发送电子邮件、打电话、提供折扣、推荐产品、推送广告、检查缺陷和批准贷款等的方式。在人工智能机器学习的外壳之下,是统计数据挖掘,即发现此前未知的模式,推荐实时行动。这种方法的缺陷在于它依赖一定的背景。正是因为这个原因,多数算法都是为了单一的目的而设计,例如深蓝(Deep Blue)。深蓝打败了前国际象棋超级大师加里・卡斯帕罗夫,但除此之外别无它用。对于这些第一代的人工智能机器而言,要实现学习,只能通过计算机科学家和统计学家的不断干涉。数据必须贴上标签,而且也必须设定目标。同样的程序设计不能被用于解决其他问题,而且算法也没法懂得使用人类自然语言所表述的非结构化数据。
自然语言。2011年2月,在综艺节目《危险边缘》(Jeopardy!)中,IBM的人工智能沃森(Watson)击败了该节目的前冠军肯・詹宁斯和布拉德・鲁特尔。人们开始清楚地看到,人工智能机器学习可以突破单一思维,处理非结构化的模糊数据。除了要掌握各种主题的事实知识之外,《危险边缘》的参赛者还必须能够懂得讽刺、谜语、俚语、隐喻、玩笑、双关语和其他复杂的语言文字。意思取决于前文、主题,也取决于讨论的方式。在为期两天的《危险边缘》联赛中,IBM的沃森总共获得了77147美元奖金,是其人类对手的3倍有多。排名第二的詹宁斯后来说:“20世纪时,工厂的工人们被新装配线上的机器人所取代。同样,布拉德和我是第一批知识产业工人,我们因为第一代的‘思考’机器而失业了。”
目前,IBM沃森并没有取代专家们,而是提高了他们的工作能力。例如,专家们只需要通过一款iPad应用,使用简单直白的英语描述病人的症状,该算法就可以为肿瘤学家提供研究和临床方面的建议。尽管IBM沃森并不依靠被编码的规则,但它必需有领域专家们的密切干涉,为它提供数据,评估它的表现。在沃森为肿瘤学家提供服务之前,它被人工输入了25000份测试用例场景、1500份实际用例场景、60.5万份医学证明,以及200万页的文字。护士们花了14700个小时的时间一丝不苟地对该算法进行培训。所有这些都需要花费时间、金钱和精力。
深度学习。在AlphaGo与人类对决之前,谷歌研究人员一直在开发它来玩视频游戏,其中包括《太空侵略者》(Space Invaders)、《突围》(Breakout)和《Pong》。根据程序设计,AlphaGo会力争高分,并且通过每天与自己玩数百万次游戏,来不断改善自己的系统。该算法能够通过反复试验来掌握每种游戏,最初是随机按下不同的按钮,之后会根据学习制订出合适的战略,并且不犯错误地加以执行。AlphaGo能实现这点,原因在于它基于一种深度神经系统,即模仿人类大脑神经元的一个硬件和软件网络。这并不是一种新概念。计算机科学家们已经讨论这个问题20余年。随着计算力的发展,深度学习变成可能,而AlphaGo也是率先实现了这种惊人的直觉思维模拟。
对大公司的影响
AlphaGo证明,无需人类专家和程序员过多监督且可以自行学习的人工智能机器的崛起是不可避免的。正如IBM沃森所显示的那样,人工智能机器将从各种各样的来源吸收大量各种形式的信息和数据,不管这些信息和数据是否结构化。执行成本将会不断下降。组织内部和外部的业务往来的协调速度将会提高,而且在这个过程中,组织摩擦会得到消除,市场协作得到加强。
基于这些原因,那些因为垂直整合而拥有传统优势的大公司将会成为首批被淘汰者。“一站式购物”和“供应链优化”这些传统观念将会变得陈腐,众多行业里规模较小的从业者或新从业者相比之下能更轻松地实现这些。
让我们以电子数据交换(Electronic Data Interchange,EDI)和其他大型跨组织系统为例。这些系统让供应商、顾客和物流专家可以进行实时沟通。思爱普公司(SAP)和甲骨文公司(Oracle)所生产的系统都非常笨拙、成本高昂、使用难度大,而且难以进行整合。在历史上,只有沃尔玛和百思买这类大型企业才有足够的规模和讨价还价的能力,能够迫使他们的供应商采用这些系统。在建设好后,这些系统仍然需要一群专家来不断进行监测、改进、向管理层提出行动建议,并且在组织内逐层推广该系统。
相比之下,开发AlphaGo的团队人数不到50人。该程序本身相对属于轻量级的,在建立后并不需要太多人类干预,而且可以广泛运用到不同的问题领域。
不难想象,自我学习的算法在协调经济交易方面将会发挥更大的作用。AlphaGo只是让我们看到了在不久的未来有哪些会变成可能。即时调整、自动优化,以及持续改进,这些都由无人监管的算法自行安静地进行管理,因而生产设施的冗余和供应链中的浪费不会再让人们为之头疼。没有了垂直整合的压力,而且组织协调所需的资源也大幅减少,那么规模较小的从业者就能够全心全意去提供一流的服务,当特定的需求出现时实时提供极具针对性的定制解决方案。
大型非科技公司即将面临的问题有:
(1)当规模不再重要时,自身组织的核心竞争力是什么?
(2)我的组织内有多少管理能力是用于负责市场协调的?
(3)如果新的竞争对手也复制了这些能力,用机器计算来取代人类专家,那么我的成本结构和他们相比存在什么优势或劣势?
(4)进一步来说,如果产品发布去中央化,我们能增加什么新的服务或产品?
(5)我是否可以与新的从业者合作,重组我当前的能力来进入新市场?
最令人兴奋的是,未来AlphaGo这类能够自我学习的机器人,将嵌入全球经济的命脉。当不断自我学习的算法将关系松散的公司、非政府组织和政府机构联系在一起,它们也许能够带来新的生态系统,解决最具难度的社会问题,例如能源、交通运输、医疗卫生和教育。这些领域目前因为错综复杂和市场四分五裂而表现不佳。
(粟志敏 编译)