从数据入手 探索新型智能范式
2021-03-02程学旗李国杰等
程学旗 李国杰等
无论是早期符号计算(以数理逻辑为基础)、进化计算、支持向量机、贝叶斯网络,还是当前在工业界获得巨大成功的基于多层神经网络的深度学习方法,从模型的本质上来看都是建立在图灵机的基础上,基本都符合邱奇-图灵论题(Church-Turing thesis),即“任何在算法上可计算的问题同样可由图灵机计算”。
计算智能的发展
换句话说,现有的人工智能模型本质上都是与图灵计算模型等价的,故可归为计算智能。计算智能一般以计算机为中心,以算法理论为基础,充分利用现代计算机的计算特性,给出了解决实际问题的形式化模型和算法。近十几年,大数据的使用、算力的提升和深度模型的发展,为计算智能带来了新的契机。大数据、大算力、大模型三者结合,极大地推动了计算智能的工业化应用。
例如,计算智能在以围棋为代表的人机对弈、机器翻译、人脸识别、语音识别、人机对话、自动驾驶等应用中均取得了巨大的成功。值得注意的是,大数据在给计算智能带来发展的同时,其复杂性和非确定性也给计算智能带来了非常大的挑战。现有的计算智能在面临大数据环境下的复杂问题和复杂系统时,依然很难给出满意的答案。
我们需要探索当前计算智能的能力边界问题,从理论上探寻这类智能所能解决的问题类型和能力边界。
譬如,通过建立深度学习和统计力学的关系,回答深度学习的相关基础问题:
1. 表达能力方面,模型做深为什么是必要的,到底深度为多少层是合理的?
2. 模型学习方面,崎岖的目标函数如何高效优化?
3. 泛化能力方面,如何实现计算智能技术从专用到通用的转变?如何实现模型的跨领域、跨任务、跨模态的泛化?
上述一系列基础问题将进一步成为计算智能未来发展的关键“瓶颈”。其原因是,当前的计算智能是大数据工程化驱动的,其能力的提升主要依赖于数据规模的增加和计算速度的增长。如果缺乏数据科学化理论的支撑,大数据驱动的计算智能难以形成从量变到质变的提升。那么另一种思路是,我们也许可以考虑发展与当前计算智能不一样的智能范式,以便更加简捷高效地解决更复杂、更普适的现实问题。
新型智能范式的探索
事实上,自然界中存在大量具备智能的自然系统。这些自然系统比现有人工智能系统具备更加简捷高效的逻辑推理和自我学习能力,如脑神经系统、社会系统、自然生态系统等。
那么,自然系统的智能模型是什么?我们能否借鉴自然系统中的智能行为,将其形式化为可计算的智能范式?实际上,已有4类智能范式在此方面做出了一些初步的探索。
脑启发计算
人类的大脑皮层具有140亿至160亿个神经元,且每个神经元会连接1000至10000个其他神经元,借此人类发展出了比其他物种更高级的智慧。
脑启发计算(brain-inspired computing)正是借鉴了人脑存储、处理信息的基本原理所发展出来的一种新型计算技术。与传统图灵计算机的计算模式相比,脑启发计算是通过增加空间复杂度来保留计算单元之间的结构相关性,从而构造基于神经形态工程的高速、新型计算架构。
脑启发计算的目标是构造一套非“冯·诺依曼”架构、可实时处理复杂非结构化信息、超低功耗的高速新型计算架构。脑启发計算的发展,也许能为数据科学提供新的计算架构和高性能的计算能力,支撑通用人工智能的发展。
目前,脑启发计算仍处于起步阶段,我们要进一步思考如何在不完全了解人脑机制的情况下发展脑启发计算模式,以及如何基于这种脑启发计算为科学研究提供新思路和新范式。
演化智能
学习和演化是生物适应环境的基本方式。现有的计算智能基本都拥有从数据中学习的能力,但对智能模型的演化能力缺乏关注。
例如,人脑是经过数百万年的演化逐步形成的。从这个角度来讲,现有的智能模型在依靠人类设计之外,是否也能通过演化过程去自动发现最佳的模型结构?传统的遗传算法是一种基础的演化计算模型;而从演化计算到演化智能,以及实现模型自动演化的智能范式,还有很长的路要走。未来,交互驱动的强化学习、开放环境下的人工智能是值得探索的方向。
复杂系统模拟
自然界存在大量的复杂系统,如人类社会系统、自然生态系统、人体免疫系统等。从控制和计算的角度来看,模型化的复杂系统是“由大量相互作用、相互依赖的单元构成的一个整体系统;一般在没有中央控制情况下,这个整体系统可通过简单的运作规则实现复杂的信息处理,进而产生复杂的集体行为,并能通过学习和进化产生自生长和自适应能力”。
是否可以通过模拟复杂系统的组成特点和交互方式来构造新型智能范式?如何通过大量简单智能体之间的交互作用,产生可预期的、具有高度复杂性的群体智能?这样的智能范式也许会从根本上改变传统的单智能体的智能上限。
人机混合智能
随着互联网、物联网及新一代通信技术的发展,万物泛在互联成为现实。未来,大量物理设备、无人系统、人脑,通过泛在网络实现“上线”和“互联”。
在这样的环境下,人在回路的人机混合智能具备了基本的物理条件。目前,人工智能技术所具备的感知、认知能力,基本上是模型与数据结合,并以机器为中心所形成的计算智能,故也称为机器智能。
这种机器智能在存储、搜索、感知、确定性问题求解等方面性能表现优越,但在高级认知和复杂问题决策方面与人类智能相差很远。虽然脑启发计算取得了一些进展,但在可预期的未来,机器智能很难完全模仿和构造出人类智能或其他自然智能。
换一个思路,如果将人的智能引入到机器智能的系统回路中,将充分融合人类智能和机器智能的优势,从而形成更高级的智能水平。在未来较长的一段时间内,这种人机混合智能也许是一些复杂问题求解的有效途径。那么,在基于机器的计算智能基础上,人作为具备智能的自然系统,如何参与到机器智能的系统回路中是一个关键问题。人机混合智能需要重点解决思维融合或决策融合的问题。
具体而言,传统的人机接口往往是单向的;在人机互联情况下,人脑如何参与到机器智能的系统回路当中?如何同时让人理解机器思维和让机器理解人的思维,从而实现思维的无缝互动?
目前,一些探索和挖掘思维潜力的工具,如思维导图、思维地图、概念图等,其理论基础与形式化模型并不清晰。一些新型的脑机接口技术进展迅速,但缺乏对人脑在直觉、意识、情感和决策方面的机理认知。也许,从技术上构建有效的人在回路智能通道,是当前人机混合智能亟待解决的关键问题之一。
上述4类智能范式的研究,在现有图灵等价的计算智能基础上,或多或少地引入了人类智能或自然系统智能的部分机制,从而为未来智能系统的发展注入新的活力。
但是迄今为止,这些智能范式在可形式化、可计算、可构造等方面还存在诸多基础性问题挑战。如果这些模式是未来新型智能范式,那么它们是否还是图灵等价的?这些问题值得我们从本源上进行探讨。
数据是人类社会、物理世界和机器世界之间的桥梁,同时数据也是人类社会和物理世界的符号化映射。因而,从数据入手是探索和实现上述新型智能范式的基本途径。数据科学基础理论,不仅对当前数据驱动的计算智能起到提质增效的作用,也将为未来新型智能范式研究提供理论支撑。(节选自公号“中国科学院院刊”)