数据驱动与知识引导相互结合的智能计算
2023-01-06吴飞
吴飞
(1.浙江大学 人工智能研究所, 浙江 杭州 31027; 2.浙江大学 上海高等研究院, 浙江 杭州 31027)
在“数据是燃料、人工智能是引擎”的数据驱动机器学习时代,人工智能正在经历“大数据、小任务;小数据、大任务”的涅槃,如何从娴熟于“炼金术”的调参师向笃定于“厚积薄发”推理机迈进,是面临的巨大挑战。机器学习(machine learning)这一单词首次出现时被定义为“不需要确定性编程就可以赋予机器某项技能的研究领域”,其目标是构造一种学习机器(learning machine),使之像人一样具有“learning to learn”的能力。人类学习离不开数据、知识以及与环境交互等,本文探讨数据驱动与知识引导相互结合的智能计算这一问题,希望这一模式将推动更通用(more general)计算范式跃变。
1 四种人工智能计算范式
图灵奖获得者 Jim Gray 曾说,人类社会已经经历了4种计算范式。第一种是从实验观测中进行科学发现。比如,从比萨斜塔上同时扔下两个质量大小不一的铁球,这两个铁球会同时落地。通过这个实验观测可知,对于同样的下落距离,不管物体质量多大、只要初速度相同,会用同样时间经过同样的路途距离,于是发现重力加速度相同这一规律。第二种范式是从数据中进行模型归纳和方程推导。比如,一段电流通过指南针,磁铁的南北极会发生变化,奥斯特由此发现了电生磁现象,法拉第随后发现了磁生电现象。麦克斯韦从电生磁和磁生电中归纳出了麦克斯韦方程组,以一种近乎完美的方式统一了电和磁,并预言光就是一种电磁波,这是物理学家在统一之路上的巨大进步。在科学发现的壮美征途上,牛顿统一了力,麦克斯韦统一了电,爱因斯坦统一了场,这都是从数据中进行方程归纳,来刻画现象后面所隐藏的隐秩序。第三种范式是虚拟仿真,即搭建计算系统去模拟复杂的客观物理世界,从仿真系统中观测各种因素的此消彼长,再指导客观物理世界的改造。
Jim Gray 认为现在进入了被称为数据密集型计算的第四范式阶段。在数据密集型计算时代,随着物联网、5G和传感器等技术进步,可以史无前例获得记录人类社会生产、生活和工作等方面海量数据。从这些海量数据出发,挖掘其结构、模式和规律等知识,从数据到知识、从知识到决策与服务是数据密集型计算要解决的难点问题。2021年7月,李国杰院士在《中国计算机学会通讯》上发表了“有关人工智能的若干认识问题”文章,围绕AlphaFold这一任务所带来的启示,提出了“科学研究第五范式雏形”的思想,这一思想很重要的一点就是将领域知识(或者人类先验知识)与算法模型紧密结合起来,以更好解决领域问题。
2 人脑三类记忆体的启示
神经科学家指出:人类大脑有三种记忆体,分别是瞬时记忆、工作记忆和长期记忆。我们可以眼观六路、耳听八方,瞬时感觉到所处空间各种信息,这就是瞬时记忆在起作用。只有那些引起瞬时记忆关注的信息,才会被输送给工作记忆体。
人类直觉、顿悟和因果等智能活动均在工作记忆体中完成。但是,工作记忆不是仅仅处理瞬时记忆所传送而来的“感兴趣信息”,而是从长期记忆体中唤醒或激活与这些“感兴趣信息”相关的信息,整合起来一起处理。这就是我们常言的“弦外之音、画外之意”。即智能体在处理信息时不是就事论事或就数据论数据,而是会将与之相关的信息综合起来进行处理。因此,我们可从“此弦”知晓“外之音”、从“此画”洞悉“外之意”。
长期记忆体中所存储的“相关信息”以怎样形式存在是值得探索的问题。或许这些潜在信息是常识性知识(common sense)或背景性知识或暗知识。这些知识我们无法用言语来明确表达、机器也无法解释,但人的大脑可以很好地存储下来(并且以恰当范方式处理)。既然人脑是这样的活动模式,现在的智能计算可否仿照人脑这一计算模式或思维模式呢?
DeepMind 在 2016 年发表了一篇《神经图灵机(Neural Turing Machine)》的文章,将传统图灵机模型与人脑思维机制进行融合,将其称为深度神经推理(deep neural reasoning)。
我们知道图灵机包括一条两端无限长的纸带,纸带上面有非常多方格。我们可以将计算任务和所需数据放在纸带上,然后数据或事件触发图灵机中已经写好的程序来完成计算任务。在这个过程中,难以用到纸带上以外的数据或信息。但是,神经图灵机外接了一个外在记忆体(external memory),不断从外在记忆体中激活与当前处理数据相关的信息,以对当前数据更好学习和理解,取得更佳效果。这篇文章发表后,Nature 期刊为其撰写了一篇社论,称其为深度神经推理(deep neural reasoning),而不是平常的推理机制。
现在出现了一个现象,只要有一个X算法,一定会把这个算法拓展为deep+X算法或neural+X算法。比如有n-gram的自然语言处理算法,就出现了 neural language model;有强化学习,就有deep reinforcement learning。这不是故作悬殊,不是单纯追求从浅层模型到深层模型的转变,而是在这个转变过程中,巧妙融合数据、知识和交互经验,体现多种学习手段的集成式融合。
3 迈向新计算范式的科学计算
科学计算是将数据驱动和知识引导进行结合的重要研究领域。自然(Nature)杂志在2018年发表了一篇题为Machine learning for molecular and materials science的文章,指出在分子与材料等物质合成领域先后出现了三代计算方法:第一代是给定一个结构,研究预测该结构性质的算法;第二代是给定物质的若干组成成分,去重建该物质的组成结构,然后基于重建的结构预测其性质;第三代是给定海量数据,从中辨析哪些成分可通过怎样的反应生成结构,推理该结构的性质。第三代计算方法是当前人工智能重要发展方向。
AlaphaFold 是 1972 年诺贝尔奖获得者克里斯蒂安·安芬森(Christian Anfinsen))所提出的一个猜想。当时,克里斯蒂安·安芬森在诺奖颁奖典礼上提出如下猜想:一个蛋白质的氨基酸(amino acid)序列应该能完全决定这个蛋白质的结构,蛋白质作为生命的基本构件,其结构与生命的各种功能息息相关。因此,可否从氨基酸序列出发,预测蛋白质的三维结构,从而形成“从数据到结构到功能”的科学研究范式?
传统通过实验来解析蛋白质结构的方法往往耗时长、成本高、难度大,如X线晶体衍射图谱法、核磁共振法、冷冻电镜法等。2021年8月,《自然》和《科学》均发表了有关蛋白质三维空间结构预测的文章。前者是Deepmind公司完成的AlphaFold、后者是西雅图华盛顿大学蛋白质设计研究所完成的 RoseTTAFold。在这两篇论文中,AlphaFold 和 Rose TTAFold 都非常强调学习注意力(attention),即蛋白质结构中不同变量之间的关联依赖关系。
比较有趣的,Rose TTAFold 的第一作者认为Rose TTAFold 的性能不如 AlphaFold,其原因在于Rose TTAFold所在实验室没有研究深度学习的工程师,只是化学家应用深度学习工具来做蛋白质三维空间结构预测的工作。从这里可以看出,AI研究一定要和X领域任务结合,形成AI+X的态势,才能更好解决领域问题。
人工智能是使能之术,其一定是与来自不同领域工程师一起协作,才能解决领域问题,这也可回应为什么李国杰院士说人工智能上不了天、落不了地,因为要解决场景的任务,一定要和场景的工程师,以及人工智能专家结合起来。
4 结论
诺贝尔物理学奖获得者、量子力学的奠基者之一保罗·狄拉克(Paul Adrien Maurice Dirac)在1929年一篇题为Quantum mechanics of many-electron systems(《多电子系统的量子力学》)文章中写道:支撑大部分物理学和化学所发展的数学理论已经完成了,目前只需要解决刻画精确定律的复杂方程求解问题。
将数据驱动的归纳抽象和知识引导的演绎推理与物理定理的约束优化结合起来,围绕具体场景问题开展场景人工智能研究,是推动人工智能发展的一种手段。英国数学家理查德森(Richardson)1922年提出来“预报工厂(forecasting factory)”的梦想,被认为是科学计算思想的萌芽。1953年9月30日,理查森在睡眠中平静去世,其夫人回忆说,理查森留给她终生难忘的一句话是:我们人生的责任是要为后人留下更美好的事物。
人工智能赋能科学发现,科学计算促进了人工智能本身深入发展,人工智能又重塑不同学科研究的范式革命,美人之美,美美与共,留美于世!