阿尔伯塔计划致力于填补目前计算智能基本理解研究的空白领域

2022-03-09美《深科技》

海外星云 2022年21期

当前人工智能的一个困境是处理“部分与整体”之间的关系。一个人工智能系统的创建需要依赖有效的算法，但往往只有将系统建立好之后，我们才能知道具体需要哪些核心算法。为了解决这个“鸡和蛋”的问题，必须同时研究两者。在这个过程大量探索可能不会有结果，但这又是不可避免的。

近日，人工智能公司开设的首个非英国研究实验室，发表了一篇题为《为了AI研究的阿尔伯塔计划》的文章，并提交在arXiv上。该篇文章的三位作者里奇·萨顿、迈克尔·鲍林和帕特里克·皮拉尔斯基，是Deep Mind Alberta的领导者，并都在加拿大阿尔伯塔大学担任教授职位。

本次DeepMind Alberta将其人工智能研究方法，称为阿尔伯塔计划。

它主要针对未来5年～10年计算智能的基本理解问题，旨在填补目前研究的空白领域，并不关注现有方法的立即应用。

文章主要对该机构的人工智能愿景和这些愿景可能实现的方向，以及将探索的研究问题和项目进行了说明。虽然这些愿景还有着不确定性，但研究人员尽可能具体地描绘了未来的道路。

按照阿尔伯塔计划，研究人员试图理解和创造一个富有生命力的计算代理。该文章还提到，代理的初始设计往往尽可能简单，且具有通用性和可扩展能力。但它们在不断与外界交互过程中，逐渐变得复杂。

从左至右分别为里奇·萨顿、迈克尔·鲍林和帕特里克·皮拉尔斯基

为了适应世界的变化，它们必须持续学习，用一个“博学”的模式来做理解和规划。文章中还提到：“智能是一段时间内的信号处理。”

该研究愿景的第一个特点是强调普通经验，而不是特殊培训集或人力干预。尽管有许多方法可以使用人为输入和领域知识来提高人工智能的性能，但这些方法通常不能适应计算资源，因此并不是本次研究的优先事项。

第二个显著特征可以概括为时间一致性。这意味着关于在代理上运行算法的所有时间都是相同的。时间统一问题涉及非平稳、持续的环境与学习算法。

保持所有东西在时间上的统一可以减少自由度，并缩小代理设计空间。不过，文章也提到，在某些情况下，最好是背离绝对的时间一致性。但当这样做的时候，可能会脱离原来的研究领域。

研究愿景的第三个显著特征体现在它对计算因素的考虑。

目前，计算机的能力虽然仍呈指数级增长，但并不会永远持续下去。计算能力越强，有效地使用它越就显得重要。因为这是决定代理绩效的重要因素。

此外，计算方面的考虑还体现在智能代理设计的各个方面。例如，通常一个智能代理能够对其观察结果的变化做出快速反应是很重要的。但是，考虑到计算的限制，反应时间和决策质量之间总是存在权衡。

研究愿景的第四个显著特点是，它包括一个聚焦环境中含有其他智能代理的特殊情况。

在这种情况下，主要代理可以学会与环境沟通、合作和竞争，并能认识到环境可能对其行为做出不同的反应。这个案例被研究为人机交互的一个子领域智能放大。

阿尔伯塔计划将人工智能问题描述为通过持续地感知和行动、有限的计算，在其他代理存在的情况下，在线最大化奖励。这种描述可能看起来很合理，但它与当前的实践相反。

现实中，通常集中于离线学习、准备好的训练集、人工辅助和无限计算。所以以上研究愿景既是经典的，也是逆向的，甚至是激进的。

本次提到的研究计划更多是为了就现有的工作达成共识，从而能进行更有效地沟通和合作。

值得一提的是，研究团队主要围绕基础代理进行设计，其本身是基于“智能代理的通用模型”，该模型也被认为是人工智能、神经科学等多领域的共同模型。如上图所示。

基本代理有4个主要的内部组件，分别是“感知、反应性策略、过渡模型和价值函数”。它们也由感知组件构造的状态信号相互连接。所有四个组件都是通过在前台运行的学习过程来做更新。

最后，文章中还描述了人工智能原型的路线图，总共涉及12个步骤。从开发核心能力（表示、预测、规划和控制）的新算法，到将这些算法结合起来，为连续的、基于模型的人工智能生成完整的原型系统。

对计算智能的理解，或会影响到社会每一个角落，包括每个人的生活。尽管它有被滥用的可能性，但其存在总体上将对世界有利。

研究团队还在文章中表示，阿尔伯塔计划具有临时、草稿性质，未来或会继续完善编辑它们。特别是最后的步骤还不够具体，随着不断地研究，该部分会取得更多进展。同时，他们也正在考虑关于智能放大和机器人技术的研究。