阿尔法狗,言之无文,行而不远
2017-08-11曹俊
曹俊
阿尔法狗(AlaphaGo)3∶0战胜了李世石。也许柯洁上阵结果会不一样,但也不会太不一样,毕竟以阿尔法狗的进步速度,击败所有人类高手不是今天就是明天。那么,人工智能(AI)将会胜过人类的智慧吗?显然不会!几十年来,AI跃上了第一个台阶,但至少还要跃升两个台阶,才有跟人类智慧较量的资本。
每个学习围棋的人,必然背过围棋十诀、棋经十三篇,知道“单关无恶手”、“棋拐一头,力大如牛”等谚语,也必然知道“棋形”等美学概念。这些“虚”的指导思想,极大地简化了具体的计算。
阿尔法狗除了暴力搜索算法外,通过价值网络和策略网络形成“棋感”,使它的能力跃上了一个台阶。经过大量训练形成的这两个神经网络,就相当于这些虚的指导思想。在神经网络中,这些指导思想以各个神经元的系数的方式存在。可以说,通过深度学习,阿尔法狗获得的知识以一系列的数字表达出来,而不是棋理。
粒子物理学家20多年前就开始使用神经网络(以及其他人工智能方法, 如Boost Decision Tree)来进行数据分析,比如寻找希格斯粒子,但一般尽量不用,因为训练出的神经网络不透明,就是一堆神经元的系数。我们说这里“没有物理”,因为难以判断其可靠程度(误差分析不好做)。此外,神经网络的一个突出问题是过度训练。对一个有限的样本,经过一定次数的训练,有用的信息基本使用殆尽;如果继续训练,在人类对它的绩效考核压力下,它就开始钻空子,报告说性能更好了,但实际上使用了垃圾信息,其表现为神经网络“发神经”。据说,阿尔法狗的第四局失误就来自过度训练。
“没有物理”有什么问题呢?首先,其他人难以判断它是否正确,没有同行评议,也许是过度训练得到的假知识呢?其次,就算无条件相信它正确,获得的知识也无法传承。在科学研究中,自己知道了什么不是最重要的,更重要的是让其他人知道你知道了什么。创造知识与传承知识是同等重要的。否则,获得的知识无法融入科学发展的长河中,未来还需要重新发现,那其对科学的贡献实际上就为零。受过专业训练的科学家与民间科学家的区别,就在于专业科学家看似普通的每一句话、每一个论据,都是建立在前人已检验过的知识基础之上的,需要推敲的新论据每次只有一小点。
同样,阿尔法狗获得的知识是一堆莫名其妙的数字,只能它自己用,不能转化为棋理,因而不能传播和传承。如果不解决表达与传承的问题,AI只能依附于人类的智慧。人类知识由一个个的个体形成网络和体系,而一个个AI都只能單独地与人类接口,不能连成网络。人类永远是它的老师。
假如阿尔法狗想与人类智慧较量,首先它要形成抽象的表达能力:可以学习人类的语言与思维方式,从而与人类网络接口;也可以独立发展出自己的机器表达,比如说,天下的AI都用同一套神经网络结构。这时候,AI就上了另一个台阶:每一个AI能够抽象出易于表达的物理和棋理。
下一个台阶,就是将这些知识授予其他机器,从而构成网络,甚至形成社会。为什么说形成社会呢?AI张三获得的知识与AI李四的知识也许相反,怎么解决冲突?怎么形成妥协?是不是还要有人类社会的等级结构?
有了这些,阿尔法狗们就可以不依附于人类,独立发展出知识体系。不过,还得要有文采哦!言之无文,行而不远,阿尔法狗愿意教,但贝塔狗、伽马狗爱不爱听呢?