辩证地看人工智能
2021-12-24孙茂松
孙茂松
人工智能的“热”现状
人工智能很“热”,我们现在谈论人工智能更多是从应用来看,从大众角度来说。人工智能的研究初心是让机器人具有人类个体的智能,也就是感知和认知的能力。感知,虽然不是人类独有的,但与人类认知密切相关。认知则是人们获得知识或应用知识的过程,或信息加工的过程,像语言、记忆、推理、思维、想象等,都属于认知。人工智能这些年的发展,特别是随着互联网的兴起,产生了超越初心的部分——群体智能,这是个体智能所没有的,比如智慧城市等。人工智能发展历史经历了大的“三起两落”,发端于2010年的第三次“起”趋于真实,人工智能研究从象牙塔走向社会,其最早的显著性标志是语音识别。进入21世纪后大约有十年的时间,全世界研究者尝试了各种机器学习的方法,语音识别的错误率怎么也降不下去。2010年人工智能進化到以深层神经网络为代表的深度学习,使得语音识别的错误率大幅下降,开启了这一波人工智能的高潮。2012年图像识别、2015年机器翻译也取得了类似的效果。图像识别用的深层神经网络是卷积神经网络CNN,差不多可以说它是直接借鉴了脑的视觉处理机理,在国际公开测试集上前几年已超过了人类的识图能力。机器翻译用的是循环神经网络RNN。最近,有研究者发现人脑中存在类似的机制,这个脑科学的发现反而是受到了计算机科学的启发。2016年谷歌研发的人工智能AlphaGo,利用了人类历史上所有的优秀棋谱,同时加上机器学习,让机器自己跟自己下,终于战胜了人类顶尖棋手;不过,其后迭代出的AlphaGo Zero却不再需要任何人类棋局,完全由机器自己跟自己下,结局是AlphaGo Zero完胜AlphaGo。如此种种,令人工智能留给公众“神乎技矣”的深刻印象,大家对它产生了高度关注和期待。
人工智能的“冷”思考
这一代人工智能技术是以CNN和RNN为主要手段的深度学习技术,在大数据、大算力的支持下,人工智能得以发挥作用,产生了惊艳的效果。需要注意的是,我们现在可能过多强调了人工智能“强势”的一面,对其局限性则关注不够。前几年,我们总在讨论人工智能是否会超越人类,答案应该是“否”。实际上,这一代的人工智能技术要超越人类,需具备几个基本条件。
首先是单一任务,任务的边界是清楚的,比如下棋就是下棋,不能是炒菜。该任务还必须同时满足如下性质:第一,其可能状态是有限的,不能有超出预期的状态出现;第二,元规则要确定,比如下棋,规定好你走一步我走一步,什么叫“死棋”,什么叫“活棋”;第三,信息完备,信息对双方都是公开的;第四,也是最为重要的是,结果判断可量化。人工智能面对满足上述条件的任务,一定能够战胜人类顶级高手。但问题是,现实任务同时符合这几个条件的几乎没有,无论是图像识别、语音识别、机器翻译还是自动驾驶,都至少不具备其中一个条件。在这些领域,目前的深度学习技术,即使给它足够大的数据,要超越人类顶级高手实质上是不可能的,但确实有可能比大多数人做得好,所以可以辅助人类去替代一些相对简单、重复性的智力劳动,这是这一代人工智能技术应用的基本定位。
为什么这一代人工智能有局限性?深层神经网络的中间是一层一层的神经元,层与层之间的神经元以各种权重连接。它的长处是通过大量与任务相关的输入输出数据,可以自主学出来一个求解该任务的“函数”。理论上已经证明,如果一个神经网络足够复杂,它可以模拟、逼近任何函数。所以它的能力非常强,这是相当了不起的;但问题也恰恰出在这儿——说到底,它仅仅是一个针对特定任务的“函数”而已,我们并不清楚其中的功能机理,所以它的可解释性、鲁棒性都比较弱,运用显式知识的能力差,推理能力缺乏,可用性也会打折扣。也就是说,它的长处和短处是共生并存的。如果某个输入数据超出了这个“函数”的视野所及,是它没有学过的,很可能马上就会“犯糊涂”,产生种种令人意想不到的错误。如在自动驾驶中,本已训练好的AI系统可以很好地识别STOP交通标志,但如果存心在上面贴上若干小纸条之类,人看一点儿问题也没有,机器却很可能会识别错,你要是自动驾驶或许一下子就掉下悬崖了。
深层神经网络的特点决定了AI很容易被没有见到的情景所迷惑,而犯人不会犯的低级错误。人容易犯的高级错误,AI因为学习充分却可能不会犯。人工智能可能随时会犯低级错误,所以在自动驾驶之类关乎人的生命安全的应用场合中,一定要十分慎重,设计好应急措施。我们要正视人工智能的缺陷,辩证地看问题。
人工智能与脑科学及智慧教育一瞥
这些年人工智能和脑科学的研究一直在试图互相借鉴。人工智能学界始终在留意脑科学的最新研究成果,看看哪些对设计新的人工智能算法或模型有启发,虽然目前为止收获不大,但这肯定是会越来越得到更多重视的一个方向。另一方面,现阶段或许脑科学更容易从深度学习中找到新的实验方法。脑科学的实验数据足够大,符合人工智能大数据运算的特点,利用深度学习技术,很有希望提出脑科学数据分析的新手段甚至开辟出新范式。
当前人工智能作用于教育并取得确定性成效的工作还不太多,虽然国际上已经有了不少初步的工作,如在线学习会产生大量数据,可通过人工智能技术发现学习者的特点,进行个性化学习,也就是因材施教。有研究根据学习者的以往学习数据,比如某个视频看了多长时间、做题效果如何等,通过RNN神经网络预先判断作业的难度,有针对性地推送适合学生个体水平的、难度适中的作业;也有研究根据学习者行为让AI自动判断课程中哪一部分内容比较难。其实不同的学生感到困难的地方是不一样的,并非固定不变,而以前决定课程内容的难度,多是基于教师的主观判断;此外还有通过CNN神经网络,借助视频技术来分析老师讲课的状态,如是精神饱满还是比较平淡的照本宣科。教育学研究表明,在线教育中教师讲课的生动性,是能否抓住学习者的关键因素。对教学视频进行大规模的自动分析,再同学习者大数据建立关联,有望对教师的在线教学提出改进建议。总体上看,人工智能赋能的智慧教育,其进展还是可圈可点的,但人工智能融合脑科学的智慧教育,似乎才刚刚起步。