人工智能:数字时代的生成器
2017-08-01陈凯
陈凯
我第一次听到艾美所编写的肖邦的钢琴曲时,几乎被惊呆了,因为那真的是“肖邦”的钢琴——优雅的旋律处处体现出肖邦特有精致浪漫的编曲风格,即便是肖邦还活着,听到这些音乐或许也会困惑——自己究竟什么时候写过这样一首作品。然而艾美并不是人,而是一个人工智能程序,大卫·科普(David cope)编写了这个用来自动作曲的程序艾美(EMI),这个作曲软件能够逼真地以巴赫、维瓦尔第、莫扎特等知名作曲家的风格来“创作”音乐作品。大卫·科普曾经在一些古典音乐会上,在真正的历史作品中掺杂了这些数码“赝品”,听众们(有时甚至是音乐学院学生)非但没有分辨出来,反而表示他们被那些作品深深地打动了。不妨想象一下听众们被告知真相后哭笑不得的表情。用相对专业一点的术语来说的话,单就音乐编写而言,艾美通过了图灵测试。用语言文字实在难以描述艾美的成就,有兴趣的朋友可以到网络搜索“David cope EMI”关键字,就能找到艾美编写的音乐。
正如大卫·科普所说,只要轻轻按下按钮,很快就能得到几千首音乐作品。据说当年大卫·科普在写歌剧旋律时卡壳,所以就创作出了艾美的最早的版本。当年——20世纪80年代,或许这个时间点让大家感觉有点意外——艾美的诞生并没有引发艺术从业者太多的担忧,大家认为艾美所做的只是逼真地模仿,不能算是创作。具体理由有以下几点,其一,艾美在大卫·科普的“帮助”下从作曲家的大量作品中归纳出了最具特征的片断,然后再重组了这些片断,由于艾美难以自主识别最具辨识性的特征,所以这个工作需要大卫·科普和艾美两者耗费大量时间来磨合;再者,虽然说这轻轻点击按钮之后的几千首音乐大多不难听,然而要从中找出最优秀的作品,还是需要靠人一首一首去挑选;艾美的另一个问题是,它只能编写时间有限的音乐小品,因为一部比较长的音乐作品,比如交响诗或者是音乐剧,要么它能充分展现出情感的变化,要么它具有完整的叙事结构,才能够吸引听众在椅子上安静地坐上几十分钟乃至一个多小时。若将以上三点用最通俗最简单的语言复述的话,那就是,艾美并不真正知道人究竟是怎么想的。
在相当长的时间里,许多人,包括我,都是这样认为的,因为一个人工智能的程序并不能真的像人类那样认知,甚至于人类自己也并不能精确地描述自己认知的具体过程,因此人工智能很难在短期内取得重大的突破。然而,现在看来,如此考虑问题还是太过简单了。
基于图灵测试的思维实验
从图灵提出“图灵测试”以来,人工智能能否拥有人的智能,是一个引来太多争论的问题。图灵构造了一个受到限制的对话环境,仅用来讨论人与机器智能上的等价问题。稍微延伸一下想象,不难发现更难让人下定论的问题:如果一台机器的外在表现完全类似于人类,那么是否要承认机器也具有人格?大部分人会认为,就算机器的外在行为与人类相似,但内部机制却完全不同,因此他们不会赋予机器“人”这一称号。然而所谓“内在”和“外在”本身又牵扯出太多哲学上的讨论,考虑以下特意构造的思维实验:某钢琴家的作品均由他的女友—— 一位天才的作曲家所创作,单就这点来说,一点也不科幻;这位钢琴家因为交通事故遭到重创,丧失了某段时期的记忆,这也是在现实中真正会遇到的情况;事故之后,钢琴家和他的女友仍然照常那样密切交往着,这看上去再普通不过了;某一天,钢琴家的脑海中忽然浮现出一段记忆,她的女友其实和他一同遭遇了交通事故,并死在了事故中,当前的所谓女友其实是一台机器——虽然说他自己也无法把握,这段记忆是否只是自己损坏的大脑所臆造的。那么,他的机器女友是否等同于他的女友?如果说这个问题来自钢琴家出了问题的大脑,那么我们就没有必要去解答此问题,因为这个问题本不存在。既然钢琴家的女友的所有表现都和人类相同,那么反而要问,钢琴家的奇怪问题从何而来?又如何才能得到解答?因为问题的提出需要根据,而问题的解答需要验证。由于钢琴家的女友所有表现与人类一致,于是就不存在问题提出的根据,又因为问题的验证具有破坏性,或者对于钢琴家而言不具有可否证性,比方说,钢琴家坚持认为,制造机器人的凭据被销毁了,或者检测机构有作弊嫌疑,甚至于他女友的内部器官也制造得和人类非常近似等。为了找出真相,钢琴家甚至可以直接研究他女友的大脑,并宣称他女友的大脑工作模式和人类不同——虽然钢琴家若真要这样做,其他人恐怕更会怀疑他的无端偏执。作为一个思维实验,每个读者可以设身处地,想象一下若自己是那个钢琴家,会采取什么样的行动——大部分人恐怕会对自己头脑冒出来的疯狂想法一笑了之吧。如果上面的思维实验真要拓展成科幻小说的话,也许读者迎来的结局是,最后有人告诉钢琴家,其实他自己才是一台出了问题的机器,钢琴家在情绪崩溃前完全否认了这一点,但因为他自己无法剖析自己内在的信息处理过程,所以他也没有证据来否认这一点,有意思的是,至少在今天,任意一个普通人都无法对自己头脑内在的信息处理的内在过程进行剖析。
仔细思考上述思维实验,我们就可以发现,当机器的行为与人类相同时,问题关键其实不在于机器是否等同于人类,而是“谁”能“提”这个问题?“谁”能“验证”问题的答案?不仅仅是因为无论谁提出这个问题,他都无法将提问的依据和验证的过程用于他自身,更重要的,人类是借助建立输入因和输出果的逻辑链来进行决策和行动的,从生存和发展的效率考虑,尊重因果远胜于无端猜疑。英国生物学家弗朗西斯·克里克认为,人的大腦决策就是一个计算过程,大部分时候大脑本身并不能认识到这个计算过程是怎样的,于是就有所谓的直觉和顿悟,甚至人们认为自己拥有自由意志。无论是否同意此观点,仅从逻辑上说,人们也必须承认他自己是无法全面追踪自己大脑的计算过程的,否则会造成自指悖论。然而,只要是计算过程,就必然存在有输入和输出的因果链条。
大数据环境下的认知
考虑有这样一个系统,它有固定的输入和输出端,在输入和输出之间存在着不对外公开的隐藏部分,人们所观察到的只是输入和输出,却无法追踪隐藏部分是如何将输入转化为输出的,这样的系统能否被设计出来?答案当然是肯定的,当隐藏层的层数和节点足够多,并且每个节点之间传输的数据会自动调整——类似于自然选择中所发生的,输出结果接近预期时保留该调整趋势,违背预期时则淘汰该调整趋势。实际上,这大致就是人工神经网络的基本工作原理,在经历足够多的训练之后,这个系统就能以比较高的概率得到预期的结果,然后因为运算量无比巨大,虽然每一次数据传递都是确定的,但人还是无法跟踪由输入条件然后得出结果的整个过程。
有意思的是,由于人工神经网络系统给出的结果只是根据大量训练从而逼近预期,所以,人们的预期决定了系统给出答案的倾向性。想象一下,若询问一台机器:你是否能解释一下你自己是如何得到先前问题的答案的?那么这台机器究竟是该像普通人类那样回答,比如:啊,因为当时发生了某事,后来我就这样想,然后再那样想,然后……于是就这样决定了;或者像一个情商欠缺的技术工程师那样回答:当我回溯思考此过程时,由于思考本身扰动了信息处理的初始条件,从而无法精确还原信息处理的过程。虽然说后者的回答更严谨,但显然,前者才像是人的回答。那么问题是,机器怎么知道人的预期是怎样的。
解答问题的方式有点出人意料,机器并不需要知道人会怎么想,它只要知道,在怎样的初始条件下,人会产生怎样的行为。对人来说,机器内部的信息处理过程是个黑箱,对于机器来说,人内部的信息处理过程也是个黑箱,机器并不用打开人这个黑箱,只需要调整自己黑箱内的数据流的权重,使得输入和输出的因果行为逼近人的预期即可。在互联网和大数据高度发达的当前,机器获得数据的方式比以前容易多了。人们逐渐发现,机器开始写诗——编诗姬写的古体诗比绝大部分普通人写得要更工整优雅;机器开始写小说——《机器人写小说的那一天》入围了日本微型小说文学奖的评奖;机器开始写大部头的音乐剧——Beyond the Fence的剧本、歌词以及音乐都由计算机生成,与David Cope的EMI不同的是,音乐创作中的特征及概念并不是由开发者给定的,而是计算机通过数据挖掘,自主“揣摩”得出的,甚至于人类无法确知这些特征和概念在整个神经网络系统中的呈现形态,因为它们并未被存储在某个确定的节点上。
一个让人有点担心又无法在这里展开讨论的问题是,计算机如果将数据挖掘的对象由人类活动转向它自己的活动,将会产生怎样难以预料的结果?当一个认知过程上升到元认知的时候,计算机是否会逐步萌生出所谓“自我”的概念?
人工智能发展中的人类学习者
在人工智能取得快速发展的今天,作为教育工作者或终身学习者都不得不思考,教育和学习的模式应该有怎样的变化,未来的教学内容又会有怎样的变化。用最概括的文字描述人的认知过程:人在与真实世界的互动中积累了大量的实际经历,在观察、模仿、试错的同时,从实践经验中抽象出概念,或者经由训练形成特定技能,这些概念和技能逐步形成相互连接支撑的网络,最后,对概念的理解和技能被反馈到真实生活中,在实践检验中不断重新调整优化。
由于种种原因,当前的学校教育仍然偏重纯粹的语言符号系统中概念的组织和符号演算方面的技能训练,无论是真实世界中经历的积累以及此后与真实世界的反馈互动都是相当欠缺的。此状况的形成固然有其历史原因及大环境整体因素的限制,但必須认真地考虑,一个人工智能系统,最有优势的地方在于封闭环境中纯粹的语言符号系统中特征的归纳及符号演算。至少在当前,人工智能系统还无法真的像人类那样与真实世界互动,它的互动对象还只能是符号化的数据。作为人,似乎并无必要在人工智能的强项上与其竞争。
当面对一个真实世界时,人工智能的表现还远不如孩子,正如一个实验所揭示的,从未见到过猫的图片的幼儿,在看了几次猫的图片后,就能识别出照片中不同种类不同姿势的猫,而人工智能却要预先看过几千乃至上万张猫的照片,才能达到和幼儿相当的水平。人到底是怎样做到这一点的,到目前还是个谜。尽管做预言家充满风险,但我仍然乐于相信,在相当长的时间里,人的思考和行为具有不可替代性,人将成为真实世界和人工智能系统之间的连接者,虽然有时候是被动的连接者,比如因为大量个人语言交流、出行、购物等信息被人工智能掌握,从而成为不自知的被他人控制的目标;但更应该成为主动的连接者,为达成某个独特目的,利用人工智能对那些与真实世界中信息所对应的符号化的数据进行分析,并由此作为行动依据。
人工智能的另一个重大弱点是,它暂时不具有行动的意向性,未来的人工智能系统能否拥有和人类一样的意向性,也还是个谜。在当前,一个人工智能系统还无法自己制定目标将它的各项超人能力统筹起来应用。就以音乐剧Beyond the Fence为例,就算它编了故事、写了脚本、创作了音乐,它自己却完全没有“意愿”要规划一部音乐剧的创作,因此就更突显人在真实世界中规划、组织和实施项目的重要性。
因此,人要学习成为一个连接者,其“连接”的含义有以下一些。
首先,人要学着充当真实世界和人工智能系统的连接者,一方面要能灵活地制作或调整真实世界中的器械设备;另一方面又要能使用抽象符号将不同的虚拟的人工智能系统、人工智能系统与真实设备连接起来,这看上去似乎和目前创客教育的目标是一致的。
其次,人还要学着充当现有世界和未知世界的连接者,宏观来说,未来的人类世界取决于人类集体的意向,未来是被创造出来,而不是被生成出来的。注意在整篇文章中,这里才第一次出现创造一词,我将“创造”视作这样一个过程:基于对现有模式的体验和研究,某种新模式因创造者的意向出现,首先是创造者本人认可这种模式,然后这种模式被创造者周边认同从而存活下来(或者恰好相反)。创造者仍然可以保有自己天马行空的创造自由,而人工智能系统会帮助创造者从繁复的相对底层劳动中解放出来,还能帮助创造者绕开看似美好但却无法以当前技术力量实现创造者构想的陷阱。
最后,我们将话题转回到音乐,用一个幻想性的故事来结束文章:《小苹果》因其欢乐的旋律和明快的节奏受到众人的喜爱。于是我编写了一个叫“温迪”的人工智能系统,在分析了一大堆和《小苹果》类似的音乐后,她“创作”出一首首好听的《小番茄》乃至《小樱桃》之类的作品,直到某一天,她写出一首在我听来极其难听的歌曲,我还没来得及提出质问,她却打印出一连串表示兴奋的符号:“嗯,我好喜欢这首歌!我的朋友也都喜欢这首歌。”
(作者单位:上海位育中学)