人,AI与写作阅读
2019-04-22丁云
记者 丁云
田耳2007年凭借中篇小说《一个人张灯结彩》获得第四届鲁迅文学奖,是迄今最年轻的得主。走走是原国内大型文学刊物《收获》杂志著名编辑,现在是类型文学全版权孵化平台谷臻故事工场的CEO,谷臻故事工场做了很多关于AI的项目。近期,两人在一场名为《未来的文学:人工智能可以取代写作吗?》的对谈中,谈了与人、与写作、与情感,与AI相关的各种有趣好玩儿。
写作,源于扎实的体验
在田耳的小说里,多有警察、辅警、道士、空调修理员这样的角色,这些也确实是他原本乡情生活的一部分。按照他的说法,写小说的人,进入社会工作也就那么几年。他干过小报编辑、空调推销员、空调店经理,给一个老板养过2年斗鸡,待到作品发表后就专职在家当作家,那几年社会经历丰富而宝贵。
他写道士生活写得那么贴,是因为有两三年里,他有缘反复和一个道士接触。那是他同学的爸爸,同学又恰非常爱谈爸爸,相信道士爸爸确有法力,他们租住在一块,这位爸爸也常来看儿子。
田耳说自己是体验型作家。与当上作家以后再去体验生活,旁边就有一个宣传干事跟着相区别,成为作家之前的经历就非常带劲了。写《天体悬浮》时,他是一个没工作的社会青年,干了各样活计。有位亲戚是派出所所长,叫他帮着编工作简报。两个月时间里,派出所的警察每人都会很高兴地给他讲他们的经历故事,也没防着他,甚至审犯人、抓吸毒时都带着他。他把一个基层派出所的行为了解得一清二楚。后来写《天体悬浮》时,他特别有一种来劲的感觉,因为心里面扎实,有底,“那种生活你是实实在在进入过。体验过和没体验瞎想,完全是两回事儿。”
现在再写长作品时他有困扰,这种生活体验的内容必须本身得有吸引力,另外,以什么方式介入也是个问题。人到中年,已无20多岁时自带的一种流浪汉气质,年轻时候的体验最好。
虽然外界认为,田耳喜欢写边缘人物。但他自己认为,可能他自己也是边缘人。20多岁时没工作,到处打工,当时以为那就是生活的全部,无所谓边缘人物或中心人物。回头再看,全世界的短篇都写底层人特别活跃,给他的感觉就是“短篇是写底层、失败、焦虑、困扰的人”,如果试着用短篇写高大上的生活,反而很难。
寻找另一个“我”
如果下一部小说要写AI机器人,田耳更倾向于写机器人伴侣。AI发展到现阶段,人类发生了什么?生活上的变化已经瞩目,反而感情上的变化模糊不清。他其实想写一个爱情故事,两个人排除万难,1000公里走了999公里,还剩最后1公里,眼看就要走到一起时,一个机器人插了一腿,机器人的意外出现改变了人的情感方式。
与其讨论如果有一天,AI能取代人,不如讨论点儿别的,比如人和机器的情感。智能机器比如手机。现实生活中,丈夫与妻子相互离开十天、半个月不一定想念,但手机一刻不能离。依他来看,以往5000年只有人和人的感情,现在人和机器的感情越来越深,这是以前没有过的。
当走走提示,或许人们有一种“AI在无形之中塑造、改变人”的恐惧。如果说话态度很凶,AI可能不给回应。人们已经习惯了生活周围的智能家居,人的语言、习惯、表述等人格的所有都在参与与机器之间的相互塑造。田耳觉得没必要,“我们现在距离上世纪80年代也就30多年,已经改得天翻地覆。往前想,当时也是恐慌,事发时已浑然不觉。”
谷臻故事工场引入了一套人工智能观影系统。以一秒钟800祯的清晰度,记录人观看电影、小说时的所有脸部表情数据,包括眉毛、眼角、嘴角、鼻孔等,以及外接记录心跳等数据,最终判断这个人对电影、小说的喜欢与否,大概有喜怒哀乐等7种感情。
这套系统引进,为开发成读小说的软件作数据参照。结果田耳参谋,大市场做相亲软件更合适。他们还真实验过,选10种女性形象,长发、天真、萝莉、御姐等,每人讲1分多钟录制一个小短片让男性观看,记录他的喜怒哀乐点,能看出什么类型他一见钟情,什么类型没有感觉。
田耳给起了一个名字,“灵魂伴侣”。后来转念,“其实没几个人有灵魂,干嘛还叫灵魂伴侣?”重取了一个名字,叫“另一个我”。既然 AI机器人有那么强的阅读力,有用云数据计算、调查、配对的强大能力,得去做每个人都会接触的事情。婚姻中,大家骨子里是找生命中的另一个“我”,做这个大家都会来劲。
黑暗中,AI认出了另一个AI
目前为止,AI介入写作的程度,比我们大多数人认知的更深。
谷臻故事工场用了大概一周时间做中国首个AI文学榜时,让AI在2018年20本文学杂志共771部短篇中进行评选。一直到截止前几个小时,它选出的最优都是莫言的短篇。直到最后一天下午2点多,送来了80部短篇,AI选出了最佳年度短篇小说,是科幻作家陈楸帆作品。人工打开这部小说,结尾有一句话,凡是楷体打星号的部分全是AI写的。
事情缘起于陈楸帆跟创新工场合作开发了一个写作软件。最初用陈楸帆自己的约100多万字的文本作训练,AI形成的段落和句子上下前后间难以形成逻辑。陈楸帆把文本范围扩大,把自己所有阅读过的、喜欢的小说全部输入,达到几千万字的训练量后,形成的大概四行字一段的段落之间有了上下文逻辑,句与句之间的语法也吻合。但小说最终为什么是分开来嵌在文本当中呢?因为上下段落没法形成联系,走走猜测,可能要达到10个亿的文字量才能训练出来。但是,这个AI写出来的东西跟陈楸帆的文笔风格是一样的。
所以走走的结论,AI既是客观,也是主观。771部小说里面,它选出了它的同类写出来的作品,这在当时没有想到。以致田耳戏谑,“机器人搞起关系来比人还不要脸。”
机器训练的深度学习是一个黑箱模式,人不知道AI在学习过程发生了什么。“你很难想象一个AI和另外AI在黑箱相遇,认出来的那一刻。”
还有一个有意思的地方。谷臻故事工场做AI文学榜时,让 AI在最好的杂志里选出最好的一批,因为是以一本杂志一年所有的短篇的方式输入,AI有一个概率算法,它会分析杂志的风格,也就是说,当它认为这本杂志整体偏向于讲鸡毛蒜皮的故事时,就把其中最鸡毛蒜皮的故事选出来,所以机器深度学习算法是可以用来做未来的趋势预测的。
或许未来,阅读趋向于私人订制
谷臻故事工场的这个AI,训练时用了大概1个多亿字的文本训练,包括四大名著、《收获》40年来所有短篇、中篇、长篇等,是一个既看通俗文学,又看经典文学、纯文学的AI。但内部发展的轨迹变化并不知晓。
走走认为,这个AI可能还有另外一个算法,一部小说的节奏。类似于勾股定理、黄金分割这样的定律、公式,AI应有一个对于文字节奏、情节密度的把控算法。她后来看了陈楸帆小说的那根线,是沿着中轴极其对称的,几乎没有任何偏差的线,猜测可能在AI创造过程中,很容易把这种“公式”优美的作品挑出来。
AI可以是一面镜子,更是一面放大镜。亚马逊当年开发一个AI用来招聘,发现这个AI非常种族歧视、性别歧视,再后来发现是人造成的。把亚马逊几十年来所有招聘收到的简历输入,再输出最终聘用的人的简历。人是什么样的选择,机器就会显现什么样的选择,甚至经学习后放大结果。
人类只有通过深度体验,才能写出接地气的作品。与其讨论让AI取代人,写出这样的作品,田耳更期待有一天,AI绕过了一切对人的模仿,创造出以人类现在的脑袋完全不可想象的新文本、新模式、新类型。
以目前的进展,AI写作实质是给出陌生化的搭配,虽然足以给人惊喜,却无法跨越类型。就是说,如果从田耳的文本中学习,AI作品会有田耳作品的所有关键性元素。日本的AI小说就屡获大奖。但有如俄罗斯的尝试,输入陀思妥耶夫斯基、托尔斯泰的小说,AI无法创作出一部逻辑缜密的推理小说,因两人作品中几乎没有类似类型,而只能完成一封情书,其中一段与托尔斯泰《战争与和平》场景相似,充满想象,又显得陌生。
以“日更”为标准的类型化小说,已完全可由AI满足。一个人一生大概读1800本书,国内AI一分钟读800万字,阅读量远大于人。解决语言问题,产出即可无穷尽。现有技术,已可根据一个人当下的大脑电波,生成音乐和画面来调整情绪,达到喜悦状态。未来,每个人也会有一个一对一提供订制服务的AI作家。