当人工智能“非礼”诗歌
2017-09-13山水如歌
山水如歌
2017年5月19日,微软联合图书出版商湛泸文化在北京发布了诗集《阳光失了玻璃窗》,作者署名小冰。
微软小冰初长成
小冰是谁?微软人工智能机器人。它诞生已三年,能聊天、说相声、调侃、唱歌、写过财经新闻评论、能告诉你明天天气……据悉小冰目前已经拥有超过1亿人类用户,进行了300亿次对话。
现在它出诗集了,摇身一变成了“机器诗人”,变成了她,一个具有少女情怀的“诗人”。在出诗集前,微软小冰在天涯、豆瓣、贴吧、简书四个平台上使用了27个化名发表诗歌作品,几乎没有被察觉出非为人类所作,拥有大量跟帖及评论。
出版方称,在经历2760个小时的推敲细琢后,从“小冰”创作的数万首现代诗中精选出139首,结集出版了这本诗集。没有经过任何润色,连错别字也原封不动保留了,甚至书名《阳光失了玻璃窗》也是小冰自己起的。故这是“人类史上首部100%由人工智能创作的诗集”。
不过据笔者网上查到的法语资料:
Jean Baudot 1964年于加拿大出版了一本书,内容全是计算机生成的诗,题目是《由Jean Baudot开发的会写作的机器:第一部电子计算机撰写的自由体诗集》(“La Machine à écrire,mise en marche et programmée par Jean Baudot:le premier recueil de vers libres rédigés par un ordinateur électronique”)。
Richard W. Bailey 1973年于美国出版了一本计算机生成的诗的选集:“Computer Poems”(《计算机诗选》)。
谁是第一留待他人考证,我们还是先看看小冰是如何写诗的。
“诗人”小冰是如何炼成的?
像人类一样,小冰写诗也不是无师自通的。她师承的导师有519位之多,都是中国现代诗人,年代跨度很大,从上世纪20年代到今天。
小冰的老师包括:胡适、李金发、林徽因、徐志摩、闻一多、余光中、北岛、顾城、舒婷、海子、汪国真……
小冰的过人之处在于:她经过6000分钟(100小时)、10000次地迭代,学习了他们上千首诗,就出师了,出诗集了。
《阳光失了玻璃窗》中收录的139首诗作,每首诗都配有一张图片,可以算作题图诗。
图片是小冰诗歌生成的输入,创作的灵感。这说明小冰除了作诗的功能外,还有一项“看”图的技能:人工智能视觉或计算机视覺(Computer Vision)技能,更准确地说图像理解技能。
一个机器诗人小冰背后,究竟有什么(人工智能)技术?
机器诗歌生成研究从20世纪60年代就开始了,最近几年成了某种热点。
Manurung在2003年提出诗歌自动生成的三准则:语法性,语义性,诗性。
早期的诗歌生成方法,主要有以下几种:基于规则和模板的方法,基于进化算法与遗传算法的方法,基于统计机器翻译的方法。
2006年由Hinton等人提出的深度学习(Deep Learning),有了大发展,成了人工智能领域内最热门的话题。深度学习基于深度神经网络,卷积神经网络,深度置信网络,递归神经网络……
而在自然语言处理领域(语音与文本),应用更多的是递归神经网络。比如清华大学孙茂松团队,及英国爱丁堡大学都曾推出基于递归神经网络的中国律诗生成模型;美国南加州大学曾推出基于递归神经网络的英语诗歌生成模型。
在网上没有找到关于微软小冰的技术细节,几乎可以肯定应用了深度神经网络,估计有几个不同类型的神经网络分工协作:“图像理解” “第一句触发”“诗句生成”。似乎诗集《阳光失了玻璃窗》中的诗不分段落,否则还需要“段落生成”子系统?
图灵测试,或你能看出哪些诗是机器写的?
所谓图灵测试(The Turing test),指测试者(一个人)与被测试者(一台机器)在隔开的情况下,通过一些装置(如键盘)进行对话的试验。经过多次对话测试后,如果有超过30%的测试者不能确定出被测试者是人还是机器,那么这台机器就通过了测试,并被认为具有人类智能。在诗歌背景下,图灵测试转换为判定诗是人或机器所写。
2016年3月20日,清华大学语音与语言试验中心公布了一次人机诗词写作大赛结果。清华的作诗机器人薇薇写的诗中,有31%被认为是人创作的,根据图灵制定的标准,薇薇在此次大赛中成功通过了图灵测试。
薇薇作品两首:
《早梅》
春信香深雪,
冰肌瘦骨绝。
梅花不可知,
何处东风约。
《镜》
照影金精映,
钗头角黍青。
白发红袖下,
明月满庭清。
土耳其伊斯坦布尔知识大学(Istanbul Bilgi University)2016年5月介绍了一个叫ROMTU的土耳其语诗歌生成系统,以48.63%的百分比通过了图灵测试,即48.63%的测试者将ROMTU生成的诗看作是人创作的。
其实,第一次听说微软人工智能机器人出诗集时,一点也不吃惊,毕竟人工智能已经渗透在很多领域了:图像处理,语音识别与生成,围棋(AlphaGo)……
当时第一个问题是:为什么“少女情怀”?
微软的小冰,清华的薇薇,《机械姬》(Ex Machina)中的伊娃(Ava),《她》(Her)中的萨曼莎(Samantha)……看来男权主义幻想要从人界像癌症一样扩散投射到机器人界,这是题外话。
小冰,你叫诗坛如何说你
对微软小冰出诗集,诗坛的反应不一。这里摘录两位诗人的观点。
向以鲜:微软发布智能诗人小冰新诗集《阳光失了玻璃窗》,再一次证明:(1)要把诗歌写糊涂,写得不知所云,写得云里雾里,故弄玄虚,装神扮鬼,东一榔头西一棒子,写得天下人都读不懂(当然他自己也读不懂),确实是一件低能的、容易的事!比如微软小冰就可以做到,平庸者可以做到!这种诗风正好对应另外一种当下亦颇为流行的,有考证癖和过度解读的伪诗歌批评者的隔靴搔痒症。(2)要把诗歌写好,写得清晰,写得鲜活,并且强烈介入我们的肉体、介入我们的心灵、介入我们的当下,介入我们民族或祖国最深的痛处,至少小冰目前还办不到,平庸的诗人办不到!(3)我的诗歌美学标准,仅代表个人的标准,不是普适的标准,我愿意再次重申:清晰、鲜活、介入、节奏和想象力……
盘予:人生是一种悲剧,对于所在的宇宙知之甚少,基础的哲学问题尚未解决,我们写诗,只不过消解一下命运的悲剧浓度而已;不同的人生阶段对于世界和宇宙的认知都不同,这些呈现在诗里,都带有人情味。或许有一天俯瞰时,昔日的想法难免幼稚,但这就是人生轨迹。机器写作缺乏的就是这些,统计、分析、编程,把汉语变成了一种赤裸裸的工具,没有意义。笔者不想妄谈“灵魂”之类在诗歌内外都虚无缥缈的话题,只从技艺角度来讲。像汉语律诗或日语俳句这类相对来说简单、有形式化约束的诗歌,目前机器就处于“有句有诗”阶段;至于现代诗,机器能写出新颖有新意的诗句,但尚处于“有句(无诗)”阶段,在不远的将来定能写出“有句有诗”之短诗。机器写诗对人类来说是挑战也是促进,诗人将不得不尽力地创造新的理论、新的题材、新的手法、新的风格……防止被机器模仿。(作者为系统控制与人工智能博士,供职于法国一跨国IT公司)endprint