AI来袭 微软小冰创意绘画揭秘
2019-10-30小智
小智
少女画家小冰
现在我们打开微信小程序里的“微软小冰”,将会发现她多出了画画的新技能,点击“少女画家小冰”即可委托她创作一幅画了,而且是独一无二的原创(图1)。
输入一段文字描述你希望得到的作品后,小冰立刻开始工作,经过后台服务器一系列的操作,很快一幅绘画作品便大功告成。除了画之外,小冰还会配上诗一般的题词,并且给每幅画打分评级(图2)。
在大约3分钟时长的作画过程中,小冰的工作大致可以分成三大阶段:首先是提炼主题,接着是构图造型,最后是上色打磨。下面就让我们深入这些过程,看看后台到底发生了什么。
①小冰的原创绘画代表作
②根據笔者输入的“美好未来”绘制的五星级画作
从意象中提取情感和主题
一切的起点来自于用户的输入,所以小冰首先要能理解用户的要求是什么,这就涉及到自然语言理解技术(Natural LanguageUnderstanding,NLU),这也是Al的核心课题之一。
目前NLU可以接收三类输入:文本、图像和声音。虽然现在小冰仅支持文本输入,不过这对小冰来说并没有太大关系,因为图像和声音输入终究也要被转换为文本,本质上它们不过是多了图像和声音识别的过程而已,而这方面的技术实现已经不成问题。
接收文本之后,接下来小冰需要“理解”文本所要表达的语义,这需要一定的智商(IQ)才能完成。比如一个词、一个句子,在不同的语境中可能会表达出多种不同的意义,有时甚至是完全相反的意义,所以小冰必须要进行词法、句法、语义等一系列的分析,以及进行“消歧”、篇章整合等一系列的处理,最终表征出文本的语义(图3)。
人类语言的魅力,在于它有着丰富的潜台词,在文本显式的语义之下,还潜藏着说话人内在的情感、态度以及各种微妙关系等,对这方面的理解就需要足够的情商(EQ)。
③自然语言理解过程
④延伸意图的提炼与创意情感内容生成示意图
在AI情商方面的探索,微软花了近五年的时间,发展出一套底层情感计算框架,它可以从获取的文本中推理出用户的情感和意图,转而再以此意图为主题进行创意性的表达输出(图4)。
对原始关键字进行语义延伸,确保了小冰每—次的内容输出都是原创性的。我们可以试验输入同样的关键词,一遍遍地让小冰重复绘画,每次都会得到完全不同的结果(图5)。
⑤同样的关键词“美好未来”得到的截然不同风格的绘画
从经典中汲取画作风格
有了核心创意和主题,接下来就是较为具体的工作了,首先是构图确定造型,然后是着色并进行细节打磨。这两个阶段的核心,都是通过机器学习技术来实现的(图6)。当然作为艺术创作的算法,并不是遵循一套即有的规则进行绘画,而是通过分析无数的绘画资料,“学习”(提取)其中特定的美学,再通过算法尝试生成符合该美学的新画作。当然这里是指风格的符合,不是指内容的符合,那样就成了抄袭,而不是所谓原创了。
小冰像人类一样,曾被送到中央美院实验艺术学院学习(学名“夏语冰”),其实就是请导师对模型进行优化、改进而已。小冰所用到的训练库,是过去400年间近236位人类画家的作品,而导师又特别为小冰设定的是伦勃朗的“女儿”,这使得小冰在模仿伦勃朗画作风格方面,显得非常突出,她的成名作及其毕业画展的许多作品,就有着浓厚的伦氏风格(图7)。
AI著作权的困惑
著作权法保护的是人类意志的产物,而AI并非人类,由它创作的作品是否也应该受到保护?如何去保护?其权利又归谁所有呢?
有些专家认为,AI作为非自然人和法人,如果对它们所产生的内容进行保护的话,必然会对传统著作权的客体认定标准和权利归属原则产生冲击。所以应该将AI所创作内容的著作权,归属到AI所有者所有。
据报道,微软(亚洲)互联网研究院已经宣布,他们放弃诗人小冰所作诗歌的著作权,并公告称,人类在小冰诗作的基础上完成最终创作,应能独享该诗歌最终作品的全部权利。那么画家小冰所作画作的著作权又将如何归属呢?我们还需拭目以待。