人工智能驱动的艺术形态的认知与创新
2021-01-20王伶羽胡洁
王伶羽 胡洁
(1.上海交通大学,上海 200240;2.武汉设计工程学院,湖北 武汉 430000)
人工智能是在1956 年美国达特茅斯学院暑期论坛上首次提出[1]。经历了3 次浪潮,第一次浪潮的关键词是“推理”,标志是由阿瑟·塞缪尔的理论编写的西洋跳棋程序于1962 年战胜了美国的西洋跳棋大师[2]。第二次浪潮的关键词是“认知”,标志是深蓝在1997 年战胜世界国际象棋冠军卡斯帕罗夫[3]。第三次浪潮的关键词是“创新”,标志是Google 旗下的Deep Mind 公司研发的人工智能AlphaGo 于2016 年战胜了围棋世界冠军李世石。2017 年7 月8 日,为了抢抓人工智能发展的重大战略机遇,中国国务院印发并实施了《新一代人工智能发展规划》[4]。
人工智能的第二次与第三次浪潮有力推动了艺术形态的认知与创新。人类的艺术创作从模仿开始,通过模仿来认知艺术作品,进而进行创新的艺术创作。人工智能技术的持续发展,不断突破了人类的能力,不但可以做到认知艺术作品,更能做到创作艺术作品。
1 艺术形态的构成与认知
1.1 艺术形态构成要素
艺术形态指的是以人为创作主体,通过视觉“形”传达创作者的意图“态”,引发受众心理“态”,以达到创作者目的(图1)。
视觉“形”基本构成要素:
内容:人物、动物、植物、食物、建筑等。
形式:二维、三维。
造型:点、线、面。
色彩:红、黄、蓝三原色。
构图:满幅、三角、边角、留白等。
1.2 艺术形态的认知
视觉传达构成要素组合成一件完整的艺术作品,其核心功能为传达创作者的“态”,一件成功的艺术作品,能准确传达创作者的“态”,建立起创作者与受众之间的信息沟通。
创作者与受众之间建立的“心理态”是通过创作者情感意图,建立起与受众之间的情感交流。常见表达载体:绘画、雕塑等纯艺类视觉表达作品。
1.2.1 《星空》的艺术形态的认知 以19 世纪末荷兰印象派画家梵高代表作品《星空》为例(图2)。作品创作的时间背景是1889 年,当时的梵高入住法国圣雷米精神病院,已经处于精神崩溃的边缘,于第二年也就是1890 年,梵高开枪自杀离开了这个世界。
《星空》展示的视觉“形”——内容:星空、树、房屋,当时的梵高已经入住法国圣雷米精神病医院,所表现的对象都是在此医院所看到的对象;形式:二维油画,19 世纪末印象派美术的诞生,标志着现代主义艺术开端;造型:线条的组合,这是梵高最有个人标志的视觉“形”表现方式,用笔大胆有力,调条卷曲层叠成云,一圈又一圈的光晕,旋转流动;色彩:主色调蓝与黄的对比色,饱和度极高、炽热感人;构图:满幅,整幅作品星空占超过60%的篇幅,给人以空间无限延伸的错觉。
图1 艺术形态构成要素
图2 《星空》的艺术形态的认知
图3 《呐喊》的艺术形态的认知
《星空》所表现的心理“态”——通过作品线条的蜷曲、层叠组合,色彩的强烈对比与炽热,构图的无限伸展,受众的情绪已经走入梵高的情感引导,可以感受到即便在精神问题严重困扰他的当时,他仍然对生命有着无限炽热的渴望,可是现实的困难让他不知所措,最后以视觉的“形”表达他内心真实纯朴感人的“态”:压抑、纠结、无奈。
1.2.2 《呐喊》的艺术形态的认知 以20 世纪挪威籍德国表现主义代表艺术家爱德华·蒙克的代表作品《呐喊》为例(图3)。在爱德华·蒙克幼年时期,父母和兄弟姐妹接二连三地死去,死亡烙印在他的生命里,同时本人体弱多病,严重打击了蒙克对生活对生命的认识,长期情绪压抑且悲观。
《呐喊》所展示的视觉“形”——内容:人物、天空、海水,内容表现的地点为从厄克贝里山上俯视的奥斯陆峡湾;形式:二维木板画,共有4 个版本,分别为蛋清木板画、彩蜡木板画、彩粉木板画、蛋清木板油画;造型:线条组合;线条粗旷有力,强烈的节奏感;色彩:红蓝为主色调,火山爆发把天空染成了血色,蓝色的海水附着着压抑的棕色,整个画面色彩沉重压抑;构图:满幅的构图,背景海水的延伸感强烈。
《呐喊》所体现的心理“态”——通过作品的视觉“形”,可以看到血色映衬下的天空与深蓝色海水、城市融为一体,似火又似血,廊桥上,棕色的人物正在呐喊尖叫,表情扭曲、痛苦,受众正是在如此组合的视觉“形”之中,已经感受到莫名的恐惧与战栗,大自然中仿佛传来一阵震撼宇宙的呐喊,最终映射出作者对生命“态”的认识:痛苦、压抑、恐惧。
综上所述,作品中所有的视觉“形”都是为了传达创作者的精神“态”,通过建立艺术作品的“形”与“态”的联系,可以认知艺术作品,这是进行艺术创作的基础。
2 人工智能驱动的艺术形态的认知
人类通过视觉与大脑来认知艺术作品,建立起“形”和“态”之间的关系。人工智能也需要像人类一样,通过机器学习,建立艺术形态的“形”和“态”之间的关系。
人的认知是人脑通过外界输入的信息,经过脑神经的加工转换输出的过程。人工智能在创新视觉设计形态中经历的第一阶段:认知。
人类的一生都在通过不断地学习来提升上述解构和认知事物的能力。小的时候,看到一只猫,人们了解到它最浅层的一个语义,即它是一只猫。而随着人们的不断成长和学习,对于这只猫的语义理解也在不断深化,逐步认识到它的大小、形状和颜色,认识到它是否温驯乖巧,认识到它是否危险、是否可以触碰,这些语义信息是我们通过学习不断地从浅层到深层构建起来的,而随着学习成果的累加,这些语义体系也在不断深化[5]。因此,为了实现艺术形态的认知,需要对艺术形态的内容、形式、造型、色彩、构图进行深度学习。
人工智能也需要和人类一样,通过机器学习来认知这个世界。人工智能从生命机理中获得灵感,能够通过神经网络模型从图像中识别出事物,并基于训练好的模型进行图像的识别与认知(图4)。
2016 年,Google Deep Dream(GDD)利用神经网络技术,训练计算机识别图像,并进一步生成艺术化图像。通过深度学习,人工智能能够实现高效地将视觉“形”中内容、形式、造型、色彩、构图各要素提取出来,其速度和准确性是人类无法企及的(图5)。
人工智能通过深度学习能够在纷繁的图片内容中归类整理分辨出视觉“形”中的各要素,实现对视觉领域的认知,这是人工智能在后期创作出创新视觉形态的关键性发展。
图4 基于人工智能的猫的认知[6]
图5 人工智能解构了图像背后的语义信息[7]
图6 城市一角的写实摄影作品[9]
3 人工智能驱动的艺术形态的创新
画家的成长体现了从模仿到创新的过程。生成对抗网络的训练也是从模仿到创新。使用了超过8 万幅15-20 世纪的西方绘画,对算法进行训练。
人工智能驱动视觉形态的创新设计发展过程中,科学家不遗余力地生成计算机对视觉“形”的认知能力,通过对视觉“形”的认知,进而提升人工智能的创新视觉生成模式。
2014 年,Goodfellow 等提出 GAN(Generative Adversarial Networks) 生成式对抗网络模式,GAN 的基本思想源自博弈论的二人零和博弈,由一个生成器和一个判别器构成,通过对抗学习的方式来训练,目的是估测数据样本的潜在分布并生成新的数据样本。
2017 年,在GAN 的发展下研发了CAN 程序(创意对抗网络,Creative Adversarial Networks)。通过修改网络目标,使其尽可能地偏离已经确立的风格,同时又尽量保持在艺术品范围之内,从而创造出创意的图形。这种程序,使得计算机不再是简单地复制模仿对象,而是通过模仿人类创造性活动,一定程度上能够独立创造出有风格的艺术品[8]。
以图6 所示的城市一角的写实摄影作品为例,通过融合不同风格的绘画作品,展示人工智能驱动的形态创新。这种融合创新实质上是一个艺术作品的“态”(风格)与另一个艺术作品的“形”(内容)的融合。
图7 为融合梵高《星空》元素,形成后印象主义风格的创新作品。通过人工智能算法融合梵高《星空》视觉元素中的风格,该案例的特点是其最具特征的线条与色彩,在融合风格生成创新艺术作品过程中,线条方面,算法汲取了《星空》线条卷曲、层叠的云朵造型;色彩方面,同样以《星空》中高饱和度的蓝黄对比运用,使作品在视觉形态传达中,呈现出梵高所代表的后印象主义风格的情感性。
图8 为融合蒙克《呐喊》元素,形成表现主义风格。《呐喊》中让人印象最为深刻的是画面前端站立的恐惧紧张,作呐喊状的人物以及人物背后在火山爆发后海天融合,血色延绵扭曲的场景。人工智能在图像形态选择时,因原图无人物出现,所以汲取了背景中海天延绵扭曲血色,造型中也汲取了《呐喊》原作中粗放且具有强烈的节奏感的线条,使整幅作品在“态”的传递中呈现出与《呐喊》一般的压抑、紧张的气氛。
学生是小组合作教学的主体,但教师更要积极发挥自身引导的作用,确保小组合作教学的顺利开展。小组合作教学完全需要学生自主进行学习,这很容易导致课堂秩序混乱,学生讨论内容偏离教学知识,使教学达不到预期的效果。因此,教师在教学中清楚自己的定位,在遇到有难度的教学问题时及时对学生进行引导,开阔学生的思路,使学生能形成新的知识见解,促使小组合作的有效开展,提高学生小组合作的学习效率。
图9 为融合毕加索《坐着的裸女》元素,形成立体主义风格,融合康定斯基《构图7》元素,形成抽象主义风格,以及融和透纳《运输船遇难》元素,形成早期印象派风格的3 幅艺术创新作品。根据对艺术爱好者、专家们进行的双盲测试,结果显示CAN 程序所创作的绘画能够成功骗过人们,也就是它们顺利通过了图灵测试,计算机似乎真的在视觉艺术领域实现了智能化[9]。
以上3 个案例有共同点,都是风格和内容的融合创新,从艺术的角度,都是从线条、色彩等要素进行风格提取;不同点是3 个艺术作品的风格是不一样的,这也从另一个角度展示了人工智能驱动的艺术作品创新具有普适性。
通过上述人工智能创新设计形态生成,不难发现,人工智能在艺术领域的研发一直沿着对视觉“形”的认知和创新的道路。
2015 年阿里巴巴开始研发的VI 视觉系统,实现了对创作者“态”赋予视觉“形”的人工智能系统——鹿班。系统的整体框架有3 个核心单元。第一核心单元,从过去海量的设计稿中利用深度学习提炼出设计经验。第二核心单元是行动器。根据设计经验鹿班会在原油设计基础上,从一个海量的设计素材库里索引,匹配和替换其中的元素,然后经过大量的计算跟迭代,最后生成一张新的图片。这其实就是强化学习的过程,就是在一个受限的空间和范围内去不断尝试,通过内部或外部提供的反馈,得出一个最优的结果。第三个核心单元就是评估。因为鹿班会得到非常多的结果,需要一个评判的机制来鉴定这些结果是否符合设计的要求和标准。目前评估问题系统还未达到很好的解决能力,如何让人工智能具有审美能力,也是鹿班工程师们接下来需要研究的技术难题。
2016 年阿里用鹿班系统制作投放了4.1 亿张海报广告,相当于200 位设计师不吃不喝做200 年的工作量。人工智能创新视觉设计对创作者“态”的准确表达,已经为阿里产生了不可估量的价值,但与此同时,也使阿里VI 设计师们陷入深深的忧虑中[10]。
4 人工智能驱动的艺术形态创新的思考
2018 年10 月,佳士得纽约拍卖会拍出了一幅由人工智能创作出的画作《贝拉米伯爵》(图10),该画作拍出了43.25 万美元(约合人民币300.98 万元)的惊人价格,而其右下角的一串神秘公式正是其作者的签名——生成这幅画作的GAN 所使用的损失函数。
当人工智能创新视觉设计可以准确表达出创造者“态”,充当VI 设计师时;当人工智能所生成的作品可以进入拍卖市场,并以实际价格成交时,人们不禁开始怀疑,是否还需要原创艺术家、设计师?人工智能的“态”是否真的可以达到艺术家的水平?
首先,应该肯定艺术家的原创价值。在人工智能创新视觉的发展过程中,“认知”是前期所要掌握的基本信息储存,再根据储存信息的提炼进行“创新”。试想如果没有原创艺术家的艺术原创,人工智能“认知”模式该如何开启,以图7-9 为例,没有梵高、毕加索、蒙克所代表的各类艺术流派,人工智能如何实现对原图的风格改造?所以必须正视艺术家原创性的珍贵与价值。
图7 融合《星空》风格后的艺术创新作品[9]
图8 融合《呐喊》风格后的艺术创新作品[9]
图9 人工智能驱动的艺术创新的案例[9]
图10 人工智能画作《贝拉米伯爵》[11]
其次,对艺术家、设计师提出了更高的要求。以鹿班系统为例,所生成的海报基本可以达到有两年工作经验的VI 设计师水平,但是系统性的、高水平的视觉形态设计,仍然需要设计们的巧思。同时鹿班系统的第3 个核心单元——人工智能的评估能力,一直是技术人员无法完全克服的难题。人类的审美能力是一个相对抽象的概念,人类且需要长期的训练、学习甚至于天赋所给予,更何况让计算机完成这样不可能实现的任务[12]。所以在人工智能技术高速发展的今天,设计师只有不断提高自身的业务能力、审美水平、鉴赏能力以及综合素质,才能在当下乃至未来依然领跑于行业,不可取代。
5 结语
人类已经进入科学融合艺术的时代,人工智能对艺术形态从“认知”到“创新”,大大提高了艺术生产力,人们在享受人工智能在艺术生产力中成果的同时,一样需要肯定艺术家、设计师原创作品的价值。科学与视觉形态的完美融合代表着时代的进步,鼓励两者的协作发展,为社会及人类发展带来高效、便捷视觉形态生产力。