应用AI绘画辅助插画设计的实践与探索
2024-04-03曹娜
摘 要:AI飞速发展所导致插画行业的变革正在萌芽,AI绘画也受到了人们的广泛关注。本文从AI绘画的发展现状入手,分析了AI绘画的原理,结合AI绘画工具辅助插画设计的前期和中期阶段的实际案例,探讨AI辅助插画设计实践探索的可能性,旨在探索如何利用AI技术提高插画设计的效率和质量,以期为插画从业人员提供新的思路。
关键词:AI绘画;插画设计;AI绘画工具
一、插画设计的发展
插画设计是指运用手绘或电脑绘画技术,创作出用于出版物、广告、包装、产品设计等领域的平面图像。插画设计的目的是为了传达信息和概念,增强视觉效果和吸引力。插画作品通常具有强烈的个性和创意性,能够吸引人们的眼球,并通过图像来表达复杂的思想和情感。插画设计的发展可以追溯到古代文明时期,如埃及、希腊、罗马等文明都有插画作品的存在。现代插画设计的发展可以追溯到文艺复兴时期,当时欧洲的艺术家们开始将插画作品应用于印刷品的制作中。随着印刷技术的发展,插画设计也得到了进一步的发展和应用。
20世纪初期,插画设计成为了广告和出版业的重要组成部分,随着摄影技术的普及,插画设计的重要性逐渐减弱。但是,随着数字技术的发展,插画设计再次获得了新的发展机遇。现代插画设计采用数字制作和处理技术,使得插画作品的制作更加便捷和高效。同时,插画设计常用于儿童书籍、漫画、广告海报、标志、T恤、海报等,成为了现代文化产业中不可或缺的一部分。随着AI绘画工具的发展,插画设计将迎来新一轮的革命,使用AI绘画工具只需要输入指令,不需要人类参与到绘制过程,便能够快速生成从令人惊艳的画作。AI绘画工具的便捷引起了人们的广泛关注和讨论,为插画从业者提供了新的可能和机遇。
二、AI绘画的原理
AI绘画是一种使用人工智能技术进行图像生成和绘画创作的方法。本质上它通过对已有的大量藝术作品的学习,利用算法对作品的内容和风格进行解析,生成新的作品。它的实现离不开图像风格迁移技术、图文预训练模型和扩散模型的发展[1]。图像风格迁移技术很大程度上依赖生成式对抗网络(GAN)算法,GAN算法是一种深度学习算法,它可以通过学习数据集中的图像来生成新的图像。它由生成器和判别器这两个神经网络组成。生成器负责生成绘画作品,而判别器负责判断生成的绘画作品是否与真实绘画作品相似[2]。通过反复迭代训练,生成器可以生成越来越逼真地绘制作品,而判别器也会变得越来越准确。相比传统的计算机图形学技术,GAN算法可以通过学习艺术家的作品从而生成更加自然、具有个性化风格的绘画作品。
图文预训练模型的出现加速了AI绘画的发展,以支撑图文预训练模型的可对比语言——图像预训练(CLIP)算法为例,它可以利用图文的特征,将两者“对齐”,再结合已有的生成模型实现“以图生图”或者“图和文生图”。操作人员使用自然语言就可以操控模型生成绘画作品。
对于AI绘画的崛起,扩散模型起着至关重要的作用,它的原理是通过人为逐步添加噪声,让图像逐渐变“模糊”,再不断学习去噪过程,如此人工智能就能从完全是噪声的图片中逐渐还原出清晰的图片,即“画”出图像[3]。
三、AI绘画的发展历程
早在20世纪60年代,艺术家和科学家一起创造出了一个全新的艺术形式,即“算法艺术”。“算法艺术”这种艺术形式利用计算机程序和算法来生成图像、动画和交互式作品,它强调了过程和代码的重要性。早期的“算法艺术”作品常常是一些抽象、无序的图像,它们可以在电子屏幕上随机变幻,展现出不同的色彩、形状和运动轨迹。这些作品的生成过程是由程序自主完成的,艺术家只需要设定一些参数和规则,就可以让程序生成出不同的艺术作品[4]。
20世纪90年代,英国艺术家哈罗德·科恩在开始研究AARON①,并在之后的几十年中不断改进程序。经过多年的改进和完善,AARON成为了一款可以自主生成绘画作品的程序。AARON的创作过程基于一系列的算法和规则,包括随机性、重复性和自我修正。艺术家可以通过设定一些参数来影响AARON的创作风格和方式,但最终的作品是由程序自主生成的。AARON使用的算法和规则是基于哈罗德·科恩对绘画和艺术的理解和经验,以及对计算机程序设计的深入研究和实践。AARON的作品已经在世界各地的博物馆和画廊展出,包括纽约现代艺术博物馆、伦敦泰特现代艺术馆和巴黎蓬皮杜艺术中心。AARON的创作方式和作品也对计算机艺术的发展和探索产生了深远的影响,被认为是计算机艺术的先驱之一。
2012年,美国的Andrew Ng和Jeff Dean在Google进行了一次实验,该实验使用1.6万个CPU和1000万个猫脸图片训练了当时最大的深度学习网络,这个网络被称为“Google Brain”,它使用深度学习算法,能够自动识别和分类图像等信息。在这个实验中,Google Brain学习了大量的猫脸图片,并生成了一个全新的猫脸。
2017年7月,Facebook联合罗格斯大学和查尔斯顿学院艺术史系,创造了一个创造性对抗网络,它被成为“CAN”。这一模型的创造为AI绘画的发展奠定了基础,它通过大量学习艺术家作品从而输出独一无二的作品。并且经过研究人员的测试,53%的被测者无法分辨CAN模型生成的是AI绘画作品。这是图灵测试的首次突破。
2018年10月,一幅由AI创作的肖像画《爱德蒙·德·贝拉米肖像》在佳士得拍卖会上,以43万美元的价格出售,创下了由人工智能算法创作的艺术品售价的纪录。这幅画是由一家名为“Obvious”的美国公司使用GAN算法创作的。Obvious公司使用了一个由15000个肖像画组成的数据集来训练GAN算法,并在最终生成的图像中选择了一个男性肖像画。同年,谷歌公司的数字艺术家凯尔·麦克唐纳设计制作人工智能机器“Deep Dream”,它可以通过艺术家的作品进行学习,生成出与该艺术家相同风格的作品。
2021年初,美国人工智能研究公司Open AI发布了广受关注的DALL—E系统,AI开始拥有了一个重要的能力,就是按照输入的提示进行创作。这一系统的发明对AI绘画的发展具有划时代的意义。
2022年是AI绘画的爆发年份,在当年美国科罗拉多博览会的艺术竞赛上,一幅由创作者结合AI绘图工具Midjourney②绘制的《太空歌剧院》拔得头筹,此事件在艺术领域引起了轩然大波。AI绘画开始广为人知,最早引发广泛关注的两个AI绘画工具是Disco Diffusion和Midjourney。这两个软件都是基于人工智能的绘画软件,它们都可以将文本描述生成精美的图片。随着这类平台的兴起,国外的谷歌、微软和Meta等公司都加大了在此领域的研发投入,国内的平台也开始逐渐崛起,例如国内最早出现的Tiamat和百度的文心一格、盗梦师等平台。此外,国外还有Facebook(Meta)的make a scene、微软的Nuwa女娲、Stable Diffusion等人工智能绘画平台。
四、插画师应用AI绘画工具的必要性
插画设计作为商业插画的重要组成部分,要求插画设计师需要具备扎实的绘画技巧、创意思维、审美能力和设计感等能力。插画师在工作中不仅需要美术相关的专业知识,而且还要能理解客户的需求,设计出符合市场需求的作品。这要求插画师需要不断提升自己,以获取适应商业市场的能力。资本市场除了优质的插画内容产出之外,同时追求高效率的产出。2016年阿里公司的“鲁班”AI系统在当年的天猫双11上制作了1.7亿张商品展示广告,达成“千人千面”的广告页面展示效果,显示不同的商品推荐页面,为用户个性化推荐商品,这样的展示效果需要巨大的工作量,这是普通设计部门的人力在短时间内无法实现的。虽然“鲁班”系统本质上只是对已有素材进行组合,需要人类设计师提供最基础的素材,只能支持较为简单和模板化的设计工作。但是,最后的效果也足以冲击到比较底层的美工,顶替了大量的人力。
在AI绘画不断更新迭代的今天,AI绘画工具不仅能够完成简单的画面设计,还可以生成越来越复杂和精美的画面,这不仅对底层美工产生冲击,很多需要高质量的创意插画行业受到了波及。数家大中小型游戏公司对已有的插画团队进行裁员,取消原有的插画外包业务,鼓励企业中的插画员工使用AI绘画工具协助办公。一些自由插画师原本依靠承接外包插画的单子可以获得不错的收入,由于AI绘图工具的风靡,客户对于插画的预算大幅度降低,导致行业内的插画师收入受到了一定程度的影响。面对AI绘画工具出现以后导致行业的巨大波动,美术从业者更应该主动学习,提高自身的竞争力。
AI不具备物理空间的社会生活经历,缺少与人共情的情感体验,而艺术本质上是一种情感的表达,因此,AI作为创作主体存在很大的争议[5]。AI绘画作为辅助绘画工具参与到创作中,通过人类操控进行创作,可以很大程度上弥补这个短板。从本质上讲,人类依然是作为创作主体,而AI绘画是作为工具使用。而且AI工具本质上是从一个巨大的素材库中提取内容进行整合输出,它本身并不具備对情感的理解能力,只能通过理性的专业词语对内容进行提取,这就需要插画师了解各种艺术语言和艺术风格,使用恰当的描述词对AI绘画工具下达指令,这关乎着生成结果的质量,也是人机协作的关键性所在。虽然AI工具省略了人类艺术家常规的创作步骤,仅仅是对现有艺术品进行拼接重组,但是作为提高生产力的工具,它确实有着不容小觑的能力。
市场的需求促使插画师使用AI绘画工具提高生产效率,而AI绘画工具必须借助插画师的力量,才能够发挥到最大效用。
五、AI绘画辅助插画设计的应用分析
目前主流的AI绘画工具主要采取“文生图”和“图生图”两种操作模式[6]。操作者可以使用自然语言对需求画面进行描述或者给出相关图片,AI绘画工具会根据相关指令,生成对应的图片。除了直接使用文和图的指令之外,操作者也可以自己训练模型以达到更加稳定的画面输出。本文将使用以上功能对AI绘画辅助插画设计进行探索。
(一)AI绘画辅助插画设计前期概念图
AI绘图软件给出图1四幅不同风格的图片,我们选择其中一个比较合适的放大,效果如图2,也可以继续选择合适的风格继续生成其他图片。这组图片从选择关键词到生成图片用时不到2分钟,插画师在创作前期进行概念输出的时候,可以借助AI工具,便捷地生成多种风格的图片,便于搜集素材和更好地向客户展示方案。当然如图2所示,我们可以看到左下角的以为男性角色的裤脚是出现了一些问题,右下角的两位女性中间也出现了不确定的图形,画面前方的两位小孩的比例并不是很协调。AI画图不可避免地会出现人物肢体和物理空间的错位,这些都是随机出现的。这些图可以在插画师前期工作时作为一个彩色草图和灵感启发使用,一定程度上提升了工作效率。
(二)AI绘画辅助插画设计线稿上色
在插画设计中,不同的配色方案,对最终效果图起着至关重要的作用。色彩不仅是画面氛围的重要组成元素,更具有直接传递情感的作用。在插画设计中期,在已经确定画面内容和构图的基础上,只对色彩和风格进行多样化的输出。使用AI绘画工具给已有的插画线稿上色,可以在框定的范围内更加稳定的产出图像,这样不仅可以给插画师提供高效的配色方案,还可以直接产生高品质的效果图,降低在上色环节的实验成本,插画师和客户都可以很直观的看到接近成品的效果图,以便确立最终的上色方案。
目前主流的使用AI辅助线稿上色的方法是多样的,基础原理是通过工具识别线稿,在线稿处于完全符合识别算法的理想的状态下,可以得到充分的提取,即可进入下一步上色环节,便于识别的线稿黑白对比明显、线条闭合且粗细恰当。在线稿得到充分识别的基础上,在操作框中添加画面的描述语,运行模型即可生成上色作品。在模型不变的情况下,AI辅助绘画会产生风格相同,配色不同的作品;更换或者添加新的模型,则会产生不同风格和配色方案的作品。
AI绘画工具中支持多种不同风格的模型,这些模型是由官方和非官方两种组织制作,都是基于大量风格化的素材进行机器学习和训练的结果,主要根据画面的色彩、人物造型风格、写实、三维、二维、线描等分类。在辅助线稿进行上色阶段,绘画者需要安装相应的模型,调整各种参数来控制最终的生成结果。从线稿上传到添加描述词,最后选择模型,点击生成,绘画者在短时间内就可以得到一幅作品。雖然目前由于线稿与算法之间不能完美匹配,可能会出现部分区域无法识别的情况,在上色环节也会出现部分区域的颜色不符合物理空间逻辑的情况(如图3),我们可以看到从左起第二幅和第三幅的右边肩部衣袖和左边出现了不同的色块。上色的结果并不是每一幅都有很高的审美,需要多次生成,再进行挑选。即使如此,AI绘画工具的上色效率是传统人工上色所无法企及的。伴随着AI绘画工具的更新迭代,它也在不断得优化,逐步解决出现得问题,变成更加高效的工具。
六、AI绘画辅助插画设计的优势和挑战
经过以上实践可以得知,AI绘画工具辅助插画设计具有很大的优势:第一,AI绘画工具在前期概念图设计和中期线稿上色阶段都表现不俗,可以极大的提高工作效率。第二,AI绘画工具可以快速提供多种不同的概念图和色彩风格作品,丰富插画设计的表现形式和风格。插画师在设计作品时,受个人艺术修养、造型能力和时间成本等多方面因素制约,AI作为拥有复制风格和高效产出的工具,它可以作为人类画师的一个巨大的数据库,提供多种多样的艺术呈现方式去传递艺术家自身的情感,将画家从重复性的劳动中解放出来,探索艺术的边界[7]。第三,AI绘画工具可以降低插画设计的成本和门槛,插画设计从业者都是经过数年的美术专业培训,不仅在造型能力和艺术修养上都付出了极高的时间成本,在进行造型训练的时候,需要大量重复的练习,使专业知识不单单是停留在脑海里,更是要心手合一。AI绘图工具的使用不要求操作者具有造型能力,只是通过对它输入提示词和运行模型,便可以得到一幅作品。操作者只需要对艺术语言有一定的认识,具备艺术史相关的知识储备,对各种绘画风格和代表人物有一定的了解,这极大地降低了插画设计的门槛,人人都可以使用AI工具进行插画设计,效率的大幅度提高和入行门槛的降低,会极大地降低企业使用插画的成本。
AI绘画辅助插画设计有很多优势,但现阶段也有很多不足:第一,由于AI绘画工具在操作过程中有很多不可控的因素,这些都会增加使用者的时间成本和操作难度。插画师在使用AI绘画辅助插画设计时,需要使用准确的专业描述词,例如,画面物理内容、构图、色彩、镜头和风格等,这能提高最后输出结果的准确性,但即使如此,在同操作方式的系统中,前期仍然需要花费大量的时间调试,以获取更为理想的效果图。第二,AI绘画工具本质上不具备创新生产的能力,而是使用已有的绘画作品进行提取学习,再对其进行重组[8]。这种通过他人画作训练出来的模型,被免费放置在公共网络中,任何人都可以获取使用,这使得画家多年来积累创造的绘画风格变得廉价,损害了原有画家的利益。而通过他人作品拼接缝合生产出来的作品是否版权,也有很大的争议。第三,插画行业人才的流失,更低的用工成本会减少插画领域人才的流入,对于想要学习插画设计的人会产生更大的阻力,对于AI工具快捷高效的过程相比人类在进行造型学习会显得更加艰苦。第四,AI绘画工具由于它和常规的绘画流程差异较大,操作者想要得到更准确的结果,前期需要时间成本了解它的运行原理和使用方法,而AI绘图工具也在飞速更新迭代,这也需要操作者密切关注其发展变化,不停地更新自我的认知,养成终身学习的习惯。
七、结语
AI绘图工具已经向大众展示了巨大的潜力,虽然现阶段的AI绘画工具还具有一定的局限性,但是它作为一个高效的工具辅助插画设计可以很大程度上提高工作效率。对比上一轮数字技术发展所迎来的产业革命,这次的革命可能不仅仅是使用工具的变化,而是直接在生产环节上进行了改变,由文字到图画的生成过程,是创作过程的急速飞跃,生产方式的变革迎来生产效率的提升。未来,无论是插画行业的从业人员的数量还是工作方式都将产生巨大的变化。面对这新一轮的技术冲击,插画从业者需要及时更新已有观念,拥抱新的科技,才能在这次浪潮的席卷中站稳脚跟。
注释:
①AARON是由抽象画家哈罗德·科恩(Harold Cohen,1928—2016)在1972年着手开发的计算机绘图程序,这是最早也是最复杂的艺术作品生成程序之一。
②Midjourney是一款2022年3月面世的AI绘画工具,创始人是美国的David Holz。
参考文献:
[1]金凤.AI绘画“小秘密”都在这里[J].科学大观园,2023(4):8-11.
[2]缪虹,王敬雷.AI绘画创作的运行规律及应用[J].丝网印刷,2023(7):96-98.
[3]喻思南.人工智能,如何妙笔“生”画[N].人民日报,2022-12-23(11).
[4]邓静.价值与局限:人工智能绘画作为新型艺术媒介的研究[J].鞋类工艺与设计,2023,3(10):54-56.
[5]郭超,鲁越,林懿伦,卓凡,王飞跃.平行艺术:人机协作的艺术创作[J].智能科学与技术学报,2019(4):335-341.
[6]刘书亮.论AI绘画对文化创意领域的影响[J].当代动画,2023(2):91-95.
[7]李媛.人工智能对艺术创作带来的影响分析[J].艺术品鉴,2023(8):23-26.
[8]张兆羽.AI绘画在数字媒体设计中的应用[J].艺术品鉴,2023(9):114-117.
作者简介:曹娜,贵州师范大学美术专业研究生。