APP下载

AI是如何作画的?

2022-11-17朱秋雨黄泽敏

南风窗 2022年23期

朱秋雨 黄泽敏

2022年,AI引发了一场席卷绘画圈的革命。只要输入几句描述语言,几分钟内,一幅清晰的画作就出现在人们眼前。

人人都能成为画家。

“AI已经不能叫作迷人,而是恐怖。”网页设计师逗砂对南风窗感叹。

作为AI领域的前从业者,她说,2021年前,“从没想过人工智能还能取代创意视觉产业”。

逐渐取代人类创意产业的是AI领域的一个分支,这被称为AIGC(AI Generated Content)。今年2月,谷歌推出开源性AI画作生成平台Disco Diffusion,引发全球“用嘴画画”热潮。随后,Dall.E2、Stable Diffusion、Novel AI等AI绘画工具相继面世。百度也推出了AI中文绘画平台“文心一格”。

技术与资本的加持下,AI绘画迅速走进了大众的视野。

但它也引发了人们警觉:AI有了与人类相当的水平,那么,它会有取代人力的一天吗?

AI取代人力,已经部分实现了。

8月,有十多年游戏研发经验的史官发了一条微博,“不管你是策划、美术还是程序,建议尽早学习使用AI画图”。

她表示,所在公司已经尝试用AI提供素材,現决定“下个项目尽可能地用AI获得美术资源,这样开发成本至少下降一半”。

史官告诉南风窗,AI绘画的一大优势是“大批量”。一个周末,她在AI画图软件Stable Diffusion上设置关键词,两天后,AI生成了1万张图。这些都是游戏里的图标,例如旗帜上的标志物,不是主角但耗费很多人力。

结果,在人类休息的时间,AI高效产出。

史官惊喜地发现,AI画的图很多能用。“一万张我都没看完,很多图随便调调就足够用了。”

AI绘画会成为如此实用的生产工具,放在2022年初,极少人能预料到。很多AI绘画爱好者有个共同记忆,年初,谷歌推出Disco Diffusion时,出一幅图耗时约1小时。

在网页等待AI最终成画的过程,心情是既期待又煎熬的。

漫长的等待时间让AI绘画一度在小众领域狂欢。但半年后,一幅AI画作的生成时长普遍在几分钟内。

“没想到时代变得那么快。这才半年,AI能做的已经天翻地覆了。”玩具设计师乌鸦对南风窗感叹。

他给记者展示了几张自己用AI生成的画作,都是色彩对比浓烈,主角鲜明,具有骷髅头、怪兽、异形人等“克鲁苏”元素,乍看作品很吸睛,像好莱坞商业片中的场景。

乌鸦说,这些画作只输入了几个描述主角的关键词,再添加他想要的绘画风格,例如,克鲁苏风。

最后一步,加上喜欢的艺术家的名字。

他仰慕波兰艺术家贝克辛斯基。后者在画里传递了超现实的末世感,那种与死亡、命运有关的狰狞与冲击,总让他着迷。有了AI,如今他也能画出无数幅“贝克辛斯基”。

更关键的一点,乌鸦说,AI绘画拥有了融合的能力。“现在AI不仅仅可以模仿,还能将各类艺术风格融合到一起。”

他曾尝试将中国水墨风加进了“贝克辛斯基”里,AI为他生成了从未想过的画面。

“如果认可融合便是创新的话,AI绝对有能力成为强大的武器,进行艺术风格上的拓展。”乌鸦如此认为。

与乌鸦相似,AI绘画的爱好者都对南风窗提起,AI一大特点是随机性。

即便在同一程序输入同样的关键词,AI生成的画作也极可能有很大区别。

史官认为,这一特点让AI在策划阶段起重要作用。“AI在试图创造现实不存在的东西时很有创造力,很多搭配人都未必想得出来。AI的混搭反而提供了灵感。”

据她透露,AI绘画如今被其大量用于游戏概念设计阶段。通过调整关键词,游戏策划会先让AI出100张效果图,寻找灵感。

“但如果我让美术或者外包先出100张图看看效果,他们应该会把我从窗户扔出去。”

AI绘画进军人类世界,让2022年下半年对AI的讨论抵达高潮。

两大观点反复交锋。一派认为AI的发展将取代艺术界,给行业带来覆灭后果。另一派如史官和逗砂,认为AI目前仅是提高效率的工具。

而之所以AI绘画引起了如此大“恐慌”,一个关键原因是,其所属的 AIGC(AI自动化内容生成),一直是不受资本追捧的冷门领域。

这是一个在AI工程师眼里难以攻克的高峰。

业内普遍认为,当AI学会自动生成内容时,意味其不局限于某一特定功能,例如语音识别、智能推荐等,而是迈入了通用人工智能阶段。

逗砂称这叫“强人工智能”。AI相当于拥有了人类完成复杂任务的智力水平。

只是,这一智力水平到底停留在哪里,一直是人工智能界的焦点。

百度文心一格负责人告诉南风窗,AI生图的原理是,AI从海量图文对应的数据中学习到了“语言描述”与“艺术画面”的关联,便从随机化的起点开始,不断修正画作,形成审美上与人类经验与知识高度一致的作品。

但难点一直横亘在AI工程师面前。

一张绘画拥有海量的信息,最基本的便是输出“长×宽”个RGB像素点。但简单组合RGB得不到有效画作,还需考虑人类绘画时每一笔的位置、形状、颜色等多方面参数。

2022年以前,支撑AI绘画领域的是2014年AI学术界提出的深度学习模型,即对抗生成网络(GAN)。模型的核心理念是让两个内部程序,生成器和判别器互相比拼,相互平衡。

这一过程就像生产赝品。

用户首先提供草图,生成器通过数据学习,生成作品,交由判别器判断其与原图的相似度。直到生成器产出了与原作同一类别的“赝品”,判别器予以通过。画作产生。

显然,GAN模型让AI绘画长期停留在“美图秀秀”的功能上。给图画加滤镜、转换风格,AI绘画长期囿于模仿人类。

2022年不同的是,AIGC实现了一次近年来最大的进化。

文心一格负责人对南风窗表示,AI绘画最近的一次技术爆发,是2022年对扩散生成模型(Diffusion Model)的引入。

模型的原理是为图片去噪,让AI查看全是噪点的画面变清晰的过程,让其有效理解图像如何生成。

“扩散生成模型能够在更短的时间内,像素级建模并生成分辨率显著提升的绘画,在美感、细节精细度上有非常显著的提升。”上述负责人说。

于是,如今使用市面上诸如Disco Diffusion等程序,用户们也惊讶地发现,机器并非像人类一般一笔一画地绘图。它们绘画是从一张高噪点的图画开始的,接着画作一步步变得清晰,拥有细节,最终成像。

技术的突破带动了各平台的“内卷”。除了谷歌Disco Diffusion开源供用户免费使用,英国AI创作公司Stable AI,在8月宣布开源,向公众开放。

Stable AI开源后,众多国内外软件基于此开发产品。逗砂告诉南风窗,最近两个月,新的AI绘画平台不断冒出,工具每天指数级地迭代,令她眼花缭乱。

“我都有点累了,每天都有新的东西出来,已经学不过来了。现在仿佛iPhone刚面世时,每年发布会都有革新性功能公布,非常让人激动。”

AI绘画能在如此短的时间取得飞速进展,推动的不只是绘画领域。

视频、音乐再到大热的元宇宙和虚拟现实,都在AIGC赛道上看到发展潜力。

“AI绘画超越了区块链,成为今年最受资本关注的领域。”逗砂说。

9月,脸书母公司Meta发布AI自动生成视频系统“Make-A-Video”。原理与AI绘画相似,根据输入文字,生成短视频。相似地,谷歌也于9月先后发布AI视频程序Imagen Video和Phenaki。

Phenaki甚至能在200字左右提示语的基础上,生成2分钟以上的长视频,实现“人人都当导演”的畅想。

一系列新品和操作让普通人感到,发展AI仿佛打开潘多拉的宝盒。

人类对AI的生畏情绪一部分源于其强大的学习和数据处理能力。一个流行的网络段子形容,AI能发展那么快,是因为给它学习资料和数据,“AI是真在学”。

更重要的是,AI学习基于的数据往往来自人类的作品。

这在部分画师眼中,AI是“缝合怪”“剽窃高手”般的存在。

8月底,大量日本画师在社交媒体上齐力抵制AI作画。他们声明:“请不要在AI自动制作的服务中使用我的作品。”

事件缘起于一个日本二次元网站,在AI绘画大火時,发布了一个测试版,允许用户自己上传15至100张图像让AI进行学习,并输出相同画风的AI画作。这一相当于“克隆”的程序,直接侵害了画师的权益,同时点燃了人类与AI创作之间的冲突。

逗砂理解这样的抵制。版权问题始终是AI绘画悬而未决的问题,但背后深藏的是来自行业内部的焦虑。

“绘圈(指日系绘画社交圈)近10年形成较为固定的画风,人物有相似的眼睛和穿搭。只要将数据训练出来, AI能形成非常稳定的画风。”

如此一来,许多中小画手在绘圈将被AI取代。

但“AI为什么是一种威胁呢?”逗砂在社交媒体上发问,“我看到了两种截然不同的态度。一种是兴奋地尝试学习如何利用AI为自己作品服务,另一种是觉得这些是无价值的电子垃圾,开始例举传统艺术多么高贵,或者自己之前学的都失去了意义”。

“《三体》里有一句特别适合用来回答,‘弱小和无知不是生存的障碍,傲慢才是’。”逗砂说。

文心一格负责人认为,AI绘画的未来将带来两方面的变化。一是今后艺术创作过程将有AI协同,例如AI生成初稿后人工修改的新创作方式。

“二是AI绘画本身,可能会形成一种新的艺术流派。”

逗砂也对人类未来感到乐观。AI绘画虽然降低了普通人绘画的门槛,“但要想用AI做出比较好的图,需要非常了解画作背后的知识,比如风格、艺术家、艺术史”。她猜想,今后(绘画)的关键可能在于人对艺术知识的理解。

“首先人得知道,才能将它描述出来。”

不过,内心深处,她也深藏对技术带给人类社会不确定性的恐惧。

在AI绘画刚火时,她创作了一幅《数字上帝》的电子藏品。

图画里的上帝是深黑色背景,身上带有电子、金属等元素。

她说,通过人工智能和虚拟技术,人们正创建一个十分逼真、真假界限模糊的虚拟元宇宙。这样一想,“我们生存的世界,是虚拟世界的可能性有多大?”