APP下载

AI帮你把梦境画下来?画梦软件体验

2022-06-09阿离

电脑报 2022年21期
关键词:文字描述作画开源

阿离

每每谈到AI替代人类工作这个话题,更多时候还是以重复、机械式工作为主,可当某一天AI能够在创造力上同人类一较高低,会是怎样一番情景呢?

前不久,一款登顶50个国家免费榜的APP就让人们重新认识了AI在创造力方面的应用,在画画这个需要灵感和天赋的领域,一款名为Dream By Wombo的智能梦境生成器软件成功刷爆了全球网友社交圈。看到这些精美的圖画,你能相信它们是由原本“没有情感”的AI创作的吗(如图1)?

图1 网络上的Dream By Wombo作品

Dream By Wombo本身是一款使用人工智能(AI)来生成复杂艺术作品的应用。用户只需输入提示(或从Dream的建议中进行选择,如“未来城市”、“钻石树”等),然后选择一种艺术风格,如Dali、Fantasy或Steampunk等。然后,用户可以实时观看Dream By Wombo根据这些输入创建艺术品的全过程。

Dream By Wombo使用的是CLIP引导的方法,CLIP是人工智能实验室 OpenAI 的一个开源的神经网络。该网络使用了互联网上的“图像-文字描述”配对训练,并且可以评估用户提供的文字描述与图像的关联程度。

为了生成艺术作品,Dream 模型从一个随机生成的向量开始,即图像的数学表示。向量中的每个条目对应于图像的一个微小细节。有些可能对应于颜色,有些对应于形状,有些对应于更抽象的含义。通常随机向量首先对应于一个灰色的像素块。然后,该算法使用 CLIP 来确定当前矢量图像与用户提示的对应程度,并在多次迭代中改进对应关系。用户实时观看算法执行此过程;该应用程序会在最终产品出现之前创建多个图像。过程的随机性意味着 Dream 永远不会两次制作相同的艺术品,就如同人们很难做两个同样的梦一样。

用户在Dream By Wombo中输入一个单词或短语作为提示,并使用算法(通过暴露于大量不同的图像来训练)来生成完全独特的原创艺术品。Dream By Wombo使用较为简单,不过目前尚未有中文版本,因此国内英文不太好的用户使用起来可能会稍微慢一些。

下载并启动Dream By Wombo软件后,可以看到其主界面较为简洁,启动软件后用户可以根据自己的梦境在“Enter prompt”框中输入一些英文单词作为关键词使用,再根据个人爱好选择使用一个艺术风格。Dream By Wombo当前默认提供了巴洛克、蒸汽朋克、漫画等二十多种画风可选,选定完成后点击“Create”按钮就能自动生成一张对应的AI画作(如图2)。

图2 关键词最好为英文单词

非常有意思的是Dream By Wombo每次作画的结果都是不同的,即便是用户使用了相同的关键字和艺术风格,其生成的画作可能在大体感觉上比较类似,但细微的差别总是存在,这或许也是AI作画的魅力所在吧!

值得一提的是在Dream By Wombo之前,其实已经有不少AI软件在尝试创作了,NightCafe Creation、Disco Diffusion等软件都可以进行类似的操作,但要么需要付费,要么对登录账号有一定要求,因此,对于大多数普通用户而言,Dream By Wombo显然是更好的选择。

让AI创作艺术品并非突发奇想,早在Dream By Wombo之前,这几年已经浮现出不少让AI作画的技术工具。最早是谷歌在2015年推出的DeepDream,还有英伟达的GauGAN、OpenAI的DALL·E、开源的Disco Diffusion等。

以DeepDream为例,其利用深度学习技术识别图片,再把自己解读的画面呈现出来。后来谷歌将这一项目开源,让所有人都可以上传图片,再生产出被DeepDream解读的结果。实际上,DeepDream真正想要了解的是神经网络黑盒子的工作逻辑。神经网络在识别图像时通常是层数越多越细致,第一层神经网络可能在识别轮廓,中间层的神经网络可能就在识别纹理、笔触等等细节了。我们看到的那些正确识别出图像的算法,都是经由人工调试后的,而DeepDream则跳过了人工指导、矫正这一步,直接凭着自己的意愿识别图片,并且会经过数次重复,最终就成了我们现在看到的样子(如图3)。

图3 DeepDream的识别与创作

除了艺术创作之外,这些年区块链技术的进步,叠加AI独一无二和视觉惊艳的特点,AI作画影响到的圈层也越来越广泛,比较典型的有美术圈、艺术收藏圈以及NFT领域,毕竟唯一性已经是一个相当不错的卖点了,只不过市场是否接受就真不一定了。

猜你喜欢

文字描述作画开源
宋人点茶,茶上“作画”
折段麦秆来作画
墨水作画
五毛钱能买多少头牛
爱是什么?
微写作
微写作
微写作
指纹来作画
大家说:开源、人工智能及创新