反常识_参考网

反常识

2022-05-12

第一财经 2022年5期

从看图说话到看字画图，AI更进一步

我们最常见到的人工智能（AI）应用场景或许是“看图说话”，即让AI识别出一张图片上的内容是什么，并用文字表示出来。许多人甚至还在Google上玩过你画我猜的游戏，用来帮助它们的AI做海量的学习训练。

4月初，人工智能研究实验室OpenAI让AI在图片上的发挥更进了一步。他们发布了一个新的AI系统DALL-E2，可以实现将文本描述转换为图像的功能。比如输入“宇航员在太空中骑马”，它就会生成一张带有浪漫色彩的太空骑马图。

DALL-E的名字来自机器人瓦力（Wall-E）和艺术家达利相结合，2则代表它是第二代产品。和上一代相比，DALL-E2制作的图更高清、更生动，速度也更流畅。据介绍，DALL-E2的核心是一个模拟了大脑神经元网络的数学系统，它和我们所认知的AI一样，都是通过分析大量數据来学习。“虽然制作出来的这些图像既超现实又呈现卡通化，但它们证明了，人工智能已经学会‘世界被组合在一起的基础逻辑。这些图像实在是令人惊叹。”《麻省理工科技评论》称。

OpenAI还试图让DALL-E2减少作恶，为此添加了“反欺凌过滤器”，禁止一些不当图片的生成。但DALL-E2基于现实世界习得的数据难免会带上性别和歧视的成分。比如让DALL-E2画一名律师，它生成的图片都是白人男性。