反常识
2022-05-12
第一财经 2022年5期
从看图说话到看字画图,AI更进一步
我们最常见到的人工智能(AI)应用场景或许是“看图说话”,即让AI识别出一张图片上的内容是什么,并用文字表示出来。许多人甚至还在Google上玩过你画我猜的游戏,用来帮助它们的AI做海量的学习训练。
4月初,人工智能研究实验室OpenAI让AI在图片上的发挥更进了一步。他们发布了一个新的AI系统DALL-E2,可以实现将文本描述转换为图像的功能。比如输入“宇航员在太空中骑马”,它就会生成一张带有浪漫色彩的太空骑马图。
DALL-E的名字来自机器人瓦力(Wall-E)和艺术家达利相结合,2则代表它是第二代产品。和上一代相比,DALL-E2制作的图更高清、更生动,速度也更流畅。据介绍,DALL-E2的核心是一个模拟了大脑神经元网络的数学系统,它和我们所认知的AI一样,都是通过分析大量數据来学习。“虽然制作出来的这些图像既超现实又呈现卡通化,但它们证明了,人工智能已经学会‘世界被组合在一起的基础逻辑。这些图像实在是令人惊叹。”《麻省理工科技评论》称。
OpenAI还试图让DALL-E2减少作恶,为此添加了“反欺凌过滤器”,禁止一些不当图片的生成。但DALL-E2基于现实世界习得的数据难免会带上性别和歧视的成分。比如让DALL-E2画一名律师,它生成的图片都是白人男性。