Sora不止生成视频,而是模拟世界

2024-05-23

文萃报·周五版 2024年8期

近日，OpenAI正式发布文本生成视频AI模型Sora，着实给了打工人一个巨大的开年惊喜，生成视频的效果很“炸裂”，不仅画质清晰、细节到位，人物表情和视角也无限逼近于专业水准。

据官网介绍，Sora可以通过文本指令直接生成60秒以内的视频，在此之前的视频生成模型一般只能生成15秒以内的视频。在官网给出的示例中，人物的瞳孔、睫毛、皮肤纹理，都逼真到看不出一丝破绽。

OpenAI在官网中介绍，Sora不是一个单纯的视频生成模型，而是能够理解和模拟现实世界的模型的基础，称之为world simulators（世界模拟器），将视频生成作为帮助 AI 理解真实世界的工具。或许我们可以理解为，AI吸收数据，通过Sora生成物理世界的影像，并逐渐理解物理世界，最终准确、真实地对物理世界进行反馈和互动。终极目标应该是具身智能体，而视频生成只是过程中的一部分。这也是Sora与其他文生视频大模型的本质区别之一。

360董事長周鸿祎说：“Sora只是小试牛刀，它展现的不仅仅是一个视频制作的能力，而是大模型对真实世界有了理解和模拟之后，会带来新的成果和突破。”周鸿祎甚至预言AGI实现将从10年缩短到1年，这也是业内人士对Sora感到震撼的缩影之一。

（据澎湃新闻2.20）