Sora不止生成视频,而是模拟世界
2024-05-23
文萃报·周五版 2024年8期
近日,OpenAI正式发布文本生成视频AI模型Sora,着实给了打工人一个巨大的开年惊喜,生成视频的效果很“炸裂”,不仅画质清晰、细节到位,人物表情和视角也无限逼近于专业水准。
据官网介绍,Sora可以通过文本指令直接生成60秒以内的视频,在此之前的视频生成模型一般只能生成15秒以内的视频。在官网给出的示例中,人物的瞳孔、睫毛、皮肤纹理,都逼真到看不出一丝破绽。
OpenAI在官网中介绍,Sora不是一个单纯的视频生成模型,而是能够理解和模拟现实世界的模型的基础,称之为world simulators(世界模拟器),将视频生成作为帮助 AI 理解真实世界的工具。或许我们可以理解为,AI吸收数据,通过Sora生成物理世界的影像,并逐渐理解物理世界,最终准确、真实地对物理世界进行反馈和互动。终极目标应该是具身智能体,而视频生成只是过程中的一部分。这也是Sora与其他文生视频大模型的本质区别之一。
360董事長周鸿祎说:“Sora只是小试牛刀,它展现的不仅仅是一个视频制作的能力,而是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。”周鸿祎甚至预言AGI实现将从10年缩短到1年,这也是业内人士对Sora感到震撼的缩影之一。
(据澎湃新闻2.20)