指上生花:人工智能新赛道
2024-03-22张宏羽
张宏羽
“Sora”演示视频截图
2023年,人工智能大语言模型“ChatGPT”凭借强大的自然语言处理能力和对上下文理解的深度“爆火”,给沉寂多年的人工智能行业撕开了一道口子。彼时,奇绩论坛创始人陆奇就已预测,未来大模型无处不在,是技术世界中的“全新物种”。
时下,人工智能浪潮愈发涌动,“无处不在”的预言初见端倪:2024年2月,人工智能视频生成类模型“Sora”将技术推到了一个全新的视觉维度,其可以根据用户输入的提示词,生成长达一分钟的高清视频,堪称“指上生花”。在官方公布的演示视频中,一名时尚女性走在城市街头,从主要人物到背景人物、从远处的建筑到近处的地面,具有极强的真实感,连脸部细节都清晰可见。
当然,“Sora”并非完美,发布者对此并不避讳,模型在准确模拟复杂场景的物理特性方面可能会遇到困难,或是无法理解具体的因果关系实例,还可能会混淆提示的空间细节,并且在处理随时间发生事件的精确描述方面也可能存在困难……尽管如此,“Sora”的横空出世仍被不少业内人士视为人工智能模型领域的一大里程碑。在360创始人周鸿祎看来,“Sora”只是小试牛刀,它展现的不仅仅是视频制作能力,而是大模型对真实世界有了“理解”和“模拟”之后,会带来新的成果和突破。
革新
相较于以往的视频生成类模型,“Sora”甫一诞生,就展现出技术的新姿态。中国信息协会常务理事、国研新经济研究院创始院长朱克力在接受记者采访时表示,传统的生成式人工智能多依赖于预定义的规则和算法来生成内容,“Sora”则引入更为先进的深度学习机制,特别是对抗网络和自编码器等技术。这使得“Sora”在生成内容时能够更好地模拟人类的创造性和直觉。
对于“Sora”的显著优势和特点,物联网产业专家袁帅从四个方面向记者进行了分析。一是多模态融合。“Sora”能够同时处理文本、图像和音频等多种模态的数据,实现跨模态的生成。这种多模态融合的能力使得其具有全面地理解和表达信息的能力,从而生成更加丰富的视频内容。
二是高度定制化。“Sora”能够根据用户的个性化需求生成定制化的视频内容。用户可以通过输入文本描述自己的需求和意图,“Sora”将这些想法迅速转化为具体的视频画面,尽可能满足用户的个性化需求。
三是高效率与高质量。“Sora”采用了高效的生成算法和模型架构,能够在短时间内生成高质量的视频内容。这使得其在处理大规模数据集或实时生成任务时具有顯著的优势。
四是可扩展性与灵活性。“Sora”的架构设计使得它易于扩展和适应不同的应用场景。通过调整模型参数和引入新的功能模块,其可以适应不同的任务需求和数据类型,展现出强大的灵活性和可扩展性。
热潮
以“Sora”为代表的视频生成类模型,展现出在多领域、多场景下的较大潜力和应用价值。甚至有业内人士预测,视频生成类模型是今年人工智能赛道的主力热点。
朱克力告诉记者,在娱乐领域,视频生成类模型可用于自动生成电影预告片、游戏宣传视频等,大大节省了制作成本和时间。在广告领域,该模型能够根据产品特性和目标受众快速生成定制化的广告视频。在教育领域,可用于制作生动有趣的教学视频,帮助学生更好地理解和掌握知识。此外,在传媒、体育等领域,视频生成类模型也能实时生成高质量的视频内容,满足快速传播的需求。
国内一家人工智能企业产品经理打趣道:“年初五迎财神,没想到没过多久迎来了‘Sora。”“Sora”的诞生直接拉升了视频生成类模型的应用效果,具体产品落地商业化的可行性愈发显著,这将吸引更多的市场参与者入场。
记者在某投资者互动平台检索发现,截至2月21日,围绕“Sora”的相关提问已达83条,涉及传媒、科技、健康、通信、教育、电商、文创等各类上市公司。除近两成的上市公司回复称“暂不涉及‘Sora或多模态AI业务”外,其余公司的回复中密集出现“加大技术创新”“适时研发并布局相关产品和服务”“密切关注发展机遇”“紧跟市场发展”等表述。
其中,芒果超媒2月19日回复投资者提问时表示,此前,公司已经组建了AIGC创新应用团队,研发上线“AIGC HUB”等内部应用平台,将AIGC技术广泛应用于媒资运营、广告投放、会员互动、视频剪辑、内容生产等业务场景。后续,公司将积极探索文生视频等新兴AI技术在传媒领域的落地应用与业态创新。
世纪天鸿2月20日回复称,公司始终保持着对“ChatGPT”“Sora”等人工智能大模型发展与应用的积极关注,目前公司已结合人工智能技术推出小鸿助教、笔神作文等相关教育产品。公司将持续利用在教育领域的内容优势与资源优势,结合前沿技术探索人工智能在智慧教育场景的落地与应用,实现教育内容的人工智能升级,为中小学师生提供更好的产品与服务体验。
浪潮已来,但非盲目跟风。对于行业上市公司,袁帅认为积极拥抱AI技术、创新业务模式和战略的同时,还需要建立数据驱动的决策体系,收集和分析用户数据、市场数据等,了解用户需求和市场趋势,从而制定更加精准和有效的业务策略。此外,应培养和引进相关人才,建立专业团队,推动人工智能技术在业务中的深入应用和创新发展。随着技术的快速发展和应用场景的拓展,相关政策和法规也正不断完善。上市公司需要密切关注政策和法规变化,确保业务合规与可持续发展。
思考
“Sora”纵然令人感到震撼,也带给我们更多的思考。
数据隐私、版权问题及生成内容的真实性和可信度等问题,早在生成式模型诞生之初,就有所讨论。对此,朱克力表示,其一,模型在训练和使用过程中可能会涉及大量用户数据,必须确保这些数据的安全和隐私不受侵犯。其二,生成的视频内容可能涉及版权问题,需要明确使用权限和来源合法性。其三,由于模型生成的内容可能具有高度真实感,应采取措施防止其被用于传播虚假信息或误导公众。这需要坚持“科技向善”,在技术设计、法律法规和道德准则等多个层面进行综合考虑和规范。
近年来,每每人工智能领域出现技术新突破,紧随而至的往往是那些尖锐的问题——一批人要失业了吗、一众企业要被淘汰了吗?人、机并非简单的“零和博弈”。战略定位专家詹军豪认为,“Sora”的诞生可能会对某些行业的从业者产生一定的冲击,但并不会直接导致他们失业。“Sora”并不能完全取代人类制作人员的角色,因为人类制作人员在创意、情感表达等方面具有独特的优势。此外,“Sora”的推出将催生新的职业和就业机会。随着人工智能技术的不断发展,需要更多的专业人才来从事相关的研究、开发和应用工作。总体来看,可能会对一些传统职业的从业者产生影响,但也将为人类创造更多的就业机会和发展空间。
对于可能受到直接影响的广告传媒、影视制作行业来说,盘古智库高级研究员江瀚指出,大模型何尝不能带来更多的商业机会和创新空间呢?与其盲目地抗拒人工智能,不如积极地去理解和利用它。通过不断学习和创新,人类可以更好地掌握人工智能的技术和应用,推动其与社会各个领域的深度融合,这才是人工智能时代真正的生存之道。
值得注意的是,人工智能时代,算力将成为关键生产要素。热潮之下,我们不能忽略背后的“算力缺口”。不少海外企业和高管人士已经将目光聚焦于AI算力上。“ChatGPT之父”奥尔特曼执着于巨额的芯片投资。更有一家名为“Groq”的初创公司试图以自研芯片在运算速度上挑战全球GPU巨头。
在国内,数字经济强省浙江,正发力冲向“算力强省”。其中,作为数字经济重镇的杭州,深刻洞察到数字经济加速发展时抢抓人工智能机遇的战略意义,在降低算力成本上谋篇布局,亮出了以算力高质量发展支撑数字经济高质量发展的雄心。在杭州市新春第一会——“深化改革、强基固本”主题年推进大会上,浙江省委副书记、杭州市委书记刘捷两次提到“Sora”大模型。按照杭州新春第一会的部署,从加快新型算力中心建设,提供信创云和人工智能算力服务,成为打造人工智能高地的关键基础设施;到构建通用算力、超算算力和边缘算力协同发展的新型算力体系……一条综合算力成本最低的改革路线跃然纸上。