APP下载

AIGC:你好,新世界

2023-05-16勒川

中关村 2023年4期
关键词:内容模型

勒川

伴随着AIGC在中国的进一步火爆,中国的科技企业也将伴随AIGC产业的爆发迎来新一轮的增长——这个崭新的未来世界也将呈现在人们眼前,而我们也将共赴人类科技的无限未来。

如果说2022年,ChatGPT和Stable Diffusion展现了AIGC强大的技术实力,打开了AIGC时代的序幕,那么2023年,在短短3个月内,GPT-4、Midjourney V5等又一次次通过令人惊喜的效果证明,AIGC已经成为毋庸置疑的科技趋势。

ChatGPT现世至今,AIGC这把火彻底点燃了全世界。巨头争相发布颠覆级产品,行业大牛纷纷下场创业,大模型技术人才也被市场哄抢。

3月19日,创新工场CEO李开复在朋友圈宣布,正在筹组一个全球化公司Project AI 2.0,致力于打造AI 2.0全新平台和AI—first生产力应用。他直言不仅要做中文版ChatGPT,更关注基于AI 2.0能力的应用前景。据他介绍,Project AI 2.0的资金、算力已陆续到位,新公司期权将由新团队绝对主导,现在主要在招聘大模型、多模态、NLP、AI算法工程与研究、分布式计算/Infrastructure 等方向的顶级人才。

如今,AIGC这项革命性技术正在重新定义我们的生产生活——它不再束之高阁,而是随着更多资本、人才、场景数据的注入,朝着更广泛的方向加速落地。资料显示,百度、腾讯优图、阿里巴巴、快手、字节跳动、网易等都在AIGC领域有所投入;国外科技巨头谷歌、Meta、微软、Stability Al、Jasper、OpenAl等也开始布局AlGC。

据投资机构al6z统计,全球范围内,图像生成、文案写作和代码编写三类AIGC产品年营收都已超过了1亿美元;Stability、Jasper.ai等AIGC独角兽估值一路狂飙。在我国,数位人工智能时代的领军人物再次亲自下场,AIGC相关产品被持续加速推出,投资机构纷纷把AIGC当成年度主题词,AIGC产业的爆发似乎已一触即发。

据《中国AIGC产业全景报告》显示,我国预计2024年将迎来指数级增长的融资热潮,预计2030年,我国AIGC市场规模将达到万亿级别;2025年和2027预计成为两次规模爆发点,年复合增长率有质变性提升。

我们正处于生产力变革的关键节点。每一次产品级的发布,都将给世界带来颠覆性应用和场景创新——可以预见,AIGC即将开启一个崭新世界,这个产业也将成为万众瞩目的蓝海。

火爆出圈

AIGC全称为Al—Generated Content,指基于大型预训练模型、生成对抗网络GAN等人工智能技术,通过已有数据寻找规律,并通过适当的泛化能力生成相关内容的技术。狭义的AIGC更关注图像、文本、音频、视频等内容生成,等同于Synthetic media, Generative Al等概念。广义的AIGC则还包括策略生成(如GameAl中游戏策略的生成)、代码生成(如GitHub Copilot)、蛋白质结构生成等。

AIGC是一种自动化的过程,根据统计分析、人工智能算法以及自然语言处理来生成高质量的内容,而非完全由人类创作。它使得内容创作成为一项更加高效和廉价的任务,同时也能够为大众带来更为个性化、更加多样化的信息。

AIGC的原理简单来说,就是利用深度学习的方法,训练一个强大的语言模型,让它能够理解和生成自然语言。语言模型是一种计算机程序,它可以根据已有的文本数据,学习语言的规律和逻辑,从而预测下一个词或者生成新的句子。语言模型越强大,就越能够生成流畅、准确、有意义、有创意的内容。

从概念提出到产品趋于成熟,AIGC用了十年时间。追溯到2014年,“对抗生成网络”GAN的提出成为当年各大厂大热的深度学习模型,现在看来这也可以算作AIGC最早的实用框架;2020年,Web3+AI成功问世,生成式艺术 NFT 领军者 Art Blocks 就是一个成功的应用案例,它是AIGC在区块链领域迈出的第一步。

在2021 年之前,AIGC生成的主要还是文字,而新一代模型可以处理的格式内容包括:文字、声音、图像、视频、动作等等,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势。

2022年AIGC 發展速度惊人,火爆出圈的ChatGPT就是AIGC这个大赛道里下一个成功的产品,一经上线便席卷全球,短短一个月突破1亿月活跃用户。

“ChatGPT不是搜索引擎的加强版,也不仅仅是一个聊天机器人,它通过SaaS方式所提供的人工智能服务,将重塑所有的数字化应用和所有行业,为我们带来一场新的工业革命。”360集团创始人周鸿祎表示。

周鸿祎将ChatGPT的成功总结为几点,分别是开放、长期主义精神、产业化公司介入、用户流量反馈,OpenAI与微软这种产学研合作的模式,为中国发展相关技术提供了成功范本。他认为中国必须奋起直追,在技术维度,聚焦于“四大一强”,即大模型、大数据、大算力、大标注、强算法。在数据维度,应大力发展包括开源数据、公共数据、私有数据、公开数据、众筹数据在内的五大类数据。

百度创始人李彦宏认为,AIGC是PGC、UGC之后,全新的内容生产方式。它不仅会提升内容生产的效率,也会创造出有独特价值和独立视角的内容。“AI从理解内容,走向了自动生成内容,包括AIGC用于作画、图文、视频等多类型的内容创作。”

根据李彦宏的判断,AIGC将走过三个发展阶段:第一个阶段称之为AIGC的“助手阶段”,AIGC用来辅助人类进行内容生产,比如生产有声书、赋能视频创作等等;第二个阶段称之为AIGC的“协作阶段”,AIGC以虚实并存的虚拟人形态出现,形成人机共生的局面;第三个阶段,即AIGC的“原创阶段”,AIGC将独立完成内容创作。

不可否认,AIGC正在成为未来人类把地球文明推向更高成就的新工具,以超出人们预期的速度成为科技革命历史上的重大事件,迅速催生了全新的科技革命系统、格局和生态,进而深刻改变了思想、经济、政治和社会的演进模式。

风生水起

虽然在AIGC领域,当前仍是由ChatGPT代表最高水准,但中国在AIGC领域的发展也是站在世界前列,中国的AI产业正在迅速爆发。

3月16日,百度正式发布全新一代知识增强大语言模型“文心一言”。这是一个多模态大模型,具备的5种能力:文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成。“文心一言”基于文心大模型技术打造,主要脱胎于两大模型:百度ERNIE系列知识增强千亿大模型和百度大规模开放域对话模型PLATO。目前,“文心一言”已经接入百度搜索,目的在于提升搜索资源效率。同时,包括小度和自动驾驶Apollo等产品,以及爱奇艺等公司也已经接入百度的“文心一言”模型。

其实在2022年全国两会期间,伴随着依托百度AIGC技术的数字人主播度晓晓正式“上岗”,成为全国两会报道中一道独特的风景线。《工人日报》应用百度数字人,第一时间推出《两会晓晓说》新媒体栏目,在代表通道、委员通道以及新就业形态劳动者权益维护、工匠精神和产业工人队伍建设等正能量话题方面进行报道,引发了大众的广泛关注。

科大讯飞也推出基于AIGC技术的产品——新一代语音合成系统SMART—TTS。其特点是在语音合成系统全链路中引入了基于海量文本、语音自监督预训练模型和表征;在文本编码阶段,结合了文本、拼音、语音三种模态数据进行预训练,提升语义表征能力;利用对比学习预训练对语音中情感、风格等长时韵律特征提取和建模;使用基于语音自编码器的预训练声学表征,进一步提升对语音频谱细节的恢复精度。

全新的虚拟人也将成为科大讯飞向AIGC领域进军的拳头产品。这款虚拟人不仅拥有全新形象,讯飞研究院还利用声音自动创造系统采用海量说话人语音数据,基于生成式流模型来构建发音人音色空间,通过在这个音色空间分布上采样,就可以创造出不同的音色,同时根据语音语义驱动的动作合成——根据说话内容,虚拟人能对应展现出恰如语境的肢体动作,与传统动作库相比,在动作拟人度及契合度方面有明显的效果提升。基于多模态预训练模型和语义理解技术,对图片内容进行深度理解,可以自动回答图片内容相关问题,并能生成图片的一句话描述,利用融合知识图谱的可控生成技术,采用比喻、拟人等多种修辞描写手法对句子加以润色,还能基于图片内容进行诗词创作,结合图像风格迁移技术生成诗图并茂的明信片。

小冰公司是国内最早开展AIGC商业化落地的代表。小冰框架已孵化出数以千万计的虚拟人类(Al beings),既有somebody instance,如少女小冰、少女Rinna、世博会参展画家夏语冰、每日经济新闻虚拟主播N小黑和N小白、万科集团2021年度优秀新员工崔筱盼、主播F201、歌手何畅、人类观察者MERROR、机器人女仆Roboko等广为人知的虚拟人名流;也有不那么知名的nobody instance,比如数千万个陪伴在普通用户身边的虚拟男友、虚拟女友;还有许多在垂直场景里默默工作的虚拟人类,如空中技巧国家队人工智能裁判与教练系统观君、金融摘要撰稿人万小冰、智能座舱同行者HiPhiGo、时尚设计师西湖一号,以及音乐制作人、金融风控师等。全新升级第三代深度神经网络渲染模型,仅需20分钟的有效数据,即可生成栩栩如生的数字人形象。基于小冰框架的人工智能创造能力(AIGC),数字人可实现对业务数据的快速学习,获得相应技能,稳定输出高质量文本、图片、音频、视频等内容。

商汤科技在今年3月发布的“书生2.5”获得了业内的广泛关注。“书生2.5”拥有30亿参数,是世界上开源模型中ImageNet准确度最高、规模最大的模型,同时也是物体检测标杆数据集COCO中唯一超过65.0mAP的模型,“书生2.5”的图文跨模态开放任务处理能力可为自动驾驶、机器人等通用场景任务提供高效精准的感知和理解能力支持。

影宙是国内首个依托AIGC技术的元宇宙活动平台,这是影谱科技探索AIGC场景落地的又一匠心之作。依托影谱科技在智能视觉、AIGC、数字孪生技术上的独家优势,影宙重构元宇宙“人、物、场”空间价值,打破传统活动模式,构建高沉浸感的空间场景、身临其境地交互体验、AI驱动的运营管理、高性价比多元部署等核心能力,支持一键举办元宇宙活动,为行业综合峰会、专业展览展示、热点营销活动等场景开创元宇宙空间新形态。目前,影宙已经成功在政府、汽车、航天、媒体、电商、家居、营销等领域实现广泛应用,以高沉浸、更智能的体验和服务让元宇宙空间充满想象。

蓝海争雄

ChatGPT只是AIGC的产业一隅,AIGC拥有更为广阔的未来,在于多模态生成带来的全新内容大爆炸,这种全新的内容创作形态也带来了全新的商业模式探索。

截至2023年3月,AIGC赛道目前在国外已出现了8家独角兽。在我国,目前只有小冰公司已明确成为独角兽公司。Minimax据传估值过10亿美元,光年之外则宣布下一轮融资已被认购2.3亿美元。目前,最受头部资本关注的机构均与底层大模型相关或与AI领军人物下场相关(如王慧文、李志飛、王小川、周伯文等)。与国外融资环境相比,国内AIGC目前融资频次及体量有一定差距。

经过对国内投资机构的广泛调研,多家机构已高度明确要将AIGC作为主投赛道,个别头部机构已经推出了相应的主题孵化项目。整体而言,大部队还处在缺乏明确逻辑和标的的观望状态,但预计本年度融资规模将有数倍增长。随着底层大模型生态的逐步开放及商业价值的落地验证,预计融资规模将在2024年出现首次阶段性的指数级增加,投资向AIGC全产业链扩散。

据《中国AIGC产业全景报告》预测,我国AIGC产业可大致分为三个阶段,2023—2025年的培育摸索期,2025—2027的应用蓬勃期和2028年后的整体加速期。

在培育摸索期,底层大模型发展加速,除原有玩家外,大资金及人才体量的玩家开始入局。中间层尚未出现相关玩家;基于Stable Diffusion等开源模型的上层应用迅速出现,由于受到底层大模型接口的限制,其他领域应用层发展相对有限。整体均处于业务场景验证和变现探索期;产业生态相对封闭,研究机构作用明显,创业公司少,大部分技术尚未达到稳定进入实际生产环节的水平。

在应用蓬勃期,人机共创逐渐被行业普遍尝试应用,在内容资讯和娱乐传媒领域产生确定性价值,基本价值创作路径和技术思路得到确认;入局玩家增多,底层大模型和中间层模型主要玩家基本确定,大模型开放API增多,有大量应用层玩家进场,呈现百花齐放的状态。

在整体加速期,AIGC在个性化、实时化、自主迭代等方向上的延展价值得到充分发挥,和其他业务系统进行紧密连接;产业生态完善,产生完整解决方案相关初创公司;能够形成一个持续自己运营的内容体系,预计会催生出完全不同的新业态。AIGC成为内容领域基础设施,自身产业链条完善。

据测算,我国2023年AIGC市场规模预计可达到170亿人民币。2023—2025年是我国AIGC产业市场规模增长的第一阶段,增长率维持在25%左右,2025年市场规模达到约260亿人民币;2025年開始,由于行业生态完善(特别是底层大模型完成对外开放),应用层蓬勃将带动产业快速增长,年复合增长率将超过70%,预计2027年我国AIGC产业规模超600亿人民币;2028年开始,AIGC产业将延展出完整产业链,并在商业化场景上持续拓宽拓深,深入变革各行业;2028年起,我国AIGC产业市场规模将持续保持高速增长,2030年市场规模超万亿。

长期来看,我国AIGC的主流营收模式可分为几种:MaaS(基于模型的调用量进行收费)、按产出内容量付费、软件订阅付费模型定制开发费。其中最具长期增长潜力,并将占据主要市场规模的为MaaS模式。AIGC产业中,不同营收模式的市场份额将有明显区分。尽管目前按照产出量收费的模式占据主流,但随着底层模型及AIGC应用生态的建立,MaaS预计在2027年将逐步成为主流。

如今,技术、趋势无一不在朝着AIGC全新的方向演进,或许没有人能拒绝这样一场激动人心的探索与尝试。伴随着AIGC在中国的进一步火爆,中国的科技企业也将伴随AIGC产业的爆发迎来新一轮的增长——这个崭新的未来世界也将呈现在人们眼前,而我们也将共赴人类科技的无限未来。

猜你喜欢

内容模型
适用于BDS-3 PPP的随机模型
内容回顾温故知新
内容回顾 温故知新
内容回顾温故知新
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
3D打印中的模型分割与打包
主要内容
FLUKA几何模型到CAD几何模型转换方法初步研究