你好,数字人
2022-03-12本刊编辑部
本刊编辑部
2021年,元宇宙概念带动了很多人对未来的无限遐想,与元宇宙紧密相关的数字人的热度也在提升,多家科技企业发布了数字人相关产品。
2021年12月,百度公司发布国内首个可在APP内互动的超写实数字人;此前,阿里巴巴集团开发的超写实数字人AYAYI 正式入职阿里,成为天猫超级品牌日的数字主理人;OPPO 发布了基于虚拟人多模态交互的手机智能助手,能与用户在多个场景生态下实时交互;Bilibili 网站专门为虚拟主播开设了分区。2 0 2 2年2月初,数字女孩李未可获得字节跳动的独家投资,这也是今年数字人领域的首笔融资……不知不觉间,数字人已经开始走进我们的生活,随着相关技术逐渐成熟,数字人作为我们与虚拟世界交互的重要载体,表现出广阔的潜在市场。调研机构的数据显示,到2030年,我国虚拟数字人整体市场规模将达到2700亿元。
当然,伴随着数字人一同出现的还有各种争议。尽管概念的热度很高,但目前产业仍处于较为初期的阶段,发展还面临政策、资金、技术、人才等层面的限制。作为新生事物,人们对数字人的认识还存在不少空白。在体系标准层面、安全伦理层面,不仅行业内缺乏统一技术标准和要求,产品质量良莠不齐,在法律法规、伦理规范方面也存在潜在风险,需要社会各方加紧研究各类数字人应用可能对人的心理带来的影响,以及对人类社会造成的影响,并尽快出台相关法律法规和伦理规范。
那么,数字人到底是什么,具有哪些特征,分为哪几种类型,以及都应用在什么行业呢?
数字人的三方面特征
根据百度网“科普中国·科学百科”的解释,狭义的数字人,是利用信息科学对人体进行虚拟仿真,是一种信息科学与生命科学融合的产物,最终目的是建立多学科、多层次的数字模型,达到对人体从微观到宏观的精确模拟。广义的数字人,是指数字技术在人体解剖、物理、生理及智能的各个层次、各个阶段的渗透。
那么,现在出现在我们身边的虚拟人、虚拟数字人又是什么呢?按照目前较常见的定义,数字人的范畴中包含虚拟人,虚拟人的范畴中又包含虚拟数字人。虚拟数字人是具有数字化外形的虚拟人物。与具备实体的机器人不同,虚拟数字人只能依赖显示设备存在。我们所知的很多虚拟人都要通过手机、电脑或者智慧大屏等设备才能显示,目标是通过CG(Computer Graphics,即计算机图形学,简写为CG)技术创造出与人类形象接近的数字化形象,并赋予其特定的人物身份设定,在视觉上拉近和人的心理距离,为人类带来更加真实的情感互动。抛开交流互动能力不谈,数字人、虚拟人、虚拟数字人在概念上可以是相同的。但在严格意义下,三者又有细微差别——虚拟人的身份是虚构的,现实世界中并不存在;数字人强调角色、数据等存在于数字世界;虚拟数字人强调虚拟身份和数字化制作的特性。
从最小的范畴说起,虚拟数字人具备三方面特征:一是拥有类人的外观,具有特定的相貌、性别和性格;二是拥有类人的行为,能够用语言、面部表情和肢体动作进行“自我”表达;三是拥有类人的思考方式,能够识别外部环境,并与人交流互动。综合来看,就是具备四方面的能力,即形象能力、感知能力、表达能力和娱乐互动能力。如果我们下次再看到有新的虚拟数字人,就可以结合这些特征和能力来判断这个虚拟数字人的可信度。
数字人的运作原理
知道了什么是数字人,接下来就要搞清楚数字人到底是怎么说话、互动的,是背后有真人在操控,还是完全通过技术生成?
显而易见,数字人能否走远,核心在技术。数字人的诞生发展和AI 人工智能密不可分,想了解数字人的运作原理,首先要知道数字人的通用系统框架。数字人系统一般情况下由人物形象、语音生成、动画生成、音视频合成显示、交互等5个模块构成,其中交互模块为扩展项,根据其有无,可将数字人分为交互型数字人和非交互型数字人。
非交互型数字人是系统依据目标文本生成对应的人物语音及动画,并合成音视频呈现给用户。交互型数字人则根据驱动方式的不同,可分为智能驱动型、真人驱动型两类:
智能驱动型数字人,通过智能系统自动读取并解析识别外界的输入信息,并根据解析结果决策数字人后续的输出文本,驱动人物模型生成相应的语音与动作来使数字人跟用户互动。这种人物模型是预先通过AI 技术训练得到的,能够通过文本驱动生成语音和对应动画,业内将这种模型称为TTSA(Text to Speech & Animation,即文本转语音和动画,简写为TTSA)人物模型。
真人驱动型数字人,是真人根据视频监控系统传来的用户视频,与用户实时语音,同时通过动作捕捉采集系统将真人的表情、动作呈现在数字人形象上,从而与用户进行交互。
目前,数字人的制作方式自动化程度还很低,生产门槛又很高,关键技术还不完全成熟。下一步,相关厂商和行业会继续加大关键核心技术的创新,降低数字人的生产制作成本,提高对数字人面部和声音的还原度,推进数字人开放平台建设,增强技术可及性,最终实现更加自然、逼真的互动体验。
数字人常见的类型和应用场景
調研分析当前市场上的数字人,从外形上,可以分为卡通、写实等风格;根据人物图形维度,可以分为二次元、3D卡通、3D高写实和真人形象4种类型。这些种类繁多的数字人到底能否走远,关键还是看应用场景。
目前,数字人市场正处于前期培育阶段,替代真人的虚拟主播、虚拟偶像是目前的市场热点,应用偏向娱乐化。按照应用场景或行业的不同,已经出现了娱乐型数字人(如虚拟偶像、歌手、网红,虚拟代言人)、教育型数字人(如虚拟教师)、助手型数字人(如虚拟客服、导游、智能助手)、主播型数字人(如虚拟主播)、影视数字人(如替身演员、虚拟演员)等。虚拟数字人技术结合实际应用场景,越来越多地进入影视、传媒、游戏、金融、文旅等领域,根据需求为用户提供定制化服务。