AI在服务
2023-10-08九一
九一
场景一
地点:直播间
时间:深夜
人物:主播
事件:忙了一整天了,主播又累又困,可直播还没有结束。他只好一边打哈欠一边继续工作,这样一来,工作效率更低了。最后,因为主播太饿了,说话都没有力气,肚子还咕噜噜响了起来,大家都很无奈。
场景二
地点:太空实验基地
时间:中午
人物:航天工作人员
事件:大家都对这次航天活动很感兴趣,希望能看到现场的一些情况。因此,航天员乘组想带一位专业记者到太空去。可是带谁去?航天员中很少有人受过专业的新闻采访训练,而专业记者又没有航天员所具备的专业素养和身体状态。这件事实在不好办。
看到这些场景,相信你们都已经知道解决方法了。对,就是使用虚拟人物。近几年,越来越多立体生动的虚拟人物正在进入我们的视线,帮助我们解决了不少问题,也给我们带来了很多不一样的体验。
主播亮相
相信很多人还记得2022年初北京冬奥会上的首位AI手语主播。
据统计,全球约有4.3亿人有中度及以上程度的听力障碍,而中国就有约2780万听力障碍者。为了让这些听障人士也能和正常人一样了解比赛的动态,感受比赛的热情,央视推出了这位独特的主播。该主播一亮相就引起了广泛讨论。其端庄的气质、姣好的面容、生动灵活的表情都让人们眼前一亮。更为重要的是,虚拟主播的手語动作精确而又连贯。
要实现这一切,背后其实需要做大量的工作。首先,这位主播的诞生,依赖于数字平台。这样的数字平台可以基于任意单个平面的人脸,重建高精度的立体人脸,并对虚拟人脸立体模型进行编辑,让生成的人像更为生动逼真。此外,这位主播可以进行播报,因为她具有数字大脑——两个引擎:一个是通过语音识别、自然语言理解等技术驱动的手语翻译引擎,负责把文字或语音翻译成手语动作;另一个是自然动作引擎,负责进行虚拟驱动,把动作在虚拟人身上呈现出来。这位虚拟主播接受了《国家通用手语词典》标准的熏陶,构建了自己的冬奥手语语料库,包括肢体动作和表情等语料;数字大脑也经过训练,掌握了手语表达的方法,因此具备高度可懂的手语表达能力和精确连贯的手语呈现效果。
相比人类手语主播,这位虚拟主播不仅可以连续播报不休息,还可以避免不同手语主播因手部习惯不同,导致“千人千面”,从而影响听障人士的理解。这样一来,听障人士就可以和正常人一样,随时了解冬奥会的情况。
记者就位
经常关注科技新闻的人可能已经知道,全球首位数字记者兼航天员小诤已经开始工作了。
2021年6月17日,神舟十二号的3名航天员顺利进驻天和核心舱后,小诤第一时间发出报道《穿越空间站》。那是小诤的第一次出场。
在随后制作播出的空间站建设、航天员出舱、空间站科普等一系列“现场报道”中,这位记者在空间站等多种环境下执行了采访任务,还做出翻转等大幅度动作,完成了真人记者难以完成的任务。
小诤的制作过程非常讲究,工程师专门找来一位和小诤气质相近的演员作为参考,甚至在小诤的脸上种下10万根汗毛。他们还让女演员戴上动作捕捉设备,捕捉某个特定动作发生时人体的一系列变化,以此对小诤进行精细建模,制作动画。
其实,小诤也不是最早的虚拟主播。早在2021年5月,央视的“五四”晚会上就出现了一位虚拟主持人晓央;在游戏直播行业更是出现了很多虚拟人物。技术的蓬勃发展,让数字人不仅在人像和表情上非常生动,还在沟通交流方面有了长足的进展。未来,数字人可能会具备类似人类的听说读写和逻辑推理等各项能力,那时候它们又将给我们带来何等惊喜呢?让我们拭目以待!