APP下载

虚拟数字人技术在广电新媒体中的应用

2024-10-20韦剑峰

卫星电视与宽带多媒体 2024年19期

【摘要】随着数字化转型的加速,传统广电新媒体的内容生产和用户互动方式已经无法满足现代观众的多元化需求,为适应时代发展,本文首先探讨了虚拟数字人技术的基本原理,包括其背后的人工智能、计算机图形学和自然语言处理技术,并阐述了虚拟数字人技术在广电新媒体中的应用优势,如提升内容创作质量、增强用户互动体验以及优化品牌形象等方面,其次结合央视网的“阿央”、央视元宵晚会的“小C”,川观新闻的“小观”等数字人实际应用案例,分析了广电新媒体中如何应用虚拟数字人技术,以为行业内外专业人士理解并运用这一颠覆性技术提供理论参考。

【关键词】虚拟数字人技术;广电新媒体;人工智能;自然语言处理

中图分类号:TN92 文献标识码:A DOI:10.12246/j.issn.1673-0348.2024.19.008

随着科技的飞速发展,人工智能和数字技术在媒体产业中的应用已成为推动行业进步的重要力量。虚拟数字人技术作为一种前沿科技,正逐渐改变广电新媒体的内容生产、传播方式及观众互动模式。这种技术利用计算机图形学、人工智能算法等先进技术创建出能够进行语音识别、自然语言处理和情感交互的虚拟角色。在全球范围内,越来越多的广播电视机构和新媒体平台开始探索使用虚拟数字人进行节目制作和服务提供,以期提高效率、降低成本并吸引更多年轻观众。而且随着5G通信技术的普及和大数据分析能力的增强,虚拟数字人在个性化内容推荐、实时互动反馈等方面展现出了巨大潜力,其不仅可以实现24小时不间断的内容生产与发布,还能根据观众行为和偏好提供定制化服务,极大地丰富了广电新媒体的内容生态系统,并为行业带来了创新驱动的发展机遇。因此,探讨虚拟数字人技术在广电新媒体中的应用具有较强的现实意义和理论价值。本文旨在结合广电新媒体实际,分析如何在实际中应用虚拟数字人技术,以达到提高内容创作质量的目的。

1. 虚拟数字人技术的基本原理

虚拟数字人技术是融合了多种高新技术的复杂系统,主要包括人工智能(Artificial Intelligence,AI)、计算机图形学(Computer Graphics,CG)、自然语言处理(Natural Language Processing,NLP)以及机器学习(Machine Learning,ML)等领域的前沿技术,所以虚拟数字人技术是多种前沿技术的集合体。具体而言,人工智能是虚拟数字人技术的核心,AI技术赋予了虚拟数字人智能和自主行为能力。深度学习和强化学习等方法使AI能够分析和理解大量数据,从而生成符合人类行为模式的反应。例如,依托深度神经网络,虚拟数字人可以学习并模拟人类的行为习惯和动作逻辑。同时,计算机图形学是虚拟数字人技术的基础。CG技术指的是各类高精度的三维建模和渲染技术,利用此类技术,可以创建出视觉上高度逼真的虚拟形象(即虚拟数字人本体)。其中三维建模技术利用多边形建模、曲面建模等方法构建虚拟数字人的骨架和皮肤,甚至可以利用高精度的三维扫描技术直接捕捉现实世界中的人物形象,生成逼真的虚拟模型。纹理映射和材质渲染技术则可将拍摄到的皮肤、衣物等表面细节映射到三维模型上,进一步增强了虚拟数字人的视觉效果,再利用高级渲染算法如光线追踪和全局光照等,实现逼真的视觉效果。自然语言处理技术可以使虚拟数字人能够理解和生成人类语言,实现与用户的自然交互。利用语音识别技术将用户的语音输入转换为文本,而语音合成技术则将生成的文本转化为自然流畅的语音输出。现代语音合成技术,如基于深度学习的WaveNet模型,已经能够生成高质量的、具有情感的语音。文本理解与生成是基于训练大型语言模型(如GPT-3、BERT等),进行大量语料库的预训练,捕捉语言中的复杂语法和语义关系,从而生成符合上下文的自然语言回复[1]。

2. 广电新媒体中虚拟数字人技术的应用优势

2.1 提升内容创作质量

虚拟数字人技术利用高度逼真的三维建模、动画和渲染技术,能够在各种场景中实现精准而自然的表演,使得内容更加生动和吸引人,极大地丰富了内容创作的手段和表现形式。这种技术不仅可以模拟真实人类的外观和行为,还可以根据实际需求创建超越现实限制的角色和场景,打破传统内容创作的物理和逻辑约束。而且,实际应用中结合机器学习和AI算法,还能生成或辅助生成新闻报道、教育教程等内容,提高内容生产的效率和质量[2]。

2.2 增强用户互动体验

自然语言处理(Natural Language Processing,NLP)和深度学习等AI技术的支持下,虚拟数字人可以实现与用户自然流畅的交互对话。相比传统静态或预录制的媒介形式,虚拟数字人可以根据用户输入实时生成响应,提供个性化信息服务或娱乐互动。例如,在直播、访谈节目中引入虚拟主持人或访谈嘉宾,不仅能够以更低成本维持24小时不间断播出,还能根据观众反馈及时调整节目内容或风格。这种高度互动性极大地增强了用户体验,并且可以有效提升用户参与度和忠诚度。

2.3 优化品牌形象

在品牌营销和形象塑造方面,虚拟数字人技术借助其高度定制化与独特魅力的虚拟代言人或品牌形象大使,可在保证一致性和专业性的同时也为品牌注入新鲜元素和活力。相比真实代言人,虚拟代言人不受时间、空间限制,并可避免一些涉及真实代言人的负面风险事件,而且数据分析和机器学习算法的综合运用,可以更精准地把握目标群体偏好及行为模式,从而设计出符合用户期待并能深度触达心灵的品牌宣传材料[3]。

3. 广电新媒体中虚拟数字人技术的应用策略

3.1 内容创作与节目制作

利用虚拟数字人技术进行内容创作与节目制作的目的是提升节目的创新性、互动性和个性化服务。虚拟数字人技术可以突破传统制作的物理和时间限制,实现更加灵活、高效和丰富的内容呈现。以世优波塔AI数字人多模态交互系统的“阿央”数字人(隶属于央视网)为例,虚拟数字人在内容创作与节目制作中,首先需要进行虚拟形象的设计与创建。这一步骤包括三维建模、角色设计、动画制作和表情捕捉等技术。技术人员可根据设计需求创建虚拟数字人的外观,并利用动画制作工具为其赋予自然流畅的动作和表情。表情捕捉技术则以实时捕捉真人面部表情的形式将其应用到虚拟角色上,使其表现更加逼真。以阿央为例,其虚拟形象的设计参考了许多真人主持人的特点,依托精细的三维建模和动画制作,使阿央能够在主持过程中表现出自然的微笑、眨眼和其他面部表情,增强观众的沉浸感[4]。

实际内容创作中,虚拟数字人可以通过自然语言处理(NLP)技术进行智能对话和内容生成。利用深度学习算法,虚拟数字人能够理解并生成自然语言,使其能够与观众进行实时互动。在2024年6月27日晚的北京数字经济体验周启动仪式上,便运用了来自世优波塔AI数字人多模态交互系统“阿央”,现场不仅与现场主持人共同完成了启动仪式的主持工作,还利用智能对话系统,与观众进行互动,回答现场提问,并介绍活动内容。这种互动性极大地增强了观众的参与感,使得节目更加生动有趣。同时,虚拟数字人在节目制作中还可以利用多模态交互系统实现更加丰富的互动方式。多模态交互系统集成了语音识别、手势识别、图像识别等多种技术,使虚拟数字人不仅能够通过语音与观众互动,还能够识别观众的手势和表情做出相应的反应。例如,在启动仪式上,当观众向阿央挥手致意时,阿央能够通过手势识别技术识别观众的动作并做出回应,这种多模态互动方式大幅提升了观众的体验感。

内容生成方面,虚拟数字人可以利用机器学习算法和大数据分析实现自动化内容生产。例如,在新闻节目中,虚拟数字人可以根据实时抓取的新闻数据自动生成新闻稿件并进行播报,并能分析观众的观看习惯和偏好,动态调整节目内容,使其更加符合观众的兴趣。在6月27日的启动仪式上,阿央根据观众的反馈实时调整了节目内容,使整场活动更加贴近观众需求,提升了节目的吸引力。节目制作过程中,还可以利用虚拟数字人和虚拟场景制作技术实现更加多样化的场景呈现。虚拟场景制作技术包括绿幕拍摄、虚拟现实(VR)和增强现实(AR)等技术。通过这些技术,虚拟数字人可以出现在各种虚拟场景中,与真实场景无缝融合。例如,阿央在主持过程中,能够在虚拟的演播室中自由移动,与虚拟道具进行互动,使节目呈现更加生动有趣。这种虚拟与现实相结合的制作方式,不仅提升了节目的视觉效果,还为观众带来了全新的观看体验。而且,在现场,阿央分别围绕元宇宙、数字人、北斗导航与卫星遥感、智慧出行等数字经济核心领域和多维度体验场景,介绍了本次推出的8条体验路线,以“可观、可感、可学、可互动”的形式,使在场参会人员体验到了经济发展的成果[5]。

从央视网虚拟数字人“阿央”的实际应用情况分析,虚拟数字人技术在广电新媒体中的应用不仅提升了内容创作与节目制作的效率和质量,还依托智能对话、多模态互动、虚拟场景制作和个性化推荐等手段,为观众带来了全新的互动体验和观看体验。

3.2 增强用户互动体验

广电新媒体领域,增强用户互动体验的关键在于利用虚拟数字人技术创造更加丰富、个性化和沉浸式的互动场景。虚拟数字人可以以实时交互、多样化的表现形式和智能化的互动能力,为用户提供了前所未有的参与感和沉浸感。例如,央视网的虚拟数字人“小C”从2021年至2024年,已经在多次重大活动和节目中成功应用。央视网的小C首次亮相于2021年,其在“两会C+真探系列直播节目”中担任起了记者的角色,与全国人大代表进行独家对话。小C依托流畅自然6544ff7266fe141d0e30c1d5a281b0b490dce3177c198ccf831b9b6b00ca1064的语音交流和实时的表情反馈,增强了观众的参与感和互动体验。为实现这一点,需要在节目制作中部署高效的实时语音处理和数据传输系统,确保虚拟数字人能够快速、准确地回应观众的提问和反馈。同时,虚拟数字人的个性化设计和情感表达是提升互动体验的核心。此方面,小C利用机器学习和人工智能技术,虚拟数字人可以根据观众的互动行为和反馈,动态调整自己的言行举止和情感表达,使互动更加贴近人类自然交流的体验。实际应用中,小C在2022年3月2日,央视网打造的《大咖陪你看冬奥》栏目在《C位看冬奥》板块中,主持风格多变、语言风趣,不仅使节目内容更加生动有趣,还有效地增强了观众的参与感和忠诚度。为实现这一点,需要对虚拟数字人的行为模型进行精细化的训练,使其能够在不同的互动场景中表现出多样化的情感和行为。

除上述外,虚拟数字人技术还可以利用沉浸式体验的创造增强用户互动体验。利用虚拟现实(VR)和增强现实(AR)技术,可以为观众提供身临其境的互动体验。例如,在《2024央视网络春晚》中,小C利用AR技术与现场主持人和观众进行互动,使观众不仅能够观看节目,还能参与到节目中来,极大地提升了互动的深度和广度。实现这一点需要将虚拟数字人的形象和动作与实际场景无缝融合,并确保互动过程中的时效性和流畅性。此外,虚拟数字人还可以利用跨平台、多设备的互动策略,扩大用户的参与范围和互动体验。在不同的媒体平台和设备上提供一致且优质的互动体验,使观众无论通过电视、手机还是电脑,都能与虚拟数字人互动。例如,小C在多个活动和节目中的应用,不仅仅局限于电视屏幕,还可利用社交媒体和网络平台与观众进行互动,增强了其影响力和互动效果。

小C在央视活动中的多次成功应用,不仅展示了虚拟数字人在增强用户互动体验方面的巨大潜力,也为未来广电新媒体的发展提供了参考和借鉴。随着技术的不断进步和应用的深化,虚拟数字人将在广电新媒体领域发挥越来越重要的作用,进而推动媒体互动形式的不断创新和用户体验的持续提升。

3.3 虚拟角色与故事叙述

将虚拟角色与故事叙述的结合,能够为观众带来更加丰富和动态的内容体验,增强节目内容的互动性和吸引力。

以川观新闻的虚拟数字人小观为例,在虚拟角色的创建上,小观的形象设计上符合新闻传播的专业性,其具有一定亲和力,从而在不失权威性的同时,增加与观众的情感连接。故事叙述方面,小观不仅仅作为新闻的播报者,更是故事的参与者和推动者。例如,在报道重大新闻事件时,小观可以进行现场模拟,利用AI技术模拟不同的新闻场景,让观众感受到身临其境的体验。此外,小观还能根据新闻内容的需要,变换报道的语气和风格,从严肃的政治新闻到轻松的娱乐报道,小观都能做到角色的自然转换,这种多样性极大地丰富了新闻内容的表达形式。

具体到故事叙述的编排,小观的日常报道不再是单一的新闻事实陈述,而是引入相关的历史背景、相关数据分析、专家访谈等多种元素,形成多维度、立体化的新闻故事。这种叙述方式不仅提升了新闻的信息价值,也使得观众能够从多个角度理解新闻事件,提高了新闻的教育意义和观赏性。而且,在特殊节目如纪念日或节假日特别节目中,还会以小观为核心特别设计故事线和互动环节,与观众进行更深入的互动。例如,在春节特辑中,小观不仅报道节日相关的新闻,还会介绍节日习俗、进行互动问答等,依托这些互动环节,观众可以感受到节日的氛围,同时也加深了观众对虚拟数字人小观的喜爱和认同。此外,小观的应用还考虑到了多平台的内容分发,比如四川日报在川观新闻客户端中的首页突出位置设置了“小观数字人”入口,使得用户无论是利用电视屏幕、网络直播还是社交媒体,均可与数字人进行互动,这便大幅增加了观众与虚拟角色互动的机会,使新闻内容能够迅速、广泛的传播。

4. 结束语

本文系统性分析了虚拟数字人技术在广电新媒体中的应用方法,发现这项技术正成为推动传统广电行业转型升级、满足现代观众需求变化的关键工具。实际应用中,广电新媒体可结合实际需求,利用虚拟数字人进行内容创作、增强互动体验,构建虚拟角色进行故事叙述。未来,随着相关技术的持续进步和优化,虚拟数字人将在内容创作质量、用户互动深度以及品牌推广效果上实现更大突破,相关人员应积极探索新技术、新理念在广电媒体虚拟数字人中的运用,进一步提高虚拟数字人的智能化程度,以推动广电新媒体向数字化、智能化转型发展。

参考文献:

[1]李青,刘勇.教育虚拟数字人标准体系设计及其路径规划[J].现代教育技术,2024,34(07):70-80.

[2]段文红,王景.元宇宙背景下虚拟主持人应用的实践与探索[J].全媒体探索,2024(06):99-100.

[3]李晓夏,肖思莹,张阔麒.沉浸式虚拟艺术在数字展示空间的应用[J].鞋类工艺与设计,2024,4(12):98-100.

[4]任佩瑶.贵州苗族虚拟数字人的设计思路与应用[J].文化产业,2024(18):147-149.

[5]叶秀端.虚拟数字人短视频传播中华优秀传统文化的影像叙事逻辑[J].中国编辑,2024(06):71-76.