APP下载

人工智能主播的技术发展溯源与演化路径探索

2023-12-13毕文佳

记者摇篮 2023年9期
关键词:主播语音媒介

□毕文佳

人工智能主播又被称为虚拟机器合成主播,是以电子信息仿真技术为依托、人工智能技术为驱动,在基于互联网技术建构的诸多全媒体平台中充当“信息采筛”主持与“信息解码”播报角色的智能化媒介产品。人工智能主播在技术变革发展的不同时代进行着转型升级,呈现出不同的功能特征,绘制了分散式的演化路径,这是智媒传播AI技术的未来研究重点与应用方向,对我国智媒传播的发展具有重要意义。

一、“人工智能”技术与“主播”主体的融合特征思考

1.“技术”“主播”——离身认知到具身认知的交互融合

现阶段的人工智能主播以AI 合成技术为依托,在实际应用过程中逐渐显示出离身认知与具身认知的交互融合特征。例如:用户在实际使用过程中赋能基础特征、功能、代号及名字,增强了人工智能主播的具身性,从而也推动了“主播”主体的人格化进程,进而“名人主播复制版”型AI主播泛化,也呈现了离身认知与具身认知的有效交互。

2.“技术”“艺术”——播音与主持艺术的智能化升级

人工智能技术在多种媒介呈现形式上都有留痕,特别是大数据、云计算、物联网、区块链及5G的植入促成了人工智能“人”具备数据采集、整合、处理、分发的功能,具备了强大的存储、分析、永动等技术特征。而播音与主持艺术的专业性和独特性集中体现在“人”的个性化语言表达,无论是语言表达中的“情景再现”“内在语”“对象感”内部技巧呈现,还是“停连、重音、语气、节奏”的外部技巧要求,都呈现了主持人“二度创作”“个性化”“人格化”的播音主持特征。

人工智能辅助技术同播音与主持艺术的有效融合,可通过两方面呈现:一方面,主持艺术的语言表达呈现可用数据化、标准化量值形成程序代码,对于“人工智能”技术的革新与辅助提供可计算性元素智库存储,为“机械化”过渡“人格化”助力,使AI 主播在形象、音韵、情感等维度进行创新性打造,促进信息传播报道更具情感化色彩;另一方面,智能技术的集优化、拟人化升级拓宽了人工智能主播的应用领域,不仅助力于媒介生产与生活,而且渗透到万物互联的全媒体传播生态各个环节中,使“艺术”赋能“技术”,推动了人工智能主播的进一步发展。

二、人工智能主播的技术发展溯源

1.有声语言的技术性创造

第一,人工智能语音转化技术。语音转化技术一方面是对现有文字符号进行有声化转述,此技术多应用于定制化、模板化的新闻生产输出,如天气预报等,可提升新闻智能化呈现的时度效。另一方面是对已有语料库的人物语音识别、采集、复制、重组。声音不再是一种独具特色与个人色彩的传播介质,而是在技术的作用下变成了一种可复制、可生产的传播介质。

2018年《创新中国》纪录片的配音工作是我国利用人工智能语音转化技术的初探,利用采集与重组编辑了已故配音演员李易的声音,被业界人士称为全球首个利用人工智能语音技术完成解说与配音的大型国家纪录片。其技术原理为,确定文本内容并向设备中录入需要模拟的声音素材,形成文本智库与声源智库,利用智能技术分析重组。在此过程中,人工智能的自我学习深化及对需要模仿对象的吐字发音细节掌控,相对精准。

就目前技术发展来看,人工智能技术已经实现了对声音的批量化生产,这种近似流水线的生产模式不仅能提高相关节目的解说与配音效率,节省大量时间,还能有效避免发音不清、读错字情况的出现,在一定程度上降低了人力资源的消耗。但该技术目前受到特定文本的制约和限制,并未完全实现自动化与智能化,提取发音音频的方式也并不能使其摆脱对特定文本的依赖,这为未来的技术革新破题提供了路径方向。

第二,人工智能语音合成技术。语音合成技术指的是情感语音合成与语音筛选回馈技术,技术人员的主管程序植入使“机器人”主播具备智能语音对话的互动,在技术内部实现了机器的自动化检索与输出,实现了交互融合功能。具体来说,在情感语音合成技术的推动下,人工智能主播能根据文本内容和声音素材的特点,对其中所蕴含的情感进行分析和把握,在充分了解当前语境的情况下利用自生产能力与对话管理能力来实现与人类的智能语音对话与自然语言应答。语音合成技术广泛植入于物联网链接下的全员媒介、手机等大众小屏媒介终端设备及智能家电、可触性穿戴设备。在全媒体传播生态建构的过程中,“中央厨房”及“智媒体”融合中心的内容生产部门,利用高质量的人工智能语音合成技术有效、快速识别新闻场景,加速新闻生产,丰富新闻内容,从而为后续的人机协同与交互奠定了基础。

第三,人工智能语音交互技术。语音交互技术的有效应用实现了人工智能主播在虚拟与物理现实中的双重多模态交互。具体来说,人工智能主播可分为实体形态与虚拟形态两种,而就目前情况来看,虚拟形态的人工智能机器人在动态化交互技术的作用下,已经能对相应人物进行扫描与虚拟生成,从而为观众展现出较为逼真的虚拟真人形象或具有鲜明个人色彩的卡通动漫形象;而对于实体形态的机器人来说,其内部配备的高清人像扫描设备能对相应人物的运动或表情变化进行追踪,并通过追踪结果自动化生成与之相对应的微表情、肢体动作及语言,实现对人类动作或语言的识别与准确回应。尽管人工智能主播能在动态化交互技术的辅助下,将真人转变为各种虚拟模型,但技术人员还应在使用该技术的同时注重观众的观感体验,尽可能使人工智能主播摆脱目前这种介于真人与虚拟之间的局面,对其外观可能造成的传播影响进行分析和研究,从而找寻人工智能主播的发展出路。

2.“人格化”“个性化”的技术模拟与设计赋能

人工智能主播的形象产品定位和功效能率产出共同决定了其“人格化”的偏向与特征,通常用户会将人工智能主播定位为社会角色中的先赋角色,即有“对象化”的模拟赋能形成一种新型角色关系。这种关系性角色是人类用户与人工智能主播或机器人进行协同合作与交互的基础和保障。技术人员和算法工程师能够利用角色转变技术为人工智能主播赋能,使其具有高度融洽的运行逻辑与运行模式,而正是由于这种融洽性,人工智能主播即使配备了各类先进技术,也只能以非自然人的身份与人类用户进行交流与互动。若出现了媒体等同,比如在明确其同类机器人身份的情况中,相关人员也只能通过相关技术手段来对人工智能主播的社会临场感加以调整,使其站在人类用户理性角度上尽可能满足使用者的需求。不仅如此,在人工智能主播的设计阶段,为了使人工智能主播能更好地在现实生活中扮演先赋角色,设计者和算法工程师以人类社会为依托,在对现实生活群体的活动特征与相应效能进行分析的基础上,加强了人工智能主播在人脸识别与建模、动作捕捉、情感迁移等方面的功能,从而使其生成的AI 分身模型更具人性化色彩,以至于最大限度上贴近了目标人类主播的各方面特征。

尽管数据推送在新闻生产的分发环节应用日趋娴熟,但是在当下人工智能主播的“私人定制”式多元化内容生产及输出表现较弱。当下人工智能主播还未能针对不同的节目形态及需求呈现出多元的能力和个性化的展示,实现媒介生产的供需满足与平衡发展。目前还没有一项技术能真正使其脱离人工干预,主持人的能力素养也无法通过当前的技术完全赋能于人工智能主播。人工智能技术的个性化呈现强调的是对不同场景进行功能识别与功能产出。对于人工智能主播来说,这种功能细化能进一步加强其人格化特征,使其在多维度“仿真”的建构进程中可以无限近似于人,增强人工智能自身的深度学习。用户可在使用和交互中注意到人工智能主播的个性化表现,从而增强用户的人际交往感知。不仅如此,态度与行为也能对用户使用人工智能主播产生一定的影响。比如,用户对人工智能的现有态度、个性特征等会对人工智能的应用产生相对应的作用;而人工智能主播在为用户提供个性化定制与推荐服务时,也会受到用户习惯偏好与行为习惯的影响。因此技术人员可通过对用户信息进行分析来调整和优化人工智能主播的参数,从而提升用户的使用满意度,加快人工智能主播的发展步伐。

三、人工智能主播的演化路径探索

1.全息沉浸式传播,元宇宙深度互联

在全媒体传播生态的建构进程中提出了全媒体的定义解读,即全程、全息、全员、全效。技术视域下的全息传播实践,是为了打通物理世界与虚拟世界的边界,利用人工智能技术、虚拟现实影像技术、物联网5G 技术实现立体化、环绕式传播,力图在元宇宙初探时建构虚拟媒介生态,真正实现无障碍的虚实空间交互传播。具体来说,现有的人工智能主播还仅存在于二维空间的智能设备屏幕中,这种具有单向性的视听范式虽能有效满足人类用户的需求,但却会在一定程度上削减人工智能主播与人类用户进行多模态感官交互的效果。而在全息投影技术的支撑下,AI 主播与真人主播可以呈现共时空同画面的方式展示在用户面前,利用虚拟现实VR眼镜等身体感官延伸终端,可以真切地让受众感受到“在场”。人工智能主播元宇宙空间的“超媒介”生产应用,即人工智能主播能够在各种场景和环境中使用,从某种角度来说能够摆脱空间的限制,在互联网、物联网与虚拟现实技术的多重作用下,实现了数据信息、人类用户与机器之间的有效连接。

2.人机协同共生,创新优势互补

虽然“主持人”是否会被人工智能主播所取代的议题仍争辩不断,但是主持人利用AI主播提升职业素养,进行高可信度的人际、大众传播实践却在有条不紊地进行。人工智能技术的辅助能够帮助播音主持人、记者采集海量数据信息,辅助直播连线与即兴采访报道;辅助新闻主播进行“备稿”重音停连的划分;辅助综艺类主持人进行受众的情绪态度抓取及满意度微表情反馈等,人机的协同共生让我们真正向往“赛博格”的无边界化、交融互动的创新优势互补。当下人工智能主播的发展困境不仅是技术壁垒,在数字信息技术及编程解码赋值上,跨界的计算机技术人员难以掌握艺术的要领与特殊的职业技巧知识,更重要的是用户的接受程度与需求程度。最新研究表明,在新闻生产领域,特殊的类型化新闻内容生产,人工智能的新闻生产采编播所收获的可信度高于职业媒体人的参与。这表明,当下用户的媒介使用与媒介反馈都产生着较大的变革,这与社会经济发展紧密相关,也与使用媒介的类别、方式、频率相关。而主持人这一依托于传统媒介诞生的媒介元素,是否会在新型的媒介生态建构中重新寻找、拓展自身的价值,挖掘职业效能取决于是否能够真正落地“人机协同”与“优势互补”。

3.深化媒体融合,建构传播生态

媒介融合的深化是“人”与“技术”的融合,而传播生态的建构是社会角色的转变与传受关系的重构。人工智能主播打破了原有传受关系,其自身存储的海量信息数据与对文本的高速识别重组能力,大大超出人类本身的能力限度。而千人千面的大数据私人定制与不间断的深化学习,更能让“技术”了解、帮助、满足“人”的需求,从而使人工智能主播更具人性化、个性化、观众缘。未来人工智能主播会朝着个性化与差异化的方向发展,人工智能主播未来有机会成为每位人类用户的私用物品,相应的差异化定制与个性化社交功能也会进一步得到提升,人类用户也会利用人工智能主播来实现对自我角色的有效延伸与拓展。

人工智能主播改变着社会关系及数字化时代中的人际交往关系,在互联网与大数据技术的推动下,人类用户与人工智能主播之间的关系更具数字化与虚拟化特征,而当这种数字化程度发展到一定程度时,人工智能主播就会脱离人工的控制与束缚,依赖各类算法对相应的新闻报道进行审核和明确。这种方式具有更高的准确性与公平性,削弱了新闻媒体报道中的主观性,尽可能减少或降低了人类主观意识与情感的影响,使得人类用户与人工智能主播的关系得到重新构建。

四、结语

当下,全媒体传播生态正在建构,媒体融合的深化过程中,核心技术是发展基础。人工智能技术参与媒介生态建构的重要呈现就是人工智能主播的生产、演化、发展、应用。我国人工智能主播在现阶段的发展中还存在着一系列问题。因此研究人员与算法工程师必须及时转变传统观念与思维,利用先进的技术手段来对人工智能主播进行优化与创新,尽可能增强其个性化与智能化特征,从而为人类用户提供更高质量的服务,使其“人”与“技术”互构的张力作用充分发挥出来,从而增强用户黏度、用户信度、用户效度,推动智能媒体传播的健康发展。

猜你喜欢

主播语音媒介
第一次做小主播
媒介论争,孰是孰非
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
书,最优雅的媒介
我是小主播
我是小主播
我是小主播