人工智能主播的功能局限和未来发展可行性研究
2024-04-06段华陶玉洁秦畅
段华 陶玉洁 秦畅
摘要:人工智能技术的支撑,打开了媒体行业发展新格局。当前,这一发展成果被应用到传播领域,人工智能主播出现在大众视野。文章通过分析人工智能主播建设的战略格局及其所呈现出来的功能局限,评估其未来发展的可行性,旨在拓展人工智能主播研究新视角、延伸人工智能主播应用新思路,进而推动传媒产业、人工智能主播产业的发展。文章结合北京人民广播电台真人数字人“时间小妮”、湖南卫视数字主持人“小漾”以及新华社数字记者、全球首位数字航天员“小诤”的应用情况,借鉴和参考中国播音学、传播学、计算机科学以及人工智能等相关学科的知识,针对人工智能主播在广播领域的发展现状,探析如何挖掘人工智能主播的潜力与价值,得出人工智能主播虽然在信息传递、娱乐和其他领域中发挥着重要作用,但在语音合成、情感模拟、信息质量和人际互动等方面存在一系列功能局限的结论。文章指出,受众对人工智能主播的接受度与其功能水平密切相关,需要更多的技术创新和用户体验优化来推动其进一步发展。未来,人工智能主播将凸显其在信息传播和用户互动方面的潜在价值,朝着定制化、情感化、智慧化的方向发展,通过人工智能技术为受众精准画像并进行个性化分析,推送个性化内容,提高受众的依赖度。
关键词:人工智能主播;应用现状;功能局限;发展路径;未来方向
中图分类号:G222.2;TP18 文献标志码:A 文章编号:1674-8883(2024)03-0005-03
课题项目:本论文为2022年度广东省本科高校在线开放课程指导委员会研究课题“关于在线开放课程驱动高校混合教学变革研究——以普通话语音课程为例”成果,项目编号:2022ZXKC267
一、我国人工智能主播发展现状
目前,我国的人工智能主播建设普遍呈现以“主流媒体引导、互联网公司技术支持”为特点的战略格局。在实际应用方面,人工智能主播的进化发展呈现出从声音文本到智能语音对话的转化[1],再到多模态交互的“三步走”战略,研究进度走在世界前列。
在2018年第五届世界互联网大会上,新华社联合搜狗公司推出世界首个全仿真智能主持人“新小浩”。该智能主播以主持人邱浩为原型,可以根据实际需要选择汉语或英语播报,实现了“声音的文本转化”初步设想[2]。但由于当时技术有限,所以首个全仿真智能主持人只能“坐播”,无法添加相关联的肢体动作[3]。
2019年,新华社与搜狗公司联合发布全新升级的站立式、女性人工智能主播“新小萌”,并投入当年有关全国两会的新闻报道中。这标志着中国人工智能主播技术迅速成熟,具有实际应用意义。站立式女主播可以根据相应播报内容展示肢体动作,声音更具有亲和力[4]。
2020年,新华社联合搜狗推出3D人工智能合成主播“新小微”,在视觉上还原了真人发肤,在立体感、灵活度、可塑性、交互能力等多个方面的设计上进行了全方位的优化[5],增加了播报内容时真人情感的肢体和表情外露。
除了新华社,以央视、新京报为代表的主流媒体也在积极研究推进人工智能主播技术发展。2018年5月2日,在CCTV13的特别报道《直播长江》中,虚拟主持人“康晓辉”与记者在现场进行对话互动、表演绕口令,声音和形象都栩栩如生[6]。从新闻画面里可以了解到,虚拟主持人“康晓辉”并不是提前制作好的动画,而是实时操控的画面[7]。此外,央视与百度公司合作推出的人工智能手语主播在2022年北京冬奥会中投入使用,服务世界听力障碍人士,彰显人文关怀。
北京广播电视台充分利用台内资源,挖掘传统广播电视台的转型路径,将台内当家主持人春妮的形象转化为数字化形象,发布中国首个广播级智能交互真人数字人“时间小妮”,处于业内的“第一梯队”。央视在对其的评价中提到,“以往,其他主流媒体生产的数字人产品多集中在人工智能主播领域,而‘时间小妮则侧重于用户服务功能,以人工智能和情景对话的形式为用户奉上贴心服务”[8]。
湖南卫视数字主持人“小漾”取名灵感源于英文单词“Young”,寓意与湖南卫视立台理念“年轻与青春”相符。“小漾”与当代20岁左右的年轻人一样,对事物充满激情和热爱,同时又自信、阳光。她现在的定位是实习主持人,后续她将在湖南卫视的各类综艺、晚会中完成辅助人类主持人沟通节目環节、活跃现场气氛等工作。
2021年6月17日,神舟十二号载人飞船发射圆满成功,中国空间站迎来了新华社数字记者、全球首位数字航天员“小诤”,它承担着载人航天工程、探月工程、深空探测工程等国家重大航天项目的现场报道任务[9]。近段时间,“小诤”主要驻扎在中国空间站天和核心舱,并“游历”于国际空间站、和平号空间站,讲述有趣的航空航天知识。
二、人工智能主播的功能局限
人工智能主播虽然在信息传播、娱乐和其他领域中发挥着重要作用,但其在语音合成、情感模拟、信息质量和人际互动等方面仍存在一系列功能局限。
(一)语音合成的局限
当前人工智能主播的语音在自然度和流利度方面,虽然语音合成技术不断改进,但人工智能主播的语音仍然难以与人类语音的自然度和流利度媲美。有时,人工智能主播的语音可能显得机械或生硬,难以模拟真实人类的表达和情感。
在口音和方言方面,语音合成技术在处理多种口音和方言时可能面临困难。人工智能主播的语音可能无法准确模拟特定地区或群体的语音特征,导致观众难以理解或认同。
(二)情感模拟的局限
人工智能主播通常是基于预先编程的脚本和算法运行的,缺乏人类的创造性和情感深度,通常无法提供与人类一样的情感深度和情感互动,尤其是在复杂的情境下。其情感模拟的准确性依赖情感识别技术[10]。虽然已经有了不少进展,但情感识别仍然不够精确,可能导致人工智能主播错误地理解或回应用户的情感。并且,它们难以真实地理解和回应用户的情感需求,导致在某些情境下显得冷漠或不够体贴。
(三)信息质量和可靠性的局限
缺乏判断能力。人工智能主播通常是基于预先编程的算法运行的,缺乏人类的判断和验证能力。因此,难以准确识别和过滤虚假信息,容易传播不准确或误导性的信息。
信息源的可信性。人工智能主播获取的信息往往来自各种渠道,难以评估信息源的可信性,因此可能传播未经验证的信息。
信息失真和误解。虽然自然语言处理技术不断改进,但人工智能主播仍然存在对语义和上下文的理解挑战。这可能导致信息的失真和误解,使其與原意相去甚远。
多义性问题。人工智能主播难以准确理解和解释多义性的语言表达,这可能导致信息误解。
专业领域知识限制。人工智能主播通常不具备特定领域的专业知识,只能提供基本的信息和答案,难以解决复杂问题或提供有深度的见解,因此在特定领域的信息传递中可能出现局限。
(四)人际互动的局限
人工智能主播无法完全替代真正的人际互动[11]。人类之间的情感联系和复杂互动不仅依赖语音和图像模拟,还包括非语言沟通和情感互动。预先编程的脚本和算法运行限制了人工智能主播在实时互动中的表现,其难以应对实时互动和复杂对话,特别是在需要迅速适应情境的情况下。
此外,人工智能主播难以进行非语言沟通,如肢体语言、面部表情和眼神交流,这限制了其在建立深刻的情感联系方面的能力[12]。
三、人工智能主播未来发展方向
随着技术的不断进步,人工智能主播功能局限正在逐渐减弱,Google的WaveNet和OpenAI的GPT-3声音合成模型可以生成逼真的人类声音。而Deepfake技术的显著进展,能够使人工智能主播以令人难以分辨的方式模拟人的脸部表情。
据国际数据公司(IDC)的统计,计算机视觉市场预计在未来五年内以每年20%的复合年增长率增长,这些技术进步都为人工智能主播在未来的发展和应用提供了更多机会。
(一)个性化和定制化
未来的人工智能主播可以通过为受众精准画像,根据受众的需求和喜好进行个性化和定制化,以提供更具吸引力的用户体验,包括调整语音特点、情感回应以及提供特定领域的信息和建议。
由此可见,客户发展的需求促使定制化的人工智能主播产生。例如,市场需要播报体育赛事信息的人工智能主播,可根据体育赛事观众信息了解需求进行人工智能主播设计,使其达到体育赛事播报的资格要求。
同时,随着相关技术的成熟,人工智能主播或能实时将手机屏幕文字转换成语音,并支持用户根据个人喜好挑选语音包,拥有自己的专属主播。显而易见的是,这项技术将为社会中的视障用户群体提供极大便利[13]。
(二)情感化发展,贴合温度
人工智能主播的情感化发展首要目标是提高情感识别和模拟能力。这包括更好的语音情感分析和情感识别技术,使人工智能主播能够感知用户的情感状态,并以相应的方式互动。情感模拟将包括更自然的情感表达和声音情感合成,使人工智能主播的语音和表情更贴近真实[14]。
未来,人工智能主播将能够提供更个性化的情感回应,能根据用户的个性、偏好和情感需求,调整情感表达和互动方式[15],以更好地满足用户的需求。这些调整有助于提供情感支持和心理健康方面的应用。人工智能主播可以成为孤独人群的情感伴侣,提供更富有情感的互动体验,也可以用于心理治疗、情感识别和干预。
(三)智慧化升级,贴合智能高度
一直以来,人工智能领域朝着贴合人性智慧发展需求演化,由于传媒行业是面向社会受众的,所以其对主持人综合能力和知识储备的检验也是全方位的。人工智能主持人需要不断完善社会知识储备与增加人情味,不仅仅是语言,还有肢体、表情管理与智能的联动配合,如此才能更好地满足社会受众的需求。
此外,传媒行业需要与社会保持密切联系,特别是对社会的热点新闻需要及时捕捉,这样才能更好地实现与公众的互动,更好地开展工作。为此,人工智能主播必须不断丰富知识储备,以满足社会发展的需求。
四、结语
人工智能主播是一个备受瞩目的技术领域,虽然其在功能上存在一些局限,但未来仍有巨大的发展潜力。随着技术的不断进步,人工智能主播的语音和表情模拟能力将得到优化提升,情感模拟将更加深入,应用领域将得到扩展,伦理和法律框架将逐渐完善。人工智能主播有望在未来成为更普遍的工具,为人们提供娱乐、信息和服务。但在发展过程中需谨慎处理伦理和法律问题,以确保其使用的合法性。
参考文献:
[1] 王鹤.人工智能时代职业主持人应有的坚守与变革[J].互联网周刊,2022(22):67-69.
[2] 孙昊.人工智能技术在媒体信息生产与传播中的应用研究[J].信息与电脑(理论版),2022,34(5):153-155.
[3] 陈峰.赛博空间虚拟偶像的亚文化构建与迷群崇拜研究[D].长春:吉林大学,2023.
[4] 刘萍.媒体融合背景下主流媒体语态变革的守正创新[D].长春:长春工业大学,2023.
[5] 陶一萍.以技术创新打造精品融媒体产品:新华社智能化编辑部两会报道的实践与思考[J].中国传媒科技,2020(6):11-13.
[6] 贾军.媒体智能化背景下的新闻生产研究[D].武汉:武汉大学,2020.
[7] 白秀梅,徐世民.虚拟主播在应急气象影视节目制作中的应用探讨[J].黑龙江气象,2020,37(2):31-32.
[8] 李伟良.广播电视和网络视听行业“次元偶像”现况探究[J].广播电视信息,2022,29(5):18-20.
[9] 综合.虚拟数字人“走进”生活[J].现代班组,2022(3):16.
[10] 刘大诚.人工智能情绪识别应用研究[J].中国高新科技,2019(13):59-62.
[11] 任秋璇.从主持传播角度浅析人工智能背景下主持人被替代的可能性:以新华社“AI合成主播”为例[J].视听,2019(12):146-147.
[12] 卫艳菲.人工智能技术下视频新闻的新嬗变[J].传播与版权,2021(5):4-6,9.
[13] 戴伟. AI主播的人性化传播实践与探索[J].视听,2023(2):140-143.
[14] 王十. AI主播的拟态话语研究[D].天津:天津师范大学,2023.
[15] 吕欣,许倩.万物互联与人机共生:新冠肺炎疫情期间的网络传播实践与思考[J].传媒,2021(4):23-25.
作者简介 段华,副教授,研究方向:播音主持业务、大型赛事体育展示、新媒体传播。陶玉洁,研究方向:新媒体传播。秦畅,研究方向:新媒体传播。