人机共存时代播音主持行业发展路径探究
2023-04-25姚俊
姚 俊
(安徽艺术学院 传媒学院,安徽 合肥 230011)
2022年党的二十大召开期间,活跃在各大媒体的AI虚拟主播借助人工智能技术的东风,以创新传播的方式再度进入公众视野,为党会报道宣传注入科技动能,得到受众的高度关注,关于真人主播是否会消亡的争论在业界再次爆发。2021年10月,国家广电总局的发布《广播电视和网络视听“十四五”科技发展规划》就提出“推动虚拟主播广泛应用于新闻播报、天气预报、综艺科教等节目生产,提高制播效率和智能化水平”。这意味着,智能主播的运用已得到国家政策的高度支持,智能主播的发展已进入快车道。
以“人工智能”“播音主持”为关键词搜索文献显示相关研究成果较为丰富,大多关注智能主播时代播音主持从业者的差异化发展路径,但对于AI与真人的协作发展较少谈及,缺乏梳理与阐述。本文试图从人机特点入手,探讨二者共存时代协作发展的新路径。
一、媒介的人性化趋势
美国媒介理论家保罗·莱文森在1979年首次提出“媒介的人性化”,用来描述媒介技术在进化过程中表现出来的一种越来越符合人类需求和便于人类使用它进行信息交流的倾向。他认为任何一种后继的媒介都是一种补救措施,同时也揭示出媒介进化的终极目标即服务和满足人类的需求[1](P38-43)。
事实上,媒介技术的发展确实按照保罗·莱文森预测的轨迹运行发展着,并且在“媒介的人性化趋势”论点诞生后的二十年,虚拟主播应运而生,以方便人类的各种方式不断进化。
(一)非人格化的虚拟主播
2001年,英国籍虚拟主播阿娜诺娃以“开天辟地新创举”的气势率先试水新闻节目,那是一个拥有动漫头像的虚拟人物,用机械般的表达模式进行新闻播报。之后,美国、日本、韩国籍的虚拟主播们也相继出现。在我国,第一位虚拟主播小龙在 2004 年央视电影频道《光影周刊》栏目亮相。囿于技术原因,之前的虚拟主播们在操作方面还需要人力的辅助,并没有节约成本,且与受众广泛接受的“人格化”标准相去甚远,不能满足人类与之进行信息交流的需求,适用范围也较为有限,导致这波虚拟主播热潮昙花一现。
(二)AI技术生产的虚拟主播
2018年11月,在世界互联网大会上,新华社发布“全球首个人工智能主播”。这个自称“AI合成主播新小浩”的英俊小伙用标准的普通话向大家介绍,说自己使用了新华社主播邱浩的面孔和声音,然而他不需要休息,也不会生病,可以不停歇地工作。
随后,央媒的虚拟主播陆续诞生。2019年,央视网络春晚撒贝宁携“撒小贝”“龙小洋”等AI虚拟主持人团队向观众拜年;2020年全国两会期间,新华社的“新小萌”,《人民日报》的“小晴”等虚拟主播为大家带来最新报道。
2021年,国家广电总局的发布《广播电视和网络视听“十四五”科技发展规划》将虚拟主播纳入行业发展规划。
2022年7月,第一个省级媒体虚拟主播“长小姣”上岗,她在上海人民广播电台长三角之声担任主持人,第一次出镜的新闻资讯是“奥密克戎新变种或能逃避免疫保护”的相关信息。2022年两会期间各大媒体使用AI主播已成普遍现象。而今,更多的县级融媒体中心也展现出虚拟主播的身影。
还原度极高的“小”字辈虚拟主持人们以仿真的形象、丰富的表情、自然的动作、流畅的表达达到让受众无法区分虚拟和真人的程度。他们中有的熟悉各国语言,有的能与真人搭档互动,共同的特点是可以24小时随叫随到地开工,不会抱怨工作是否超负荷,也没有人际关系,薪资待遇等管理问题,大幅提升传播效率、降低使用成本,以愈来愈聪慧的技术革新态势预示着虚拟主播发展已进入快车道,“主持人”将不再是“铁饭碗”。播音主持从业者尚未解决因媒体深度融合而带来本领恐慌,又将面临可能会被AI主播替代的职业危机。
二、真人主播的独有优势
随着科技进步,大量的人工智能技术所达到的智商甚至情商会超越人类的部分能力。然而,“媒介人性化”决不等同于媒介智能化、媒介类人化。媒介智能化和类人化是指媒介将进化成类似人类的生命体,具有可以与人类抗衡的智慧和能力,成为“第二个人类”。这种“智能人类”是不可能出现的。若想不被虚拟同行们替代,需要理性分析人类独有的优势。
回顾传媒发展的历史,大体可以划分为口语传播时代、文字传播时代、印刷传播时代 ;电子与资讯的时代[2](P101-105)。媒介对人类文明和知识的传播作用毋庸置疑,从某种角度说,媒介促进了人类发展。
虚拟主播技术是电子与资讯时代的产物,真人主播从某种角度来说,是传媒界的第一代媒介,即口语传播者。为何人类发展进步至今,媒介更迭日新月异,口语传播者没有象报纸、书籍等媒介经历式微阶段呢?笔者认为,这是由于人类的独有特征所致。法国哲学家笛卡尔在17世纪便提出,人与机器的区别在于人具有理性的灵魂,“我思故我在”。
(一)“我思故我有”态度
根据笛卡尔的观点,人工智能语言即便可以组合词汇回应人们的提问,但也未必能最适应当时的场景,即便在某个问题领域回答得很出色,但在其他方面可能存在缺陷,而人则可以,因为理性是万能的工具,能用于一切情景[3](P38-55)。
播音员主持人是党和人民的喉舌,承担着“讲好中国故事,传递好中国声音”的重任。必须清醒地认识到,国际形势错综复杂,播音员主持人需要在长期的实践和学习中培养过硬的政治素养,方能在关键时刻体现出个人的态度。
央视新闻联播播音员康辉一向以稳重冷静的态度而被观众喜爱,然而在怒怼某国对我国的不实言论时,他不仅使用了“荒唐的令人喷饭”等接地气的语言表达,而且使用了AI虚拟主播无法做到的“笑语”技巧,将大众心中对不实言论的不屑和愤慨表达得淋漓尽致。
湖南卫视主持人汪涵具有能力强、情商高、反应快的特点。在一次节目中,嘉宾吴京表演太极拳。汪涵说太极拳以柔克刚,你家住哪里直接把你推回去,台湾省嘉宾欧弟接话说我在台湾哦。汪涵不动声色地机智回答:“台湾我们不推,要拉回来。”赢得满堂喝彩。
以上两位真人主播用自己的表达彰显了自己的责任意识和政治素养,对事情有态度是真人主播超越虚拟主播的独有优势。
(二)“我思故我有”情绪
新华社研究院中国企业发展研究中心2023年6月发布的《人工智能大模型体验报告》中,对于人工智能的情商进行测试,其中百度文心以较强的共情能力、高情商的表达获得了最高分,然而遗憾的是,目前尚未将这项技术与弄到AI主播的程序中。
共情是心理学范畴的概念,是个体对他人情绪情感的理解、推断以及自身产生相似情绪反应的过程,可以使个体准确感知他人所处的情绪状态并在此基础上做出恰当情绪反应,与亲社会行为密切相关[4](P892-904)。共情是需要在互动中体现的。即便是同一个人,在不同的场景下,也会对同样的问题给出不同的答案,甚至在同样的场景下,因为当天的身体、情绪等原因,对同样的问题给出不同的答案。
按照程序运作的机器人并不是根据理解来解决问题的,无法保证在互动中会有恰当的共情表达。更何况,人类的共情不仅仅凭借语言,还依赖于表情、眼神、体态等细微的副语言。
汶川地震期间,央视主播李梓萌在现场掩面而泣,令人动容;众多现场报道的记者疲惫的神情,难以克制的悲痛和嘶哑哽咽的表达给人带来强烈的共鸣情绪。
对于播音员主持人来说,共情不仅仅是对受众情绪的体察,更是与受众的情感链接,是有温度的表达。在新冠疫情期间,有媒体使用AI主播播报新闻,准确率和效率的确大幅提升,然而无法在言语中体现出党和国家对人民的深切关怀。
与精密的机器相比,在某些方面人类或许显得笨拙,但维系人类社会的是爱与同情,这种人类独有的共情能力是高智商机器人所无法养成的。
(三)“我思故我有”个性
传播学之父、美国学者威尔伯·施拉姆在《传播学概论》中曾提出著名论断——“传播是各种技能中最富有人性的”,赋予了传播“人”的内在属性[5](P52-55)。相比较于AI主播按照既定程序完成播出任务,真人主播在长期工作中,会逐渐形成自己的主持风格,并以自己独有的方式进行传播。他们个性鲜明、情感饱满,这种不同个体独有的人格化特征是AI主播暂时无法做到的。
江苏卫视《非诚勿扰》主持人孟非被称为“史上最特别的月老”。他原是民生新闻主持人,后转型主持娱乐节目。因为长期的新闻主播素养,以及平民化接地气的视角,使得《非诚勿扰》穿着娱乐节目的外衣,却有着社教节目的灵魂,在主持人孟非的引导下,《非诚勿扰》成为引发受众对择偶观、爱情观、家庭观、心理健康、亲密关系等话题深入思考的高质量婚恋节目,其间所传递出的价值观,有着明显的主持人孟非气质,这就是真人主播的人格魅力。
主持人的个性对节目风格影响是巨大的,会给节目贴上个性化标签,成为节目的符号。比如说到中国诗词大会,受众集体无意识会想到董卿。换成龙洋后,观众们久久不能适应,虽对于也很出色的龙洋不太公平,但不得不说,这是由于之前董卿的个性化特征赋予节目的气质非常浓郁,以致于换成任何一个主持人总觉得后者是一位客人。
2015年前后,关于主持人个性与节目风格之间的关系,是很多业界人士探讨的热点,研究成果也较为成熟。一般认为,主持人的个性风格与节目的时代背景、节目形式、受众喜好与个人特质息息相关[6](P170-172)。其中个人特质的形成与原生家庭、专业背景、就业经历、专业基本功、情感经历、品格修养均有密切复杂的关系,而个体与生俱来的个性气质更是影响个性的重要因素。不同的主持人在节目中关注的视角侧重点、主持语言的特点,甚至着装、笑容都会千人千面,节目风格也随之相应改变。
在播音主持艺术中,从原始文本的“一度创作”到主持人的“二度创作”,再到节目后期的“多重创作”,都凝结了不同阶段创作者的个人体验、经历沉淀、文化认知。人们描述特定现象的生活无法绝对客观,总是以特定的视角观察对象[7](P34-38)。因此只有当AI主播真正以“拟人际化”的方式呈现在传播当中,营造出“面对面”逼真的交流效果,才能有所谓的个性[8](P115-132)。
(四)“我思故我有”缺点
2001年7月,北京申奥成功,央视记者在镜头前情绪激动地发出破音的吼叫“我们成功了,北京申奥成功了!”这条不足60秒的现场新闻报道获得当年中国新闻奖最高等级的奖项。以专业的角度去看,这位记者的表现有诸多缺陷,过高的声音位置、口齿不清的表达、飞快的语速、兴奋到不够端庄的面部表情等。但她的情绪与全国人民高度链接,让人从中感受到作为中国人无以言表的激动和自豪。这就是真人主播的魅力。笔者曾于2019年和2022年在教学中尝试使用当时的智能语音技术试播这条新闻,2019年的机器人语音较为机械化,而2022年已能表达出平稳的兴奋状态,且兴奋的毫无瑕疵。
有心理学家指出,人们都很喜欢、相信那些非常自信的人,但是人们又非常质疑完美的人,会和那些非常完美的人保持一定的社交距离和心理距离。因此过于完美的智能语音并不会让受众产生亲近信赖的心理,因为人无完人,过分完美不够真实。
假设有一天,智能技术让AI主播达到了类人化的人格又会怎样呢?1970年机器人专家森昌弘警告世人,机器人如与真人高度相似,可能会陷入“恐怖谷”的怪圈。他的研究表明,人类对于智能人因好奇而产生的好感,随着拟人化程度的提升而不断提高,直至相似程度达到100%的时候,会陡然下降,让人产生厌恶和惧怕的感受。
直至目前,并未有研究和报道证明AI主播陷入恐怖谷理论,一方面说明人们对于AI主播的兴趣依然是有增无减,另一方面也说明职称AI主播的智能技术暂无法达到与真人比肩的境地。人机共存时代即将到来,且将持续较长阶段,成为媒介技术迭代值得载入史册的发展阶段。
三、人机共存时代的职业发展路径
人工智能主播逐步拟人化的发展,曾引发学界和业界对于人类播音员主持人是否会被取代的探讨,而近两年,这种探讨的激烈程度逐渐下降。因为人们发现,未来人工智能主播的应用场景可能与人类主播并不完全重合,这不仅是因为在政治导向、深层语义的理解表达等方面依然存在难以逾越的技术壁垒,也是因为人工智能主播在存在方式、应用场景方面的广度可能会超越传统意义上的播音员主持人。凭借人工智能技术的机器学习能力,人工智能主播的类型化和个性化将与个体使用行为紧密联结,从而走入寻常百姓的家中,定制化地服务于个体[9](P86-87)。
在全媒体时代的当下,人工智能技术下的AI主播确实能够节省人力,节约成本,取代重复度高、模仿性强、思辨力弱的节目种类,因此也确实会使得播音主持岗位职数下降,导致一些技能不如AI的真人主播失业,但并不会让这个职业消失。
由上述分析得出,真人主播若想在人机共存时代,不被大浪淘沙,必须拥有不被虚拟以及真人同行所替代和超越的技能特征。
(一)符合全媒体时代的复合型技能
复合型人才是当下不同行业共同的需求。何为复合型人才,指的是不仅在专业上较为突出,还同时拥有熟练掌握与专业相关技能、具备在多个岗位工作能力的人才,是知识、技能、思维的多方面复合。这与大多数人概念中以为“复合”指的仅是具备多项技能而有所不同。
复合型知识是复合型技能的前提,而复合型思维则体现了人才创新力和能够从不同角度思考为题的变通能力。随着时代的发展,各个行业的复合型内涵会随之改变。
1.播音主持行业的复合型演变。中国播音主持高等教育创始人之一马尔方早在改革开放初期就高瞻远瞩地强调播音员要“一专多能”“采编播合一”。彼时,中国传媒大学被称为北京广播学院,仅招收以专科为培养目标的播音员。作为播音教育的先驱者,马尔方提出,学校应该有一个播音馆,拥有比电台更加先进的设施供学生进行训练,这样培养出来的播音员还能懂得采编技能,有利于播音水平的精进和提升。马尔方先进的教育理念在九十年代初期开花结果。
随着节目播出形态的变化,上世纪90年代初期,最早的采编播一体的主持人诞生在广播平台,大多指的是直播节目的主持人,他们需要在设备和技术人员的保障下,独立完成采编播一连贯的工作任务,曾几何时点歌节目、夜话节目主持人成为一代人心中的白莲花。而电视台的播音员不仅需要播出新闻,还会随时与场外记者进行连线报道、与专家进行新闻访谈等等,因此他们不仅仅是播音员,还成为“一专多能的主播”。
当前,我国有600所高校设立了播音与主持艺术专业,在人才培养方案中,不约而同地提到培养采编播一体的复合型人才,2019年之后有高校修订人才培养方案,复合型人才的画像调整为采编播摄录制一体的复合型人才。
可见,随着时代的发展,复合型的内涵也会随之改变。
2.全媒体时代播音员主持人的复合型内涵。习总书记在二十大报告中提到要加强全媒体传播体系建设,那么,全媒体时代的播音员需要怎样的复合型技能呢?
2019年,被戏称为神仙打架的央视的《主持人大赛》通过搭建国家级的电视主持人竞赛平台,以80、90后为主的选手们有着过硬的专业能力,他们借由鲜活的时代人物和中国故事,准确、客观地传达新闻信息,并不断抒怀对时代发展、社会进步、优秀传统文化传承的真切感受;还有很多非播音专业的选手借助跨界技能脱颖而出,例如选手果新禹熟练运用智能技术,携手以他为原型塑造的AI主播“向果果”共同参赛,带领受众观看时光博物馆,展现祖国七十余年的变化,让观众在感同身受的同时体验智能技术的耳目一新[10](P52-54)。
这次被戏称为神仙打架的大赛生动诠释了新时代所需要的播音员主持人类型:精湛的专业能力+交叉跨界的知识结构,这是播音员主持人复合型技能的3.0版本。
(二)如何练就全媒体时代的复合型技能
全媒体时代赋予播音主持行业“复合型技能”更饱满的内容,播音主持从业者需要快速适应岗位需要,在全媒体建设体系中,跟上步伐、不拖后腿,不被淘汰。
1.丰富知识结构,让知识复合。在使用AI主播逐渐成为行业发展趋势的当下,单纯的播报工作不再是真人主播唯一需要夯实的专业基本功。笔者访问的某省级新媒体集团负责人认为,他们不再需要只会读稿背稿的播音机器,而是需要有节目相关专业知识的内容生产者和新媒体运营人才,电商直播主持人,需要了解运营方面的技能,短视频新闻节目需要能够熟练运用采编播一体的技术,独立完成一期节目。
不仅新媒体如此,传统媒体也是一样。央视二套的财经节目主持人李斯璇具有经济学和数学交叉学科知识背景,科学类节目《是真的嘛》主持人黄西是一位生物学博士,央视一套主持人撒贝宁毕业于北大法学专业。
多学科背景使得真人主播在完成工作任务时能够更好地把握节目内容、表现出专家型主持人的特征,具有不可替代性。
2.夯实专业技能,让专业复合。提升情商,做有温度的口语传播者。人与机器最大的差别是人具有灵魂。敏捷地体察他人情绪,与受众和嘉宾建立情感链接,是AI主播无法习得的能力。独有情商(EQ)又称情绪智力。它主要是人的非智力因素,最早由美国耶鲁大学教授彼得·沙洛维和新罕布什尔大学教授约翰·梅耶于1990年提出。包括自治、自励、自控、通情达理与和谐相处五个方面。
提升情商对于真人主播至关重要,在AI 主播无法完成的新闻访谈、人物访谈、综艺类节目、情感类节目类型中,与工作人员和嘉宾友好相处、顺利沟通,灵活机动地面对节目录制时发生的问题。因此,培养高情商的表达,最大化地体现出真人主播的人文关怀,将成为真人主播无法被替代的优势。
深耕内容,做有思想的口语传播者。凸显人类的理性灵魂,这是人与机器的最主要差别。内容为王的理念在任何传媒时代都是普遍真理。自媒体时代,出现很多优秀的主播,他们大多不是专业的播音员主持人,比如“逻辑思维”的罗永浩、“灵魂有香气的女子”李筱熠,他们的普通话语音不够标准、他们的表达未必专业,然而他们牢牢抓住市场需求,以深厚的文化素养,强大的内容生产能力占领市场。
播音员主持人理应培养全媒体时代的复合型思维,深挖节目内容,让自己成为节目的符号,体现出独有的个性化特征,是主持人最具核心竞争力的能力。
3.树立学习意识,让思维复合。重视深度思考力、坚持终身学习、开发多技能,在实践中实现自我迭代、价值提升,是播音员主持人在全媒时代下延长职业生涯的关键因素。
我国600所高校的人才培养方案中的培养目标均存在无法及时与实践岗位需求相匹配的问题,这不是学界专家及教学管理者的问题,而是因为媒介发展的速度日新月异。对于已经走上主播岗位的从业者来说,知识的更新迭代更需要通过自身的努力。
首先,要走出舒适圈,嗅觉灵敏地感知当下媒介的变化;其次要根据媒介变化冷静思考自己的发展方向;第三要了解发展方向所需要的知识技能并及时规划自己的学习,利用实践岗位的优势,理论结合实践快速学习。
能够快速转变思想,不断革新自我,不仅可以提升守正创新的能力,还可以培养思维复合能力。这对于根据程序来完成工作任务的AI来说,是具有难度系数较高的能力。
结 语
全媒体背景下的人机共存时代,真人主播需要更新复合型技能理念,加速自身成长和转型来应对市场变化,做AI做不了的事,做真人同行替代不了的事,从知识结构、专业技能、思维模式等进行自我革新,提升跨界能力、夯实专业基础,坚持终身学习,成为有温度、有思想、有创新力的人才,做党和人民的喉舌,讲好中国故事,传递好中国声音。无论是AI主播,还是真人同行,在与其他同行竞争时,方能不被淘汰。