新媒体短视频中合成语音的幽默建构及修辞策略
2021-11-07赵梦歆
摘要:近年来,以讯飞配音等企业为代表提供的语音合成(TTS)产品在抖音等短视频平台的内容创作中的使用趋于普遍。文章以合成语音为研究对象,以乖讹论为幽默理论基础,对合成语音的幽默成因进行分析,并总结提炼合成语音产品在新媒体短视频中的修辞策略,以此为新媒体短视频创作者提供新的创作思路。
关键词:合成语音;短视频;乖讹;修辞策略
1.引言
语音合成又称文本转语音(Text To Speech)。中国信通院数据显示,我国智能语音市场规模已达到100.7億元[1]。手机APP、儿童故事机、智能机器人等多种场景都有语音合成技术的身影。作为参与内容创作并建构幽默内容的重要符号,智能合成语音为新媒体短视频内容创作提供了较大的空间。那么合成语音的幽默成因及其在短视频内容创作中的修辞策略,即为文章的研究议题。
2.关于合成语音的应用研究
在新闻传播领域,翁佳(2017)认为合成语音从长远看来在提高播报效率、稳定播报质量方面均具有优势,但目前存在的音色单一、语流顿涩等问题不可回避[2]。喻国明(2020)等人认为,与能够提供更多节奏和音调等副语言变化的真人语音相比,合成语音可以被看作是提供信息不足、需要受众加入丰富联想的冷媒介[3]。
3.合成语音的幽默机制
3.1乖讹论
既然合成语音相较于真人语音在表情达意方面并无明显优势,为什么合成语音却成了新媒体短视频中建构幽默元素的重要组成部分呢?合成语音如何参与幽默的建构?这要从基础的幽默理论中寻找答案。作为三大主流幽默理论之一的乖讹论(Incongruity Theory)是在当代幽默研究中占主导地位的幽默理论。乖讹论的核心特点是不和谐带来的陌生化。根据Suls(1972)的乖讹-消解模型,在幽默产生的第一阶段,笑话的接收者发现他/她对原文的期待被笑话的结尾证明是不匹配的[4],这种不匹配、不和谐正是形成幽默的开始。康德和叔本华(Attardo,1997)都从乖讹论的角度对幽默进行了定义,均认为幽默是“不和谐的表现”[5]。Beattie(Ritchie,1999)认为:乖讹是两个或更多不和谐、不协调的部分在一个复杂的合集中统一起来[6]。王韵(2008)将幽默乖讹分解为常识乖讹、社会文化乖讹、修辞乖讹和语意乖讹四个部分。并认为修辞乖讹的实现是形式和内容的不和谐是造成的[7]。
幽默是基于内容与内容、内容与形式、形式与形式之间的不和谐,而这种不和谐是受相应语境框架下制约以至于这种不和谐是没有恐慌感的。合成语音语调固定单一、语流顿涩,难以为短视频内容提供丰富的韵律形式。这恰恰满足了乖讹形成幽默的两个前提条件,一方面短视频的文本内容及其他模态元素为整个短视频营造了幽默的前提语境,另一方面,音调固定、音色单一、语流顿涩的合成语音与前者已构建出的语境出现强烈但没有负面情绪的不和谐、不协调。
4.合成语音在新媒体短视频中的修辞策略
文章在抖音平台上选取不同领域的几类短视频账号,通过对短视频文本的详细分析,获得合成语音呈现幽默的修辞策略。基于前述幽默的产生机制及对短视频内容的分析,合成语音参与幽默修辞大致可以分为四种乖讹类型。
4.1合成语音与内容的修辞乖讹
语音是语言的物质外壳,语言依靠语音实现其社会功能。因此,语音本身承载了语言信息和韵律线索两方面元素。然而,当语言信息表述时所需的韵律线索与合成语音提供的韵律线索发生不匹配时,则乖讹产生。
4.2合成语音象声词与表达词义的修辞乖讹
在当今网络环境中,呵呵、嘿嘿等象声词被赋予了更多含义。如呵呵,原本仅是笑声的象声词,但是在当今语境中增加了否定别人的同时又表达嘲讽和不懈。因此可以说,象声词在不同语境中拥有多种表情功能。而短视频合成语音的象声词韵律较为固定,其表达并不能覆盖所有人们想要表达的真实情绪,但恰是这种“无能为力”,塑造了合成语音与语境之间强烈的乖讹感。
4.3合成语音与模态的配合
视频传播一向是多模态的,在“大屏幕”向“小屏幕”、“长视频”向“短视频”演进的今天,新媒体短视频的信息密度更高。为了能够在较短时间内完成大量信息的传播,单位时间内利用多模态共同呈现短视频主题成为了必要的修辞手段。合成语音与画面、音乐、音响等其他模态共同建构而形成的不和谐,其幽默的建立形成了合成语音幽默的新风格。
5.结语
合成语音作为一种修辞手段,为建构短视频的幽默效果提供了一种新策略——基于合成语音的特性及其与短视频诸元素的配合与布置,在乖讹理论的指导下,让合成语音参与到短视频的创作中以强化短视频整体的幽默效果。但是,在这一时间节点,在当今技术背景下,合成语音经过短视频内容创作者的灵巧加工后必然会具有独特的幽默功能。这“不完美”的声音必将被更多人记住,这正是语音修辞送给短视频受众的意外之喜。
参考文献:
[1]《2020年智能语音行业市场趋势预测及投资战略可行性》,搜狐网,https://www.sohu.com/a/401090451_120624718
[2]翁佳.智能语音技术对播音主持专业与行业影响探究[J].电视研究,2017(12):57-59.
[3]冯菲,王文轩,修利超,喻国明.冷热媒介:合成语音与真人语音的不同传播效应——基于EEG的实验证据[J].新闻与传播研究,2020,27(12):5-20+126.
[4]Suls,J . M. A two stage model for the appreciation of jokes and cartoons:An information processing analysis[A]. In Goldstein &. McGhee ( eds. ) The Psychology of Humor :Theoretical Perspectives and Empirical Issues [ C]. New York:Academic Press,1972:81- 100.
[5]Attardo,Salvatore. The semantic foundations of cognitive theories of humor [J].Humor:International Journal of Humor Research.1997,( 10- 4):395 - 420.
[6]Ritchie,Graeme. Developing The Incongruity Resolution Theory [A]. In Proceedings of the 9 th Symposium on Creative Language:Humor & Stories.Edinburg,1999.
[7]王韵.幽默乖讹的再现——试论王尔德喜剧的翻译[J].河南社会科学,2008(03):123-124.
作者简介:赵梦歆(1986—),男,汉,河南开封,讲师,硕士,武汉晴川学院,应用语言学。