AI“歌手”翻唱类音视频的情绪价值、技术隐忧及应对策略

2023-11-21王朝洋

西部广播电视 2023年17期

王朝洋

（作者单位：黑龙江大学新闻传播学院）

数字技术的发展正逐渐改变着人们日常生活的方方面面，技术对于传统社会的渗透也冲击着人类现有的认知和生活方式。2023年3月，歌手陈珊妮发行了由其AI模型演唱的歌曲《教我如何做你的爱人》，该歌曲通过AI音轨和唱法技巧模型搭建的神经网络和复杂算法来实现演唱。这一行为艺术式的歌曲制作映射出人工智能技术对于音乐领域的颠覆式改变。

然而，AI技术在歌声合成方面的应用并非首次，早在2007年出道的日本虚拟偶像“初音未来”就运用了AI歌声合成技术。但是，专业公司打造一个虚拟歌手的启动成本要几十万元，经济成本的掣肘使得虚拟歌手的创造局限在资本化的专业领域。而如今在网络开源社区（又称开放源代码社区，一般由拥有共同兴趣爱好的人组成），普通用户根据某一声音的声库就可以免费训练一个自己的虚拟歌手，技术的可操作性和近乎零成本的投入为AI“歌手”的民间创造提供了可能。此外，AI“歌手”翻唱音视频的上百万次点击量也反映出其能提供给用户独特的情绪价值，但对于AI“歌手”的内存技术问题、版权争议和未来发展，学界和业界应当更加重视。

1 AI“歌手”翻唱类音视频的技术实现路径与平台扶持

AI“歌手”的音频是基于“生成式语音模型”的一款人工智能生成内容（Artificial Intelligence Generated Content, AIGC）产品，使用AI音色转换技术Sovits4.0版本生成。创作者需提前准备好歌手的采访、直播等素材，经过去呼吸声、去杂音等技术细节处理以保留歌手的“干声”，即歌曲去掉乐器、伴奏、混响、和声后剩下的“原始声音”，再将素材投入到机器中“训练”出AI“歌手”的音色。

AI“歌手”翻唱音视频的走红不仅有技术层面的支持，也有平台力量的推动。例如，哔哩哔哩（bilibili，简称“B站”）音乐区推出的“虚拟之声创作计划·2023年第二期”就鼓励创作者根据要求对歌曲进行“原创/翻调/填词/改编”等创作，并给予优质作品流量扶持和活动奖励，目前该活动已有近亿次浏览量。

此外，技术层面的低门槛与平台方面的助推力量为普通用户打造AI“歌手”提供了可能性，用户利用开源社区的现有声库，根据成熟的算法程序进行“填空式”操作，便可将不同的声音与任意歌曲进行搭配组合，AI“歌手”的打造权和歌曲翻唱的支配权开始向用户开放。

2 AI“歌手”翻唱类音视频的情绪价值

2.1 替代性满足：实体缺席下的数字分身陪伴

“替代性满足”理论来自弗洛伊德的精神分析心理学，指欲望能量在最初对象上遇到阻碍时会向其他对象转移，是一个层层转移、不断妥协的过程，因此最终的替代对象与原始对象之间也会存在差异[1]。歌手本人因种种原因难以保证持续的新歌产出与演艺活动开展，以至于在粉丝和大众的视野中不甚活跃时，粉丝出于对喜爱歌手的思念和期待而利用AI技术实现歌手的数字分身在赛博空间“营业”。因此，即便歌手本人缺席，只留存声音在场，粉丝也能获得替代性的满足感。如孙燕姿的粉丝在听到“AI孙燕姿”的翻唱歌曲后评论，“都说不好听、没感情，我的第一反应是，多好的粉丝福利”。AI“歌手”作为歌手的数字分身能够从心理上抚慰粉丝的焦躁心理，用声音提供陪伴感，以满足粉丝的期待。

2.2 参与式创作：想象力延展与记忆重塑

亨利·詹金斯在其著作《文本盗猎者：电视粉丝与参与式文化》中将参与式文化表述为“粉丝对电视文本进行盗猎挪用与拼贴重组”[2]。在互联网时代，粉丝将歌手声音的素材与其他歌手的歌曲进行拼贴重组的参与式创作，一方面是在技术支撑下的想象力发挥，如用王心凌的声音呈现韩红的《青藏高原》，用特朗普的声音搭配《我爱你，中国》，超越现实的想象力在技术赋权下得到了实现的可能。另一方面，网友的评论提供了记忆层面的分析维度，如“年轻时听孙燕姿，是对爱情的憧憬和幻想；年轻时听周杰伦，是单恋的苦涩和回味。他们的不完美，就像我们年轻时的感情。现在他们结合在一起，真完美”。歌手与歌曲的重组不仅仅是简单的搭配组合，也是个体记忆的重塑。过往记忆中的遗憾以一首首旋律所谱写，而如今的释怀也由喜爱的声音演唱着喜爱的歌曲来见证。用户参与下的音视频创作由此在想象力和记忆层面完成了延展和重构。

2.3 戏谑式狂欢：“红人加热歌”的民间游戏

巴赫金的狂欢理论以民间为研究立场，指出狂欢节的主要仪式是人们以笑谑形式推举“国王”为其加冕和随后脱冕[3]。在AI“歌手”的翻唱音视频中，歌手和歌曲的原本样态仿若国王的“王冠”，是平民无法触及之物，而在狂欢节中，如“陈墨瞳1995”等B站UP主（uploader，指在视频网站、论坛、ftp站点上传视频音频文件的人）因发布“AI孙燕姿”的翻唱作品而获得平民“加冕”，相关歌手的粉丝也由此开启了一场戏谑式的狂欢游戏。而与自上而下的权威音乐发布形式不同，这种自下而上的由普通用户发起的民间游戏有着反主流、反权威的特征，“红人加热歌”的推歌形式将“平民”心中的实力歌手与优质歌曲进行重新组合，用户自行打造着理想中“未来华语乐坛的发展方向”。

2.4 遗憾之填补：已故歌手的数字永生

当前，元宇宙是学界和业界共同关注的热点议题。学者喻国明曾对元宇宙进行描绘：“元宇宙是集成与融合现在与未来全部数字技术于一体的终极数字媒介，它将实现现实世界和虚拟世界连接革命，进而成为超越现实世界的、更高维度的新型世界。”[4]有学者曾预言，“在元宇宙社会，因为生命可以数据化，个体生命也就能够永远存在”[5]。当歌手因疾病或意外事件离世后，其留存的作品成为“绝唱”。而AI“歌手”作为数字媒介实现了个体持续化的连接，生与死的界限在媒介技术的操作下逐渐“消失”，已故歌手在赛博空间实现数字永生。例如，姚贝娜的歌迷通过制作“AI姚贝娜”翻唱歌曲将个体的哀思转化为更广泛领域的社会性纪念，粉丝以此方式填补自己喜爱的歌手无法再演唱的遗憾，他们相信这种具有哀悼式的“关怀文化”能够证明死者仍然存在于某种精神领域。

3 AI“歌手”翻唱类音视频的技术隐忧

3.1 “流水线”式生产与作品灵韵丧失

AI“歌手”翻唱歌曲只需通过歌手声音素材和其他歌手歌曲的拼贴即可完成制作，远比现实中歌手制作歌曲的流程简易，AI“歌手”甚至能取得高于歌手本人的受关注度。由消费推动的AI“歌手”翻唱作品的批量生产使歌曲成为流水线式的工业品，丧失了其作为艺术品的独特价值。

此外，AI翻唱歌曲虽运用了歌手的声音素材进行机器训练，但受限于人工智能的技术属性，人本身的情感与情绪无法得到有效诠释。因此，现有AI“歌手”的歌曲演绎仍饱受听众“没有感情”的诟病。从戈夫曼的拟剧论视角看，AI“歌手”的翻唱是基于数字技术的“理想化表演”[6]。但歌手的“补救表演”甚至是演唱时的失误，因其更加打动人、更加真实往往也被视为一首歌曲的灵韵所在，这是追求效率和准确性的机器所无法实现的。

3.2 技术解构下人沦为机器的养料

解构主义作为后现代思潮的一种，是后结构主义的一个重要分支，是对结构主义的批判和发展，其始作俑者是法国当代哲学家雅克·德里达（JacquesDerrida）。“延异”是解构主义的关键词之一，在时间和空间两个维度被赋予了延迟和间距的双重含义[7]。AI技术解构了歌手作为人的整体性，将歌手的声音从人本体中间隔开来，并与其他音频素材进行重组拼贴，是技术作为人的创造物反过来支配人的异化表现。此外，AI“歌手”的翻唱以歌手声音素材的机器训练作为前提，在这一过程中，人的主体性被悬置，歌手身为“人”的属性被削弱，歌手成为AI的养料，人演变为技术发展的内容物，也使网络用户产生“AI未来会替代人类”的担忧。

3.3 居主导地位的粉丝数字劳动

英国学者克里斯蒂纳·富克斯总结的数字劳动（digital labour）具备以下学界普遍认同的特征：劳动发生场所是以数字技术为支撑的互联网，劳动主体是互联网用户，劳动对象是主体的情感、认知、经历等，劳动产品是主体在互联网上生成的内容[8]。AI“歌手”翻唱现象的出现与爆火离不开粉丝群体在互联网场域倾注情感与体力的数字劳动。在以往的粉丝文化中，无论是数字打投（指打榜投票）还是舆论造势，粉丝都是围绕歌手和歌曲进行数字劳动和情感实践，歌手或歌曲的走红往往是歌手和粉丝的共同劳动。然而，在AI“歌手”翻唱的媒介实践发展中，歌手和歌曲似乎只提供劳动创作的素材，粉丝的数字制作与素材拼贴才是劳动的决定性力量，占据着劳动的主导地位。

3.4 职业担忧抑或价值重估

在AI“歌手”翻唱的媒介事件逐渐发酵后，新浪微博曾出现“AI出来后第一个失业的是孙燕姿”的热搜话题，从而引发AI“歌手”是否会替代真人歌手的讨论。一方面，彭兰教授认为在AIGC的语境下，人类试图以“情感”“思想”作为创作的防守阵地，但可能会发现这块阵地并不像人类想象的那么坚固[9]。真人歌手的情感与创作或许未必比机器的程式更有趣、更有价值。另一方面，AI“歌手”对于实力歌手和经典歌曲的拼贴演绎也从一定程度上说明，经过时间沉淀后仍焕发生命力的人、事物的价值得到了重估，或许AI“歌手”将会引领真人歌手再次“回春”。

4 引导抑或管制：AI“歌手”翻唱类音视频应对策略

AI“歌手”翻唱在互联网的热度越来越高，而其引发的版权争议同样值得关注。虽然生成该技术的源项目So-VITS-SVC已正式停止维护并存档，但仍有该领域的爱好者创建了自己的分支继续维护。一面是热情不减的音乐爱好者的自发创作维护，一面是主体合法权益的侵害隐忧，AI“歌手”未来应当如何发展？

4.1 技术层面

从技术层面上看，工业和信息化部、国家网信办等相关部门应联合学界和互联网公司共同进行社会调研与技术研判，判断AI“歌手”及其翻唱作品是否对社会发展进程有利好作用。

一方面，如果经过研判此类人工智能技术的使用和作品的产出对社会发展的作用是利大于弊，则各方应出台相应政策和规定引导其发展，并对该技术模型进行内容输出的可塑性培养，持续响应用户需求，适配更多场景的用户交互。

另一方面，若经过权威研判，此类作品未来将产生难以控制的负面后果，就要及时对其进行管制。对于多数如AI“歌手”类的AIGC产品，相关方应对用户输入的指令和投放的语料进行限制和约束，以降低其技术模型的内容输出风险。此外，AI“歌手”作为人工智能合成技术的分支，向普通用户开放后不可避免地会产生AI伦理问题，如将歌手的声音用于暴力、犯罪、色情等违法和敏感内容制作中。因此，不仅要对技术使用进行政策约束，也要通过增加过滤机制来规避不当内容的生成。

4.2 政策法规层面

从法律角度看，我国现有法律还未对人的声音进行法律的界定和责任的划定。就歌手的音色或者唱腔而言，本身是不受著作权法保护的，但在商标法的规定中，歌手的声音可以作为商标来保护。所以从这个角度来说，人声同样拥有人身属性，违规利用有可能给声音主体的合法权益造成损害。此外，对于歌手姓名和歌曲的使用等也可能侵害歌手、歌曲作品的词曲创作者等主体的合法权益。例如，AI“歌手”的名字中提到了明星的具体人名，则对明星的姓名权造成了侵犯。更为重要的是，这项人工智能合成技术引发了人们对于其运用途径的担忧。有不少用户在“AI孙燕姿”走红后纷纷表示，“如果将该技术运用于诈骗，未来该怎么办”。因此，面对此类人工智能合成技术，政策和法规的出台是保证技术合理合规发展、保证人们生活幸福稳定的重要前提。

4.3 平台方层面

AI“歌手”翻唱的音视频发布平台同样需要承担相应的责任。平台方在日常运营中，本就有着对用户发布信息进行内容研判和风险预估的责任，而针对如今新出现的AI“歌手”翻唱作品，平台方更应绷紧敏感神经，依据现有政策和法规进行处理。一方面，从原创者和原创内容角度来看，平台方应该在对内容和版权进行研判和分析后，对原创信息通过加水印、用显眼的设计标注“原创”字样等方式来保护原创者的版权和其他合法权益。另一方面，平台方也应当对用户的侵权行为和侵权内容作出快速反应和处理。如及时标注原创来源、下架相关侵权作品、对侵权行为严重或屡教不改的侵权者予以冻结账号、查封账号等处置。

5 结语

AI“歌手”及其翻唱作品所能提供的情绪价值应当被给予肯定，但内存其间的技术异化和版权争议仍是其无法逃避的现实隐忧。在互联网时代，诸如AI“歌手”类的AIGC产品无疑会推动内容市场的多元化发展，进而提升现实歌手的知名度。但现实歌手本身也有影响力“失焦”的风险，粉丝大众和音乐行业未来可能追逐的将不再是作为“人”的歌手，而是歌手的声音。正如学者詹新惠所言，面对尚在探索中的AIGC，我们需要明确，技术不是目的，追求更好的世界、更美好的生活才是目的和目标。