APP下载

“AI 孙燕姿”爆火,技术如何复刻声音?

2023-05-30颜媛媛

电脑报 2023年19期
关键词:孙燕姿开源音色

颜媛媛

“AI孙燕姿”横空出世

2023 年最火爆的华语歌手是谁?不是周杰伦,也不是孙燕姿,而是“AI 孙燕姿”。

近期,在各大视频平台上,“冷门歌手孙燕姿”靠着各种各样的AI“分身”翻唱不同曲风的歌曲,营业时长感人,作品出圈火爆。从流行到摇滚、再到“魔性”,没有AI孙燕姿驾驭不了的曲风。

“这歌太上头了,我能循环听一个晚上。”这两天,经常逛B 站的“姿迷”(孙燕姿的歌迷)会常常发出这样的感慨,有人一晚上搜罗了“孙燕姿”翻唱的各种经典曲目。尤其是周杰伦的《发如雪》播放量高达106 万,《半岛铁盒》《爱在西元前》等播放量也超过了60万……

本人未曾开口,轻而易举地占据华语乐坛半壁江山,连资深歌迷都不太能听出差异。孙燕姿悄无声息“攻占”华语歌坛的背后,靠的还是人工智能。

音乐圈的科技与狠活儿

除了“AI 孙燕姿”,还有“AI 周杰伦”、“AI 王心凌”……据悉,这些翻唱歌曲,是由多位UP 主通过开源项目自制后上传。

“他们”的翻唱歌曲,由创作者通过开源项目“so-vits-svc”自制后上传。

按照目前的技术,歌手的唱腔、技巧和风格还很难完全模仿,但音色已经基本能1:1 复制了。而我们也发现,AI 孙燕姿用的核心技术主要来自一个叫作so-vits的开源项目。

随着AI 歌手的火爆,“教你打造属于自己的AI 孙燕姿”“让喜欢的歌手为你唱歌”等AI 训练教程也火速上线,制作此类歌曲的门槛越来越低。

在《下雨天》的AI 翻唱视频下,B 站网友评论,“那以后,能听见黄家驹、张国荣他们唱新歌了。”

目前,这个项目已经迭代到了4.0 版本。相较于以往VITS、soft-vc、VISinger2 等项目,so-vits 的使用大大简化,仅凭数段音频,就可用一个生成式模型来合成目标音色的音频,训练出用户想要的声学模型。这个模型可以保留音高和音调,也可以用不同的語言来翻唱。

制作一首AI 歌手演唱的歌曲需要4 个步骤:下载一键启动包、输入合适的干声(无音乐的纯人声)、训练声学模型(训练时间越长效果越好)、进入音频编辑软件进行合成和后期。目前,网上已经随处可见教学视频,博主仅需3 分钟就可教学AI 音频制作的全流程。

实际操作起来其实并没有这么简单,目前,有两个比较火的开源项目,分别是so-vits-svc 和RVC,它们都使用了一种叫作vits 的模型,原本是用于文本生成语音的,但是经过改造,可以直接将音色特征作为输入,不需要转换成文本。这样就可以实现任意歌曲的音色转换,而不仅仅是歌词。

AI 孙燕姿就是利用这些技术,将孙燕姿的音色特征提取出来,然后用它来翻唱其他歌手的歌曲。这个过程并不简单,需要一定的算法相关经验和成果,也需要大量的数据采集和实验。

据悉,AI 孙燕姿的创作者之一Rcell 表示,他和他的团队经过半年时间做了上百组实验,才得出了当前的最优解。他们采集了孙燕姿的四张专辑《孙燕姿 同名专辑》《克卜勒》《逆光》《是时候》,共计约100首歌曲作为训练数据。他们还尝试了其他歌手的音色转换,比如周杰伦、林俊杰、王菲等等,但是效果都不如孙燕姿的好。

而此前为了纪念邓丽君逝世22 周年,日本节目《金SMA》利用全息投影技术,令一代歌后“复活”。粉丝们自行训练张国荣、姚贝娜等故去歌手的模型,让故人以“数字生命”的形式重现,透过这些久违的声音,让听众在互联网的一片喧嚣之中,感受到独有的人文主义温暖。

今年3 月,歌手陈珊妮发布新歌《教我如何做你的爱人》,粉丝听完新歌后几乎都在称赞这首歌的演唱水准一如以往。但一周后,陈珊妮发表长文表示,她的新歌其实是由“AI 模型”演唱,就连单曲封面也是AIGC 生成。在歌曲制作过程中,她为调教AI 演唱做了充足的工作,这些工作量不低于甚至远高于亲自演唱。

而陈珊妮也表示,期望透过这首歌,促动所有关心艺术创作的人思考——如果 AI的时代必将到来,身为创作人该在意的或许不是“我们是否会被取代”,而是“我们还可以做些什么”。

绕不开的版权问题

AI 翻唱涉及的版权问题主要包括:AI翻唱是否侵犯了歌手的声音版权? AI 翻唱是否侵犯了其他歌手的音乐版权? AI 翻唱的歌曲是否享有自己的版权?

这些问题在我国目前还没有明确的法律规定和司法判例,存在很多争议和困难。

国外,AI“入侵”音乐界早有案例。如一名TikTok 用户利用AI 蕾哈娜翻唱碧昂斯热门单曲《Cuff It》的案例,引起了该曲版权方环球音乐的注意,并引发了侵权诉讼; 美国摇滚乐队Nirvana 起诉歌曲《Drowned in the Sun》的制作团队,称该团队利用AI 技术模仿了他们的风格;美国说唱歌手Jay-Z 起诉网站VocalSynthesis,称该网站用他的声音朗读《哈姆雷特》等文学作品,侵犯了他的声音版权和肖像权。

以大模型为桥梁,非编程人员便可打造专属AI 工具,无疑是向通用人工智能迈进的重要一步,但当AI 在音乐、绘画等领域的应用门槛逐步放低,相应的版权问题势必纷至沓来。

有意思的是,so-vits-svc 模型的开发者已经从源代码托管服务平台Github 上删库,并表示,删库主要是因为项目已经停止维护和更新,并且声明了项目的免责条款,强调项目是一个开源、离线的项目,所有成员和贡献者对项目没有任何控制权,也不知道用户使用项目的目的和方式,因此所有基于项目训练的AI 模型和合成的音频与项目的成员和贡献者无关。

5 月9 日,抖音也发布了关于人工智能生成内容的平台规范暨行业倡议。其中提到,创作者、主播、用户、商家、广告主等平台生态参与者,在抖音应用生成式人工智能技术时,发布者应对人工智能生成内容进行显著标识,帮助其他用户区分虚拟与现实,特别是易混淆场景;发布者需对人工智能生成内容产生的相应后果负责,无论内容是如何生成的;虚拟人需在平台进行注册,虚拟人技术使用者需实名认证;禁止利用生成式人工智能技术创作、发布侵权内容,包括但不限于肖像权、知识产权等。一经发现,平台将严格处罚。

AI 技术生产的声音,可能会让你感到新奇,但也可能会让你感到迷惑,在听这样的歌曲时,最好不要忘记了真正的歌手、真正的歌曲、真正的音乐。

猜你喜欢

孙燕姿开源音色
精雕细琢的外形与音色 Bowers & Wilkins(宝华韦健)805 D4
一期一歌一影 孙燕姿《遇见》 未来总有一个人会等你到来
五毛钱能买多少头牛
擅长营造美好的音色 Marantz SA-10 S1/PM-10 S1
论长笛演奏的音色变化
从辉煌到柔美——七彩音色之西方管乐篇
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
开源计算机辅助翻译工具研究