人工智能音乐的独创性认定研究
2024-12-22高园
[摘要]文章认为,人工智能音乐作为人工智能生成物是否受到著作权法保护,必须对其独创性进行分析,而人工智能依据程序与算法生成人工智能音乐,离不开用户的情感与个性表达。有关主体判断人工智能音乐是否具有独创性,既要考量用户是否与人工智能进行充分交互,表达自身的情感和个性,又要剥离其中属于公有领域的思想部分,并对其中的旋律、和声、节奏及歌词等元素进行分析,从而判断人工智能音乐是否充分体现用户的情感和个性,达到著作权法意义上作品独创性要求的最低限度的智力创造性。
[关键词]人工智能音乐;独创性;算法作曲
从旋律谱写到模唱、编配和声与配器,音乐创作往往涉及庞杂的乐理知识与繁复的乐器演奏技术,是一个呈现文化底蕴的漫长创作过程。然而目前,人工智能音乐的出现让没有经过专业训练的普通人在较短时间内创作音乐成为可能。从20世纪90年代加州大学音乐学教授柯普写出的第一个音乐智能程序“EMI”到如今的人工智能音乐生成器,人工智能音乐对传统著作权法领域提出了严峻的挑战。人工智能音乐是否构成著作权法意义上的作品,受到著作权法保护,这与作者、人工智能开发者、用户之间权利义务与利益的平衡息息相关,亟待有关主体做出回应。
一、人工智能音乐概述
人工智能音乐受到著作权法保护的前提即人工智能音乐构成著作权法意义上的作品,而人工智能音乐是否具有独创性直接决定其是否构成著作权法意义上的作品。基于此,文章对人工智能音乐的概念及其创作过程进行分析,探讨人工智能音乐的独创性认定。
(一)人工智能音乐定义
人工智能音乐有广义和狭义之分。广义的人工智能音乐指人工智能在音乐产业中的应用,包括但不限于人工智能作曲、音乐信息检索、乐谱跟随、智能混音等应用。狭义的人工智能音乐则指由人工智能创作的音乐。文章讨论的人工智能音乐仅指狭义的人工智能音乐。
人工智能音乐的创作过程通常被称为“算法作曲”。在人工智能音乐的创作过程中,人工智能开发者对人工智能设定算法并进行不断的训练,使人工智能从海量经过处理的音乐数据中推演出音乐创作的规律,再根据用户的指令对曲风、调性、和声等音乐元素不断地进行迭代计算,最终生成用户需要的音乐。
“算法作曲”之所以能够实现,是因为音乐具有严密的逻辑体系,可以完成随性的情感表达。古希腊数学家毕达哥拉斯指出:“音乐和算数是不可分割的,数字是打开整个精神世界和物质世界的钥匙,而乐音和节奏体系既然按数字排列,就必然体现天地之和谐并与宇宙相对应。”[1]人工智能音乐将作曲与算法结合在一起,恰是印证了毕达哥拉斯的洞见。早在18世纪末,一种音乐骰子游戏盛行,据传该骰子游戏由音乐大师莫扎特创作,是一种利用掷骰子的结果来决定音乐的写作程序,它可以产生严格符合曲式结构、和声布局和调性关系的莫扎特风格的小步舞曲和三重奏。此外,福克斯的对位法、勋伯格的十二音体系等早已成体系的作曲方法,被作为作曲规则映射到计算机算法中,有助于人工智能将音乐的程式化特征进行数字转化,使“算法作曲”成为可能。
(二)人工智能音乐创作特点
人工智能音乐在本质上是人工智能对用于训练的音乐样本及其分布状况进行建模,然后在模型中抽取新的样本生成新的音乐。人工智能音乐的算法涵盖范围广,其中较有影响力的算法主要如下。第一,语法表示。语法表示采用模式匹配来抽取被分析的具有特定风格音乐的短的音乐序列特征,并依据这些特征出现的频率赋予相应权值,再使用扩充、转移网络来组织这些特征,生成在音乐风格上与被分析的音乐相近的新音乐[2]。第二,马尔可夫链(Markov Chain,MC)。马尔可夫链分析音乐逻辑,推测当某些音符出现时接下来的另一个音符出现的可能性,呈现一个随机过程。1957年希勒和艾萨克森创作出世界上第一部完全由计算机生成的弦乐四重奏《伊利亚克组曲》[3],
该组曲就是由马尔可夫链模型生成的。马尔可夫链在分析前面音符逻辑排布的基础上,推导出后面音符出现的可能性,这是一个纯粹的数理逻辑递推过程。依照这种算法生成的音乐既呈现统一程度较高的音乐风格,又存在较大的局限性。第三,人工神经网络(Artificial Neural Network,ANN)。人工神经网络是从信息处理角度出发通过模拟人的大脑对信息进行处理的一种数学模型,能够按照不同的连接方式组成不同的网络,并在此基础上加上感知器和自适应线性元件等,利用反向传播的误差进行参数调整[4]。第四,遗传算法(Genetic Algorithm,GA)。遗传算法是一种使用适应性函数来演化样本的全局优化算法,主要构造适应性函数,以此来评估及选择系统生成的旋律[5]。换言之,遗传算法模拟物种进化的过程,通过遗传与突变进行反复的进化迭代,最终生成符合用户需求的音乐。第五,迁移模型算法(Translatioinal Models)。迁移模型算法将其他种类的信息迁移为音乐信息。最常见的应用是由用户上传一张图片,该算法则对这张图片中的线条、色彩等信息进行识别,然后将相关信息转换为相应的旋律、和声、节奏等音乐元素,从而生成与图片相符的音乐。
虽然人工智能音乐利用诸多算法实现创作的路径不同,但是究其本质是人工智能从学习材料中找到音乐的规律,并利用算法根据这些规律来生成一些新的音乐。由此可见,在人工智能音乐的创作过程中,算法主要的作用是贯彻音乐背后的逻辑,为用户提供符合乐理、创作要求的音乐,音乐的情感表达则依靠用户给出的指令。需要注意的是,在人工智能音乐的创作过程中,若人工智能依照一些随机数据并生成模仿,在一定程度上通过倒推、检验来进行筛选和修正,则难免陷入“猴子和打字机”的怪圈,使所创作的音乐难以具有一定的审美价值,更遑论构成具有独创性的音乐。
然而在实际上,人工智能音乐并非完全由人工智能进行创作。人工智能音乐的创作过程离不开人工智能开发者的训练,也离不开用户发布的指令及其不断地调试,既融入了用户的情感色彩,也加入了用户的独特审美选择,这在一定程度上使人工智能音乐具备独创性成为可能。
二、人工智能音乐独创性分析
在大陆法系下的著作权制度中,作者享有对作品的人身权利,因此大陆法系下的著作权制度对作品独创性具有较为严格的判断标准。德国教授乌尔里希·勒文海姆提出,作品要具备独创性,必须包含以下特征:第一,必须有产生作品的创造性劳动;第二,体现人的智力、思想或情感的内容必须通过作品表达出来;第三,作品应体现作者的个性并打上其个性智力的烙印;第四,作品应具有一定的创作高度,它是著作权保护的下限[6]。在英美法系下的著作权制度中,作者对作品只享有财产权利,因此英美法系下的著作权制度对作品独创性的判断标准比大陆法系的更为宽松,然而其对作品独创性的要求也经历了从过去的“额头流汗”标准到现在的“少量创造性”标准[7]。美国学者保罗·戈尔斯坦提出,对作品独创性的认定应该依据以下标准:第一,作品由作者独立完成而不是对其他任何作品的复制,这是区别这种特殊作品来源和归属的判断标准;第二,作品必须体现作者在创作过程中所付出的最低限度的技巧、判断、风格等劳动成果[8]。
现阶段,我国著作权法对作品独创性的认定主要包括“独”和“创”两个要求。作品独创性中的“独”指作者独立创作,包括从无到有的创作和在他人基础上的创作;作品独创性中的“创”指作品应当具有最低限度的智力创造性[9]。
(一)独立性
独立性要求作者独立创作作品,而非抄袭他人。然而,人工智能音乐的独创性判断涉及两个问题:一是人工智能音乐是否应当被认定为由人工智能音乐软件的用户独立创作?这牵涉人工智能充当什么角色或发挥什么功能等问题。二是如何确定人工智能音乐并非抄袭、剽窃的结果?这要确定人工智能音乐及其生成过程没有侵犯在先作品的著作权。
在人工智能音乐的创作过程中,人工智能音乐是由用户独立创作完成,还是由用户与人工智能共同创作完成?现阶段,人工智能并未取得法律上的主体地位,显然不能被视为著作权法意义上的创作主体。同时,人工智能的发展仍然与达特茅斯会议中所确定的强人工智能概念还有较大差距。换言之,当前,人工智能虽然在部分专业领域具有强大的功能,但是它作为一种精密的工具,并非真正具有智慧,且将在可预见的较长时间内暂时无法真正具有类人的智慧。故笔者认为,人工智能按照用户发出的指令,经过各种调试,创作出人工智能音乐,它虽然可以弥补用户专业性知识的缺乏,提高作曲的效率,但是归根结底仍是根据用户情感表达进行创作的工具。因此,在人工智能音乐的创作过程中,用户创作符合作品独创性中“独”的要求,也就是用户独立创作的要求。
要确定人工智能音乐并非抄袭、剽窃的结果,有关主体必须判断人工智能音乐是否侵犯在先作品的著作权。司法实践对某音乐是否涉嫌著作权侵权通常采用“接触加实质性相似”的判断标准,即只有作者在创作某音乐时同时满足接触或可能接触在先作品、某音乐与在先作品之间存在实质性相似,某音乐才能被认定为侵权。具体来说,在传统的音乐创作领域中,若某音乐已经通过大众媒体向不特定受众进行传播,且作者通过网络、电视、报纸等大众媒体有接触或有可能接触在先作品,那么即可推定作者在创作某音乐时接触了在先作品。具体到人工智能音乐,一方面,人工智能在开发和训练过程中会被喂养大量的音乐数据并形成相关训练数据库,且人工智能未必会像自然人一样主动、偶然地接触公有领域的音乐数据,故由人工智能举证相关训练数据库是否存在在先作品具有一定的困难;另一方面,人工智能音乐创作取决于人工智能开发者的指令,若由人工智能开发者进行相关举证,其有可能因自身的利益而否认人工智能训练数据库存在在先作品,亦有可能通过技术途径论证创作音乐的人工智能无法接触且没有可能接触在先作品,而其他主体无法越过人工智能开发者的否认找到实质性证据来证明人工智能接触或有可能接触在先作品。基于人工智能音乐所需要的音乐数据的广泛性以及举证的困难性,笔者建议,有关主体可以直接推定人工智能接触或有可能接触在先作品,除非人工智能开发者能够举证并未使用在先作品作为音乐数据喂养人工智能,人工智能也并未接触或有可能接触在先作品。在实质性相似方面,学界和业界一般认为若两个音乐之间存在8小节以上的内容雷同即可被视为抄袭。然而这种观点较为概括,且并未结合音乐的长度和内容相似程度进行具体的考量。需要注意的是,对人工智能音乐是否具有实质性相似,有关主体应当从受众的角度做出判断。例如,美国联邦第二巡回上诉法院在1946年Arnstein v.Porter一案的判决中指出,判断非法占用这一问题的合适标准,不是根据受过训练的音乐专家对内容的评价分析,因为专家的证言缺乏证明力,只能用来帮助确定普通受众的反应。可见,司法实践对人工智能音乐实质性相似的判断要结合受众反馈、词曲结构、和弦走向以及音乐用途等进行综合分析。
(二)创造性
创造性要求作品体现作者独特的个性,满足最低限度的智力创造性。如果仅因工具过于智能就认为作品创作过程没有创造性,无法体现作者的情感表达,这是不合理的。在人工智能音乐的创作过程中,尽管用户只需要向人工智能给出指令即可完成音乐创作,也不能简单地认为人工智能音乐没有包含用户的情感,没有呈现个性表达。例如,在摄影作品创作中,摄影角度的选取、拍摄时机的把握等在一定程度上充分体现作者独特的审美与智力创造。又例如,在“AI文生图”著作权案中,北京互联网法院认为原告通过提示词对人物及其呈现方式等画面元素进行设计,通过参数对画面布局和构图等进行设置,并不断调整和修正,最终获得涉案图片,这体现原告的审美选择和个性判断。
然而,在人工智能音乐的创作过程中,用户并非总是能够符合作品独创性中“创”的创造性要求。具体来说,用户利用人工智能生成原创音乐与用户利用人工智能为一段音乐编配节奏,两者涉及的创造性显然是不能一概而论的。因此,对人工智能音乐的创造性是否达到作品独创性中“创”所要求的高度,有关主体要结合具体音乐元素进行分析。
三、人工智能音乐独创性认定
结合前文所述,人工智能音乐融入了用户的情感和个性表达,然而并非所有的人工智能音乐都能达到作品独创性的标准。对人工智能音乐独创性的认定,有关主体要考量用户对人工智能是否做出足够明确、足以表达其情感和个性的指令,并排除所生成音乐中属于公有领域的思想及表达,分析其中的音乐元素,从而判断人工智能音乐是否构成著作权法意义上的作品。
(一)用户与人工智能的交互
人工智能音乐要体现用户的情感与个性表达,用户必须在与人工智能交互的过程中将情感与个性表达通过指令传递给人工智能,使人工智能根据指令创作出用户所需要的音乐。因此,依据用户与人工智能交互的程度不同,人工智能音乐的生成大致可以分为两种情况进行讨论。
第一,如果人工智能的页面可交互指令过于简单,或仅有简单的选项,或用户通过点击即可“一键生成”,未充分赋予用户更多表达情感和想法的空间,则用户会被动地在有限的选项中进行选择,难以在人工智能音乐的创作过程中体现自身情感,更无法通过人工智能音乐表达情感。换言之,用户仅在有限的排列组合选择中表达独特情感与创作想法,这只能是一种“额头流汗”的劳动,所生成的人工智能音乐也难以符合著作权法意义上的作品独创性要求。
第二,如果人工智能为用户提供自由表达情感和个性的空间,使用户根据自身的需要选择调性、节奏等元素,则更有可能生成符合著作权法意义上作品独创性标准的人工智能音乐。具体而言,在人工智能音乐的创作过程中,如果用户可以与人工智能进行关于音乐的较为复杂、有深度的交互,获得更为多元化的创作可能,而非通过有限的选项进行简单的选择,那么可以认为用户融入了自身的思想情感和创作意图。例如,在人工智能音乐的创作过程中,如果用户要想创作奇幻、悠远、充满希望的音乐,就可以通过人工智能对节奏、和弦走向、歌词风格等各种参数进行设置,并不断地进行调整和修改,以创作生成符合自身需求的多利亚调式音乐。在这一过程中,人工智能音乐无疑体现了用户的情感和个性选择,而人工智能更像是一个辅助用户进行音乐创作和表达情感的工具。
(二)公有领域的保留
著作权法保护的是音乐的表达,而非音乐的思想。要对人工智能音乐的独创性进行认定,有关主体必须对人工智能音乐构成元素的组织编排进行分析,剔除其中公有领域的思想部分。常见的音乐公有领域涉及作曲理论、范式以及已经超过著作权保护期限的作品等。
音乐创作需要依据乐理,通常会遵循一定的范式,而这些理论和创作范式即为音乐的思想部分,在进行音乐的独创性认定时需要被剥离。早在11世纪,圭多达莱佐在《辩及微茫》中创造出最早的音高模型,即六声音阶体系。到15世纪,一种规律性的“节奏模式”在音乐中得到广泛运用。从文艺复兴到巴洛克时期,旋律的对位开始程式化。随着复调技术的不断发展和成熟,音乐向高度逻辑化的方向发展[10]。这些音乐中已成体系的创作原则、作曲范式、常用的和弦走向等均属于思想部分。此外,古典音乐、民族音乐中已超过著作权法保护期的音乐素材也属于公有领域的表达。也就是说,作者在进行音乐创作中使用这些表达并不构成侵权,且有关主体在判断音乐独创性时应当剔除这些表达。例如,S.H.E的《不想长大》因与莫扎特的《G小调第四十号交响曲》相似而广受诟病,然而《G小调第四十号交响曲》已经超过著作权保护期并进入公有领域,故《不想长大》并未侵权。
具体到人工智能音乐,有关主体在判断人工智能音乐是否具有独创性时,要对人工智能音乐中公有领域的思想部分进行剔除。需要注意的是,在人工智能音乐的创作过程中,人工智能被投喂大量来自公有领域的音乐数据。例如,经典的和弦走向“F-G-Em-Am-Dm-G-C”由于悦耳动听,被广泛运用于流行歌曲创作,在人工智能音乐的创作过程中,用户可以通过调试使人工智能生成海量的该和弦走向的音乐。又例如,人工智能被投喂某一音乐家的大量音乐数据,用户可以通过人工智能生成模仿该音乐家的音乐,形成与该音乐家作曲风格类似的音乐。然而,人工智能音乐不能因风格与作曲相似就被认为只是简单的复制和模仿而非独立创作。具体来说,在人工智能音乐的创作过程中,人工智能普遍遵循或使用的范式属于公有领域思想部分,而基于这些范式创作出来的内容虽存在一定的相似性,但也不应被认为人工智能音乐与在先作品存在实质性相似。
(三)人工智能音乐独创性的认定元素
音乐创作需要对旋律、和弦走向、节奏、歌词等元素进行编排。音乐可能包含一个或多个音乐元素,这些音乐元素对音乐的独创性认定至关重要。基于此,笔者认为,人工智能音乐是否将用户的情感与个性表达出来,达到“创”所要求的最低限度的智力创造性,有关主体要针对人工智能音乐的各个音乐元素进行分析。
第一,旋律是音乐中最显著的元素,它由一定的音符、音符时值和音符顺序组合而成。根据《美国传统词典》,旋律指“一种令人愉快的乐音组合或序列”,或者“将相互关联的每一个单独的音符按照一定的节奏组合在一起,使它们能够表达一种特定的意境或思想”[11]。由此可见,旋律一般指音符的横向排列。然而,虽然音符可以排列组合构成多个序列,但由于乐理等因素的限制,实际存在的能够形成悦耳序列并构成旋律的音符组合是有一定局限性的。有关主体对音乐独创性的认定通常聚焦于旋律,因为旋律比和声、节奏等元素更易凸显独创性,是音乐独创性的主要来源。人工智能音乐的旋律虽然并非由用户直接谱写,却是人工智能根据用户的指令而生成的,并经过用户选择或调试,故而人工智能音乐的旋律表达了用户自身的情感,体现了用户个性的选择。需要指出的是,在同一和声走向的音乐中,其旋律往往让人听起来较为相似,给人以类似的感受,但不应认为该旋律不具有独创性。换言之,若人工智能音乐的旋律能够区别于其他音乐,体现用户独特的情感和个性选择,则应当被认定具有独创性。
第二,和声一般指音符的纵向排列。根据《美国传统词典》,和声指“和弦的结构、进程和相互关系”[11]。由此可见,和声包括和弦与和声进程。如果将旋律比作音乐的骨干,那么和声就是音乐的血肉,使旋律表达更加丰满。在音乐创作过程中,旋律与和声的先后并没有绝对的规定,而取决于作者的创作习惯,但一般认为和声是由旋律决定的,和声是旋律的底层逻辑,先产生旋律,再编配和声。在大多数音乐作品中,由于旋律的重要依附性,和声在一定程度上被认为缺乏独创性,然而在某些情况下,同样的旋律尽管仅有有限的和弦排列,不同的作者也仍然会根据自身的情感编配和选择不同的和声。也就是说,每种对和弦的不同构造和处理,都体现作者独特的个性选择,如大三和弦较为明亮,小三和弦更为柔和,这些不同的和声使音乐产生丰富的变化。因此,虽然单纯的和声作为音乐的构成元素并不存在所谓独创性的问题,但是在某些情况下和声的编排也体现独创性。有关主体对人工智能音乐独创性的认定,要在一定程度上聚焦用户的情感是否通过对和弦的选择来进行充分表达。
第三,节奏指不同长度和强度的音符序列组成的常规模式,即音的长短与强弱。在音乐中,节奏与旋律相辅相成,如流行音乐具有稳定的节奏,古典音乐的节奏则相对富于变化。此外,也有只有节奏而没有旋律的音乐,如鼓的表演体现作者的情感表达,是对节奏进行创意性的编排。可以说,在某些特定情况下,节奏本身也可能具有独创性。在人工智能音乐的创作过程中,若用户使用人工智能创作一段只有节奏的音乐,该音乐不应被一概认定为不具有独创性,也就是有关主体要考察该音乐是否体现了用户的情感和个性,并区别于其他一般的节奏编排。
第四,歌词通过文字的内涵、文字与音乐的融合来表达思想情感。歌词并非音乐必备的元素,配有歌词的音乐则由乐曲部分和歌词部分共同组成,且这两个部分一般可以分离。从这种意义上说,歌词可以被视作相对独立的作品。然而,在某些情况下,词曲的创作浑然一体,不可分割,共同构成完整的音乐。因此,对人工智能音乐中歌词独创性的判断,有关主体可以参照作品的独创性进行认定。
四、结语
面对生成式人工智能发展的浪潮,有关主体应当给予积极的回应,以更好地平衡作者、人工智能开发者与用户之间的利益。人工智能音乐包含旋律、和声等诸多元素,相比人工智能生成的文字、绘画,人工智能音乐独创性的认定更为复杂。对人工智能音乐独创性进行认定时,有关主体要考量用户的情感与个性是否充分地与人工智能交互,并将人工智能音乐中属于公有领域的思想及表达排除在外,分析旋律、和声、节奏、歌词等元素,从而判断人工智能音乐是否充分体现用户的情感和个性,达到著作权法意义上作品独创性所要求的最低限度的智力创造性,最终助力人工智能音乐的发展和繁荣。
[参考文献]
[1]格劳特,帕利斯卡.西方音乐史[M].6版.余志刚,译.北京:人民音乐出版社,2010.
[2]郑银环,王嘉珺,郭威,等.基于特征旋律挖掘的二阶马尔可夫链在算法作曲中的研究与应用[J].计算机应用研究,2018(03):849-853.
[3]TANG L.Illiac Suite for String Quartet[EB/OL].(2014-02-17)[2024-10-15].https://lydiaswada.wordpress.com/2014/02/17/illiac-suite-for-string-quartet/.
[4]韩力群.人工神经网络教程[M].北京:北京邮电大学出版社,2006.
[5]冯寅,周昌乐.算法作曲的研究进展[J].软件学报,2006(02):209-215.
[6]吴汉东,曹新明,王毅,等.西方诸国著作权制度研究[M].北京:中国政法大学出版社,1998.
[7]王国柱.邻接权客体判断标准论[J].法律科学(西北政法大学学报),2018(05):163-172.
[8]戈尔斯坦.国际版权原则、法律与惯例[M].王文娟,译.北京:中国劳动社会保障出版社,2003.
[9]王迁.知识产权法教程[M].7版.北京:中国人民大学出版社,2021.
[10]刘灏.人工智能与计算机作曲:前提、技术与问题[J].音乐艺术(上海音乐学院学报),2019(04):137-144.
[11]SOUKHANOV A H.The American Heritage Dictionary of the English Language[M].Boston: Houghton Mifflin Company,1992.