论人工智能学习创作的合理使用

2020-12-09马忠法肖宇露

山东科技大学学报（社会科学版） 2020年5期

马忠法，肖宇露

(复旦大学法学院，上海 200438)

当前，商业研发公司及其研发人员利用人工智能在文学艺术领域生成大量具有较高艺术价值的成果。[1]这些人工智能创作物(1)本文所称的“人工智能创作物”，是一种拟人化的表达，具体指计算机程序通过自主学习而掌握类似人类创作作品的能力，而后自主生成的内容。其和人类创作的作品相比，在最终作品的形式和内容上并无明显差异，都具有艺术欣赏价值。但是在作品创作过程中，人工智能由于具有自主性，可以自主确定作品的内容和形式，并直接导致最终作品的生成，较高程度地替代了人类创作过程中的部分工作，因而将其认定为人工智能创作物。虽然繁荣了文化市场，但也引发了一些新的著作权问题。[2]例如，商业研发公司及其研发人员在训练人工智能学习创作过程中，如果未获得作品著作权人的许可而复制使用其作品，便会侵犯著作人的权利。[3]然而，人工智能学习创作对于作品的使用目的、方式和程度，与传统人类学习创作有较大区别，使得作品使用似乎具有某种程度的转换性。与此同时，该行为也能促进技术发展，实现某种程度上的公共利益。因此，也有人认为人工智能编创具有内容和目的的转换性, 并在原作基础上生成新作品, 属于非表达性使用，同时也不与原作品的正常使用相冲突，故而人工智能编创应适用版权合理使用制度。[4]但与此相反，也有人认为，人工智能创作目的和人类创作目的一致，生成物体现出原作者的创作技巧, 进入其预期的创作范围和市场，所以人工智能对作品的使用是基于作品中的独创性表达，难以适用转换性使用规则。[5]

由此可见，大多数学者都指出了人工智能学习创作使用作品的行为具有特殊性，并依据合理使用制度，特别是转换性使用规则，对该行为能否被豁免进行了广泛讨论。然而，他们对人工智能学习创作的原理剖析还不够深入，使得后续对于转换性使用规则的法理分析缺乏足够深入的技术逻辑支撑。此外，学者们提出通过转换性使用规则来判定人工智能学习创作使用作品行为，但是并未进一步论证为何我国可以适用美国司法中的“转换性使用规则”来判定合理使用。所以，我们需要进一步说明其背后所蕴含的法律原理和司法审判依据。最后，学者们主要从转换性使用规则来探讨该行为，而忽略了“四要素”标准中的其他要素。因此，如何从利益平衡的角度，继续挖掘作品使用对于人工智能研发者、著作权人、公众之间的利益冲突与平衡，值得进一步深入研究。为此，本文将首先阐述人工智能学习创作的原理和过程，并分析我国《著作权法》对合理使用的判断标准，进而再对以商业为目的的人工智能学习创作而使用作品之行为，能否纳入到合理使用范畴进行探讨。

一、人工智能学习创作原理及合理使用的认定标准

要全面深入地分析人工智能学习创作而使用作品之行为，能否纳入到合理使用范畴，就必须要先科学地理解和准确地把握人工智能学习创作的原理和过程，弄清楚人工智能使用作品的特殊路径，与此同时还需要准确理解我国对于合理使用的认定标准，为后续的法理分析奠定理论基础。否则，基于对人工智能学习创作的误解，可能会造成法理分析陷入错误逻辑循环。基于不准确的法理依据，同样也会导致法理分析的结论出现偏颇。为此，下文将重点厘清人工智能学习创作的原理和过程，以及我国对于合理使用的判断标准这两个基础理论问题。

(一)人工智能学习创作的原理和过程

为更好地介绍人工智能学习创作的原理和过程，笔者将结合人工神经网络和机器学习的技术原理以及人工智能创作的过程，来系统阐明人工智能学习创作的原理和过程。

1.人工神经网络的构建

人工神经网络是人工智能学习创作的基础程序，它是一种模仿人类神经网络行为特征，由大量简单处理单元组成的分布式处理器，其具备与人类相类似的学习能力和思考能力，并通过调整神经元之间的连接强度参数，来记忆存储知识。[6]人工智能神经网络系统的构建，使得人工智能可以通过学习从外界环境获取知识。它可以通过有序的方式改变神经元之间的接触参数，从而构建目标任务的解决路径和方案。[7]因此，人工智能神经网络的构建，是人工智能学习创作中最基础的程序语言结构。

2.人工智能通过大数据进行机器学习

人工智能神经网络组建完成后，人工智能训练者(2)本文所称的“人工智能训练者”，指用于创作的人工智能的数据训练者，其主要负责对人工智能所需学习的数据进行筛选，并将数据资料导入到人工智能程序中，由其自主学习，最终使得人工智能具备创作能力。将作品数据输入到人工智能程序中。而后，人工智能将借助学习系统，自主捕捉数据资料中的特征元素，并和目标任务之间建立某种数学函数关系。而这种数学函数关系，是基于对数据的挖掘分析而自主确定的。这个学习过程主要有两种模式，一种是强化学习模式，另一种是无监督学习模式。[8]它们的共同特征是，数据资料均不需要人类预先标记，而直接让人工智能学习。它们的主要区别是，外部环境和系统自身对于模型构建的影响方式和途径的不同。[9]所以，训练人工智能，均需要将没有标记的作品数据复制到人工智能中，而后由其对作品的自主学习分析，建立函数模型，从而掌握解决任务的能力，也即是创作能力。换言之，该能力是人工智能通过数学编程语言对作品数据进行学习掌握的，同时又以程式化的数学语言来展示出人工智能对于作品创作的理解。因此，对作品数据的复制与分析，是人工智能拥有创作能力的关键环节。

3.人工智能进行创作

使用者向人工智能输入相关的创作素材，并明确相关创作要求。随后，人工智能将根据之前的作品数据学习所构建的函数模型生成相应的内容。值得注意的是，此时人工智能所进行的创作，并没有涉及用于训练的原作品的汇编和改编，而是基于对原作品的分析挖掘而形成的函数模型生成新的内容。这个模型是人工智能自主形成的作品理解方式和载体，是对原作品的抽象识别、提取与构造。因此，不应该将人工智能创作的过程，简单理解为大数据的组合，而应理解为大数据抽象出的数学模型的再数据化输出。

(二)我国对于合理使用的认定标准

厘清人工智能学习创作的原理和过程后，我们需要进一步明确合理使用的具体认定标准，从而为后续的法理分析奠定基础。当前，我国对合理使用行为的判断，主要遵循国际公约设定的“三步检验法”。根据《伯尔尼公约》第9条第2款以及《TRIPS协议》第13条的规定，“三步检验法”是指未经他人许可而使用已经发表的作品，须符合以下三个要件：(1)在限定的特殊情形下；(2)不得影响该作品的正常使用；(3)不得不合理地损害著作权人的合法权益。[10]具体而言，我国是通过《著作权法》第22条中所穷尽式列举的12种情形以及《著作权法实施条例》第21条的限定条件而共同确定合理使用的判定情形和标准。由此可见，若严格依据我国《著作权法》，法定情形以外的行为均无法被认定为合理使用。

但是，我国法院在部分案件的审理中，已经突破现行《著作权法》的规定，认定法定情形以外的行为也可以属于合理使用。[11]例如，在覃绍殷案中，法院认为复制国画并向部分目标客户发行的行为，以及在拍卖过程中用ppt播放画作的行为，均以方便客户了解拍卖标的为目的，因此均构成合理使用(3)参见覃绍殷诉北京荣宝拍卖有限公司侵犯著作权纠纷案，北京市第一中级人民法院 (2003) 一中民初字第12064号民事判决书。；在吴锐案中, 法院认为被告向使用者提供图书的前言、正文等少量信息，是为了让读者更方便地了解书本内容，故而属于合理使用(4)参见吴锐诉北京世纪读秀技术有限公司侵犯著作权纠纷案，北京市海淀区人民法院 (2007) 海民初字第8079号民事判决书。。由此可见，为更好地应对技术创新和商业模式转变所带来的新挑战，司法审判中可以将法定情形以外的行为认定为合理使用，以平衡使用人和著作权人之间的利益，维护著作权法的立法宗旨。但该行为仍须符合“不得影响作品的正常使用，也不得不合理地损害著作权人的合法利益” 两个条件。然而，这两个条件具有较强的抽象性和原则性，在个案认定时难以被准确把握。因此，最高人民法院则提出，可借鉴美国的“四要素标准”[12]，也即是结合使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素来综合判断是否属于合理使用(5)参见最高人民法院印发的《关于充分发挥知识产权审判职能作用推动社会主义文化大发展大繁荣和促进经济自主协调发展若干问题的意见》的第8条：在促进技术创新和商业发展确有必要的特殊情形下，考虑作品使用行为的性质和目的、被使用作品的性质、被使用部分的数量和质量、使用对作品潜在市场或价值的影响等因素，如果该使用行为既不与作品的正常使用相冲突，也不至于不合理地损害作者的正当利益，可以认定为合理使用。。因此，以商业为目的，人工智能学习创作而使用作品的行为，虽然不属于法定的合理使用情形，但是该技术的发展关乎文化产业的变革以及国家科技战略的实施。所以，在这个特殊的情形之下，需要结合四要素的判断标准，对该行为是否影响作品的正常使用以及是否不合理地损害著作权人的合法利益作出判断，而非直接将其排除在合理使用的范畴之外。

二、人工智能学习创作使用作品行为的转换性认定

虽然“四要素”的判断标准涉及作品使用的四个方面，但就目前来看，学者对于人工智能学习创作而使用作品行为的争论，焦点在于如何认定该行为的目的和性质，也即如何认定该行为是否具有转换性。而事实上，该问题也是该行为的定性之重点和难点，为此，本文将首先重点围绕此问题展开详细讨论。随着美国司法实践的不断发展，使用行为是否具有转换性使用已经成为判定使用作品的目的和特点的重点，而使用原作品的行为是否具有商业性已经变得越来越无关紧要。[13]美国联邦法院认为，新作品所实现的转换性程度越高, 商业性使用等合理使用其他判定要件的重要性就越低。这种转换性体现在新作品是否在原作品的基础上，以更进一步的目的或者不同的特征来增加原作品的表达、内容和信息(6)See Campbell v.Acuff-Rose Music Inc.510 U.S.569(1994)。。因此，为更充分地论证人工智能学习创作而使用作品之行为是否具有转换性，笔者将首先厘清转换性使用规则的内涵和应用，再结合人工智能的技术原理来分析作品使用中所蕴含的转换性之有无及其程度大小。

(一)转换性使用规则的内涵和应用

当前美国司法实践对于转换性使用的判断标准有两个：(1)内容转换性，即新作品对原作品的表达形式或内容的改变，或对原作品的批判或评论, 或借助原作品内容构造新的表达，[14]例如挪用艺术类的行为(7)See Cariou v.Prince, 714 F.3d 694 (2d Cir.2013)。；(2)目的转换性，即新作品对原作品所欲实现的目的或功能的改变，例如搜索引擎所提供的网页快照(8)See Blake A.Field v.Google, 412 F.Supp.2d 1106, 1118-1119 (D.Nev.2006)。和缩略图(9)See Perfect 10 v.Google, 508 F.3d 1146, 1168 (9th Cir.2007)。。[15]其实，在我国司法审判中，也已经运用转换性使用规则来判断合理使用行为。在王莘案中，法院认为被告以片段式的方式向用户提供图书内容，是为了给用户提供方便快捷的图书信息检索服务，构成对原告作品的转换性使用(10)参见王莘与北京谷翔信息技术有限公司等作品信息网络传播纠纷上诉案，北京市高级人民法院(2013)高民终字第1221号民事判决书。；在“葫芦娃”“黑猫警长”案中，法院认为电影海报为说明年代特征而引用涉案作品，并结合其他元素而作为海报背景，已经产生新的艺术价值，转换性程度较高，属于转换性使用(11)参见原告上海美术电影制片厂诉被告浙江新影年代文化传播有限公司、华谊兄弟上海影院管理有限公司著作权侵权纠纷案，上海知识产权法院(2015)沪知民终字第730号民事判决书。；在李向晖案中，法院认为涉案文章中虽然使用缩小化、清晰度不高的涉案图片，但其不再是单纯再现原作的艺术美感和功能，而是使受众联想到与游戏相关的三国历史，故这些图片让原作的艺术功能发生了转换(12)参见李向晖与广州华多网络科技有限公司著作权侵权纠纷上诉案，广州知识产权法院(2017)粤73民终字第85号民事判决书。。由此可见，转换性规则的运用，可以解决商业性使用作品的行为能否构成合理使用之难题。[16]下文也将从目的转换性和内容转换性两个角度，分析判断以商业为目的的人工智能学习创作而使用作品之行为是否构成转换性使用。

(二)人工智能学习创作不具有目的转换性

对于人工智能分析作品进行创作学习的这一过程而言，其对作品的使用不具有目的转换性。我们以人工智能学习创作画作为例进行阐述。根据人工智能学习画作的技术原理和过程可知，人工智能是借助于它的浅层神经网络来分析挖掘画作的整体风格特征，同时利用它的深层神经网络来提取画作的细微特征。[17]人工智能将不断地重复提取和挖掘这些海量画作中的全部信息，逐步构建画作中的特征量和所对应的风格之间的抽象非线性函数模型。[18]在此过程中，人工智能对于画作的使用目的和功能，并没有与人类学习绘画的目的和功能有实质性的区别。人类画作的传统功能就是让受众欣赏、学习等，而人工智能对于画作分析挖掘的目的就在于掌握这些画作的特征元素，这与人类自主学习画作的风格特征元素，从而掌握这类画作的创作本领的目的没有实质性区别。只不过与人类学习画作不同，人工智能是通过人工神经网络的算法系统，以数学函数建模的方式来抽象地理解和学习绘画。[19]因此，在这个意义上来说，人工智能只是实现学习画作目的的路径方式较为特殊，但是其对画作的使用目的和功能并没有发生改变。

但是，有人却以人脸识别作为典例，来证明人工智能使用原作品的行为，与原作品展示独创性表达无关，故而应被认定为目的转换性使用。其理由是人脸识别是对照片中的人脸生理特征元素的识别，并没有对照片中人物的光线、角度、色彩等独创性表达元素进行识别。[5]但笔者认为这是对人脸识别技术的理解不够深入透彻。首先，人脸识别技术只是特征识别和判断，并不属于人工智能创作技术，因此不应该将两者混为一谈。[20]其次，人脸识别也是涉及对照片中独创性表达元素的提取和识别。虽然人脸识别的核心是根据不同人的脸部生理特征进行区别，但这些特征元素却是蕴含在照片中的独创性表达中，它们是无法脱离于独创性表达而单独存在的。[21]因为在照片中，人脸生理特征的呈现是会受到外界环境的影响，例如光线、角度等。[22]因此，人脸的生理特征和照片中的独创性元素已经混为一体，无法剥离开来。人脸识别就是需要先识别出人脸生理特征在不同照片中的不同独创性表达特征，然后再对这些独创性表达中的一般性生理特征元素进行提取和识别。[23]换言之，人脸识别技术目前无法直接做到对人脸的生理特征进行有效识别，而自动忽略照片中的独创性表达元素的干扰和影响。此外，在实际的人脸识别技术中，为了提高准确率，往往不仅借助于人脸的生理特征元素，还会通过整体脸部的特征元素，来修正诸如肤色光泽、发型等因素的影响，而这些特征元素也正是独创性表达内容。[24]所以，在当前的人工智能技术限制条件下，人工智能对作品的使用，仍然是对其独创性表达的使用。

此外，人工智能根据函数模型生成创作物的行为，也不具有目的转换性。首先，原来作品的目的和功能是训练人工智能学习如何创作，而该目的是在训练结束的时候已经达成，即在人工智能生成函数模型的时候已经达成。人工智能创作画作的阶段，已经不涉及对原作品的再次使用，故而谈不上对原作品的使用目的和功能。其次，对于人工智能先通过对原作品的学习，然后根据自身的学习成果再进行画作创作的过程而言，其与人类先学习创作而后再创作的过程相比，原作的使用目的和功能也无明显区别，即原作品也是用于其传统的被学习而后创作的功能。由此可见，无论是对于人工智能分析作品进行创作学习过程而言，还是对于人工智能根据函数模型生成创作物的行为过程而言，人工智能对于作品的使用均不具有目的转换性。

(三)人工智能学习创作不具有内容转换性

首先，人工智能学习阶段不具有内容转换性。在人工智能学习创作画作的例子中，人工智能通过对海量作品中的特征元素进行分析和挖掘，构建出作品特征量和目标之间的函数模型关系，从而掌握创作不同风格类型的画作本领。这个模型只涉及对原作品的认识和理解，这如同人类通过研究画作后所形成的对画作创作的理解。该过程显然没有新作品的生成，故而缺乏讨论内容转换性的前提。其次，人工智能生成画作的过程，也不具有内容转换性。因为人工智能生成的画作，是根据其自主学习而构建的函数模型进行创作。该模型并非是原作品的数据库，而是对原作内容的理解模型，其本质是函数和算法。该过程的实质是函数模型的图像输出，并不涉及对原作品的任何操作。所以，其并没有以原来的画作作为基础内容，而对其增加新的表达和内容，也没有对原作品进行批判或者评论，更不是借助原作品的内容而创作出新的表达。所以，人工智能学习创作的整个过程均不具有内容转换性。

三、人工智能学习创作而使用作品行为中的利益平衡要素认定

对于人工智能学习创作而使用作品行为的认定，除了判定该行为是否具有转换性外，更需要从合理使用的利益平衡角度出发，对被使用作品的性质、被使用部分的数量和质量、作品使用行为对原作品潜在市场或价值的影响三个角度予以分析阐述，从而切实维护《著作权法》的立法宗旨。

(一)被使用作品的性质

该要素是指根据不同被使用的作品类型和性质，而确定不同程度的合理使用标准。[25]例如，未发表的作品严于已发表的作品，虚构作品严于纪实作品，视听作品严于印刷作品，为特定对象创作的作品较一般作品更为严格。[26]由此可见，独创性程度越高的作品，其著作权人的权益更需要得到保护，故而被纳入到合理使用的标准就越高。[27]由于人工智能创作的学习需要提供高质量的作品用于数据分析和挖掘，故而这些作品往往都是具有较高程度的代表性和典型性。因此，目前用于人工智能学习创作的作品，一般都是世界名家的画作、著名音乐家的乐曲、知名作家的文集和诗集等。这些作品都具有较高艺术价值，无一不体现出创作者独特的个人思考和情感。对于这些作品的合理使用行为的认定，需采取更为审慎的严格标准予以判断，从而更大程度地保护著作权人的利益，这便导致人工智能学习创作纳入到合理使用范畴的难度加大。

(二)被使用部分的数量和质量

该要素是指与被使用作品的整体相比，所使用的部分的数量和内容的实质性。[28]使用原作的内容幅度越多，或者使用了原作内容的重要性程度越高，对著作权人的权益造成的冲击就越高，故而使得使用行为就越不容易构成合理使用。[29]人工智能学习创作，是对作品形式和内容的学习，尤其需要对作品中独创性较高的部分进行分析。因此，这就需要对作品全部内容进行复制，或者对其中的实质性部分内容进行复制。由此可见，人工智能学习创作而复制原作品的行为构成对作品的实质性使用，这无疑使得该行为纳入到合理使用范畴的难度加大。更为糟糕的是，人工智能学习创作所需的作品数量往往达到巨量级别，这就导致对市场上实质性利用的作品总量巨大，对整个文化作品市场冲击巨大，极大地损害了著作人的利益，使得该行为更不易于被纳入到合理使用范畴。

(三)使用对原作品潜在市场或价值的影响

美国法院曾指出，使用对原作品潜在市场或价值的影响是合理使用判断中最重要的因素(13)See Consumers Union of United States v. General Signal Corp.724 F.2d 1044 (1983).，其不仅需要考虑使用作品行为对目前市场的损害，还需要进一步考虑对未来潜在市场的不利影响程度(14)See Harper & Row v. Nation Enterprises, 471 U.S. 539 (1985).。合理使用制度的设立初衷，在于平衡使用人利益以及公共利益与著作人利益之间的冲突。[30]因此，在衡量人工智能学习创作而使用作品行为对原作品市场的冲击程度时，需要厘清使用人利益、公共利益以及著作权人利益。

人工智能使用作品行为，会让使用人和社会公众获得巨大利益。一方面，通过海量作品训练，人工智能自身学习和创作能力得到较大提升，进而可以生成大量具有较高艺术价值的创作物。通过出售这些创作物，使用人可以获取巨大的经济利益。[4]另一方面，人工智能学习创作技术的发展，不仅有助于繁荣文化市场，丰富社会公众的文化产品选择空间，还能提升科技对经济的拉动作用，对于国家创新驱动发展的战略具有重要作用，因而有助于实现较大的公共利益。[31]但是，更不应忽视的是，人工智能使用作品行为也会严重损害作品权利人的利益。人类作者由于精力和时间有限，无法快速地学习和创作海量作品。相比而言，人工智能却可以高效率地学习和生成海量创作物。这不仅使得人类作者在作品创作竞争中处于明显的劣势地位，而且人工智能创作物大量涌入现有的作品市场，也会使得人类同类型的作品市场份额受到极大限缩，造成著作权人的经济收入减少。[32]因此，应通过收取人工智能使用作品费，来弥补著作权人经济现实收入和预期收入的双重损失，而不是将人工智能使用作品行为纳入到合理使用的范畴，使得作品被免费使用。否则，著作权人为防止作品被学习致使自身利益受损，而不愿积极创作，这将不利于人类文化产业的可持续发展，更不利于人工智能学习创作技术的长远发展。[33]因此，人工智能学习创作技术的发展纵然对于公共利益和社会发展有较大裨益，但是其对于人类创作的冲击也是史无前例的巨大，对于人类文化事业的可持续发展也会造成巨大的冲击。因此，为平衡使用人利益以及公共利益与著作人利益之间的冲突，不应当将人工智能学习创作的行为纳入到合理使用的范畴之中。

结语

随着技术变革不断加快，人工智能学习创作技术也不断取得新突破，商业公司及其研发人员越来越多地使用他人作品来训练人工智能学习创作。因此，尽早对该行为能否被法律豁免的问题进行定性，能减少人工智能研发和创作的法律风险和隐患，对于技术发展和文化发展都具有重大意义。通过上文的分析可知，以商业为目的，人工智能学习创作而使用作品的行为，不属于我国《著作权法》所规定的12种合理使用情形。与此同时，该使用行为也不具有对原作品的内容和目的转换性，而且是对独创性较高的作品的实质性使用，对原作品的市场冲击较大。因此，虽然人工智能学习创作技术对于文化产业发展和科学技术发展具有重要意义，但是以商业为目的的人工智能学习创作而使用作品行为，不但和原作品的正常使用相冲突，也会不合理地损害作者的正当利益，故而不可被认定为合理使用，作品使用人仍然需要支付合理报酬给作品权利人。