生成式人工智能的著作权问题及其保护对策
2024-07-02李月泉刘娟
李月泉 刘娟
[摘要]生成式人工智能对现有的著作权理论与法律规范提出了前所未有的挑战。国内首例涉及“AI文生图”著作权案对生成式人工智能的著作权定性、权利归属、侵权责任追究等具有指导意义。文章以此案为切入点,分析生成式人工智能的著作权定性争议,包括生成式人工智能的性质、生成行为的性质和生成内容的性质,并分析生成式人工智能的著作权侵权问题,包括训练数据侵权和内容侵权。笔者认为,关于上述性质问题,生成式人工智能不应被赋予适格的权利主体地位,生成式人工智能依旧是人类可控的工具,而只有包含人类独创性的生成内容才能构成作品;针对生成式人工智能的著作权侵权问题,应以“合理使用制度”和“转换性使用”等加以规制。
[关键词]生成式人工智能;著作权;知识产权
2023年11月,北京互联网法院对我国首例涉及“AI文生图”著作权案做出一审判决,肯定涉案人工智能生成物的独创性及其享有的著作权。在该案中,原告利用生成式人工智能模型Stable Diffusion,通过输入提示词和设置参数,生成涉案图片,并发布在小红书平台上,而被告未经原告许可,在百家号平台上发布了该涉案图片并去除了原告的署名水印。原告认为被告的行为侵犯其享有的署名权和信息网络传播权,将被告诉至北京互联网法院,要求被告赔礼道歉并赔偿经济损失5000元。在判决书中,北京互联网法院指出,该案主要涉及三大争议焦点:一是涉案图片是否构成作品,构成何种类型作品;二是原告是否享有涉案图片的著作权;三是被诉行为是否构成侵权行为,被告是否应当承担法律责任[1]。北京互联网法院经审理认为:原告利用生成式人工智能模型,通过输入提示词和设置参数,生成涉案图片,体现原告的智力投入和个性化表达,因此涉案图片符合我国著作权法对作品的定义,受到著作权法保护,且其著作权归属于原告;判决被告在判决生效之日起七日内,在涉案百家号平台上向原告赔礼道歉,并赔偿原告经济损失500元。
可见,该案判决坚持著作权法以“自然人的创作”为核心保护对象的观点。这一观点的基础在于,生成式人工智能虽然能够创作内容,但是其不具备自由意志,不能被称为法律意义上的主体,因此无法成为我国著作权法意义上的作者。这种观点强调了创作行为背后必须有人类的思想表达和创造性劳动。同时,该案判决也认可人工智能生成图片的作品属性和人工智能使用者的创作者身份。随着人工智能技术的快速发展,其在艺术和文学创作中的应用越来越广泛,这一判决观点将有利于激发和鼓励人工智能使用者利用生成式人工智能及其技术工具进行创作的热情,从而实现著作权法“激励作品创作”的内在目标;这一判决观点也有助于推动人工智能使用者对生成式人工智能进行内容来源标识,促进监管法规的落实和公众知情权的保护;这一判决观点还能够强化自然人在人工智能发展中的主导地位,推动技术的创新和应用,确保技术进步服务于人类的整体福祉,并保护创作者的合法权益,平衡人工智能技术的规制和发展。此外,该案判决还为“人工智能生成内容获得版权保护的人类干预程度”以及标准提供了参考。
北京互联网法院通过该案对生成式人工智能的著作权问题进行了开创性探索,这已成为定位生成式人工智能性质的一个风向标。长期以来,学界存在的普遍观念认为:人是认识世界和改造世界的主体,人工智能仅是人类活动的辅助工具。然而当前,以保护人类“独创性表达”为出发点的著作权法在人工智能的冲击下面临严峻挑战,生成式人工智能的行为能称为创作吗?人工智能生成内容能否定性为作品?它们是否受著作权法保护?如果其享有权利,权属问题如何解决?这亟待有关各方做出回应。文章以我国首例涉及“AI文生图”著作权案为切入点,结合生成式人工智能的特点,深入剖析生成式人工智能的著作权问题,并思考相应保护对策,为有关各方协调和解决生成式人工智能的著作权问题提供思路。
一、问题的提出:生成式人工智能的著作权问题
(一)生成式人工智能的著作权定性争议
我国首例涉及“AI文生图”著作权案体现了当今社会对人工智能生成内容相关法律问题的高度关注,究其原因,学界对生成式人工智能的性质存在争议。基于人工智能的强大算力及其与自然人创作思路极为相似的生成模式,部分学者肯定生成式人工智能的“自主性”,认为它是“强人工智能”,主张用“单位作者制度”[2]加以规制。印度、南非等国家甚至已赋予人工智能法律主体资格,肯定人工智能的创作行为。目前,我国学界主流观点认为,鉴于技术的可控性以及内容的可规制性,目前生成式人工智能仍属于“弱人工智能”,是自然人创作的工具。此外,学界还存在“生成式人工智能没有‘强弱人工智能之分”的观点,认为机器自动生成是不存在的,但机器运算是否为人所预期仍需要进一步讨论。由此可以看出,虽然生成式人工智能的主体性质和行为性质相互关联、密不可分,但是生成式人工智能的主体性质、生成行为性质、生成内容性质难以明晰。目前,我国学界对人工智能生成内容的性质存在“孳息说”“作品说”“工具说”及“非作品说”等,而大多学者持“作品说”,认为人工智能生成内容虽然具有人类智力创作成果的表象,但是其生成过程与人类智力创作活动存在本质不同,不属于著作权法意义上的作品,难以享有著作权[3]。
人工智能生成内容面临权利归属问题。在司法实践中,自然人或法人参与人工智能内容的生成过程,并基于自然人与法人具有的独立行为能力与责任能力,可以享有相应的权利。在现有法律制度体系下,学界更关注的是人工智能开发者、用户,甚至是被用于人工智能生成模型训练的素材的作者等法律明确承认的主体以及他们在何种条件下可以对人工智能生成内容享有相应权利。
(二)生成式人工智能的著作权侵权问题
1.生成式人工智能训练数据侵权
生成式人工智能在生成过程中包含输入大量数据进行训练和深度学习后输出成果的步骤,这些步骤均涉及他人已享有著作权的作品,容易出现著作权侵权问题。具言之,生成式人工智能模型的形成和完善依赖大量的数据训练,而用于训练的数据往往包含受著作权法保护的内容,且生成式人工智能的生成过程往往不符合我国合理使用他人著作权作品的情形。例如,以科研目的为主的人工智能研究是否属于我国现有的科研目的的合理使用情形存在争议[4]。我国著作权法第二十四条规定:“为个人学习、研究或者欣赏,使用他人已经发表的作品。”由此来看,虽然生成式人工智能在训练数据中使用他人著作权作品的行为或可合法化,但是生成式人工智能作为一个系统性工程,难以符合规定中“个人”的要求,从而导致权利人的作品、数据等权利客体未经许可被作为生成式人工智能的训练数据,使维权面临挑战。
2.生成式人工智能内容侵权
生成式人工智能在文本创作中的应用十分广泛,其带来的侵权风险也不容忽视。当生成式人工智能通过深度学习生成的内容与原始文本在核心内容上高度相似时,即使表达方式有所变化,也可能被认定为侵犯了原作者的著作权。此外,生成式人工智能还能够对现有作品进行再创作,呈现在思想内核上一致而在文字表述上有所差异的新作品,存在“洗稿”现象。这种情况不利于原作者著作权的保护。首先,如果人工智能生成内容不被认定为传统意义上的“作品”,那么它可能不会受到著作权法的保护。其次,即便人工智能生成内容与原作品在表达形式上有所不同,但若其未涉及核心创意的抄袭,则可能不被视为侵权。最后,生成式人工智能不是法律主体,其使用者或开发者的责任可能难以界定。
二、生成式人工智能的著作权保护对策
一直以来,我国密切关注人工智能技术的发展、应用与相应规制,推动其在法治框架下的有效创新和运用。文章拟以法解释学为基础、结合法理和法律精神,提出相关建议,为解决生成式人工智能著作权问题提供参考。
(一)生成式人工智能的著作权定性
生成式人工智能通过其生成内容影响人类社会生活,只有确定生成式人工智能的性质才能确定其生成过程是否属于“创作行为”,进而确定其生成内容是否为著作权法所保护的“作品”,最后确定其生成内容的权利归属。
1.生成式人工智能的性质
文章认为生成式人工智能存在“强弱人工智能之分”,强人工智能指能够像人类一样具备广泛的认知能力,如理解语言、解决问题和学习等,而弱人工智能只能执行特定任务或领域内的简单任务,如识别图像、语音和机器翻译等。根据生成式人工智能的现有特性,笔者认为其仍属于弱人工智能。第一,缺乏通用性。生成式人工智能只能完成特定任务,如生成图像或文本,而无法像人类一样在各种任务之间轻松切换、拥有全面理解世界的能力,并依赖数据和算法,需要大量的数据来训练模型,以便生成高质量的内容,且算法本身也受到诸多限制。第二,无法实现自我学习。生成式人工智能依赖于外部输入数据,无法像人类一样自主学习和探索,无法进行常识推理、自我学习和创造性思维等高级认知活动。第三,缺乏创造性。生成式人工智能通常基于训练数据的组合和变换,并没有体现真正的创造性,无法从零开始设计出新的概念和想法,也无法理解其背后的意义和价值。因此,文章认为生成式人工智能不应被赋予适格的权利主体地位,生成式人工智能依旧是人类可控的工具。
2.生成式人工智能的行为性质
自现代著作权法产生至今,其立法目标始终是通过赋予权利人对作品的法定专有权来激励作品创作和传播[5]。生成式人工智能虽和自然人创作过程相似,都建立在对经典的大量观察、模仿、提炼基础上,但其不包含人的思想和感情,也不是著作权法需要保护和激励的那种行为(人工智能不能被激励),而是应用算法、规则和模板的结果。因此,笔者更赞同以“人工智能使用者说”来定位生成式人工智能的行为性质[6]。该观点认为,人类仍是创作核心,人工智能学习的数据仍由人类提供,生成内容的指令仍由人类操控,在人工智能成长出自我意识、脱离人类控制、拥有人格之前,其运作过程都不能称作行为,哪怕在利用人工智能的创作中,自然人发挥的作用逐渐变小,法律仍应着眼于对人的保护与规制,而从使用人工智能的结果来看,生成式人工智能的应用赋予了普通使用者更多的创作权利和自由,其受益者仍然为个人。
3.生成式人工智能的内容性质
从生成式人工智能过程可知,部分生成式人工智能的内容涉及人类思想表达,由人类利用人工智能间接创作所得,如果其具有独创性和可复制性,就可以满足成为作品的要求,应当享有著作权。因此,笔者认为对生成式人工智能内容的定性需要因情况而定,考量人在内容创作中的参与程度和独创性贡献、分析人类思想的表达在成果中所占比例是否达到值得保护的程度,以确定其是否为作品。例如,在“AI文生图”著作权案中,原告通过提示词、参数设置等方式设计了画作中的人物及呈现方式、布局构图等元素,体现了原告的选择和安排等个性化表达,因此该生成内容被认定为作品,并受著作权法保护。而对这个“人”,笔者认为应限定为“创作者”,即只有创作者在生成式人工智能内容中具有独创性表达,该内容才能被认定为作品。对有的学者将“欠缺自然人的创作贡献”[7]的人工智能生成内容的著作权归属于人工智能的开发者,笔者认为这种观点欠妥。依据我国著作权法第一条规定:“……鼓励有益于社会主义精神文明、物质文明建设的作品的创作和传播……”和此条款体现的激励创作的法律精神,上述观点“欠缺自然人的创作贡献”的内容便不构成作品,自然不享有著作权,而开发者的创作也不应由著作权法予以激励,其独创性也就不予被考虑。
4.生成式人工智能的著作权归属
经过前文的逐步定性,生成式人工智能内容确定应享有著作权,即生成内容具备创作者的独创性。创作者利用人工智能进行创作涉及先后两个行为:前者是作为人工智能使用者与人工智能服务提供者之间的合同行为;后者是向人工智能输入指令和参数使其输出“作品”的创作行为。后者以前者为前提,如果没有创作者和人工智能服务提供者合意授权使用,创作者无法进行后续涉及生成式人工智能的创作。无论是规范合同行为的合同法,还是规范创作行为的著作权法,都属于私法,应以尊重当事人意思自治为原则,因此,笔者认为,其著作权的归属先应遵循“有约定从约定”的规则。例如,OpenAI公司在ChatGPT相关服务协议中明确约定,在法律允许的范围内,将“输入”和“输出”内容中的所有权利转让给使用者[8],若创作者与人工智能服务提供者未约定权利归属,则该作品著作权属于创作者。
(二)生成式人工智能的著作权保护对策
1.以“合理使用制度”和“转换性使用”规制生成式人工智能训练数据侵权
生成式人工智能在机器学习时未经允许输入他人已享有著作权的作品作为训练数据,产生侵权争议。对该问题,笔者认为可以利用“合理使用制度”加以规制。依据我国著作权法第二十四条规定,“合理使用制度”指在法律规定或作者无保留相关权利的条件下,直接无偿使用已发表的享有著作权的作品,而不需要经著作权人许可的著作财产权限制制度。“合理使用制度”作为限制著作权行使范围的法定制度之一,包含公平性和公益性的目标,能够协调创作者、传播者、使用者三者之间的关系,符合当前既鼓励技术发展又保护作者权利的价值取向[9]。具体而言,生成式人工智能对机器学习作品使用的情形可以考虑被纳入“合理使用制度”,以此鼓励创作者进行知识分享,促进生成式人工智能技术进步。在相关条文增设之前,亦可借鉴“转换性使用”的判定标准,“转换性使用”即对他人作品进行使用时或具有再生产功能,或与著作权人对该作品内容的使用方式、目的或功能截然不同的作品使用行为[10],从而减少机器学习在合理使用的何种范围内进行扩大解释的不确定性,如考察机器学习使用作品的目的是实现社会公共利益价值;确保数据收集和使用方式合法,以保护作者经济利益;审视机器学习的表现结果应为功能转换,以挖掘数据潜在价值为主,而非内容的再创造。
2.以“思想表达二分法”和邻接权规制生成式人工智能内容侵权
如果生成式人工智能内容与已享有著作权作品实质性相似但不构成作品,那么可能出现无法直接适用传统著作权侵权判定标准的情况。文章认为因该内容不构成作品,其经济价值普遍偏低,先可以“合理使用制度”进行判定,若超出合理使用的范围,再创设相应的邻接权,如“改编生成权”,用以控制和获取由其作品衍生出的人工智能生成内容的利益。
根据“思想表达二分法”,只有表达方式受到保护,而思想、方法等不受保护。面对生成式人工智能内容与原作品思想相同但表达有所差异的侵权情形,笔者认为可以明确规定原作品邻接权中改编权的范围和条件,对生成式人工智能内容的改编有明显恶意以及实质性相似程度超高的情形判定为侵权,为著作权人提供保护。
对侵权主体难以确定的问题,参照生成式人工智能内容著作权归属的论述,笔者认为生成式人工智能内容的侵权责任归责也可以优先尊重当事人意思自治,若无约定,则生成式人工智能内容不一定构成作品,该内容的创作者、人工智能的使用者和服务提供者可按比例承担连带责任,并赋权专业人员组成的行业组织对人工智能算法进行技术审查和比例认定,从而确定各方对该内容的贡献。
三、结语
国内首例“AI文生图”著作权案对生成式人工智能的著作权定性、权利归属、侵权责任追究等具有指导意义。文章以此案为切入点,分析生成式人工智能的著作权定性争议,包括生成式人工智能的性质、生成行为的性质和生成内容的性质,并分析生成式人工智能的著作权侵权问题,包括训练数据侵权和内容侵权。关于上述性质问题,笔者认为,生成式人工智能不应被赋予适格的权利主体地位,只有包含人类独创性的生成内容才能构成作品,而针对生成式人工智能的著作权侵权问题,应以“合理使用制度”和“转换性使用”等加以规制。
[参考文献]
[1]胡畔.AIGC创作内容侵了谁的权[EB/OL].(2023-12-13)[2024-04-10].https://baijiahao.baidu.com/s?id=1785093009030152885&wfr=spider&for=pc.
[2]许辉猛.人工智能生成内容保护模式选择研究:兼论我国人工智能生成内容的邻接权保护[J].西南民族大学学报(人文社科版),2019(03):100-106.
[3]于雯雯.人工智能生成内容的著作权[N].学习时报,2019-08-21.
[4]张金平.人工智能作品合理使用困境及其解决[J].环球法律评论,2019(03):120-132.
[5]熊琦.人工智能生成内容的著作权认定[J].知识产权,2017(03):3-8.
[6]朱梦云.人工智能生成物的著作权归属制度设计[J].山东大学学报(哲学社会科学版),2019(01):118-126.
[7]於兴中,郑戈,丁晓东.生成式人工智能与法律的六大议题:以ChatGPT为例[J].中国法律评论,2023(02):1-20.
[8]OpenAI.Terms of use[EB/OL].(2023-11-14)[2024-04-10].https://openai.com/policies/terms-of-use.
[9]陈增宝.生成式人工智能的著作权法规制[J].数字法治,2023(06):24-28.
[10]李杨.著作权侵权认定中的转换性使用理论适用阐释[J].北方法学,2023(03):42-56.