二元主体结构的AIGC著作权归属研究
2023-11-12李启南
李启南
(兰州交通大学电子与信息工程学院,甘肃 兰州 730070)
0 引言
随着ChatGPT 等大型AI 模型的广泛应用,AI生成式内容(AI Generated Content,AIGC)正引领着内容创作和知识表达的范式转变,同时也带来了AIGC著作权和AI生成恶意内容的可问责性等新的法律挑战。虽然AIGC模型的所有权通常归功于创建它的机构或个人,但AIGC 通常由已存在的数据和新的创意元素混合组成。这种界限的模糊引起了由AI 生成内容的知识产权归属的担忧。尽管法院正在进行持续的辩论和诉讼,但在如何解决这一问题方面仍缺乏共识。
AIGC 著作权难题涉及可版权性和版权归属两方面。作为提供法律明确性的首次尝试,欧盟发布的AI法案旨在为生成式AI模型提供法律指导和监管。我国《著作权法》采用作品“类型开放”模式[1],规定“符合作品特征的其他智力成果”属于作品,据此可将AIGC认定为人工智能作品,受著作权保护。这推动了《著作权法》现代化变革[2],解决了人工智能生成物可版权性问题。
在AIGC创作中,人工智能扮演了作者的角色,承担了作品创作的实质工作。但目前人工智能处于弱人工智能阶段,按照伦理人格主义的标准,“弱”人工智能只应作为法律客体[3],根据主客体不能互换的基本原理,人工智能本身不能成为AIGC著作权主体,AIGC 著作权主体仍然是人工智能背后的人类。
AIGC 是作品创作软件开发人员和人工智能算法设计人员的智力劳动、投资者投资、作品创作软件使用者运行软件、数据库开发者选取材料共同劳动的成果[4],存在多个著作权主体:投资者提供资金,算法所有者组织算法设计者、数据库开发者共同研发人工智能算法,算法使用者指定关键词运行人工智能算法生成具体AIGC。将著作权整体归于某一著作权主体都有其合理性,但同时也都存在不合理性。因此,需要在众多著作权主体之间进行AIGC 著作权归属划分,平衡各方利益,这就产生了AIGC著作权归属问题。
明确AIGC 著作权归属,有利于充分发挥各个著作权主体的积极性,鼓励各个著作权主体的智力创新活动,减少AIGC 出版纠纷,保护出版市场秩序,促进更多高质量AIGC 出版。《知识产权强国建设纲要(2021—2035年)》提出“研究完善人工智能、大数据、算法产出物的知识产权保护规则”。李晓宇认为人工智能作品的设计者、创作者、使用者、投资者乃至人工智能机器自身,皆对数据作品有一定的利益诉求,应将人工智能生成数据作品分为“完全由人工智能付出实质性贡献而生成数据作品”和“由人工智能与人类创作者共同付出实质性贡献而生成数据作品”两类,使用博弈论进行分类保护[5]。但人工智能作品已经可以通过图灵测试[6],说明从创作结果来看,人类已难以判断作品是否由人工智能创作,该方法存在实用性不强的问题。因而判断AIGC 著作权归属问题,使用从创作结果分析的研究方法越来越不现实,取而代之的是从创作过程分析的研究方法。
本研究在分析现有AIGC 著作权归属研究成果基础上,通过分析各著作权主体在创作过程中所起的作用,采用投资者、创作者二元主体结构进行AIGC 著作权归属划分:算法设计者作为原始主体获得著作权中的署名权;投资者、算法所有者根据合同约定获得邻接权;算法使用者通过购买、转让等方式作为继受主体获得邻接权;数据库开发者根据算法设计者要求付出劳动,获得邻接权。
1 AIGC著作权归属现状
传统作品著作权归属采用创作者一元主体结构。在该法律体系下,AIGC 著作权归属观点有所有者说、投资者说、使用者说三类。熊琦认为应借鉴早已存在且运作成熟的法人作品制度安排,将人工智能的所有者视为著作权人[7]。张子浩认为应将人工智能作品视为特殊职务作品,其著作权主体认定为人工智能技术所属的法人或非法人组织[8]。深圳市南山区人民法院就“网贷之家”抄袭腾讯机器人Dreamwriter 撰写文章的案件做出判决,认为涉案文章是由腾讯公司主持的多团队、多人分工创作的法人作品,著作权归腾讯公司所有。陈全真认为应建立一套以人工智能投资者为著作权人、同时辅之以意思自治原则的智能创作物著作权归属制度安排[9]。刘维认为基于人工智能创作过程的自主性,避免对算法所有者的多重激励,应当拟制算法使用者就人工智能创作成果享有著作权[10]。李伟民认为解决人工智能作品归属方面适用视为作者原则,在人工智能的研发者、开发者、投资者、管理者、控制者中拟制承担人工智能作品的主体和责任人,既符合现实需要,也不违背立法原理[11]。
创作者单一主体结构的法律体系无法兼顾所有人工智能作品著作权主体的利益。这导致作品著作权归属争论不断,著作权侵权责任不明,扰乱了出版市场秩序,损害了作者和出版商利益。人工智能作品创作的高效性和同质化,进一步增加了解决该问题的难度,人工智能作品保护难以落到实处。
《著作权法》借鉴、学习外国知识产权制度,结合了社会主义核心价值观,在创作原则为主原则的基础上吸收了投资原则作为辅原则,主体制度上体现为创作者作为著作权主体与投资者作为著作权主体的二元结构。英联邦国家将人工智能作品著作权归属于对该作品创作进行了“必要操作的人”。“必要操作的人”包括程序员、使用者,也可能是人工智能系统或设备的投资者。刘铁光认为基于创作者主体声誉积累的诉求,应在任何情形下都保留其署名权;基于投资者主体对作品或邻接权客体的利用诉求,应做无障碍利用的著作权配置安排[12]。罗祥等建议增设人工智能创作物邻接权新类型,解决狭义著作权制度与人工智能创作物保护存在难以解决的理念冲突与规制困境[13]。朱倩雯认为现阶段人工智能发展正处于弱人工智能阶段,运用邻接权制度对其进行保护较为适当[14]。
2 AIGC创作过程
目前“创作”已不再是人类的专属[15]。2014年,Goodfellow 等人提出了生成式对抗网络(GAN),用于从现有数据生成图像。2017 年,微软的AI 机器人小冰创作了首本诗集《阳光失了玻璃窗》。2021年,OpenAI推出了DALL-E,支持从文本生成图像。2022 年,OpenAI 推出了ChatGPT 作为基于生成式预训练变换器(GPT)的通用语言模型,它可以执行各种复杂任务,如生成类似人类的回复和营销文案。2023 年多模态版本GPT-4 的发布进一步扩展了大型AI模型的能力。
AIGC 存在两种主要内容生成模式:协助生成(AI-Assisted Content Creation)和自主生成(Autonomous Content Creation by AI)[16]。
协助生成模式需要人类干预。AI 算法为创造内容的人类提供建议,在此基础上人类根据AI 提出的建议编辑和改进内容,提高最终产品的质量。该模式生成的AIGC 著作权归具体创作的人类,不存在著作权问题,但存在速度慢、自动化程度低、成本高等不足。
自主生成模式无需任何人类干预,AI完全独立地创作内容。AI 机器人可以自主快速且低成本地创作大量AIGC,作品内容质量仅仅取决于生成AI模型。该模式生成的AIGC 著作权归属目前缺乏明确法律规定,属于本研究讨论范畴。
AIGC 创作过程是通过对大量已有作品进行分类和整理,发掘分析这些作品所表达的思想感情、所采用的语言特征、所特有的表达风格等,从中抽取和提炼出这些作品的规则、模式、结构、趋势,再将这些规则和模式应用到具体创作场景之中,其后通过自我观察,独立地、持续地改进和优化其分析和处理过程[17]。
人工智能进行内容生产必须以海量的真实数据为前提,并通过算法分析挖掘数据[18],呈现出算法驱动和数据保障两大特征。苗成林认为评定人工智能生成物独创性的方法应该使用对人工智能的创造过程进行分析,根据人工智能生成物的特点分析其独创性的判断方法[19]。
AIGC 创作过程具体分为算法训练和作品生成两个阶段,前者提取和理解用户意图信息,后者根据提取的意图生成所需内容。
2.1 算法训练阶段
人工智能生成作品之前必须经过学习模拟人思维过程的阶段。在学习过程中所学内容取决于作品数据库中的数据,而该数据的数据量大小、数据类型等最终由人类决定。人工智能算法依据的预设学习规则亦由人类决定。因此,AIGC 体现了人类的思想,而这些思想通过文字的形式得以表现,思想表达二分法原则反映于AIGC中,体现了思想表达共生一体[20]。
该阶段,计算机按照算法设计者预设的学习规则,从数据库开发者已标注的作品数据库数据中学习、发现特定类型作品的用词规律、情感取向、韵律规则、主题表达等创作规律,形成AIGC创作能力。
一方面,人工智能算法得益于对海量作品数据库的高速化、自动化机器学习,能够全面学习作品创作规律,发现一些人类忽略的创作规律,体现独创性,生成较高质量的作品。这表明人工智能算法能够部分脱离人为控制,提高AIGC 质量。另一方面,AIGC 创作离不开人类的参与。算法设计者预设学习规则,算法使用者提供关键词,数据库设计者标注数据,三者都直接参与了AIGC创作,都能影响着AIGC质量。
2.2 作品生成阶段
该阶段,算法使用者提供关键词(如图像、题目等),运行训练好的人工智能算法生成特定AIGC。既体现了创作行为的不可预测性,又产生了基本满足关键词要求的结果。
人工智能算法根据关键词自动进行词语联想、搜索、排列组合,比较不同词语搭配关系,选择最优结果输出,保证生成作品既不偏离作品主题,又符合作品创作规律。此类算法巨大的词语联想、词语排列组合空间,强大的搜索功能保证了AIGC 具有较高的生成质量。
根据独创性客观标准[21],AIGC 按照关键词自动进行词语联想、搜索、排列组合,比较不同词语搭配关系等操作不需要人工参与,人类无法预测其结果。算法借助计算机强大的算力,组合上述操作就能够发现人类未发现的创作规律,创造出具有独创性的AIGC。
AIGC 是在半监督模式下人工智能自行创作的作品,其创作结果无法被设计者所预知,具有高度的随机性与不确定性,任何人都不能直接决定人工智能最终所生成作品的外在表达,充分体现了创作的独创性。
3 AIGC著作权归属分析
曹源认为人工智能创作物获得著作权保护具有合理性[22]。波斯纳认为著作权配置的功能是明晰著作权及其归属,降低著作权变动的交易成本。AIGC 完成需要不同创作者之间进行分工,最后整合成完整的作品,是多人创作作品。
对于多人创作的作品,如果不在制度上对著作权归属进行直接安排,则会存在应该由谁享有和行使著作权的争议,必然导致因著作权归属不明而降低交易效率、增加交易成本。如果全部由一个创作者取得原始著作权,那么实现作品的整体利用就需要经过多次交易,也将降低交易效率、增加交易成本。因此,应该根据主体的不同利益诉求,为参与AIGC 创作的不同主体配置不同的著作权,明确AIGC著作权归属,鼓励AIGC创作发展。
3.1 资金投资者获得邻接权
资金投资者既需要承担前期投入的风险,又必须关注市场的需求,其工作已经成为AIGC 创作中最为关键的环节。鼓励投资者的著作权法,自然应该通过制度安排使资金投资者以获取著作权方式收回投资与获取利益。
资金投资者作为著作权主体是降低交易成本的制度选择,是实现著作权激励机制的有效途径。但是不论是作为自然人的投资者,还是作为法人或非法人组织的投资者,或不直接参与创作,或不能进行创作。因此,按照“额头出汗”原则,投资者不能成为作品的原始主体,不应获得著作权,应赋予投资者邻接权,以著作权主体的身份在正常商业活动中实现收回投资和营利目的,鼓励其投资AIGC创作。
3.2 算法所有者获得邻接权
算法所有者是通过组织算法设计者、数据库开发者研发人工智能算法进而取得算法所有权,但并不使用算法进行特定作品创作的个人或组织,是创作作品的技术、人员投资者。
AIGC 创作本质是人工智能模拟人的思维创作作品,体现在甄选材料、归纳总结、预判结论、情感模拟、谋篇布局、遣词造句等多方面。该过程中,人工智能所有者将会根据自己的需求,限制人工智能的具体创作方向、范围和类型,如限制人工智能只进行诗歌创作,这体现了其所有者的意志。
算法所有者是保障各创作环节稳步进行的组织者,为算法开发提供了物质基础和环境基础,其对作品生成的投入和贡献应当被肯定,基于相应的行为所产生的投资回报期待也应当被满足。但算法所有者和资金投资者一样,两者都不直接参与作品的具体创作活动,对特定作品独创性没有直接实质贡献。按照“额头出汗”原则不应被赋予著作权。
为补偿其组织人工智能算法开发的投入,应赋予其邻接权,方便其出售或租赁算法给算法使用者创作作品获得经济补偿,避免作品因为著作权主体配置变动导致频繁交易,增加交易成本。
3.3 算法设计者获得署名权
AIGC 是人工智能开发者、所有者和使用者等共同直接努力的结果,他们投入时间、劳动成本共同创造AIGC,希望作品能够为其带来经济利益,以平衡投入甚至获取额外的经济利益。
AIGC 创作的特点是算法所有者、算法设计者、算法使用者三者相互分离,因此我们需要在算法设计者和算法使用者之间合理进行著作权分配,为了避免著作权过度分割,应将人工智能生成物的著作权归为对人工智能创作负有责任的一方。
算法设计者负责算法整体架构设计、功能实现及负责算法具体模块设计和调试等工作,任何利用该算法完成的创作都以此为基础。如果赋予算法设计者著作权,意味着使用该算法创作的所有作品都属于算法设计者,这无疑将打击算法使用者应用该算法创作特定作品的积极性,不利于发展AIGC创作。同时,算法设计者享有软件著作权,为避免双重奖励,不应再享有算法本身的财产权。但应该将署名权配置给算法设计者,以激励其研发和改进新技术、新算法,创造更优质的AIGC。这是因为署名权保护本质是对作者系某作品的创作者这一事实的确定,在于保护作者与作品联系的声誉。算法设计者需要署名权以提升与积累其声誉,以提升未来算法的竞争力。
算法设计者获得署名权的目的,一是向公众说明作品创作的情况,满足公众的知情权;二是保障人工智能研发者的利益,使相关公众知晓该人工智能算法,扩大人工智能的知名度和影响,从而实现人工智能的使用者和研发者的利益平衡。
3.4 算法使用者获得邻接权
算法使用者是指使用、操作人工智能算法,生成特定作品的人。算法使用者通过购买或者租赁的方式取得使用算法的权利,然后将自己的创作意图、创作要求提炼为若干关键词,向人工智能算法提供关键词、选择生成作品类型,执行人工智能算法生成具有一定质量的特定作品。算法使用者是直接引发作品创作的主体,是为创作作品做出实际安排的人,人工智能作品程度不等地体现着使用者的思想。
使用者提供关键词、选择创作类型等在先行为是创作作品的必要环节,是作品创作的启动者。关键词和作品形式的选取等会对生成作品的独创性产生直接影响,但作品的创作并不会因此受使用者控制,使用者对作品独创性实质贡献微小,因而其不应被赋予著作权。
算法使用者的目的是通过使用算法生成作品、传播作品,不能因为其行为成本低就推断使用者并无创造性劳动的付出[23],应赋予算法使用者邻接权,鼓励其进行AIGC 生成、传播,推动作品的利用和再创作。只有这样,著作权语境下的人工智能产业才会形成完整的产业链。
3.5 数据库开发者获得邻接权
AIGC 创作是以众多受著作权法保护的在先作品为基础的再创作。再创作是建立在对已有作品学习、积累、借鉴与思考的基础之上的,因此AIGC质量与学习的数据库的数据数量、质量密切相关。两个AIGC使用同一个算法,学习不同数据库,两者结果就会呈现出不同独立表达,存在差异性[24]。如果机器学习所使用的数据本身不够完整或存在一定的价值倾向,则机器学习的结果也存在一定的价值倾向,从而导致AIGC存在偏见。
现有观点普遍忽视了数据库在AIGC 创作中所起的作用,数据库开发者未能参与作品著作权划分,挫伤了其参与AIGC 开发的积极性,不利于AIGC 发展。叶霖等关注了此问题,提出人工智能作品生成依赖的数据库开发者可以根据权利共享或者分享协议,获得人工智能作品的部分权利[25]。
数据库开发者的工作是按照算法设计者要求,从众多数据中挑选出符合要求的数据,正确标注数据分类,构成优质数据库。数据分类标注工作不仅需要具有计算机知识,而且需要有相应的专业知识,属于专业性、创造性劳动。数据库开发者的工作质量直接决定了数据库的质量,数据库的质量又直接影响着AIGC 创作质量,因此数据库开发者的智力劳动对AIGC 的生成具有贡献。我们需要重视数据库在AIGC 创作中的作用,赋予数据库开发者邻接权,补偿其付出的智力劳动,鼓励其积极参与AIGC创作,共同提高AIGC质量。
AIGC 创作过程中,对于在先作品的获取与使用是否存在着著作权侵权风险,学者们对此进行了研究。吴汉东认为从人工智能数据输入—机器学习—结果输出的机器创作过程出发,可发现人工智能批量化的机器阅读行为具有著作权合理使用性质[26]。焦和平建议在立法上增设“人工智能创作”合理使用类型[27]。初萌认为对人工智能著作权侵权责任的分析应当摒弃“统合分析”模式,坚持“层次分析”方法,就深度学习中的复制行为与输出侵权作品的行为分别进行评价。应基于人工智能行为的自主性和算法黑箱,相应配置人工智能设计者、控制者“防抄袭”注意义务,并以公平责任作为补充[28]。饶先成等提出对平台施加事前过滤的注意义务,强制要求平台以语义识别为基础,设置语义识别的不同语种、拼音及俗称的替换,同时构建跨平台数据库,在上传时进行识别,过滤涉及侵权的在先作品[29]。
4 结语
AIGC 丰富了人文科学内容,和人类创作作品共同成为人文科学事业发展的组成内容,符合《著作权法》关于促进社会主义文化和科学事业发展与繁荣的立法目标,理应受《著作权法》保护。Chat-GPT 的发展进一步突出了AIGC 著作权归属问题。本研究分析了AIGC创作主体在创作过程中所起的作用,据此采用投资者、创作者二元主体结构进行AIGC 著作权归属划分:人工智能独创性直接来源于算法设计者,其工作成果直接决定了AIGC 创作质量。算法设计者作为原始主体获得著作权中的署名权,以保护与提升其声誉,从而使其未来的作品更具有市场竞争力,鼓励其发展AIGC创作技术,进而提高AIGC质量。投资者、算法所有者、算法使用者对AIGC 独创性无直接贡献或直接贡献微小,不应赋予著作权。投资者、算法所有者根据合同约定获得邻接权,补偿其投资、组织人工智能算法开发的投入,方便其通过出售或租赁算法给算法使用者创作AIGC 获得经济补偿,鼓励其提高人工智能算法质量;使用者通过购买、转让等方式作为继受主体获得邻接权取得财产回报,以鼓励其创作、传播AIGC;数据库开发者根据算法设计者要求付出劳动获得邻接权,获取经济利益,鼓励其积极参与AIGC创作,提高AIGC数据库质量。