算法创作侵权问题的应对策略研究
2022-03-16何俊
◇ 何俊 ◇
随着大数据与人工智能时代的到来,算法开始被应用在越来越多的社会生活场景中,并呈现出越来越广泛而深刻的影响力。在文化产业领域,算法崛起推动了版权产品市场的供给侧变革。通过算法创作技术生成的音乐、小说等逐渐成为版权产品的重要来源。所谓“算法创作”,即是人工智能机器依靠算法对网络数据进行挖掘、统计和分析,总结其中的人类审美倾向、思维模式及其表达规律,并实现自我优化,最终通过数学建模形成表达文本的过程。
这个过程包括输入和输出两个阶段的操作:在输入阶段,需向算法程序中导入大量作品内容,使其暂时或永久地存储;在输出阶段,算法程序会根据系统中的作品数据,抽象出一定的创作模型,并根据这些模型产出某种类型的版权产品。
创作型算法在运行过程中可能带来侵害他人作品著作权的问题。算法创作中的版权侵权有两种主要的形式:第一种是未经许可复制权利作品;第二种是生产与权利作品构成实质性相似的版权产品并传播。前者与输入阶段相关联,而后者与输出阶段相关联①初萌:《人工智能对版权侵权责任制度的挑战及应对》,《北方法学》2021年第1期。。
算法创作作为人工智能时代文化产业发展的重要成果,虽然会使版权人遭受一定程度的利益减损,但其能够带来的经济效益和蕴藏的巨大发展潜力是不容忽视的。本文通过分析算法创作过程中的版权侵权现象,并以平衡版权人的利益和文化产业发展的公共利益为价值起点,探寻版权制度关于算法创作侵权问题的应对策略。
一、算法创作各阶段的版权侵权风险分析
(一)输入阶段:以复制权为核心的权益损害
在输入过程中,算法使用者需要向智能机器导入作品资料。这一步既要将纸质作品进行数字化处理,也要将其以电子化的形式储存到计算机硬件上,作品内容也在此时以电子数据的形式被复制和长久地保存。此外,智能机器在对网络上已有的电子数据进行深入挖掘和深度学习时,基于数据处理的需要,也不得不临时复制缓存作品。
版权制度最初规定复制权的原因是:在计算机科学不存在或并不发达的时代,复制作品通常是为发行行为做准备的,复制行为是作品向公众传播的前提。版权法是基于保护传播权才注重对非法复制行为的规制。但在人工智能时代,复制权中已经被大数据、算法技术等赋予了不依赖于传播权的独特价值。即便作品只是被一个或少数几个特定主体复制而并未向社会传播,这种复制本身也能产生相当可观的经济价值。更进一步言,虽然算法创作的目的并不是对已有作品进行直接的对外传播,其过程也不会造成对作品的公开传播效果,但无论是永久复制还是临时复制,其本质都是在利用这些作品的内容制造与人类创作相媲美的版权产品,然后将其推向市场获取经济利益,这反映了作品的使用价值在当代社会的延伸与拓展。
由此可见,创作型算法在输入阶段的上述复制行为,如果是在没有法定事由或征得许可的前提下进行的,显然构成了对原有作品版权人的复制权权益的侵害。
(二)输出阶段:相似版权产品的市场替代
当算法程序完成对系统中已有作品的学习和建立创作模型两个步骤后,就会正式生成新的创作物。在一个完整的算法创作“生产线”上,归纳和模仿是极其重要的两项“生产工艺”,这决定了新的创作物无法避免地携带有此前输入作品的特征。如果这些特征属于原有作品的独创性表达,且算法创作物中对这些特征的运用使得其与原作品构成实质性相似,则此种算法创作可能被认定为剽窃,会对被学习者的作品市场产生较强的替代效果,损害版权人的合法权益。
实践中出现了一种以模仿和重现某一作者的创作风格为技术目标的算法创作。它从作品中提取出作者极具个性化的独有表达,是作者作品的核心智力成果。例如,微软与荷兰国际银行合作开发的名为“下一个伦勃朗”的人工智能来收集荷兰画家伦勃朗的346幅画作,利用特殊的算法程序解构其中的人像、色彩、服饰、构图等方面的作品特征,最后模仿伦勃朗绘画风格生产出类似的创作物①TechCrunch中国_discard:《下一个伦勃朗:又一个机器仿制大师画作的项目》,搜狐网,http://www.sohu.com/a/68645978_115640. 2016-4-11.。再如,巴黎索尼计算机科学实验室用音乐家巴赫的352首清唱曲作为训练数据,“创作”出具有巴赫风格的音乐作品,经测评有超过一半的听众将人工智能创作的作品误认为是巴赫本人创作的作品②DeepTech深科技:《深度学习模仿巴赫清唱曲,可以假乱真》,网易,https://www.163.com/dy/article/C95267UR05119734.html. 2016-12-25.。
上述两位文化艺术领域的大家离世已过百年,其作品已不受现有版权法的保护,但如果是仍在版权保护期的作品,则原作品版权人的个性化表达不能被他人进行达到“实质性相似”标准的过度模仿。此外,在速度和效率方面,人类作者的创作同算法创作有巨大差距,原作者面临着被取代的巨大风险。因此,当版权作品被用于类似的算法创作时,被学习的作品作者将被置于被剽窃的侵权风险之下,同时其作品的市场利益也会因替代效果而受到减损。
二、版权制度回应算法创作侵权的价值考量
(一)激励个体创新:维护版权人利益
版权法通过赋予作者对其作品的永久的或一定期限的垄断性权利,前强化作者通过作品获取利益的能力,从而激励个体创作,最终促进社会整体的创新。但如前所述,作者通过其作品而享有的权益很可能受到算法创作技术的侵蚀,如不对这种风险加以控制,则会对作者的创作积极性产生消极影响。相较于人工智能时代以前的“人工生产型”版权侵权行为,算法创作侵权主要有以下两个特点:
第一,算法创作的版权产品对原有作品的市场侵占或排挤能力强。创作型算法不同于人类作者,它能突破脑力、精力和知识面的限制,以较低的边际成本连续、快速地生成大批量类型多样的创作物。一旦投入生产,算法创作物将很快进入并挤占相当大的一部分文化市场空间,从而产生市场替代效应,导致原有作品的市场占有率大幅度降低。
第二,从权利的救济层面来看,版权人受到算法创作侵权的事后救济成本较高。首先,创作型算法获取复制他人作品数据的过程通常是离线与在线状态交替转换的,现有的网络技术手段难以及时对违法复制行为准确检测和记录。算法创作的这种隐蔽性,提升了版权人的取证难度。其次,算法创作软件所生成的文字内容所涉及的相关作品数量相对巨大,且原相关作品的内容呈碎片式散见于创作物的各个部分。对于单个作者而言,该情形是较难被察觉的①张洋:《网络文学新时代出版界应对抄袭的策略研究》,《科技与出版》2019年第12期。。最后,当前创作型算法研发者一般都是实力雄厚且掌握先进智能技术的大型企业,如谷歌、微软和腾讯等。这便导致作为个体的版权人在与研发者的博弈中处于弱势地位,版权人的利益争取及维护困难重重②刘友华,魏远山:《机器学习的著作权侵权问题及其解决》,《华东政法大学学报》2019年第2期。。
所以,考虑到算法创作侵权可能会使版权人经济利益受损更为严重,并且维权难度更大,基于对版权人利益以及个体创新激励的考量,版权法应当为版权人构建合理有效的利益补偿机制和维权机制,以维持激励创作的效果。
(二)推动社会发展:促进技术进步
版权制度的直接目的是通过赋予作者依其作品而享有的垄断性权利以激发其创作欲望、鼓励其提升创作能力,但最终目的在于利用这些知识成果,使其转化为文化、教育、经济乃至整个社会的强大发展动力。算法创作是人们对作品成果的新型利用方式。促进算法创作技术的发展,有助于人类和智能机器之间形成良性互动,激励人类作者开发创新潜力,重塑人类作者在文化创造中的角色定位,推动文化产业的转型升级,从而丰富人类文化的多样性,促进社会科技文化的进步①马忠法,肖宇露:《人工智能学习创作的侵权困境与出路》,《武陵学刊》2019年第5期。。版权制度想要实现这一价值目标,必须要斟酌如何进行制度设计方能既满足算法创作技术发展所需条件,又兼顾作者的利益使其不失创作之热情。
创作型算法的基础构建与自主优化均依赖于大量的作品数据,这些作品中固然有一部分已经归入公共领域,但为了使算法程序紧跟文化前沿,研发者对仍在版权保护期限内的作品需求也许更为迫切。但研发者若在未获许可的情况下对权利作品进行复制或缓存,依现行法律规定,相应版权人有权请求给付赔偿金。这虽对版权人有利,但算法研发者为避免侵权却被迫在训练数据的收集环节消耗大量的时间与金钱成本,这将阻碍算法创作技术的研发与应用。更难处理的是,在互联网上,许多作品的版权人信息并未明确标示,算法研发者难以查清和联系该部分作品的版权人,更遑论许可的取得了。这无疑会促使创作型算法研发者更倾向于不经作者许可而直接复制和使用作品。
因此,从技术发展的角度考量,满足算法创作技术发展的基本需求就是尽可能减少创作型算法研发者复制和使用作品的制度性成本。换言之,如果相关制度设计既能降低创作型算法研发者复制作品数据的交易成本,又能满足版权人的合理利益需求,则算法创作的复制权侵权问题将迎刃而解。当然,从更长远来看,版权制度为实现推动社会发展这一价值目标,在促进技术进步方面还应该考虑如何引导算法技术实现最大程度的优化,避免算法创作停留在生产只会模仿人类作品的流于同质化的版权产品这一水平上,以真正促进文化产业的升级。
综上所述,激励人类个体创新是版权制度的直接价值目标;以创新力量推动社会整体进步是版权制度的终极价值追寻;而在数字经济时代,支持算法创作技术发展是实现后者的重要途径。因此,针对算法创作的侵权风险问题,版权制度在具体的规范设计和个案实施上应当以终极价值统摄直接价值,在遵守商业道德和诚实信用原则的前提下对算法创作予以宽容和鼓励,不宜过度苛求版权人的权益保护而对创作型算法研发者施加太多约束。
三、应对算法创作侵权的版权制度设计
(一)复制权保护制度的完善
根据国内外学者研究及立法司法经验来看,目前针对复制权侵权问题主要有两种解决方案:一是直接认定算法创作所涉复制行为构成合理使用;二是对算法创作适用法定许可制度。
首先,根据我国2020年新修《著作权法》第二十四条关于合理使用的规定,其中阻却复制权侵权的典型事由,如以个人学习、研究或欣赏目的的使用,为学校课堂教学或科学研究目的而少量复制等均难以与算法创作中的复制情形相对应,算法研发者复制作品的事实难以被合理使用之规范所涵摄。从以上对版权制度涉及到算法创作的价值目标分析可以得知,若将为实施算法创作而复制他人作品资料的行为解释为合理使用,意味着研发者无需获得许可也不必支付费用即可随意复制他人作品满足其营利性目的,版权人的作品产生了经济效益但本人却未能得到利益分配,这必定极大挫伤个体的创作积极性。
因此,为更好平衡双方利益,不宜通过合理使用制度来解决复制权侵权问题,而应当将为实施算法创作而复制他人作品资料的行为纳入法定许可。研发者复制作品数据用于开发和优化创作型算法,可以不经过版权人的许可,但要支付作品使用报酬给版权人。同时,应配套建立版权人的事前和事后退出机制。版权人既可以事先发出声明否定研发者或训练者的复制行为合法性,也有权在其作品数据被复制使用后,通知研发者立即删除其作品,并按法定标准主张其作品被使用期间的报酬。通过此制度设计,一方面可避免研发者因不得不复制他人作品而陷入侵权的困境,确保研发者获取足够的作品数据作为优化创作型算法的基础;另一方面,该制度也赋予了版权人请求研发者支付经济补偿的权利,尊重和保护了版权人的收益性权利。
但单纯依靠法定许可制度,还不能完全解决算法创作使用作品数据所面临的困难和问题。第一,算法创作需使用的作品数据是非常庞大的,现实中,这些作品数据往往处于分散状态,被不同的市场主体所控制,研发者通常需要付出较大的获取成本。第二,虽然研发者使用作品数据不再需要获得版权人的许可,但其仍然需要履行相应的报酬支付义务,否则依然会构成侵权。现实中,版权人数量多且分散,导致交易费用较高,可能让研发者怠于履行支付义务,版权人基于复制权的可得利益难以受到保障。此外,复制过程隐蔽性强,版权人也难以自行监督作品被复制的情况,无从得知侵权之主体,维权依然困难。因此,考虑到算法创作过程中复制作品数据时遭遇的上述现实困境,除适度扩张法定许可制度外,还有必要完善著作权集体管理制度以为版权人与研发者交互之用,从而确保双方的权利得到充分保障。
针对上述困境,各类版权集体管理组织应对市场上的作品进行数字化转换和统一收录,收集整理作者信息,构建全国统一的作品数据和作品权利信息发布平台。对于网络上存在的大量版权人身份信息未明的作品,集体管理组织同样应当进行登记和统一编码。创作型算法研发者复制作品数据必须通过该平台,且需要办理申请和登记手续。只要特定的作品数据存储于该官方数据库,而研发者通过其他渠道复制了作品数据,并无合法的抗辩理由,则应推定为侵权行为。这一平台建设成为全国交易市场后,创作型算法研发者在输入阶段对作品数据的交易效率将极大提升,交易成本也能控制在较低范围。与此同时,作品权利人可以有效地掌握作品的使用情况和收取酬金,有效地保障了权利人的财产收益。
(二)剽窃预防制度的建立
算法创作的效率极高,虽然从目前来看它所生成的版权产品与人类创作的作品在情感、审美以及对于世界的深层次思考方面仍存在着较大差距,但毋庸置疑的是,它的不断发展与完善必将导致作品市场竞争激烈程度剧增,降低人类作者的创作热情,损害以激励为核心的版权制度。为此,必须建立剽窃预防制度,以防范算法创作仅仅是在生产与原有人类作品过于同质化的版权产品,使算法真正实施有价值的“创作”,而非重复地制造平庸的文化内容。
建立剽窃预防制度的关键在于创作型算法研发者的“防抄袭义务”设置,这是一种事先预防的侵权规制范式。“防抄袭义务”要求创作型算法研发者在其数据系统与算法程序中嵌入禁止抄袭或剽窃的要求,使禁止抄袭或剽窃成为项目目标、设计过程和操作流程中不可或缺的组成部分。从技术的可行性上讲,目前关于文字作品的分析、索引和比对技术已经非常成熟,只要文字类版权作品被纳入过滤系统特征信息库中,用户上传的含有该作品实质性内容的部分都能被准确地识别出来;图片、声音和视频文件的过滤机制也逐渐完善,在算法合理的情况下能够得出可靠的结果①崔国斌:《论网络服务商版权内容过滤义务》,《中国法学》2017年第2期。。
当然,即便创作型算法的研发者严格遵守了“防抄袭义务”,囿于现阶段算法技术的不成熟性以及文化内容的复杂性,想要完全避免生成的版权产品与原有作品构成实质性相似也是不现实的。因此,在司法实践中,还应结合个案,考虑算法研发者使用版权人作品的数量、享有的市场份额、被控侵权作品的使用与下载量、对原告创作激励的损害等因素,综合认定算法创作是否构成剽窃型侵权。
版权制度自诞生以来,就一直承担着保护创作者权益、激励创新、推动文化传播和提升社会整体文化水平的重要功能。在技术的快速更迭中,版权侵权体系受到了来自人工智能技术的挑战,因此有必要对其进行重新审视。在算法创作侵权这一特定的时代问题中,版权人利益与社会长远利益呈现出冲突之势。版权制度应对两者进行综合考量,仍以权利保护和侵权规制为出发点,完善法定许可制度、集体管理制度,创新作品剽窃行为之规制规则,如此方能实现版权制度的与时俱进,促成法律与技术的良性互动。