APP下载

文本与数据挖掘合理使用例外规范的体系化设置*

2020-01-09

图书馆论坛 2020年4期
关键词:著作权人规范文本

杨 娟

0 引言

跨过信息联合的Web1.0时代、人与人互动的Web2.0时代,我们正处于个性化与智能化并存的Web3.0时代。从海量信息中提取目标信息造就了新型经济形式——数字经济。文本与数据挖掘(Text and Data Mining,TDM)是其中非常重要的类型,但法律争议不断,并引发了世界性的研究热潮与立法修正。立法上,虽然各国明确禁止商业目的的TDM,但又在探索如何借用著作权传统合理使用制度予以开放,以调节产权保护与鼓励知识创新之间的关系。毋庸讳言,发达国家已经走在前列,其最新成果是2019年3月26日欧盟通过的《数字单一市场版权指令》(Directive on Copyright in the Digital Single Market,以下简称“2019年《版权指令》”)。该法最引人注目的部分之一是增加了著作权“例外”条款,扩大了合理使用制度的适用范围,目的在于减少成员国间版权制度的差异,使在线访问欧盟数字作品的广泛性、普遍性成为可能[1]。不无遗憾的是,类似立法规范在我国现行立法和《著作权法》(修改草案第三稿)中尚未出现,而学术研讨尚处于初期阶段。比较一致的呼声是国家应当在科学研究、教育教学、文献传递等领域为TDM提供可操作的空间,但相关法理、立法规范及规范体系设置等问题依然缺乏针对性的研讨。实务中,部分图书馆等文化遗产机构已采购TDM 技术装备为用户提供相关服务,面临较大风险。就此,本文以规范分析方法为基础研究方法,结合比较法方法,对此议题进行探讨。

1 文本与数据挖掘之概念与意义认知

1.1 概念认知

TDM 泛指利用计算机技术和互联网资源从海量文献中有目的性地发现信息和数据的技术。TDM 概念界定分歧较大。英国知识产权局认为TDM 是“从机器的可读资料中提取有价值信息的过程,涉及对资料的大量复制、数据的提取以及数据的整合,从而识别出特定模式”[2]。欧盟2016年《数字版权指令草案》和2019年《版权指令》均采用开放性定义,统称为“自动分析技术”(the automated computational analysis),即能够对以数据形式的信息进行自动分析的技术,分析的对象包括文本、声音、图像或数据。其最典型的技术形式是TDM。可见立法者更倾向于将各种可能符合立法规制的包括TDM 在内的自动分析技术包含在内。学术界概念分歧更大。有人认为,广义的TDM 是指从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的但又是潜在有用的信息和知识的过程;狭义的TDM 仅指对结构化数据、无结构的文本或半结构化的文本的分析[3]。也有人认为,TDM 是指“基于计算机从文本或数据中提取、组织数据的过程;通过大量复制素材、提取数据并重组其识别模式、趋势和假设;或通过一定的方式重组挖掘信息”[2]。这类概念更侧重于技术手段,缩小了内涵,几乎将TDM 与数据挖掘等同。也有观点认为TDM 是指“为了获取模式、趋势、相关关系等信息而对数字格式的文本与数据采取的任何自动化分析手段”[4]。这类定义侧重于强调文本与数据挖掘的目的性与指向性。另一类观点认为,TDM 是指“利用自动分析技术分析文本与数据的模式、趋势以及其他有价值的信息,是以计算机为基础的、从文本或数据导出或组织信息的过程”[5];或认为TDM 是“对以指数速度增加的数字数据进行分析并提取新的见解和知识的重要技术”[6],其将视线聚焦在文本与数据挖掘结果的有用性上。还有一类观点认为,TDM 是“大数据时代开发和研究数据的一种新型工具,包括多个复杂的计算机自动处理环节,涉及对文本内容和数据的提取、解构、重组,以及对分析挖掘结果的传播与转移(出售、出租、赠与、销毁等),还与版权技术保护措施的设置与规避相关联”[7],其主要着眼于TDM 技术使用的合法性。不难看出,尽管学术界对TDM 的认知有差异,但是总体上来说均承认其具有3个方面的特性:其一,TDM 是一种新的知识发现技术,即以海量互联网信息为对象,从中提取相关信息的技术;其二,它的目的在于寻求特定信息之间的某种关联关系,如模式、趋势等,并以此为基础生成或提出新的知识、见解、方案、路径等;其三,此种技术是一种智能化为基础的自动化技术,运作将呈现为一个过程。

1.2 意义认知

现如今,大数据、物联网、人工智能、区块链、虚拟现实、共享经济等技术与数字经济的融合将颠覆传统发展模式,为经济社会发展提供全新机遇[8]。TDM也是数字经济时代的产物,作为一种新型的知识发现方式,不仅应当鼓励发展,更应在理论层面阐发其时代意义。

1.2.1 TDM的技术意义

TDM技术产生于1980年代后期,起源于数据仓库(data warehouse)概念。数据仓库是对数据集合的一种处理方式,不同于传统数据管理系统,它的特性在于联机事务处理,即为数据分析与决策提供分析处理服务。“人类正被信息淹没,却渴望知识。”[9]数据云集导致传统的数据查询与搜索已经不能满足用户数据处理的需求,就此多维数据库和多维分析的概念得以诞生。在这一过程中,TDM被设计成“人和应用程序”,即在提取数据的同时依次对数据加以分析处理,其过程大致可以描述为:(1)对数据库予以清理、集成后形成数据仓;(2)对目标数据予以选择变换,通过诸如模糊方法、粗糙集理论、云理论、证据理论、遗传算法等种种数学方法形成数据的分类、聚类、回归、关联、序列、偏差等模式;(3)经过评估、比较或聚合形成新知识。可见,在前述TDM 程序中,因算法方案的不同其技术效果也千差万别。此外,TDM 技术的有效性还与数据存储技术、去冗降噪技术、新型表示技术、融合技术等等相互关联。本质上,无论是云服务还是区块链都是数据处理技术。不过,云服务因利用大量计算资源而遭受是否安全的质疑。这推动了中心化数据服务商向身份可验证的合法服务商方向发展,产生了clourdvisor、Intel SGX 等新技术。然而这并未消除公众的担忧。借由区块链(公有链)完全去中心化的分布式平台来去除节点控制以构建新的云服务——区块链即服务(Baas),已经得到高度重视。公有链自有其弊端,比如速度较慢,于是私有链和联盟链得以诞生。在私有链下,授权才能加入的特点使得数据服务未能完全去中心化,但是此种牺牲获得了运算上的高效。至于联盟链则是多个机构共同参与的私有区块链,是更高级的形态。数据安全与处理高效似乎始终是一对矛盾。在公有链为基础的云服务中,数据高度安全,但数据处理必然变慢;而在私有链和联盟链为基础的云服务中,部分牺牲数据安全性和公共性却换取了数据处理的高效。不管是云服务还是区块链,各类数据还存在众多的领域、壁垒和收集难题,跨库TDM 技术的发展有望在这些领域取得突破,从而具有重大的应用意义。

1.2.2 TDM的经济意义

TDM 既是应商业需求而生,也最先被商业领域所采用。尤其是在金融、电信、保险、零售、交通等领域得到广泛运用。在人工处理数据洪流已经变得不可行且过于昂贵的当下,效率与耗费在客观上促使TDM 成为必须行动的项目。当前,TDM面临2个经济方面的矛盾:一方面,在数据即财富理念的支配下,数据收集和数据服务已经出现了严重的壁垒化迹象。在单个数据库之内各商家在防止数据外流(安全)的同时,追求以特定的算法来设计属于自己的数据检索、提取和分析的技术方案。在单个数据库之内云计算可能已经足够应付而无需TDM 的进一步开发。另一方面,基于竞争的内在需求,数据外联行动亦已在各商家之间展开。不过,数据服务商总是秉持对外保守而对自己开放的策略。直言之,TDM技术对于数据寡头而言具有非常大的经济价值,将进一步强化其数据攫取动能。在本文看来,受经济利益格局的影响,后者已经成为矛盾的主要方面。可以预见,适应公有链、私有链和联盟链的发展,未来TDM 技术也许将呈现出大众化、个性化、特定化的多重发展局势。大众化的TDM设备将具有较高程度的普适性,但速度慢;而个性化的TDM 将运用针对性的算法设计服务于有特别需求的图书馆、情报馆等文化遗产机构;至于特定化的TDM 将成为数据寡头的特殊设备,主要服务商业需求,这使得以数据服务为目标的各类TDM技术将迎来广阔的应用市场。

1.2.3 TDM的法理意义

不管TDM 技术在未来呈现出何种面貌,原则上来说,法理只关注其运作行为的法律意义。TDM 的核心含义是按照特定算法挖掘并分析行为人所需要的目标数据,而不问该数据是否被特定法律法规所保护。之所以如此,是因为其涉及的知识产权保护个体实在太多,使得任何TDM算法的设计者均不可能在其算法规则中针对各主体所申明保护的数据设计特别规则。撇开技术可行性不谈,事实上,已知的数据保护方案可以通过特定技术给挖掘行动设定门槛。在未来的发展过程中,类似于搜索服务领域中具有法律规制效力的Robots协议不仅可以加以利用,而且也会升级。数据挖掘并不会始终处于自然状态。由此,对TDM 技术的法理分析应切换到普遍意义上的挖掘行为是否属于法律容忍的范畴,且此种容忍是否应当存在特定的领域。这显然已经为当下的法学研究所不断涉及。

2 文本与数据挖掘合理使用例外规范国际立法例考察及其经验

发达国家和国际组织已经放弃通过事先许可的方式来限制TDM 的运用。之所以如此,最主要的原因就在于TDM 所作用的对象实在过于广泛,既无合适的权益代表人,也无可行的操作方案。这使得在立法中构建“窄通道”的合理使用例外规范,成为解决问题的唯一通道。

2.1 合理使用例外规范之国际立法例

2.1.1 英国立法例

2014年11 月18 日,修改后的英国《版权、设计与专利法(1988)》共设计了11项版权例外。TDM 包括在“Text and Data Analysis”之内,是对第29条(非商业研究的文本与数据分析复制件)所增加的例外,具体包括5项内容:(1)如下合法获取作品的人所制作的作品复制件不构成侵权:该复制件的形成出于非商业的纯粹研究目的;且该复制件附有致谢(除非没有必要)。(2)非经版权人授权的以下情况下视为侵权:将副本转让给任何其他人,或将副本用于非商业的纯粹研究以外的目的。(3)制作的复制件涉嫌为交易目的而形成的可被认定为侵权交易复制件。(4)“交易”是指出售或出租,或是相应的提供行为。(5)如果私人合同中存在阻止或限制制作作品复制件,而根据本条不会侵犯版权,则该条款不适用①。英国知识产权局的解释是,只有在合法访问作品和非商业研究目的的前提下,研究人员为了计算分析才可以制作版权作品的部分复制件,而不是这篇作品的复制件。此外,该法赋予出版商和内容提供商基于网络安全性或稳定性的干预权[10],但实际上是一种监督权。

2.1.2 德日法等国立法例

2013年3 月22 日,德国著作权法修改草案意外地为TDM 开了一道很小的豁口,即搜索引擎服务提供商和新闻聚合服务提供商在使用“个别词语”和“最小文本片段”时,无需向报刊出版社付费。但是该法因保护报刊出版者权的实质意图而受到了强烈反对,被视为是互联网时代的立法倒退[11]。此后法国、比利时、西班牙等也曾有类似动议,但后来迅速转向,纷纷修改立法拥抱TDM 技术。2016年10月7日,《法国知识产权法典》在第L122-5条和第L342-3条分别加入了针对于作品著作权和数据库权的TDM例外,适用于科学相关的文献;2017年1月1日修订生效的《爱沙尼亚著作权法》第19 条第3 款规定TDM 例外不以来源合法为条件,但要求使用人尽可能地注明作品的作者和来源。2017 年6 月30日修改的《德国著作权与邻接权法》第60d条进一步扩大,不仅挖掘所得数据的使用不限于复制,而且还增加了两类传播行为例外:(1)在合作科研中向合作伙伴传播;(2)为监督科学研究的质量而传播至特定的第三方。日本也改变了1978年著作权法禁止以任何方式复制作品的严厉态度,于2009年修改后的文本规定:在不损害作品正常使用和危害作者合法利益的前提下,信息分析者在必要限度内有权对作品进行缓存或者改编;但数据库的利用不适用这一规则[12]。

2.1.3 欧盟立法例

欧盟立法主要起督促作用。《2019年版权指令》第3、4、5、6条分别规定了4种TDM规范。

第一种类型是以科学研究为目的的TDM 规范,是基本规范。其构造为:(1)合法获取作品或其他内容;(2)以适当的安全等级存储;(3)著作权人有权在必要限度内采取措施来确保承载权利作品的网络和数据库的安全性和完整性。

第二种类型是TDM 例外规范,其构造为:(1)成员国立法有义务允许科学研究性的TDM;(2)TDM结果可以保留到必要时为止;(3)只要著作权人没有明确作品及其内容的保留使用权即可进行TDM;(4)本规范不影响以科学研究为目的的TDM规范的适用。

第三种类型是数字和跨境教育TDM 规范,其构造为:(1)成员国立法应允许非商业和教学说明目的的数字和跨境教育TDM,但该行为须在教育场地内且安全的电子场合下由学生、教学人员进行,并尽可能附有来源说明;(2)成员国可以设置限制(许可协议),但该协议必须方便教育机构发现和应用;(3)限制许可协议只在该教育机构所在地的成员国内生效;(4)成员国立法可规定相关行为人向权利人补偿。

第四种类型是文化遗产机构例外规范,即成员国文化遗产机构出于保存目的可以任何格式或载体复制任何由其永久收藏的作品或内容②。

2.1.4 国际立法例之经验总结

首先,开放TDM 是例外,保护著作权人权益是基础。从上述国际相关立法例的基本结构来看,基本构造分为3个层面:第一层面是保护著作权人的复制专有权,即原则上禁止任何形式的复制。第二层面是考虑与国际公约衔接。因为《伯尔尼公约》《世界版权公约》、Trips协议均允许成员国在控制性前提下对著作权设置合理使用制度。第三层面才是控制性原则指导下的TDM例外规范。换言之,TDM例外规范表面上表现出开放性,但因附加有诸多限制性条件,因而整体上呈现了保护著作权人权益的封闭性结构特征。

其次,设置TDM 规范的最佳方案是设置著作权合理使用例外规范。在TDM 规范设计上,大陆法系国家基本上采用严格的限制性合理使用例外规范方案;而英美法系国家采取开放式规范,判断是否侵权时主要采用四要素检验法,即考察:(1)使用行为的目的和性质。(2)受保护作品的性质。(3)作品使用的数量及其比重。(4)使用行为的市场影响、实际效果等。为协调区域内各国法律体系的差别,欧盟立法既规定成员国的开放义务,同时又规定了成员国立法不得超越的边界,总体上依然呈现出封闭式例外规范体系的特征。

最后,TDM例外规范的核心在于边界控制。从各国立法例来看,大都以大陆法系国家的著作权合理使用制度为基础,同时糅合了英美法系国家的四要素检验法和转换性使用理论。TDM 例外规范的核心在于边界控制,即既要限制主体,也要限制客体;既要控制行为,也要规制目的;甚至还赋予了著作权人基于网络安全的干预权。

3 对设置文本与数据挖掘合理使用例外规范的体系性思考

国家立法是一种严密的逻辑性活动,既需要考虑利益平衡,也需要考虑立法规范本身的性质;既需要考虑风险控制,也需要精巧的、具体的制度体系设计。设置TDM 例外规范也离不开此种体系性的思维模式。

3.1 文本与数据挖掘的法理重塑

3.1.1 文本与数据挖掘的利益再平衡

对于TDM 例外规范的利益平衡,国内研讨主要局限于TDM 行为人、著作权人和公众之间的利益平衡。然而,现有学理研究在相当大的程度上忽略了TDM 利益主体扩大化的现实趋势。从线性地来看,TDM 可以分为上游市场和下游市场。上游市场是TDM 技术市场,下游市场才是TDM行为市场。TDM立法规范将对上游市场产生根本性的影响,是决定一国相关立法是否成功的关键。而上游市场的技术研发瞄准的又是下游应用市场,因为下游市场是技术的应用者,故而立法还必须兼顾下游市场主体的利益。目前来看,TDM 主要有两种形态:一是以大型IT企业为主体的商业市场,这主要涉及人工智能(AI)、新闻聚合、深度学习等领域;二是以教育教学和科学研究为目的的公共文化服务市场,主要涉及各类学校,图书馆、文化馆等文化遗产机构。

与资本主义国家之个体本位主义优先相比较,我国社会主义国家的集体主义本位观决定了国人应当更多让利于公共利益,这也是我国数字经济竞争力依然较弱而亟待鼓励的现实所决定的。我国正处于民族复兴的关键时期,故而立法导向上适度以国家利益优先是可取的。而从TDM 本身看,决定行为人是否侵权的往往并不是行为人本身,而是TDM算法。TDM属于大数据研究,“大数据研究不同于传统的逻辑推理研究,而是对数量巨大的数据做统计性的搜索、比较、聚类、分类等分析归纳”[13]。其基本功能是寻找2个或2个以上变量取值之间的规律性,这在统计学上称之为相关性或关联性研究。上游市场是特定TDM 算法的设计者,而下游市场的TDM行为人只是实施者。那么TDM算法设计者是否是共同侵权行为人呢?法学界对此并未加以讨论。

目前有关TDM 的法学研究关注的是结果,并不是过程。在技术竞争日趋白热化的当下,我国TDM 立法利益平衡应优先考虑国家利益,公众利益次之。就此,国家立法为保护国家利益应当全面开放TDM 上游市场,以鼓励技术创新,为大数据研究提供足够的法律空间。对上游市场的规制主要应通过下游市场的技术应用来间接予以引导。故而对下游市场之TDM 应用的立法规制成为牵一而动全身的关键。

3.1.2 文本与数据挖掘的性质

国外有观点认为TDM 是阅读权的再现,或是其自然内容。比如开放存取开放知识基金会工作组(Open Knowledge Foundations Working Group on Open Access)认为“有权阅读即有权挖掘”。欧洲研究图书馆协会也持类似观点。也有学者认为:“既然著作权不保护思想,那么在表达和讨论时读者就可以用自己原创的方式重新使用论著中所蕴含的思想”;“TDM 活动应当被允许,就像自然人阅读作品无权得到版权人事先许可一样,机器阅读合法接近的作品也无需许可”[14]。当然,还有一些其他观点:

(1)虽然“数据”本身不能受到版权法的保护,但是把数据按照既定原则挑选出来,并依据相关方法予以聚合而形成的聚合物——“数据库”则可能涉嫌侵权。因为该“数据库”一旦在选择和编排上体现出独创性则受到版权法的保护[15]。此种观点并不成立。因为如果因TDM 而形成新的“数据库”,那么此种“数据库”的使用者恰恰是其创作者本人。不过,反向侵权行为成立的可能性还是存在的。运用TDM 技术所形成的文本或数据本身很可能是从未授权作品中按任意指令提取而来的,而TDM 可能并没有新增或极少新增其他内容。如此一来,必然会形成巨额篇幅的他人作品的自动汇编文本,而此种文本显然不具有独创性。此时,TDM 涉嫌侵犯被复制作品著作权人的复制权。

(2)TDM在运作中存在对数据的获取、分析、整理、持有、传播,从而可能形成对被复制作品著作权人复制权、信息网络传播权、翻译权、汇编权、改编权等权利的侵犯;如果以数据库为挖掘对象,则涉嫌对撷取权(Extraction)、反复利用权(Utilization)的侵犯[16]。这种观点放大了TDM的侵权可能性。如果在合法接近作品的前提下,TDM 行为人只是为个人欣赏、科学研究、教育教学而运用,则因合理使用制度的合法阻却而并不构成侵权。本文赞同如下观点:“用于TDM目的的内容访问,提取和复制都是偶然的阶段,最终不会导致对作品的可保护(表达性)部分的外部重复使用。”[17]

再回到TDM 是法律权利的观点。本文对此持怀疑态度:第一,阅读权是自然人欣赏、品味作品的智力活动,而行为人通过TDM 所获得的信息其本人并不一定阅读,甚至根本无精力来阅读。第二,阅读权的行使以合法接近作品为前提,但是TDM 并不一定具备这一前提。比如开放校园网络中,非本校人员可以用该校人员的账户即可登录图书馆购买的数据库,利用其服务并挖掘相关电子文献资料。第三,阅读权的作用对象是作品全部或部分,但是TDM 只提取作品中的指定信息,甚至是特定长篇论著中的极少片段。故而TDM 只是信息获取行为,其本身并不具有阅读权的性质。阅读意味着可以挖掘,但挖掘并不意味着阅读。正是在此种意义上,无合法接近之前提且没有得到著作权人许可或法律授权的TDM涉嫌侵权行为。

那么TDM 属何种行为呢?本文认为属于新型复制行为。理由如下:第一,TDM 是复制行为。所谓复制,传统上即指作品载体数量的增加。诚然,增加复制品的意义并不在于增加复制品的载体,而是在于增加含有作品内容的载体。换而言之,知识产权法意义上的复制本质上是对作品及其内容的复制。显然,TDM 是通过新的技术方式提取作品及其内容,自然属于复制行为。第二,TDM是新型复制行为。TDM本质上是复制了他人作品或其中的某些信息。在这一新技术条件下,复制并不以载体数量增加为必要要件。TDM过程既存在缓存,也存在结果的拷贝。其提取的结果信息既可以复制在不同载体上,也可以大量复制在同一载体上,甚至只是存在于提取过程中的缓存中。此种与传统复制存在巨大区别的复制行为显然属于新型复制行为。

3.1.3 文本与数据挖掘的风险控制

理论上来说,TDM 带来的风险主要在于外部溢出,即TDM结果的对外传播。TDM获取的信息量往往非常庞大,其结果仅作为自然人应用时受速度、效率和信息使用能力的限制,很难导致大面积的侵权效应。不过,在群体、团体合作的境况下这种局面将变得不可控。故而国际立法例在设置TDM 例外规范时,非常突出的一点就是对TDM 结果的溢出予以设限。这也是四要素检验法中第四项所特别关注的内容。在本文看来,此种溢出风险控制主要涉及两个方面:一是TDM技术的溢出,二是TDM结果的溢出。前者是指特定机构面向特定或不特定的主体提供某种TDM 技术,这使得普通人员无需掌握复杂的相关技术即可便捷地应用。在不支付对价的前提下,TDM 技术的溢出比较少发生。因此风险控制集中在结果溢出方面,主要涉及主体边界和适用范围边界2个问题。严格来说,合法实施TDM的特定单个组织内部之间的TDM 结果传播不属于溢出,因为此种传播不产生交换价值,对于著作权人的权益影响较小。而外向传播所产生的影响则要考量接收主体的性质、数量、接收目的以及与传播人的关系等。如果此种传播基于交换考虑,不管交换的利益为何和大小,原则上应当补偿著作权人;即便传播行为本身并不基于交换利益的考虑,如果接收主体众多,或接收主体将其用于商业活动,或为获得对价而接收,或接受容易导致著作权人作品收益明显受损,则原则上也应当补偿著作权人。

在挖掘结果不向外传播的情形下,预防TDM侵权受信息不对称的限制显然不太现实。再者,对不产生交换价值的TDM 结果内部传播行为,著作权人也极难主张权利。从主张TDM 侵权最为积极的国际出版商的态度来看,其主要目的在于防止TDM 的商业运用和希望通过事先许可建立由其控制的平台等方式来限制TDM 在科学研究中的运用。然而,这既无法操作,也因损害知识自由获取权而遭到以此为使命的图书馆等文化遗产机构的强烈反对。据此,规制TDM 最为有效的方式是在下游市场予以概括性的控制,即在原则禁止的基础上设定其合理例外,例内由法律授权,例外属于侵权。

3.2 文本与数据挖掘合理使用例外规范体系化构建

我国应继续修改《著作权法》(修改草案第三稿),通过TDM 主体、目的、客体、行为等4个层面形成体系性的封闭式许可例外规范体系。

3.2.1 体系结构

首先,在主体上,应当采取扩大化的态度,以适应相关实务、国家利益和公共利益以及国际趋势的需要,即TDM 行为人应当包括自然人、任务型科学研究团队、科学研究组织、科学研究机构、图书馆为主体的文化遗产机构等几类特定主体。其中任务型科学研究团队、科学研究组织、科学研究机构、文化遗产机构之所以被纳入,是为了更多的照顾科技发展之国家利益。

其次,在目的上,应当以国家利益优先兼顾公共利益。众所周知,限制主体并不等于限制行为。TDM 例外规范的国际立法例都将交换目的排除在外。本文认为,对TDM 行为人进行主观方面的限制应采取如下方案:对于自然人而言,TDM 只能限于个人学习、教学和研究之目的。对于任务型科学研究团队、科学研究组织和科研机构的TDM 应限制在纯粹科学研究目的范畴之内。而对于图书馆、文化馆等文化遗产机构的TDM,则应适度予以扩大,即限制在:(1)为保存或保留文献资料。(2)向特定用户提供个人学习与研究,教育教学、非商业的科学研究服务范畴之内。尤其值得特别说明的是,图书馆等文化遗产机构基于公益目的向特定主体提供TDM 工具服务,且所获TDM 信息不得用于外向传播或交换获利目的。其中特定对象是指相关文化遗产机构基于本身属性所对应的用户。比如公共图书馆向本区域用户提供公益服务,高校图书馆向本单位职工、学生与科研团队提供本职服务。

再次,在客体上,TDM 作用对象应限制在已经合法获得或接近的文献资料与数据库范畴之内。相反,如果前述主体能够在无限制的行为客体范畴内为TDM,那么将意味着著作权人的作品及其内容在非常大的范围内被无偿使用,最终削弱著作权人的创造动力。何况,我国是社会主义国家,许多作品本身是职务作品,而且《公共图书馆法》《普通高等学校图书馆规程》等规定了有利于文化遗产机构的出版物缴存制度。同时文献资料的数据库也处于一家独大的局面。如果科研人员可以免费使用相关数据库实施TDM,则可以免费提取几乎绝大多数现有电子文献资料中的信息。显然,这将导致合法接近作品之前提条件的实质性破坏,著作权人几乎将无法从其作品的出版中获得足够的收益。故而立法设置合法获得或接近文献资料与数据库是必要的。

最后,在行为上,应从复制行为、传播行为和分析行为3个层面对TDM予以必要的限制。从国际立法例来看,复制行为非常复杂,涉及复制载体、复制对象、复制方式、复制时间等诸多问题。学术界和司法实务界对此均存在争议。目前相对一致的看法是复制必须实现“固定”③,不具有独立经济价值的复制和时间极短的缓存并不构成复制。对于TDM 中的传播,目前各界相对一致的共识是原则上应禁止挖掘结果向外传播,但是特定研究群体内部之间或为了保存相关信息的传播因不具有独立的经济价值而属于例外。本文认为,此种情形本质上不是著作权法上的传播行为,而是无独立法律意义的传送或保存,甚至在特定场合下是必然发生的中间行为。不过,TDM 过程中所发生的分析行为很少被关注。从实务来看,分析行为已经突破了Mining 本身,已经发展到自动聚合、聚类、比较和整合的高级智能阶段。对此,建议单次挖掘结果所形成的文献或数据资料不能超过同一来源文献的5%,且不得公开出版。

3.2.2 对《著作权法》(修改草案第三稿)的修改建议

从《著作权法》(修改草案第三稿)来看,第11 条规定的复制权与现行规定相比发生巨大变化,即将固定在载体上的数字化作品纳入了该项权利的保护范畴。这意味着缓存状态的临时复制不受该法的保护。这一技术中立主义值得赞赏。换而言之,立法者意图维持对传统复制行为的打击目的,而为合理接近作品不可或缺的“自发复制”开了一道绿灯,进而为TDM 留存了一道很窄的空间。本文也认为临时性的“自发复制”不具有与合法有形复制竞争的性质,不会从根本上损害著作权人的利益。不过,这并不意味着《著作权法》(修改草案第三稿)已经认可了TDM。从整部文本来看,相关基础性规范依然处于缺漏状态。这集中体现在《著作权法》(修改草案第三稿)中的合理使用制度并没有为TDM提供合适的空间。

众所周知,我国著作权法依然维持集束式立法方案。《著作权法》(修改草案第三稿)也不例外,其第四章专章集合合理使用规范,总共分为8 条。其中最适合设计TDM 例外规范的当属第42条第1款第1项、第6项和第8项。第1项将个人为学习、研究而复制他人已经发表的作品的片段设置为例外;第6项将为学校课堂教学或者科学研究,翻译或者少量复制已经发表的作品,供教学或者科研人员使用,设置为例外,但不得出版;第8项规定将文化遗产机构,如图书馆、档案馆、纪念馆、博物馆、美术馆等为陈列或者保存版本的需要,复制本馆收藏的作品设置为例外。然而,此3项均存在缺憾,没有考虑TDM实务,容易造成TDM侵权。其一,第1项规定只是规定复制片段,没有容纳被复制作品的全部内容,很容易造成自然人TDM侵权。其二,第6项规定存在3点缺陷:一是在主体上有所缺漏,没有容纳临时或专项任务型的科研组织、科研团队和常设科研机构的TDM 结果传播行为,容易造成TDM 结果内部传播行为侵权;二是没有对诸如聚类、合成、自动分析等作品内容提取行为作出规范,容易造成TDM 结果侵权;三是没有对已有作品的相关邻接权、汇编权、改编权设置针对TDM的例外。其三,第八项的范畴过窄。

为适用TDM 实务和未来发展,《著作权法》(修改草案第三稿)第42条第1款中的相关例外规范可以作如下修改:(1)第1项修改为:“为个人学习、研究,复制、挖掘或以自动化分析技术方式使用他人已经发表的作品。”(2)第6项修改为:“为学校课堂教学或科学研究之公益目的,在已经合法获取或合法接近并尽可能说明来源的前提下,翻译、少量复制、挖掘或以自动化技术方式使用他人已经发表的作品,供教学或者经国家有关机关批准的任务型科学研究团队、科学研究组织和科研机构及其内部人员使用,但不得出版,且应尽可能附有来源说明和致谢。前述单次行为所形成的文献或数据资料内容不能超过同一来源文献的5%。”(3)第8项修改为:“图书馆、档案馆、纪念馆、博物馆、美术馆等文化遗产机构为陈列或者保存版本的需要,或基于公共服务目的以本单位收藏的作品,自建数据库或购买的数据库服务可以向特定用户、国家有关机关批准的任务型科学研究团队、科学研究组织和科研机构提供复制、挖掘或自动化分析技术服务,但不得因此收费。前述主体通过本项规定的方式获取的信息不得向外传播,并尽可能附有来源说明和致谢。”

4 结语

秩序因想象而被构建[18]。信息技术与想象连接加速了人工智能。在2019年8月29日召开的世界人工智能大会上,马斯克直言人工智能研究已经找到了高效的脑机连接方法,未来世界的人工智能机器看人可能是像人类看大猩猩一样的幼稚可笑。TDM 也正在不断智能化,这正是其“恐怖”之处。然而,“《世界人权公约》赋予知识产权的人权意义,揭示了现代知识产权制度关于专有权利保护与知识财产利益分享的均衡思想”[19]。当前,基于惨烈的国际竞争态势考虑,我国文本与数据挖掘例外规范体系的设置有必要秉持国家利益优先下的均衡思想,总体上倾向于知识财产利益分享。图书馆等文化遗产机构可能通过购买上游市场的TDM 装置用于合法接近文献资料的挖掘,并依照合理使用例外规范向特定用户提供教育教学、科学研究、个人欣赏服务。诚然,这一领域依然属于不毛之地,更具体的服务提供规则体系还需要进一步研讨。

注释

①本部分内容参照英国《版权、设计与专利法(1988)》第29条翻译而来。

②本部分内容参照欧盟《2019年版权指令》第3、4、5、6条翻译而来。

③“固定”是美国判例法创造的一个术语。2008年美国法院认为“固定”应考虑两个因素:一是媒介要件,被复制的作品或其内容必须附着一定的媒介上,并通过该媒介可以被感知、复制或传播;二是时间要件,即作品或其内容附着在媒介上的存续时间须是非短暂的。

猜你喜欢

著作权人规范文本
著作权转让声明
著作权转让声明
著作权转让声明
著作权转让声明
来稿规范
来稿规范
文本联读学概括 细致观察促写作
PDCA法在除颤仪规范操作中的应用
来稿规范
作为“文本链”的元电影