国际文本与数据挖掘版权新策解析及启示
2017-03-26周玲玲
■周玲玲
对外经济贸易大学英语学院,北京市朝阳区惠新东街10号 100029
作为“互联网+”时代的新兴科学技术,文本与数据挖掘(Text and Data Mining, TDM)在国际立法界、司法界、出版界以及学术界获得广泛的梳理、论证及支持[1-9]。我国在立法及司法上尚未将TDM明文列为版权限制与例外给予直接支撑;但国内学术界对于TDM已展开了一定视角的讨论,例如图书馆视角[10-12]、技术应用视角[13-14]、出版商视角[15],而以科技期刊利益视角对TDM所展开的研究鲜有文献报道。
科技期刊集聚科学领域的重要学术资源,科学领域的TDM能够为科学创新带来多元化契机。由此,基于科技期刊的TDM能够鼓励科学创新与发展。然而,科学领域的TDM存在高额利润[16],备受权利相关人(主要为科研人员和出版商)的关注,实践中科技期刊的TDM一直存在权利之争。出版商常常通过许可协议中的具体条款限制科学领域的TDM,从一定程度上阻碍或减缓了科学的创新与发展。
TDM是否符合版权法宗旨而应当被认定为新型的合理使用?其在国际领域的发展动态包括哪些?这些动态具有哪些共性及特性?国际动态对于我国科技期刊建设有哪些启示?在没有直接立法及司法支撑的基础上,国内科技期刊应该如何有效地学习国际动态,为自身争取更多权利,进而为我国的科学事业提供更为广泛的发展契机?笔者对这些问题进行深入探讨及梳理。
1 国际立法动态
2014年,英国将TDM作为版权限制与例外在立法中予以确认[1]。随后,欧盟成员国,例如德国、法国、爱尔兰以及爱沙尼亚,相继对TDM进行梳理及讨论[16],但目前尚未正式颁布相应修法。2016年,欧盟以指令提案(Directive Proposal)形式就TDM提出宗旨性建议[2]。
1.1 英国
英国于2011年全面启动知识产权修法工作[17]。2014年,英国政府对现行《版权、设计和专利法案1988》(Copyright,DesignsandPatentsAct1988)做出10项不同立法层面(均低于法案层面)的修订,其中包括多项版权限制与例外的改革举措[18],而TDM例外便是上述修订中较为显著的一项限制与例外举措。依据第29条款的修订内容,合法获取作品的主体基于非商业性研究目的对作品展开数据挖掘、分析的复制行为,不构成版权侵权[1]。
该条款的适用主体为合法获取(Lawful Access)作品的主体。法案及条款并未就合法获取进行单独定义及说明,而是在各项具体条款中体现合法获取的形式。合法获取作品的途径具有多样性,包括订阅图书、数据库许可协议以及知识共享协议(Creative Commons License)。
该条款适用于非商业性目的研究。事实上,英国在此次修法之初已经认识到基于非商业性目的的使用行为并不会损害版权宗旨;相反,这些行为能够积极地促进创作,最终保障版权宗旨的达成[18]。该条款在充分肯定非商业性研究目的的同时也排除了基于商业性研究目的开展TDM例外的可能,这一适用目的的限制从实质上确保了出版商基于商业性目的在TDM领域享有的经济利益。
该条款的适用条件主要包括2项:第一,合法获取作品的主体出于非商业性研究目的对作品进行TDM时所做的复制是基于计算机分析展开的;第二,复制的同时要充分标明作品的相关信息。上述2项适用条件旨在平衡不同权利人之间的各项利益。“非商业性研究目的”较为完善地确保了出版商的经济利益,“充分标明作者相关信息”则有效地保障了作者以及出版商的人身权。
1.2 欧盟
欧盟委员会于2016年9月14日正式发布《欧盟数字化单一市场之版权指令提案》(ProposalforadirectiveoftheEuropeanParliamentandoftheCounciloncopyrightintheDigitalSingleMarket)(以下简称为“欧盟指令提案”)[2]。该提案以立法建议形式针对欧盟范围内的版权及其限制与例外做出宗旨性表率。TDM便是3项版权限制与例外之一。
欧盟委员会基于法律效力、经济效益、相关权利人利益以及社会或基本权利影响4个视角对TDM展开多方综合考量[16],最终在提案第3条款中确定欧盟的宗旨性态度。依据该条款, 为科学研究目的,成员国应当在立法中明确允许研究机构为开展TDM工作所需的各种复制及数据提取活动。任何通过合同条款阻止TDM例外的行为都应当视为无效行为。作者有权就TDM所需数据在合理范围内采取必要的措施确保其安全性、完整性。此外,该条款建议成员国通过鼓励作者(包括出版商)与研究机构协商达成双方认可的最佳实践[2]。
该条款的适用主体为研究机构。在前期讨论中,欧盟委员会将适用主体确定为公共利益研究机构。由于后期各方权利人对于公共利益研究机构的界定存在一定分歧,欧盟委员会最终将适用主体笼统地界定为研究机构。主体的细化及最后确认将由各成员国在国内立法修订中自行决定。欧盟这一举措不仅为成员国提供了必要的原则性指引,还为各成员国立法机构留有足够的自由裁量权。
该条款的适用目的为科学研究目的。此条款并未明确限定科学研究目的的性质。换言之,不论是商业性科学研究目的,还是非商业性科学研究目的,都可以包括在该条款的适用目的内。与英国的非商业性研究目的相比,欧盟的适用目的具有更为宽泛的内涵。事实上,欧盟不将适用目的限定为非商业性科学研究目的,旨在鼓励公共利益研究依据该条款积极开展公共机构与社会资本合作的研究项目(Public-Private Partnership)[16]。对于商业性研究机构而言,其是否可以依据商业性科学研究目的适用该限制与例外完全取决于各成员国的国内立法修订。出于权利人利益平衡的考虑,各成员国在自身的立法修订中也不可能将该类行为认定为版权限制与例外。实践中,各大出版商更不会同意将商业性研究机构出于商业性科学研究目的开展TDM认定为版权限制与例外。
该条款的实施通过禁止合同条款阻止TDM例外适用予以保障。实践中,出版商通过合同规避版权限制与例外的情况时有发生,这一行为严重违背了合同合法原则高于合同自由原则的基本要求[19]。因此,在欧盟指令提案中给予上述宗旨性的禁止规定是非常必要的。与此同时,该条款鼓励权利相关人通过自行协商达成最佳实践。该举措为条款的实施提供了必要的灵活度,增强了条款的有效性。
2 国际司法动态
近年来,通过司法判例将TDM作为版权限制与例外的实例在美国频频发生。法官在依据成文立法中原则性合理使用条款[20]判定实践案例符合合理使用要素的同时,确立了转换性使用[6]的法理本质,进而保障了TDM的合法合理性。在众多案件中,Authors Guild v HathiTrust[3](以下简称为“HathiTrust”)与 Authors Guild v Google, Inc[4](以下简称为“Google Book”)成为认可TDM具有合理使用本质的典型案例。
在HathiTrust案件中,HathiTrust数字图书馆与Google签订大型数字化项目(Mass Digitization Project),允许Google对参与该项目的高校图书馆中所有作品进行全文扫描形成数字版本的作品,并提供给HathiTrust及相关高校图书馆使用。HathiTrust向公众提供3种使用方式:全文搜索、数字保存以及对经认证的视障用户提供无障碍阅读[3]。其中,全文搜索涉及大量的TDM。
基于全文搜索,用户可以对HathiTrust数字图书馆中的所有作品通过检索词进行全文搜索。对于仍处于保护期限内的作品以及未经作者授权的作品,HathiTrust仅提供检索词出现的页码以及该检索词在该页码出现的频率。HathiTrust的全文检索本质上是一种TDM技术的应用,与原作品的使用具有截然不同的目的,并不代替原作品的使用,具有较强的转换性,最终被法院认定为合理使用[21]。
在Google Book案件中,版权争议主要出现在图书馆项目(Library Project)这一子项目中。基于图书馆项目,Google对参与该项目的图书馆中近2千万本图书进行了全文电子化扫描。有些图书馆仅仅允许Google就公共领域的作品进行扫描,有些图书馆则允许Google对所有作品(包括仍在保护期限之内的大量作品)进行扫描。然而,对于受保护的作品,Google并不事先征得权利人的同意,且不向权利人支付任何报酬。Google将扫描后的电子版图书向用户提供片段浏览(Snippet View)服务。具体而言,Google将扫描图书的每页分为8部分,输入检索词进行搜索后,只能出现含有检索词的少许片段。从片段浏览的本质分析,这一服务实质上是TDM技术的应用。与图书的原有使用目的完全不同,片段浏览旨在为用户提供更为完善的文字搜索工具,进而提高用户搜索图书的效率,具有较高的转换性,最终被法院认定为是合理使用。
HathiTrust和Google Book依据现行立法中的原则性合理使用条款,充分地论证了TDM的合理使用本质。尽管这2个案件中所采用的TDM在形式上具有一定的差异,但从使用本质上分析,2种TDM均不以替代原有作品为目的,都可以依据原则性合理使用条款被认定为转换性使用,进而被判定为合理使用。
3 国际出版商政策动态
国际出版商对于TDM技术一直占居主导地位。在TDM法律确定性不够明确的基础上,国际出版商主张通过许可协议以及提供平台的方式掌控TDM在科学研究中的实践应用[15]。
作为2013年“欧洲许可对话(Licenses for Europe)”的重要成果,包括爱思唯尔、美国化学学会、英国医学杂志出版集团的多家与会出版商承诺将基于非商业性目的的TDM纳入学术机构订阅许可范围内,并且开发共同的基础设施促进TDM发展[22]。
2015年,国际科技医药出版商协会(International Association of Scientific, Technical and Medical Publishers)发表声明,将积极通过版权许可协议在欧盟领域为非商业性科学研究目的且受保护作品的TDM工作提供支撑。具体而言,签署该声明的出版商做出如下3项表态:首先,签署出版商表示,将针对科研领域的非商业性TDM达成样本条款嵌入至现有许可协议中;其次,签署出版商将基于现有的基础设施进一步促进及提高科研人员的TDM能力;最后,签署出版商将改善现有的基础设施确保科研人员能够将许可订购数据与开放存取数据共同应用至TDM研究中[5]。与此同时,签署该声明的出版商强调,将通过必要的措施对自身数据进行技术保护,以免在TDM应用中造成不必要的经济利益损害。
上述战略表态表明,出版商目前在一定程度上已经认可基于非商业性目的开展TDM的合理使用性。然而,出版商仍然希望将基于该类目的的TDM进行有效掌控,即希望通过版权许可协议以及共建平台的形式对此进行有效控制。
4 国际TDM版权新策特征
4.1 相同之处
将国际立法界、司法界以及出版界就TDM提出的版权新策进行比较梳理,发现各项新策之间存在一定程度的共性。
首先,TDM的合法合理性在国际立法层面、司法层面以及出版商政策层面都得到了一定程度的认可。不论是成文立法基于不同程度、不同视角的有条件认可,还是司法判例的转换性法理论证,或是出版商自身政策的妥协,都一致明确TDM有利于鼓励创新的本质。
其次,上述各项新策都希望在进一步应用TDM的过程中,协调网络环境中各方权利相关人之间的利益平衡,进而在鼓励创新的同时保障各方权利人的基本利益。不论是英国修法中适用目的的限定,还是欧盟指令提案中适用主体的限定,都是基于各方权利人利益平衡的考虑。司法判例从法理上更为彻底地论证了TDM不会影响权利相关人现有利益的本质。与此同时,国际出版商通过将非商业性TDM例外样本条款嵌入至许可协议的方式表明了其对文本与挖掘的立场和态度。
4.2 不同之处
首先,上述各项新策对于TDM的认可程度存在一定的差异。TDM在司法层面得到了最大程度的认可。法官依据成文立法原则性条款[20],在具体案例中判定TDM的转换性本质,进而无条件认可了TDM的合法合理性。TDM在立法层面上也获得了一定程度的认可,而立法层面上的认可均通过多重方式对TDM的合理开展予以灵活性限定。出版商则仅仅认可出于非商业性研究目的开展TDM的可行性,认可方式相对单一,并且对该类认可进行了样本条款及专属平台的双重监管及掌控。
其次,上述各项新策对于TDM的认可方式存在一定差异。在司法上,TDM依据其转换性本质从法理上已经获得了无条件认可。在立法上,上述国家及地区根据具体条款,通过设定限定条件的方式认可TDM的合法合理性。英国立法通过设立“适用目的”的方式限定TDM的合理使用,而欧盟指令提案则通过明确“适用主体”的方式限定TDM的合理使用。与英国立法相似,国际出版商也从“适用目的”上对TDM进行了限定。有所不同的是,出版商们愿意通过在现有许可协议中逐一嵌入样本条款的方式(而非立法普遍认可的方式)对TDM进行认可,研究机构需要通过实践谈判才有机会获得开展TDM的机会。这一方式对于出版商而言非常有利,然而其实施效力低下,不利于平衡各方权利相关人之间的利益。国际TDM版权新策的特征见表1。
表1 国际TDM版权新策特征
5 国际TDM版权新策对我国科技期刊建设的启示
科技期刊作为科学研究的重要传播载体,不仅是我国科学发展的真实见证,还为进一步的科学创新提供坚实支撑。科技期刊内含丰富多样的科学数据,而科学数据的TDM是助力我国期刊科学创新及发展的有效方法及良好契机。因此,科技期刊的TDM对于鼓励我国科学创新及发展至关重要。目前,我国科技期刊对于TDM的价值已有一定认识[23-24],主要从技术层面对TDM在科技期刊中的应用展开初步探讨。然而,科技期刊界目前对于TDM的国际发展动态以及法理本质讨论较少,也尚未就TDM在期刊中的实践应用形成有力的政策支撑。基于第4节中TDM国际发展动态的梳理及比较论证,笔者提出以下建议。
5.1 明确TDM鼓励创新的法理本质
国际司法动态表明,TDM具有典型的转换性本质。这一本质决定TDM不具有替代原有作品的目的性及可能性,不会影响原有作品的潜在市场,也不影响作者及出版商的现有利益,并且充分保障了鼓励创新的立法宗旨。事实上,转换性本质的考量及确认也极大地降低了“商业性目的”在具体案例中的考量比重。
基于国际司法动态,中国科技期刊应当正确厘清TDM的转换性本质,广泛梳理、跟进TDM目前在国外的法理研究,积极收集相关真实判例例证及文献,为期刊TDM的政策建设及同行实践提供坚实的法理基础。
5.2 夯实科技期刊TDM政策联盟
目前,科技期刊界对于TDM的理论研究存在梳理角度较为单一、文献不够充实的问题。现有的文献梳理主要从技术视角展开,且数量相当有限。政策缺失是导致上述现象的根源之一。实践中,科技期刊界尚未对TDM给予足够的重视,未形成专门政策支撑TDM工作的开展。
科技期刊界应当充分认识到TDM对于助力未来数字环境中科学发展的无限潜力,加强同行之间交流及宣传,借鉴国际发展动态及理论梳理,争取达成适合于我国国情发展的行业政策联盟,有理有节地将TDM这一新型技术应用至期刊自身业务发展中。
5.3 加强科技期刊国际合作谈判中TDM的谈判
目前,科技期刊与国际出版商就数据库进行许可谈判时,常常忽略数据库TDM权利的协调。事实上,上述国际出版商对TDM做出的表态已经充分认可基于非商业性目的开展TDM的合理使用性。
我国科技期刊可以以此为据,结合TDM的法理本质以及业界政策联盟,在数据库许可订购谈判中主动提出非商业性TDM的实践需求,要求国际出版商切实在许可谈判中嵌入相应许可条款,有效获取数据库TDM的合理使用权利。
5.4 加强科技期刊界与技术产业界合作,联合建立国内科技期刊数字平台
目前,我国科研人员在实践中很难就国内科学数据展开TDM的合理使用研究。原因可归纳为:第一,包括中国知网在内的商业数据库商一般允许用户基于商业许可订购获取TDM权利,订购费用较高;第二,商业数据库商通常基于商业许可条款限制科研人员开展TDM的合理使用;第三,目前市场上尚未专门针对我国科技期刊形成科学类数据库平台,以供科研人员展开TDM研究;第四,我国科技期刊的技术力量相对薄弱,还有相当一部分科技期刊以单刊编辑部形式经营,无论从业务范围还是人员架构以及技术储备上,都不具备自身开展TDM的最基本能力。
基于TDM的转换性合法合理本质,以及我国科技创新的实践需求,我国科技期刊界可以引荐欧盟鼓励公共机构与社会资本合作开展TDM的策略,充分加强自身与技术产业界的合作,在厘清法理基础的前提下,由科技期刊提供数据资源,由技术产业界提供专业技术,共赢合作,联合建立国内科技期刊数据库平台,为我国科研人员就本国科学数据提供TDM的合理使用研究。
6 结束语
近年来,TDM在国际立法界、司法界以及出版界均得到了广泛的梳理。从司法判例的转换性本质论证,到建立在具体限定条件下的版权限制与例外立法修订,再到出版商提出的样本条款及平台共建,都在不同程度上论证了一个事实,即TDM具有鼓励创新的合法合理性,应当积极被应用至科学研究中。科技期刊作为助力国家科学发展的重要资源,应当积极梳理TDM的国际发展动态,厘清其法理本质,夯实相关行业政策联盟,在国际合作谈判中主动嵌入相关合理使用许可谈判,并且考虑加强与技术产业界合作,联合建立国内科技期刊数字平台,为科研人员开展TDM合理使用提供坚实支撑。
[1] The UK Parliament. The copyright and rights in performances (research, education, libraries and archives) regulations 2014[EB/OL]. (2014-05-19)[2017-05-08]. http://www.legislation.gov.uk/uksi/2014/1372/pdfs/uksi_20141372_en.pdf.
[2] The European Commission. Proposal for a directive of the European Parliament and of the Council on copyright in the Digital Single Market[EB/OL]. (2016-09-14)[2017-05-08]. https://ec.europa.eu/digital-single-market/en/news/proposal-directive-european-parliament-and-council-copyright-digital-single-market.
[3] Authors Guild v HathiTrust[EB/OL]. (2016-05-15)[2017-05-08]. https://cases.justia.com/federal/district-courts/new-york/nysdce/1:2011cv06351/384619/156/0.pdf.
[4] Authors Guild v Google, Inc[EB/OL].(2016-05-15)[2017-05-08]. https://www.authors-guild.org/wp-content/uploads/2014/10/2013-Nov-14-AGvGoogleOpinion-SDNY.pdf.
[5] STM publishers. A statement of commitment by STM publishers to a roadmap to enable text and data mining for non-commercial scientific research in the European union[EB/OL]. (2016-12-25)[2017-05-08]. http://www.stm-assoc.org/2015_11_10_Text_and_Data_Mining_Declaration.pdf.
[6] Leval P N. Toward a fair use standard[J].HarvardLawReview,1990,103(5):1105-1136.
[7] Morris C. Transforming “transformative use”: The growing misinterpretation of the fairuse doctrine[J].PaceIntellectualProperty,SportsEntertainmentLawForum,2015,5(1):10-31.
[8] Diaz A S. Fair use & mass digitization: The future of copy-dependent technologies after Authors Guild v. HathiTrust[J].BerkeleyTechnologyLawJournal,2013,28(4):683-714.
[9] Kwok H F K. Google book search, transformative use, and commercial intermediation: An economic perspective[J].YaleJournalofLawandTechnology,2015,17(1):283-367.
[10] 徐轩,孙益武. 英国数据挖掘著作权例外条款研究及其启示[J]. 图书馆建设,2015(9):10-14.
[11] 于静. 国际图书馆界对文本和数据挖掘权利的争取及启示[J]. 图书馆,2016(3):80-84.
[12] 李钢. 大数据时代文本挖掘的版权例外[J]. 图书馆工作与研究,2016(3):28-31.
[13] 张欣欣,缪弈洲,张月红. CrossRef文本和数据挖掘服务——《浙江大学学报(英文版)》 的实践[J]. 中国科技期刊研究,2015,26(6):594-599.
[14] 李金海,何有世,熊强. 基于大数据技术的网络舆情文本挖掘研究[J]. 情报杂志,2014,33(10):1-6.
[15] 茹丽洁,顾立平,田鹏伟. 国际出版商对文本和数据挖掘限制的正当性辨析[J]. 图书馆建设,2016(7):27-33.
[16] The European Commission. Impact assessment on the modernization of EU copyright rules accompanying the document proposal for a directive of the European Parliament and of the Council on copyright in the Digital Single Market[EB/OL]. [2016-10-05]. https://ec.europa.eu/digital-single-market/en/news/impact-assessment-modernisation-eu-copyright-rules.
[17] Hargreaves I. Digital opportunity: A review of intellectual property and growth[EB/OL]. [2017-03-20]. https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/32563/ipreview-finalreport.pdf.
[18] 周玲玲. 英国著作权限制与例外改革及其对我国图书馆的启示[J]. 图书情报工作,2016,60(6):21-25.
[19] 周玲玲,杨萌,马晴晴,等. 网络时代图书馆相关公共利益的维护研究——以我国《著作权法》及第三次修法为例[J]. 图书情报工作,2015,59(23):5-10.
[20] The US Congress. Copyright act of 1976[EB/OL]. [2016-05-16]. http://www.copyright.gov/title17/92chap1.html#107.
[21] 周玲玲,马晴晴,陈扬. 基于转换性使用的著作权例外及其对图书馆界的启示[J]. 图书馆建设,2017(4):34-39.
[22] The European Commission. Licenses for Europe[EB/OL]. [2017-03-08]. https://ec.europa.eu/licences-for-europe-dialogue/node/7.html.
[23] 卜延明,范洪涛. 数据挖掘技术在科技期刊网站中的应用[J]. 编辑学报,2015,27(3):276-279.
[24] 姚伟欣,马建华. 新学术环境下科技期刊数字出版平台的技术发展趋势[J]. 中国科技期刊研究,2013,24(6):1039-1043.