APP下载

欧盟有关文本和数据挖掘的法律框架

2016-03-01樊佳怡

信息资源管理学报 2016年1期
关键词:指令数据挖掘权利

樊佳怡

(上海图书馆,上海,200031)



欧盟有关文本和数据挖掘的法律框架

樊佳怡

(上海图书馆,上海,200031)

[摘要]文本和数据挖掘是数据驱动创新时代重要的研究工具。数据库商对此增加额外的许可条款,使版权问题再次成为争议焦点。结合版权视角和数据库特殊权利视角,梳理欧盟有关文本和数据挖掘的法律框架现状及发展,并介绍英国版权法2014年修订所显示的支持文本和数据挖掘的进步趋势。这种趋势将对图书馆增强信息服务能力产生积极的影响。

[关键词]欧盟法律文本和数据挖掘版权数据库特殊权利

1争议:法律环境对文本和数据挖掘的限制

文本和数据挖掘(Text and Data Mining,简称TDM)包括以计算机为基础的文本和数据分析及组织的各种技术,用于在海量内容中抽取关键信息并从中发现规律和趋势。在数据驱动科研与创新的时代,这项技术已成为研究人员必不可少的工具。有报告[1]指出,文本和数据挖掘的出现代表着欧洲一次重要的经济机会,将使欧盟国内生产总值增加数百亿欧元。

科研人员认为,“有权阅读即有权挖掘”[2]——既然有权获取论文,进行文本和数据挖掘同样不需要特殊许可。然而,被挖掘的文献或数据库可能受到版权、相关权利以及数据库权利的保护,进行文本和数据挖掘需要取得权利人的许可。一些出版商正试图通过设计严格的协议来限制文本和数据挖掘行为。2014年2月,Elsevier推出新政策[3],在Science Direct的机构订阅协议中增加有关文本和数据挖掘的许可条款,包括使用目的、原文篇幅、原文链接等条件。Elsevier认为,机构付费订阅的内容只包括缓存、阅读、打印以及在PDF文档中进行检索的权利。其他一些出版集团也在尝试以额外费用将可挖掘的文本内容推送给机构用户。对学术界而言,文本和数据挖掘被定义为一种要求通过许可方式赋予额外权利的活动,而且由出版行业掌握决定权,这代表着一种危险的趋势。

国际图联在声明[4]中认为,许可授权并不是解决文本和数据挖掘问题的合适方案。图书馆界需要确保许可协议所增加的限制不会阻碍学术自由、科学进步与创新。法律规定的不明朗,使研究人员和机构面临风险。在大数据时代,版权又一次成为争议角色。欧盟于2014年4月发布报告[1],认为欧盟的法律框架存在缺陷,并敦促欧洲版权法进行修订以利于研究人员使用计算机程序提取已发表论文中的片段和数据。

2版权视角下文本和数据挖掘的合法性

目前欧盟法律框架中涉及文本和数据挖掘的版权及其限制与例外,主要出自2001年通过的《欧洲议会和欧盟理事会关于协调信息社会中版权和相关权某些方面的指令》[5](简称:《版权指令》)和1996年通过的《欧洲议会和欧盟理事会关于数据库保护的指令》[6](简称:《数据库指令》)。

2.1是否涉及版权专有权利

2.1.1复制权

复制是利用作品最基本的方式。用户很难想象,只是通过计算机进行简单的读取和提取,就可能被认定为侵权。然而,复制的概念在数字时代已发生重大的变化。欧盟《版权指令》根据作品在网络中传播的特点对复制进行了重新界定,在第2条明确规定:复制包括以任何方式或形式所进行的直接的或间接的复制、永久的或暂时的复制,且不论该种复制是全部复制还是部分复制。这一解释使版权人享有广泛的复制权,有权控制各种延伸的复制行为。

在欧洲法院Infopaq案[7]中,从事媒体监测与分析业务的Infopaq公司根据客户提供的主题,通过数据采集程序从丹麦的期刊报纸中选择内容制作成摘要。法院认定,对受版权保护的作品中一个由连续11个词语构成的片段进行复制,只要该片段包含作者具有独创性的表达,即构成部分复制。

文本和数据挖掘行为必然涉及计算机对作品的复制,包括以任何形式对数据库的全部或部分制作暂时或永久的复制件。基于《版权指令》的广义解释,复制权已成为文本和数据挖掘首要面临的法律障碍。

2.1.2其他版权专有权利

除复制外,文本和数据挖掘对作品的处理还包括转换文件格式、提取部分数据和文本等。欧盟《版权指令》并未明确提及作品的改编权,一般用广义的复制权来涵盖这部分行为。例如,将PDF格式的文件转换为HTML格式或HML格式的文件,显然属于复制权范畴。而对人工翻译或软件所进行的机器翻译行为的界定则相对模糊。在《版权指令》中,诸如戏仿、为残障人士使用而进行的重制等版权例外,不仅是针对复制权的例外,其实质也是针对改编权的例外。

相较而言,在欧盟《数据库指令》、《软件指令》及大部分国家的国内法中,都有关于改编权的明确规定。符合版权保护条件的数据库作品,按《数据库指令》第5条的规定,除享有复制权外,还享有改编权、向公众提供权、向公众传播以及对改编作品的进一步权利。其中,文本和数据挖掘可能涉及的是改编权,具体包括对数据库进行编译、改编、整理及其他改动。事实上,文本和数据挖掘是独立的创作,与来源数据库大不相同。经过从大量数据中进行的选取、分析、索引、比较、链接、重组和整合之后,很难识别数据出自哪个来源数据库。同样,来源数据库的结构也基本不可能出现在最终的结果中。因此,证明数据挖掘行为侵权的难度很大。此外,发行权、向公众传播权和向公众提供权等,都不适用于规制文本和数据挖掘活动。

2.2能否适用版权的限制与例外

尽管文本和数据挖掘对作品的使用落在版权法调整的范围内,但版权法同时设定了对专有权利的限制与例外。能否适用版权例外,是考察文本和数据挖掘行为合法性的重要环节。

2.2.1临时复制

欧盟《版权指令》明确将临时复制排除在复制权的范围之外,这也是唯一一条强制性的版权例外。其第5条第1款规定了临时复制的条件,即“该复制是短暂的、偶然的,是技术过程中不可分割的组成部分,且使作品在网络中的传输成为可能”。在前述Infopaq案的判决中,欧洲法院就Infopaq公司的行为是否属于复制权例外的争议,判定予以严格解释,并根据《伯尔尼公约》所确立的“三步检验法”进行解释,这是相当严格的要求。

文本和数据挖掘的流程可以拆解为:获取信息来源、转换数据格式、载入数据、分析数据、形成报告。这一系列步骤所涉及的大量复制行为中,如果发生任何不符合临时复制条件的下载、保存情形,即不能适用这一版权例外。因此,临时复制例外很难为文本和数据挖掘提供法律支持。

2.2.2科学研究

科学研究例外在《版权指令》和《数据库指令》中有着不同的含义。

欧盟《版权指令》第5条第3款(a)项表述为:“仅为教学的举例说明目的或科研目的而使用,只要指出了来源,包括作者姓名,除非结果表明指出来源是不可能的,并以实现正当的非商业性目的为限”。就文本和数据挖掘而言,更可能以“科研目的”比较完美地适用该条款。该条款就“注明出处”的灵活规定也避免了注明大量数据来源的问题。唯一的不利因素在于,该条款不具有强制性。欧盟各国立法保护水平的不一致,例如对“作品”、“受益人”的不同定义,可能成为文本和数据挖掘适用科学研究例外的潜在阻碍。

欧盟《数据库指令》第6条第2款(b)项表述为:“使用只是为了教学或科学研究的示例说明的情况,只要对所使用的材料加以注明并以某种程度证明其目的是非商业性的”。这项条款针对的是数据库的结构,包括其选取和编排方式。与《版权指令》相比,少了“除非指出来源不可能”这一豁免,对文本和数据挖掘的适用性提出了挑战。并且,与《版权指令》相似,这项科学研究例外同样不具有强制性。

3数据库权利视角下文本和数据挖掘的合法性

文本和数据挖掘需要处理大量文本、声音、事实、数据等,与数据库发生密切的联系。基于数字化技术和互联网络的特殊性质,欧盟通过《数据库指令》创设了独立于版权法之外的数据库特殊权利(sui generis),将内容的选择和编排不具有独创性而不能得到版权保护的数据库纳入特殊权利保护的范围。

3.1是否涉及数据库特殊权利

欧盟《数据库指令》第7条第1款要求各成员国为“在数据库内容的获取、验证和呈现方面作出实质性投入的数据库制作者”规定一种权利,以“防止对数据库内容的全部或实质部分进行提取和/或再利用”。可见,特殊权利保护的是数据库制作者在收集材料方面的投入,即以“投入”标准取代了版权保护的“独创性”标准。不论该数据库是否版权作品,都享有数据库特殊权利。

数据库特殊权利由两项权利组成:提取权和再利用权。首先,提取权包括采取任何方法将数据库内容的全部或实质部分永久或暂时转移到其他载体上,类似版权中的复制权。欧洲法院同样对其作了广义解释。由于数据库通常是所需要挖掘的语料库的一部分,文本和数据挖掘在大部分情况下都将涉及对数据库内容实质部分的提取,需要取得权利人的许可。第二,再利用权包括以任何形式将数据库内容的全部或实质部分向公众提供,类似版权中的发行权。文本和数据挖掘并不涉及再利用权。

3.2能否适用数据库特殊权利的限制与例外

3.2.1对非实质部分的提取

前述提取权和再利用权,这两项权利的对象都是“数据库内容的全部或实质部分”,并不涉及“数据库内容的非实质部分”。欧盟《数据库指令》在第8条第1款规定了合法用户对非实质部分的权利例外,即“数据库制作者不得阻止该数据库的合法用户提取和/或再利用数据库内容的非实质部分”。对于实质部分的判断标准,法规仅规定可以是“定性的和/或定量的”。当数据库的合法用户仅获准提取数据库的特定部分时,该规定也仅适用于特定部分。据此,文本和数据挖掘仅在用户有权使用数据库并仅提取其非实质部分的情况下,才能适用这一权利例外。假如数据库商的许可协议中明确禁止数据挖掘行为,用户就失去了“合法用户”的主体地位,不能适用权利例外。

3.2.2用于教学科研的提取

文本和数据挖掘可能适用的另一项权利例外,是欧盟《数据库指令》第9条(b)项所规定的科学研究例外。在满足合法用户条件的基础上,提取还需符合3个条件:出于非商业性目的、用于教学或科学研究、注明来源出处。可喜的是,“用于科研”并未强制要求科研是其唯一目的。同时用于统计、行为分析等其他目的的文本和数据挖掘行为,同样可以适用这一例外。遗憾的是,“注明出处”在文本和数据挖掘实践中不具备可操作性。要求在数据挖掘过程中将数据来源存储于内部服务器中也并无实际意义。

4突破:英国新增有关文本和数据挖掘的版权例外

在目前欧盟的法律环境中,版权人和出版商处于更有利的地位。国际图联认为[4],文本和数据挖掘的合法性只能通过法定的例外来实现。为了得到更清晰的法律保护,研究人员设想:效仿科学研究例外,专门为文本和数据挖掘行为设计一种权利例外。这种例外将不要求科学研究是其唯一目的,也不需要注明数据来源。

2014年6月,英国版权例外制度的最新修订[8]正式生效。修订增加了一条关于文本和数据挖掘的例外,允许研究人员采用数字化研究方法来提取内容中的事实和数据。法案第29A条规定了构成该例外的条件:第一,必须出于非商业目的;第二,对所使用的信息作充分的说明(除非在操作上不能实现);第三,不得将所使用的信息转移给他人或作其他处理。根据新法的规定,任何人都可以在无须征得版权人同意的情况下,出于非商业目的对其读到的材料进行文本和数据挖掘。数据库商和内容提供商可以要求用户付费访问其内容,可以采取合理的技术手段,但不能阻止用户出于非商业目的的文本和数据挖掘活动。并且,任何意图阻止或限制文本和数据挖掘的合同条款都不具有可执行力。

英国新增的这项权利例外是对当前欧盟法律框架的明显突破,值得注意的是,法案中使用“数据分析(Data Analysis)”取代人们所习惯的“数据挖掘(data mining)”。相较而言,“数据分析”概念在对相关技术的涵盖上可以有更广义的解释,诸如抓取、处理、比较、复制、分析、存取、检索、翻译、分类、解析等等,值得借鉴。

新法通过后广受好评,大英图书馆发表声明[9]表示欢迎,认为新的版权例外将为图书馆用户带来显著的帮助,并将推动科研、创新和经济增长。Copyright for Creativity(C4C)[10]等一些组织也纷纷发布声明和报告,推动欧盟借鉴英国的做法,起草一条专门为文本和数据挖掘设计的、具体的、强制性的法定版权例外。

5结语

纵观文本和数据挖掘在当前欧盟法律框架中所处的位置(如下图1所示),主要面临的问题涉及版权专有权利中的复制权和数据库特殊权利中的提取权,而可能适用的权利例外却存在各种不确定因素:或定义模糊,或难以满足其要求,或可能为许可协议所规避。英国新修订的版权例外(图中以虚线表示)如能在未来为欧盟所效仿,则将填补这一空白,为文本和数据挖掘提供更明确、更有效的法律保护。

文本和数据挖掘是数字环境下重要的研究工具。为了适应时代的变化,法律对各种利益保护的侧重也在发生变化。版权限制与例外制度的核心价值,就是在各种法律之间维持一种平衡。在美国和其他一些国家,文本和数据挖掘属于合理使用的范畴,从事这项活动无需获得版权人的许可。在欧盟,尽管法律环境不甚明朗,但英国版权法的修订显示了支持研究人员自由地进行文本和数据挖掘的进步趋势。这种趋势将对图书馆增强信息服务能力产生积极的影响。

参考文献

[1]European Commission.Standardisation in the area of innovation and technological development, notably in the field of Text and Data Mining[OL].[2015-05-11].http://ec.europa.eu/research/innovation-union/pdf/TDM-report_from_the_expert_group-042014.pdf

[2]Open Knowledge Foundation's Working Group on Open Access .The Right to Read Is the Right to Mine[OL].[2015-05-11]. http://blog.okfn.org/2012/06/01/the-right-to-read-is-the-right-to-mine/

[3]Van Noorden R. Elsevier opens its papers to text-mining[OL].[2015-05-11]. http://www.nature.com/news/elsevier-opens-its-papers-to-text-mining-1.14659

[4]IFLA.IFLA Statement on Text and Data Mining[OL].[2015-05-11].http://www.ifla.org/publications/ifla-statement-on-text-and-data-mining-2013

[5]EU.Directive 2001/29/EC of the European Parliament and of the Council of 22 May 2001 on the harmonisation of certain aspects of copyright and related rights in the information society[OL].[2015-05-12].http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=CELEX:32001L0029:EN:HTML

[6]EU.Directive 96/9/EC of the European Parliament and of the Council of 11 March 1996 on the legal protection of databases[OL].[2015-05-12].http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=CELEX:31996L0009:EN:HTML

[7]ECJ.Infopaq International A/S v DanskeDagbladesForening C-5/08[OL].[2015-05-12]. http://curia.europa.eu/juris/liste.jsf?num=C-5/08

[8]U.K. The Copyright and Rights in Performances(Research, Education, Libraries and Archives)Regulations 2014[OL].[2015-05-12].http://www.legislation.gov.uk/uksi/2014/1372/regulation/3/made

[9]British Library. British Library welcomes new exceptions tocopyright[OL].[2015-05-12].http://www.bl.uk/press-releases/2014/march/british-library-welcomes-new-exceptions-to-copyright

[10] Copyright for Creativity.The Copyright Manifesto[OL].[2015-05-12].http://copyright4creativity.eu/2015/01/19/c4ccopyrightmanifesto/

Study on the European Union Legal Framework of Text and Data Mining

Fan Jiayi

(Shanghai Library, Shanghai, 200031)

[Abstract]Text and Data Mining is one of the important research tools in the data driven innovation era. Some publishers asked for additional license which made copyright the focus of controversy again. The paper introduces the European Union legal framework in the perspective of both copyright and sui generis, and the progress in the revision of copyright law of the United Kingdom which makes positive impact on library information services.

[Key words]European Union lawText and data miningCopyrightSui generis

[作者简介]樊佳怡,硕士,参考馆员,Email:jyfan@libnet.sh.cn。

[中图分类号]D913

[文献标识码]A

[文章编号]2095-2171(2016)01-0012-05

DOI:10.13365/j.jirm.2016.01.012

(收稿日期:2015-06-01)

猜你喜欢

指令数据挖掘权利
听我指令:大催眠术
探讨人工智能与数据挖掘发展趋势
我们的权利
ARINC661显控指令快速验证方法
LED照明产品欧盟ErP指令要求解读
论不存在做错事的权利
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
权利套装
坐标系旋转指令数控编程应用