国际图书馆界对文本和数据挖掘权利的争取及启示
2016-02-13河南职业技术学院图书馆郑州450046
于 静(河南职业技术学院图书馆 郑州 450046)
国际图书馆界对文本和数据挖掘权利的争取及启示
于静
(河南职业技术学院图书馆郑州450046)
〔摘要〕面对版权问题对文本和数据挖掘技术在图书馆领域应用的制约,国际图书馆界采取了发布版权原则声明、游说开展版权立法、对出版商的版权政策提出质疑以及构建维权合作同盟等争取文本与数据挖掘权利的对策,其成果主要体现在:版权立场受到社会认同和支持、版权例外制度初现端倪、部分出版商调整了版权政策、图书馆的版权实践模式趋于多元化等。国际图书馆界争取文本和数据挖掘权利的做法与经验,对我国图书馆具有启示意义。
〔关键词〕文本和数据挖掘图书馆版权
〔分类号〕G251
〔引用本文格式〕于静.国际图书馆界对文本和数据挖掘权利的争取及启示[J].图书馆,2016(3):80-84
“数”是世界的本原,世界的本质就是数据,文本与数据挖掘这种新时代的科学工具让我们实现了用数据化手段测度人类行为和人类社会,再次改变了人类探索世界的方法[1]。但是,当前“文本与数据挖掘”(Text and Data Mining,简称TDM)并不能物尽其用,因为现行版权制度没有为TDM提供例外的权利或者侵权责任豁免的规定。加之,80%的信息是以文本和数据形式存在,使得TDM的经济价值更加受到重视,于是私人与公众之间的利益平衡问题就自然无法回避[2]。近年来,国际图书馆联合会(IFLA)、欧洲研究图书馆协会(LIBER)以及大英图书馆等主动采取了争取TDM权利的行动,向社会表明了版权立场,推动了国际与国内立法,促进了出版商版权政策的调整,图书馆的版权实践模式也趋于多元化,这对我国图书馆界有着积极的启示意义。
1 图书馆对文本与数据挖掘版权政策的现实需求
1.1图书馆对文本与数据的挖掘涉及复杂的版权问题
随着大数据的兴起,数据从原先仅具有符号价值逐渐延伸为同时还具有经济价值、科学价值、政治价值的重要资源,成为一种无形资产与新兴财富源泉[1]。TDM能够全面提升图书馆的基础业务、信息服务和管理活动的能力、水平与质量。然而,图书馆对数据的获取、分析、整理、保存以及传播利用和对挖掘结果的增值开发都可能涉及复制权、信息网络传播权、翻译权、汇编权、改编权等权利的保护问题。图书馆在从事TDM前,要对挖掘任务进行描述,决定识别、捕捉、分析、聚类数据的方法,设定挖掘阈值(数据灵敏度),从而会使数据呈现在不同的技术模式之下,曝露在不同的利用环境之中,面对不同的版权风险,如果失于控制,就可能受到侵权。按照欧盟《数据库法律保护指令》(Database Directive)的规定,如果图书馆未经授权地对数据库进行TDM,还可能涉及对“撷取权”(Extraction)、“反复利用权”(Utilization)的侵犯,即便这些数据本身或许并没有版权意义。图书馆从事TDM,如果触及数据的跨边界传播问题,那么版权矛盾就更加复杂。比如,目前“研究数据联盟”(RDA)的重要工作之一就是在促进数据全球化共享的同时,协调不同国家、地区之间的版权保护。IFLA指出,与版权和数据库相关的法律会影响到图书馆完成其使命以及为用户传递信息服务的能力,妨碍图书馆以有利于社群的方式使用资料──有助于学术、科研、人类健康和科学的进步、创造性及社会包容[3]。图书馆开展TDM迫切需要版权政策的支持。
1.2图书馆对文本与数据的挖掘行为受到版权的制约由于TDM在版权制度的监管范畴内,所以图书馆的TDM行为与版权人之间产生了新的利益磨擦,过于严苛的版权制度阻碍了TDM在图书馆领域的应用。一方面,现行版权制度没有为图书馆提供从事TDM的例外权利。比如,按照英国原《版权、外观设计和专利法》第50节D条的规定,享有合法使用数据库的组织或个人,无论访问数据库的全部或者其中一部分,都不构成侵权。但是,这个狭隘的例外条款,并不适用于TDM[4]。另一方面,即便法律赋予图书馆享有TDM例外权利,也可能被许可合同条款排除。因为,大多数国家的版权法都设置了合同优先适用原则。图书馆和档案馆版权联盟(LACA)曾对大英图书馆与出版商签订的合同进行分析,发现许多合同附有排除法定版权例外的条款[5]。这样,图书馆不得不为TDM寻求授权许可(即便是对本图书馆订购的资源),授权成本之高、效率之低,可想而知。个别出版商虽然允许图书馆对已经出版或者本图书馆订阅的资源开展TDM,但是限制条件很多,挖掘程序经常出现“卡住”等问题。
2 图书馆界争取文本与数据挖掘权利采取的行动
2.1发布图书馆界的原则声明
图书馆的职责是为人们提供信息和知识获取。既然版权管理知识的所有权与发布权,那么版权政策和版权制度就是图书馆员与图书馆行业组织关切的问题[6]。特别重要的是,图书馆必须身体力行地主动参加到争取权利的活动中去[7]。本世纪以来,国际图书馆界面对版权不断扩张,合理使用权利被啄食,实现公共利益日渐困难的局面,发布了一系列的版权声明。针对TDM版权问题,IFLA在《关于文本和数据挖掘的声明》中阐述了版权保护与图书馆的关系,分析了TDM为科学研究、知识创新以及图书馆带来的新机遇,指出并且批评了版权对图书馆开展TDM构成的威胁,提出了图书馆界的原则立场[8]。LIBER在《促进开放科学的声明》中认为,只有改革版权制度,扫清版权障碍,才能为TDM在图书馆的应用铺平道路[9]。原则声明体现了图书馆界对社会责任的担当,既向全社会表明了对TDM版权问题的高度关注,又旗帜鲜明地表达了主张与愿望,还为不同国家、不同地区的图书馆提供了指导思想,规划了努力的方向。
2.2游说开展国际与国内立法
图书馆是公共政策的有效代言人,是制衡版权人团体的公益组织,负有谋取公众利益的使命感,有职业责任与立法者交流,促进法律能够允许图书馆最大限度地获取资源[6]。IFLA指出,TDM是提高图书馆信息服务水平和审视馆藏资源的新工具,其合法性只能通过版权例外来实现[3]。IFLA在《图书馆和档案馆版权例外与限制条款建议条约》4.4版第20条中提出了设置TDM版权例外的具体意见[10]。目前,TDM已被世界知识产权组织(WIPO)的“版权与相关权常务委员会”(SCCR)纳入了《图书馆和档案馆相关的例外与限制》讨论框架。在推动国内立法中,英国图书馆界的贡献尤其突出。2011年5月,《哈里夫斯报告》(Hargreaves Report)首次提出为TDM设置版权例外条款后,英国图书馆界就表示了积极赞同,并提出建议。英国图书馆与情报专业协会(CILIP)理事会主席John Dolan指出,只有图书馆能充分利用资源,英国才能成为研究与信息领域的世界领跑者[11]。2014年初,英国知识产权办公室将版权法修订草案专门向图书馆界通报,足见图书馆在国家立法体系中的重要地位以及立法机关对图书馆界意见的高度重视。
2.3对出版商的政策提出质疑
在立法处于空白的情况下,图书馆界直接针对出版商的TDM版权政策提出主张,往往更加有效。比如,就许多出版商利用合同限制图书馆TDM权利的问题,IFLA指出:应排除与立法相悖的合同条款的有效性,只要TDM的结果不能替换受版权保护的原始作品,就可以共享这些成果。否则,法律的不确定性将阻碍重要的研究与数据驱动的创新[3]。LIBER针对欧洲出版商协会(EPC)在《版权2014年愿景:版权可以在网上使用》中不赞成为TDM建立版权例外制度的观点,认为“一对一”的授权许可或者“点击许可”不具有可扩展与可操作性,希望欧盟变革版权法,促进用于TDM例外的发展[12]。就Elsevier提出的“TDM机构许可协议”,LIBER指出TDM只能通过Elsevier的数据接口进行,限制了机器人、蜘蛛、网络爬虫等最常用挖掘技术的应用,同时Elsevier保留在任何时间阻止、变更、暂停、删除或禁止访问API和其他任何服务的权利,迫使图书馆等机构不得不同意非常苛刻的条件来获取狭窄的挖掘权利[13]。图书馆界的观点对出版商调整版权政策起到了积极影响。
2.4构建争取权利的合作同盟
在与版权人的长期博弈中图书馆界深刻认识到,只有凝聚各方面的力量,才能与强大的版权利益集团抗衡。比如,自2009年起,IFLA、eIFL、LCA等图书馆联盟就与非洲代表团、巴西代表团、档案界代表团等合作,在历次WIPOSCCR会议上提出了《图书馆与档案馆的版权例外和限制条款建议条约》、《需要一部图书馆和档案馆例外与限制条约的理由》等文件[14]。2012年,SCCR第24次会议在日内瓦召开,IFLA与17个民间团体合作签署版权声明,涉及12条建议,其中第9条就是关于TDM的内容[15]。除了IFLA、eIFL、等国际性的图书馆组织外,地区性的图书馆学术团体在TDM问题上也开展了联合行动。比如,LIBER质疑EPC提出的TDP版权政策的公开信,就是与欧洲研究型大学联盟(LERU)合作完成的。从某种角度认识,立法的进步就是团结的胜利。正如LACA主席Naomi Korn在2014年英国颁布实施修订后的《版权与表演权(研究、教育、图书馆与档案馆)条例》所说,版权改革包括图书馆员、信息工作者、基金会以及教育、科研、博物馆和其他文化组织孜孜不倦的协同工作[16]。
3 图书馆界争取文本与数据挖掘权利的主要成果
3.1主张得到社会认同和支持
图书馆界争取TDM权利的基本策略就是提出并广泛宣传自己的主张,赢得社会的理解和支持,形成舆论氛围,影响立法,并促进出版商改善版权政策。IFLA在《关于文本和数据挖掘的声明》中提出的重要主张包括:阅读权和挖掘权具有统一性,有阅读权就有挖掘权;立法保障图书馆TDM的例外权利;授权许可不是解决TDM版权问题的合适方案[8]。LIBER则认为,市场机制具有局限性,不可能完全解决TDM版权问题,TDM遭遇版权障碍的症结是版权法的内容缺乏明确性[12]。这些主张得到广大消费者组织的普遍认同。比如,“创造性版权”(Copyright for Creativity)组织认为,版权例外要为公众获取资源这一公共政策服务,不应将TDM完全交给市场[17]。欧洲研究开放获取基础设施(Open AIRE)和开放获取知识库联盟(COAR)向欧盟科学委员会科学2.0提出建议,认为应在版权法中引入强制性豁免条款[18]。研究、科学与教育机构全球联盟希望STM撤回涉及TDM的许可模型[19]。
3.2立法努力的成效初现端倪
2014年6月,英国修订后的《版权与表演权(研究、教育、图书馆与档案馆)条例》第29A条规定了非商业性目的TDM的版权例外。该条款有两个非常突出的特点:一是并未限定被挖掘文本和数据的“量”,合法用户的例外权利可以对抗“复制权”以及欧盟针对数据库设置的“撷取权”、“反复利用权”等;二是排除了合同条款对“挖掘权”限制的可能性,规定“任何的意图阻止或限制对文本或数据进行挖掘的合同条款不具有可执行力”[20]。这项规定对图书馆有重要意义,避免了图书馆的合理使用权在合同模式下变成“一纸空文”。所以,大英图书馆欢迎这些能为图书馆带来显著利益的版权例外[21]。在此之前,德国于2013年8月生效的修订后的《版权法》中设置了TDM版权例外条款,但是只适用于已出版期刊、报纸的“数个单词或文本的最小片段”。目前,美国、日本、韩国、新加坡等国家的用户已经能够对通过合法途径得到的仍在版权保护期内的材料进行TDM[21],而澳大利亚、爱尔兰等国家在版权改革草案中同样提出了允许对短小信息进行挖掘的建议。
3.3部分出版商调整版权政策
由于数据蕴涵着巨大的经济价值和商业利益,于是版权人希望依靠其版权垄断地位,对TDM的使用采取授权许可原则。比如,欧洲出版商协会(EPC)认为,为TDM提供版权例外是一个“陷阱与欺骗”,是意图以研究的名义最大限度的免费使用版权资源[12]。为了达到授权许可目的,国际科学、技术与出版商协会(STM)等出版商制定了格式化的许可模型,限制对数据的挖掘、复制和分发,使研究成果与其他公共资源、知识来源的结合变得更加困难、混乱和不可能[19]。在IFLA、LIBER等图书馆组织和研究、科学、教育机构全球联盟、欧洲研究型大学联盟等团体的反对下,Elsevier、Nature等出版商调整了TDM版权政策。比如,2014年1月,Elsevier在美国图书馆协会(ALA)于费城召开的会议上宣布,只需图书馆等合法订阅机构签署一个协议,用户就可以使用在线接口API免费TDM原始文献。虽然Elsevier的TDM版权政策仍然对图书馆构成诸多限制,但必定是向前迈出了重要的步伐。目前,承诺允许非商业性TDM的出版商还包括:美国化学学会、布里尔出版社、牛津大学出版社、英国物理学会出版公司、施普林格出版集团等。
3.4版权实践模式趋于多元化
按照“三步检验法”的规定,TDM例外只适用于“特定情形”,这无法完全满足图书馆对文本和数据挖掘的需求。另一方面,立法处于初创阶段,版权例外不可能覆盖到所有领域。所以,即使是注重TDM版权例外立法的英国,也在努力构建“版权集成中心”(Copyright Hub),完善版权交易平台。LIBER指出,立法真空地带造成的法律缺失,使图书馆不可避免地要同意部分TDM授权许可[13]。对于授权许可,IFLA、LIBER等虽然不认为是解决TDM版权问题的最合适方案,但是并不完全排斥。早在2000年,IFLA就在《许可原则》中就认同了许可模式,只是强调许可协议不应取消或削弱图书馆的法定权利。目前,一些出版商正在改善技术和授权政策,以便利许可。比如,CrossRef's Prospect 是Elsevier的一个试验项目,通过提供API与通用许可框架,解决TDM授权难题[22]。Springer也在与版权结算中心(CCC)合作,提供期刊内容的非商业性的挖掘权利[23]。“开放获取”(Open Access,简称OA)是图书馆寻求扩展TDM权利的另一条实践道路。目前,欧洲数字图书馆、档案馆与博物馆联盟(Europeana)已经使用CC0协议对资源进行标记,用户可以对被标记资源检索、挖掘和利用。英国研究理事会(RCUK)在OA政策草案中明确指出,该OA政策将支持TDM。
4 结语
当文本和数据成为“财富”,就可能从以前没有版权价值的共享资源变成了“私有资源”,图书馆对文本与数据开展挖掘不再是能够随心所欲的行为。然而,失去了TDM权利的支撑,图书馆的管理与服务都将受到压抑,这是IFLA、LIBER等图书馆联盟争取TDM权利的根本原因。TDM技术的应用还与国家竞争力有内在的联系。比如英国联合信息系统委员会(JISC)指出:如果不能对文本和数据广泛开发,那么英国在国际竞争中将严重落后于那些注重鼓励文本和数据挖掘的竞争对手[20]。新世纪以来,世界各国对版权法的修订趋于频繁,而且呈现出从“小修”向“大修”的发展态势,目的都是使版权法,尤其是版权例外制度能够更好地适应新技术变化与经济发展的新要求。2011年7月,我国启动了《著作权法》第三次修订,这是主动的完全根据国内经济社会发展和科学技术进步的现实需要作出的积极调整[24]。在修法讨论中,有学者注意到了TDM涉及的版权问题,建议立法为TDM留下足够的空间与弹性[25]。但是,中国图书馆学会、上海图书馆学会在立法建议中都没有关于TDM的权利诉求,《著作权法第三次修订草案送审稿》也没有TDM的内容,意味着对TDM版权例外的立法将错过本次修法的机会。虽然如此,图书馆界仍有必要开展深入细致的调查研究,积累丰富翔实的资料,向立法机关进言献策。同时,我国图书馆界要响应IFLA等组织的呼吁,主动参与支持国际图书馆界争取权利的行动。在我国《著作权法》及其配套制度还没有关于TDM规定的现实法律环境中,图书馆要更加注重使用版权行为的规范性、合法性,提高版权管理水平,防范与化解风险。图书馆还要与版权人、版权中介组织合作,完善授权机制,开辟应用TDM的渠道。
(来稿时间:2015年10月)
参考文献:
1.黄欣荣.大数据时代的哲学变革[EB/OL] .[2015-08-19].http://news.gmw.cn/2014-12/03/content-14035796.htm
2.孙学军.Nature:学术研究的文本挖掘时代[EB/OL].[2015-08-19].http://www.medsci.cn/article/showarticle.do?id=1c4e3038959
3.王微.国际图联关于文本和数据挖掘的声明[EB/OL].[2015-08-23].http://Copyright.las.ac.cn/news/
4.张舵.英国高等教育机构的数据挖掘:法律和政策[EB/ OL].[2015-08-23].http://Copyright.lasac.cn/news/
5.赵湘乐,杨辉.数字时代下的著作权例外──以英国知识产权立法改革为视角[J].电子知识产权,2012(9):52-59
6.王微.著作权与图书馆:当前议题[EB/OL] .[2015-08-05].http://Copyright.las.ac.cn/news/
7.张沙丽.美国电子时代的版权法、知识产权和图书馆[J].中国图书馆学报,1998(4):24-30
8.IFLA.IFLA statement on text and data mining[EB/OL] .[2015-09-03].http://www.ifla.org/files/assets/clm/statements/ iflastatement-on-text-and-data-mining.pdf
9.LIBER Statement on Enabling Open Science[EB/OL] .[ 2015-09-07].http://libereurope.eu/news/liber-state-ment-onenabling-open-science/
10.IFLA, ICA, EIFL, et al.Treaty proposal on copyright llimitations and exceptions for libraries and archives(Version4.4)[EB/OL].[2015-07-20].http://www.ifla.org/files/assets/hq/topics/ exceptions-limitations/tlib.Pdf
11.李力.英国在全球版权调查的末位徘徊── CILIP加入尽快改革英国版权法的呼吁队伍[J].图书情报工作动态,2012(4):20-21
12.杨秀云.LIBER和LERU反对欧洲出版商协会TDM版权政策[EB/OL] .[2015-08-27].http://Copyright.las.ac.cn/news/
13.王微.LIBER回应Elsevier的文本与数据挖掘政策[EB/ OL].[2015-08-22].http: //Copyright.las.ac.cn/news/
14.陈辰, 王江奇, 史海建.2011年图书馆著作权法律跟踪扫描年度总结[J].图书情报工作动态, 2012(2):20-24
15.邓玉.IFLA在WIPO会议上签订教育目的的著作权例外和免责条款[J].图书情报工作动态,2012(6):31-32
16.王微.英国著作权法改革突破获证实[J].图书情报工作动态,2014(5):7-8
17.智慧芽.欧盟版权:阅读权与数据挖掘权[EB/OL] .[2015-08-29].http://blog.zhinuiya.com/459
18.张梦霞.欧洲研究开放获取基础设施和开放获取知识库联盟共同向欧盟委员会科学2.0的意见咨询提出8点建议[J].图书情报工作动态,2014(10):14-16
19.陈雪飞.研究、科学和教育机构全球联盟呼吁STM撤回新许可模型[EB/OL].[2015-07-12].http: //blog.sciencenet.cn/ blog-1035376-829809.html
20.胡开忠,赵加兵.英国版权例外制度的最新修订及启示[J].知识产权,2014(8):73-78
21.Benjamin White.大英图书馆知识产权主管谈英国著作权法的改变及其产生的影响[J].胡芳, 译.图书情报工作动态,2014(5):9-11
22.史双青.Elsevier更新文本挖掘政策以改善研究人员的获取状况[EB/OL] .[2015-08-11].http: //Copyright.las.ac.cn/news/
23.刘晶晶.Sprnger和著作权结算中心合作加强文本与数据挖掘解决方案[EB/OL].[2015-07-20].http: //blog.sina.com.cn/s/blog.c2cbooldold102v1m.html
24.阎晓宏.《著作权法》第三次修改的几个问题[J].知识产权,2012(5):3-6
25.殷泓.三问著作权法修改[EB/OL].[2015-07-20] .http: // epaper.gmw.cn/gmrb/html/2014-04/29/nw.D110000gmrb201404 29.htm
The International Library Community to the Text and Data Mining Rights for the Fight and Enlightenment
Yu Jing
( Library of Henan Vocational and Technical College )
Abstract〔〕In the face of the copyright problem of text and data mining technology in library field constraints, the international library community take the publishing copyright statement of principles ,lobbying to carry out copyright legislation on the publisher’s copyright policy raised the question as well as the construction of rights cooperation alliance for text and number according to the Countermeasures of mining rights, the results mainly reflected in: copyright position by social recognition and support, incipient copyright exception system, some publishers copyright policy is adjusted, the practice mode of copyright in the library diversified etc..The practice and experience of the international library community to strive for the right of the text and data mining, to our country library has the enlightenment significance.
Keywords〔〕Text and data miningLibraryCopyright
〔作者简介〕于静(1985-),女,本科,河南职业技术学院图书馆馆员,研究方向:信息资源管理。