图书馆应用文本和数据挖掘技术的版权问题刍议
2016-01-18侯玉玲
[摘 要] 文本和数据挖掘技术在图书馆的应用遇到了版权障碍。我国图书馆在应用文本和数据挖掘技术的过程中应努力争取相关权利,重视版权利益关系的平衡以及版权矛盾的消解,措施包括广泛宣传图书馆的主张、积极推动国内版权立法、不断提高版权管理水平、合作解决授权难题等。
[关键词] 图书馆;文本和数据挖掘;版权
[中图分类号] G253.1 [文献标志码]A[文章编号]1005-6041(2015)06-0001-04
20世纪90年代以来,应对新技术变革背景下层出不穷的版权问题的挑战成为图书馆界的重要任务。文本与数据挖掘(Text and Data Mining,简称TDM)技术作为一种新的识别、选择、捕捉、分析、聚类知识与信息的科学工具,对图书馆建设与服务有日益重要的作用。然而,版权利益矛盾遏制了TDM的应用价值,成为图书馆领域权利博弈的新焦点。国际图书馆联合会(IFLA)、欧洲研究图书馆协会(LIBER)等图书馆联盟以及有关国家的图书馆从肩负的历史使命出发,以对社会责任担当的勇气坚决开展了争取TDM合法权利的行动,取得重要成果。我国图书馆在应用TDM技术的过程中应积极维护自身权利和公共利益,重视利益关系的平衡,努力弥合版权立场分歧,消融版权矛盾。
1 图书馆应用文本和数据挖掘技术的版权障碍
1.1 文本和数据挖掘引发新的版权利益摩擦
如果文本具备独创性,就受到版权法的保护。但是,在传统版权制度中,“数据”并不是版权保护的客体。然而,当把数据按照既定的原则挑选出来,依据相关的方法聚合在一起时,这种聚合物——“数据库”就由于在数据的“选择”或“编排”方面体现出独创性而受到版权法的保护,尽管这种保护并不涉于“数据”本身。可是,数据库的制作需要实质性投入(人力、物力、资金等),如果其数据任由他人攫取、复制、传播,那么制作者的贡献就无法得到回报,从而减弱发展数据库产业的动力。于是,欧盟在《数据库法律保护指令》中专门设置了“撷取权(Extraction)”“反复利用权(Utilization)”来弥补版权法的不足。版权利益冲突与技术进步相联系,版权制度就是通过控制协调技术的应用,来保护版权。所以,TDM在图书馆的应用必然产生新的摩擦,带来新的法律风险。比如,未经许可挖掘文本和数据,可能侵犯复制权、撷取权、反复利用权;将挖掘的文本和数据聚合提供给用户检索或者进行远程推送,可能侵犯复制权或信息网络传播权;如果图书馆向用户提供被挖掘网站的超链接,可能侵犯信息网络传播权等。图书馆从事TDM不当,除了可能承担间接侵权责任外,还可能承担直接侵权责任。IFLA针对TDM版权问题指出,版权和数据库法律会妨碍图书馆利用资料,影响图书馆的信息服务能力[1]。
1.2 图书馆的文本和数据挖掘例外权利缺失
版权的本质是私人利益与公共利益相互妥协达成的谨慎平衡,从而既保障版权人享有专有权以激励创作,又使专有权向社会适当让渡以满足公众接触和利用作品的诉求,照顾了公共利益。图书馆是公众利益的代言人,是版权让渡的最大受益组织,这是几乎所有国家的版权法专门对图书馆利用作品作出特殊制度安排、提供版权例外权利的原因。比如在美国,把图书馆、档案馆、博物馆等包含于有资格享有其版权法第108条例外之列,一直不受108条款研究小组(the Section 108 Study Group)的争议[2]。然而,目前绝大多数国家的版权法并未对图书馆开展TDM设置版权例外。在此情况下,按照版权使用原理,图书馆就必须将从版权人或者版权中介管理组织“取得授权”当成TDM的前置条件,这不仅对图书馆存在时间与成本的不利益性,而且具有实际的不可操作性。对图书馆适用授权许可存在的弊端,学术界早已多有论述。
1.3 图书馆争取文本和数据挖掘权利的努力
在大数据时代,“数据”作为新兴财富受到版权法的庇佑,无可厚非。但是,如果把数据完全禁锢于“版权围栏”之中,使图书馆等组织不能通过TDM分享数据创造的“红利”,那么不仅版权人会受到版权的“自伤”,而且公共利益必定会有损失。于是,IFLA、LIBER等图书馆联盟开展了维权行动。IFLA发布的《关于文本和数据挖掘的声明》阐述了TDM与图书馆资源建设、信息服务的关系,指出版权法严重阻碍了TDM的应用,限制了数据驱动创新[1]。LIBER在《促进开放科学的声明》中认为,建立TDM版权辖免制度,将明显提高科研成果产出价值[3]。LIBER还针对爱思唯尔(Elsevier)等出版商和欧洲出版商理事会(European Publishers Council,简称EPC)等出版行业联盟的TDM版权政策提出了质疑与建议。影响TDM版权立法是图书馆界维权的另一项重要举措。比如,IFLA在《图书馆和档案馆版权例外与限制条约建议稿(4.4版)》第20条提出了TDM立法建议,目前已被世界知识产权组织(WIPO)“版权与相关权常务委员会”(SCCR)纳入了立法程序。图书馆界的维权效果显著,主要体现为宣传了版权立场,立法努力初见成效,促进部分出版商调整了版权政策等。
2 图书馆界对文本和数据挖掘的版权立场
2.1 有阅读权就应该有挖掘权
“挖掘权”的定位与归属,及其同“阅读权”的关系是版权人和图书馆争论的关键问题之一。版权人认为,“挖掘权”是版权人享有的权利,由版权人专有并控制,而且“挖掘权”和“阅读权”具有分离性,图书馆通过立法或者版权协议获得“阅读权”,不必然意味着同时享有“挖掘权”。图书馆界的观点与此大相径庭,认为“阅读权”和“挖掘权”具有同一性,特别是对于图书馆已经购买或者订阅的数字资源,既然享有了“阅读权”,就自然应该享有“挖掘权”。IFLA指出,如果科研人员和科研机构,或者是通过图书馆提供服务的用户,已经合法地获取数据内容(包括数据库),那么读取的权利就包括挖掘的权利[1]。LIBER认为,有权阅读就有权挖掘[4]。图书馆界的认识与众多科学家不谋而合。比如,英国巴斯大学的罗斯·迈恩(Ross Mounce)教授说:阅读的权利就是挖掘的权利[5]。图书馆界之所以强调有“阅读权”就有“挖掘权”,在于“阅读”和“挖掘”的目的并无区别,只不过TDM是以“计算机为基础的阅读”[1]。加之,如果认可“阅读权”与“挖掘权”是两种不同的权利,那么图书馆就必然要为从事TDM对已经合法获取阅读权的资源进行“二次授权”和“二次付费”。
2.2 授权许可不是合适的方案
对于解决TDM版权问题的政策,版权人主张采取“授权许可”原则。比如,国际科学、技术与医学出版商协会(STM)提出了“TDM样本许可证”,其中包含非商业性TDM的许可示范条款。又比如,Elsevier设计了“一键点击”方案,允许同意授权条款的图书馆从事TDM。把“授权许可”当成解决TDM版权问题主要模式的观点遭到图书馆界的反对。IFLA指出,授权许可不是协调TDM版权矛盾的合适对策,可用于TDM的信息量很大并且多样,远远超过许可授权的能力,且不能一概而论,导致授权许可为主的解决方案不可能实现[1]。LIBER认为,授权许可不具可扩展性,不可能弥合版权制度与TDM现实需求的差距[4]。图书馆的主张对出版商改善版权政策是有所触动的,施普林格出版集团(Springer)、牛津大学出版社、英国物理学会出版公司等出版商已经调整了授权政策,减少对图书馆的限制,爱思维尔(Elsevier)等出版商健全了授权机制,扩大了授予图书馆的挖掘权利范围。
2.3 版权例外制度是最佳选择
国际图书馆界对TDM最重要的版权立场就是主张建立合理使用制度,赋予图书馆应用TDM技术的例外权利。IFLA指出,TDM的合法性必须靠法定例外得以实现[1]。LIBER则希望创新版权法来满足TDM需求的例外[6]。图书馆电子信息联盟(EIFL)认为,过于严苛的法律无助于解决图书馆与版权人在文本和数据挖掘问题上的摩擦[7]。虽然,版权人极力反对为TDM建立合理使用制度,但是立法终究在争议中迈出了重要的步伐。2014年,英国政府按照英国著名学者哈格里夫斯(Hargreaves)在《数字化机遇:知识产权与经济增长报告》中提出的建议,结合图书馆、档案馆、教育组织的诉求,实施了修订后的《版权与表演权(研究、教育、图书馆与档案馆)条例》,其第29A条规定了非商业性的TDM例外。英国对TDM的立法,为图书馆开展非商业性的TDM提供了例外权利[8]。因此,受到英国图书馆界的积极赞赏与评价,英国图书馆与档案馆版权联盟(LACA)表示将认真梳理这些对图书馆有重要影响的新变化。
2.4 排除法定权利的合同无效
对任何从事TDM的行为都实行版权例外并不符合利益平衡原则,也不满足《伯尔尼公约》《与贸易有关的知识产权协议》《世界知识产权组织版权条约》规定的设置例外条款的“三步检验法”。所以,即便是立法为TDM设立了适度的版权例外规定,图书馆对合理使用范围之外的TDM仍然要被纳入授权许可的轨道。特别是在TDM版权例外制度尚未得到世界各国、各地区普遍立法时,图书馆开展TDM只能走授权许可的道路(对公有领域文本和数据的挖掘除外)。但是,如果版权人把合同当成垄断版权的工具,借助版权法关于契约适用优先的原则,要求图书馆接受其提出的不合理条件,合同就可能削弱甚至于排除图书馆的合法权利。比如,STM认为,出版商应该从自己的商业战略和经济模型出发来设计和提供TDM许可条款。显然,版权人企图向图书馆许可的并不是“版权”,而且“版权协议”。IFLA指出,只要TDM的结果无法替代原作品,就应排除与法律相悖的合同的法律效力[1]。这种观点得到立法的认同。英国修订后的《版权与表演权(研究、教育、图书馆与档案馆)条例》第29A条规定“任何限制和排除文本和数据挖掘的合同条款不具有执行力”。这样,英国图书馆可以放心适用TDM例外规定,而不必担心合同的制约。
3 我国图书馆界的对策
3.1 广泛宣传图书馆的观点
影响并推动立法朝着有利于社会整体利益的方向发展是图书馆的责任。但是,面对强大的版权利益集团,图书馆需要寻求来自全社会力量的支持。为此,图书馆必须广泛宣传自己的版权立场,赢得社会共识,形成舆论导向。由于版权立法关乎公众利益,所以公众愿意与图书馆携手促进立法变革,只是不了解图书馆的主张,更不知道怎样与图书馆合作。加拿大图书馆协会(CLA)主席肯·罗伯茨(Ken Roberts)指出,公众毫无疑问地关心版权政策,渴望在整个社会获取知识有相应的规则保障[10]。2012年7月,在世界知识产权组织(WIPO)“版权与相关权常务委员会”(SCCR)第24次会议上,TDM版权例外立法建议之所以被写进立法讨论文件,就在于IFLA做了大量广泛而且深入的宣传工作,争取了17个民间团体共同参与。2005年和2012年,中国图书馆学会、上海图书馆学会等针对我国《信息网络传播权保护条例》立法以及《著作权法》第三次修订,发布了《关于网络环境下著作权问题的声明》和相关的立法建议,但是其内容除了图书馆界和立法机关外,甚少被社会知悉,呼声微弱,不足以对立法构成影响,这是图书馆界诉求未能在立法中充分体现的重要原因之一。
3.2 积极推动国内版权立法
随着经济、技术和社会的发展,各国版权制度面临着创新的重大任务。其中,版权例外制度的问题最多,改革的呼声尤其迫切[11]。近年来国际社会掀起的新一轮版权法改革浪潮,就是要使版权制度特别是合理使用制度能够适应新形势的发展。目前,除了英国之外,德国在“谷歌法”中豁免了搜索引擎和新闻聚合服务提供商展示短小片段之TDM的侵权责任,澳大利亚、爱尔兰等国家在版权改革草案中也加入了对TDM版权例外立法的建议[12]。2012年7月,我国启动了《著作权法》第三次修订议程,这为版权制度跟上数字时代创造了契机。我国应借鉴英国、德国等国家的立法实践与经验,密切结合国情,按照《世界知识产权组织版权条约》第10条关于数字版权“限制与例外”设置的原则,组织力量对TDM版权问题深入调研,适时立法。因为,TDM的立法不只是理论或者技术问题,而是与国家竞争力的强弱有内在联系。正如英国联合信息系统委员会(JISC)指出的:如果不能对信息资源广泛开发,英国将在国际竞争中严重落后于重视与鼓励文本和数据挖掘技术应用的竞争对手[13]。
3.3 不断提高版权管理水平
在我国目前的版权制度框架内,图书馆还没有从事TDM的例外权利,这就更应该注重对使用版权行为的风险评估,提高版权管理的科学化、规范化。一方面,要健全版权政策。EIFL的《关于制定图书馆版权政策的建议》、ARL的《ARL白皮书:授权许可的趋势》等可以提供这方面的借鉴。建议中国图书馆学会图书馆法律与知识产权研究专业委员会制定TDM版权指南,为图书馆版权实践提供指导。另一方面,要加强图书馆员版权素质的培养。对此问题,国际图书馆界有许多经验可以学习。比如,美国图书馆协会(American Library Association,简称ALA)出版的《K—12馆员与教育工作者版权完全手册》《完整的版权:K—12图书馆员与教育者日常指南》,探讨了图书馆工作、教育活动遇到的复杂版权问题。又比如,图书馆与信息专业人员协会(Chartered Institute of Library and Information Professionals,简称CILIP)建立了“版权和信息法网站”(Keep Within the Law),宣传版权法,列举释读相关案例,为图书馆提供版权建议。还比如,EIFL与哈佛大学伯克曼互联网与社会研究中心合作开设了联机开放课程“版权与图书馆员”。为了对图书馆员的版权管理能力进行认证,美国克里克(Click)大学为通过版权教育、考试合格的美国专业图书馆协会(SAL)的部分会员颁发了“版权管理资格证书”(CM:Copyright Management)。
3.4 合作解决授权许可难题
大英图书馆知识产权主管本杰明·拜(Benjamin White)认为,版权法的变化不是一个“零和游戏”的局面——有赢家就有输家[9]11。图书馆与版权人的博弈是一种合作性博弈,目的是为了获得“双赢”。其实,图书馆版权领域的诸多问题并非通过立法与司法得到解决(即便对相关问题有法律规定),而是磋商机制起到了消融分歧的关键作用。目前,合作解决TDM版权问题的努力已经初见成效,这既体现为在图书馆界的影响下部分出版商对版权政策的调整,还表现为除了图书馆、版权人之外,更多的主体参与到协调TDM版权冲突的过程中来。比如,版权结算中心(CCC)正在与施普林格出版集团(Springer)合作,由Springer提供期刊内容,建立兼容的XML内容来源,供用户挖掘使用。Springer市场和数据库部门经理贝蒂娜·戈纳(Bettina Goerner)指出,这个项目是一次深度创新,初衷是推动终端用户的科学研究[14]。由于我国对TDM版权立法滞后,法律依据缺失,合作将在协调相关的版权利益冲突中发挥更加重要的功能,图书馆界应予以重视和实践。
[参考文献]
[1]国际图联关于文本和数据挖掘的声明[EB/OL].王微,编译.[2015-07-12].http://Copyright.las.ac.cn/news/.
[2]陈传夫,符玉霜.国际图书馆版权政策及我国新一轮版权法修改建议[J].图书与情报,2009(5):11—18.
[3]LIBER发布促进开放科学的声明[J].张梦霞,编译.图书情报工作动态,2014(10):16—17.
[4]LIBER回应Elsevier的文本与数据挖掘政策[EB/OL].王 微,编译.[2015-07-12].http://Copyright.las.ac.cn/news/.
[5]Elsevier更新文本挖掘政策以改善研究人员的获取状况[EB/OL].史双青,编译.[2015-07-12].http://Copyright.las.ac.cn/news/.
[6]LIBER和LERU反对欧洲出版商协会TDM版权政策[EB/OL].杨秀云,编译.[2015-07-12].http://Copyright.las.ac.cn/news/.
[7]著作权与图书馆:当前议题[EB/OL].王 微,编译.[2015-07-25].http://Copyright.las.ac.cn/news/.
[8]徐 轩,孙益武.数据挖掘版权政策构建研究:研究型图书馆的立场[J].图书情报工作,2015(10):34—40.
[9]Benjamin White.大英图书馆知识产权主管谈英国著作权法的改变及其产生的影响[J].胡 芳,编译.图书情报工作动态,2014(5):9—11.
[10]Facebook版权所有制规则的转变表明大众对数字世界的关心[J].张红丽,编译.图书情报工作动态,2010(1):26.
[11] 赵湘乐,杨 辉.数字时代下的著作权例外——以英国知识产权立法改革为视角[J].电子知识产权,2012(9):52—59.
[12]王 清.国际版权法律改革动态概览[J].电子知识产权,2014(5):56—63.
[13]胡开忠,赵加兵.英国版权例外制度的最新修订及启示[J].知识产权,2014(8):73—78.
[14]Springer和著作权结算中心合作加强文本与数据挖掘解决方案[EB/OL].刘晶晶,编译.[2015-07-25].http://blog.sina.com.cn/s/blog.c2cbooldold102v1m.html.
[收稿日期]2015-10-13
[作者简介]侯玉玲(1980—),女,新乡学院图书馆。