大数据出版与版权保护初探
2017-03-21周平
周平
摘要:大数据出版形式与传统出版形式有很大的区别,随着技术的发展,大数据出版已经成为未来出版的趋势之一,将成为出版社的核心竞争力。本文分析了大数据出版模式的特点,提出完善元数据记录是大数据出版版权保护的关键,同时需要注意其他的著作权相关问题。
关键词:大数据出版最小数据元数据版权保护
根据我国的《著作权法》的规定,出版包括报纸出版、期刊出版和图书出版。报纸和期刊出版,作者与报社或者期刊社不需要签订书面合同;图书出版,作者或者著作权人需要与出版社签订出版合同,情况相对复杂。为行文方便,本文中的大数据出版仅讨论出版社的大数据出版相关问题。
一、大数据出版模式
大数据出版就是指将大量的出版物转化为可制表分析的量化形式,并通过建立数据库使信息产生相关关系的过程。根据块数据的处理流程,即采集、预处理、挖掘及分析、解读与显化来看,大数据出版也具有类似的过程。从传统出版来看,作者将撰写好的书稿交给出版社,经出版社编辑加工、版式设计后印刷,装订成册,成为单册书或系列丛书,其内容和发行数量都是有限的。
由于我国的出版体制,相当多的一些出版社专业化分工经营了数十年,积累了大量出版物,为大数据出版提供了相当丰富的内容资源,但这是一些一直在沉睡的块数据。如何唤醒这些沉睡的数据信息,对数据的再利用、数据的重组和扩展都是大数据出版所要解决的问题,也是出版社的核心竞争力。充分利用它们的价值,是相关出版社的发展机会。目前有的出版社正在做的工作是,选择一部分出版物进行数字化、碎片化,成为数据化资源,在此基础上通过大数据出版技术形成一种新的出版物。
大数据的特点是“要利用所有的数据,而不再仅仅依靠一小部分数据”,这使得一个大数据出版物不可能由少数作者完成,它肯定涉及大量的作者。有的数据有作者,是某个自然人的创造性活动;有的可能由机器采集,比如地理信息或某个固定摄像头采集的视频数据等。自然人创作的内容数据涉及版权问题,在下文会进一步讨论;而机器采集的数据不涉及版权问题,在此不予讨论。
二、最小数据和元数据
(一)最小数据
对于大数据出版物来说,不管它的规模多大,都是由一些基本的数据单元组成,这个数据基本单元,尚未有一个统一的说法。有学者提到了一个“最小数据集”的说法,可以应用到大数据出版中。也就是说大数据出版中每一个独立的数据,或者说最后抽取集成并呈现的最小数据集中的独立的一个单元是“最小数据”。
由于大数据用户通过检索阅读获得的可视化内容是一个数据集,这个数据集很可能是由不同来源的最小数据组成,那么每一个最小数据便是一个非常值得研究的单元了。
出版社要解决的问题是定义或处理每一个最小数据,这也是出版社的价值所在:第一是它的内容,这个是用户(读者)最关心的问题,内容是否适用;第二是它与其他数据的关系,也就是说,如何根据大数据出版选题的编辑思想来确定某个最小数据的内容以及与其他数据的有机衔接,体现出版社的编辑水平和编辑价值;第三是它的著作权人信息。这三点构成了某个最小数据的基本内容。
(二)元数据——出版内容的可靠性和合法性基础
元数据是关于数据的数据,它描述了各种形态的数据内容的特征和属性,同时,这种描述是遵守一定规则和标准的,它被认为是大数据出版的根基。
元数据自始至终记录内容对象各个阶段的信息,体现出管理功能;而且,元数据记录的管理信息是不可以被篡改和删除的,以确保内容对象的真实性、准确性和可靠性。元数据还可以充分描述内容对象各个阶段的平台信息,为数据的迁移、长期应用提供保障。此外,用户在使用大数据出版物时,每次使用或阅读时会留下电子痕迹,技术上可以记录每个最小数据的抽取(阅读或使用)次数,以此为依据进行收费,其中的一部分就是向著作权人支付的报酬。
由于元數据的这个特点,它对版权保护就显得尤为重要:因为它记录了数据的来源、版本信息、著作权人信息。所以,出版社在进行数据化编辑时必须重视规范元数据,以保证大数据出版物中内容的可靠性和合法性。
三、大数据出版所涉及的版权问题
各个专业出版社通过多年的发展,已经积累了大量的出版数据资源,某一专业领域的大数据的选题出版已经成为可能。但在现有的著作权法框架下,大数据的出版还需要解决版权问题。
著作权法对作品的著作权规定了保护期,超过保护期的作品,出版社在进行大数据出版时,没有需要授权的障碍。
出版社对著作权保护期未届满的作品的使用,主要涉及三个方面的问题:一是出版合同对大数据出版的影响,二是著作权人发生变化对大数据出版的影响,三是对其他出版社出版图书的使用障碍。
(一)出版合同对大数据出版的影响
实践中,出版社与著作权人签订出版合同,出版社使用作品的方式会在合同中具体约定。比如:“甲方(著作权人)授予乙方(出版社)在本合同有效期内享有在世界各地以图书及数字化形式出版(包含纸质图书出版、互联网出版、电子出版、无线出版)上述作品文本的专有使用权。”此项合同条款可以理解为:出版社对作品进行编排、版式设计以纸质图书的形式出版;“互联网出版、电子出版、无线出版”是将图书内容数字化,电子出版只是媒介发生了变化,比如其载体由纸质变成了电子阅读器;“互联网出版”“无线出版”是指出版社就出版的图书获得了信息网络传播权。只有获得信息网络传播权,才可以进行大数据出版。
出版合同通常不超过10年。在合同有效期内,出版社可以将已经出版的图书内容汇集起来,进行大数据出版。出版合同期满,合同中约定的著作权人许可出版社行使的各项权利相应终止。在作品的著作权保护期仍未届满的情况下,就大数据出版而言,如果出版社想要将此部分数据资源合法地继续置于其数据库中,就必须重新获得著作权人的授权。未经授权,出版社应将此部分内容从其数据库中移除,否则构成对著作权人著作权的侵犯。
(二)著作权人发生变化對大数据出版的影响
根据《著作权法》第25条的规定,著作财产权可以通过合同约定进行转让。著作权的转让导致著作权人发生变化。虽然权利转让不需要经过出版社同意,但应当通知出版社,以便在元数据中及时更新著作权人信息,将作品使用过程中著作权人应该获得的报酬及时交付给著作权人。
因作者死亡而发生继承,导致著作权人发生变化:作者死亡后,其著作财产权并不因作者的死亡而终止,其财产权由继承人继承并享有,直至著作财产权的保护期届满。如果继承人死亡时,著作财产权的保护期限仍未届满,则由继承人的继承人继承而成为新的著作权人。
著作权属于法人或者其他组织的,当法人或者其他组织终止时,著作权由承继的法人或者其他组织享有。
由以上可以看出,一个作品的著作权人有可能不断发生变化,元数据中应当对著作权人的变化有完整的记录,以保证著作权人利益,同时也是为了减少纠纷,使大数据出版健康发展。
(三)对其他出版社出版图书的使用障碍
大数据出版要体现其大,在内容上要尽可能全面。这样,对某个出版社来说,自己已有的图书资源就显得不够,需要按编辑的整体构想收入其他出版社的相关图书内容。2015年3月23日,国家新闻出版广电总局《关于开展专业数字内容资源知识服务模式试点工作的通知》,要求相关专业出版社之间进行自愿协作。
在现行《著作权法》的框架下,整合其他出版社的图书进行大数据出版,存在一定的法律障碍:《著作权法》第30条规定出版社对图书出版享有专有出版权,这意味着某出版社在整合吸收其他出版社相关图书资源时,会直接违反现行《著作权法》关于专有出版权的规定。有观点认为,著作权人与出版社签订出版合同,双方有权在合同中约定出版社是否享有专有出版权,而不必由法律直接规定出版社享有专有出版权。著作权法第三次修改也注意到了这个问题,在《著作权法》(修改草案送审稿)中采纳了这一观点,删除了出版社直接享有专有出版权的规定,修改为:“合同中未明确约定许可使用的权利是专有使用权的,视为许可使用的权利为非专有使用权”“合同中约定许可使用的方式是专有使用权,但对专有使用权的内容没有约定或者约定不明的,视为被许可人有权排除包括著作权人在内的任何人以同样的方式使用作品。”这一规定意味着:第一,著作权人可以同时与不止一个出版社签订非专有出版合同;第二,即使著作权人与一个出版社签订了专有出版合同,也可以通过合同约定许可出版社实施分许可,即授权享有专有出版权的出版社许可其他出版社出版其图书。如果送审稿这一规定获得通过,则相关出版社协作进行大数据出版的障碍即可消除。
参考文献:
[1]大数据战略重点实验室 块数据——大数据时代真正到来的标志[M] 北京:中信出版社,2015
[2][JP3]凯文·凯利 失控——全人类的最终命运和结局[M] [JP]东西文库译 北京:新星出版社,2010
[3]涂子沛 大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活[M] 桂林:广西师范大学出版社,2014
[4]李明德,管育鹰,唐广良《著作权法》专家建议稿说明[M] 北京:法律出版社,2012
[5]周怡,胡大卫,段学俭,等 元数据:数字出版发展的根基[J]编辑学刊,2011(5)
[6]张振宇,周莉“大数据出版”的理念、方法及发展路径[J]出版发行研究,2015(1)