APP下载

休眠数据的数据创新与知识产权保护

2018-01-29

图书馆研究与工作 2018年9期
关键词:弹性知识产权主体

(四川大学图书馆 四川成都 610041)

1 引言

数据创新与知识产权保护是大数据时代背景下所面临的两大重要内容。由于国内具有价值的数据大多散落在各级政府、医院、科研院校以及其他行业并相互独立,形成了信息孤岛,从而产生了暂时搁浅的休眠数据,这些数据不仅单项价值巨大,多重数据的整合开发更能发挥出巨大潜能。休眠数据是指已经存在于数据库中、当前并不使用、将来有可能使用的数据,这种数据随着时间延长而积累蔓延[1]。也有学者认为休眠数据是指数据价值被特定主体利用殆尽之时,只是这些数据的某一方面用途的价值被使用,并不意味着这些数据没有其他任何价值,可能由于主体或主体数据需求的改变,可能由于数据技术的发展,也可能由于其关联数据的出现,使其成为非常有价值的数据或者数据集合[2]。而如何将大量具有潜在价值的休眠数据进行再利用或重组创新,以及相关知识产权保护问题对传统知识产权法提出了怎样的要求,都亟需进一步探讨和分析。

2 休眠数据的数据创新

休眠数据的数据创新是将已经存在于各种数据库中的不经常被使用或不被挖掘,但是具有一定潜在价值的数据,通过重组或整合等方式释放,从而使数据的潜在价值得到充分体现。

2.1 数据再利用

海量休眠数据的潜在价值巨大,其数据再利用的不同环节和不同阶段都蕴含着重大的商业性价值,并能促使产品增值以实现新的价值创造[3]。休眠数据再利用的典型例子是通过大数据技术搜索关联数据,使主体和客体数据之间瞬时交互形成关联列表,使数据中隐藏的价值得以实现。例如,京东商城将顾客在网站内的所有浏览轨迹都通过机器人系统自动记录下来,根据不同的数据特点进行自动分类并分析处理,按照商品类别形成不同的推荐栏目,从而为客户提供个性化的服务;携程网对机票价格与机票预定时间二者销售数据之间的关系进行了分析,以预测未来一段时间机票价格的走势。

2.2 数据重组

休眠数据有时需要通过与另一个毫无相干的数据集结合,其价值才能被激活变得有意义,即用一种用户自己特定需要的方式根据不同的创新要求混合这些数据——数据重组。例如,广州军区广州总医院在2013年对手机辐射是否可增加大脑神经胶质瘤风险进行了研究,其中手机用户以中华人民共和国工业和信息化部统计数据其中一部分(2 750人)为例,与此同时,选取胶质瘤患者2 630名作为参照对象,结合两个数据集研究后发现二者并没有任何的直接关系。总之,随着大数据时代的到来,两个或多个数据源重组再利用的总和比部分数据更加有价值。当我们将多个独立数据集合的总和重组在一起时,重组总和本身的价值比单个数据总和更大。

3 大数据时代中的知识产权

大数据时代,创新主体对休眠数据的分析和挖掘以及重组再利用是通过对数据的抓取、分析与加工等手段得到新的数据集信息。但是这一过程中同时又产生了新的问题,即原有数据创造者的权利维护(即知识产权)与创新主体现有权利的拥有该如何界定和分配,对传统的知识产权法提出了更高更精准的要求。而传统意义上的知识产权是指人们就其智力劳动成果所依法享有的专有权利,通常是国家赋予创造者对其智力成果在一定时期内享有的专有权或独占权[4]。知识产权从本质上说是一种无形财产权,其客体是智力成果或者知识产品,是一种无形财产或者一种没有形体的精神财富,是创造性的智力劳动所创造的劳动成果。

3.1 新特征

传统的知识产权简单来说具有3个特征:专有性、地域性、时间性。大数据时代又重新赋予了知识产权新的特征:其网络资源相对于传统文字资源有着自己独特的特征。①数字化、网络化,这是网络信息资源的基本特征;②信息量大,种类繁多;③信息更新周期短;④资源庞大,开放性强,信息资源不受地域限制,任何联网的计算机都可以上传和下载信息;⑤组织分散,没有统一的管理机制和机构。而黄立芳提出数据产权这一概念,即数据开发者对合法获得的共有或专有领域的数据,通过抓取、分析、加工、处理等智力劳动获得的数据或数据集所拥有的人身权和财产权[5],也是对大数据时代背景下知识产权的补充。

3.2 新挑战

海量休眠数据经过数据重组或整合等方式加工处理后成功创造出新的数据集合或数据集,即数据创新。这些创新数据既可以作为评价科研机构产出水平的数据,也可以通过在商业领域、银行、商户之间的交易记录和凭证预测消费者消费倾向[6]。李学龙、龚海刚依据目前大数据分析的主要领域将大数据生成的来源划分为科学数据、商业数据和互联网数据3种类型[7]。无论是严谨的科学数据、热点的商业数据还是自然语言处理的互联网数据,都存在暂时被搁置的具有潜在价值的休眠数据。这些休眠数据经过进一步挖掘、加工、分析与整理需要新的知识产权政策支撑,是否会侵害到原有数据创造者的合法权利,是否对重组的结果给予合理的保护,这些都使得原有知识产权保护面临新的挑战。

4 大数据时代背景下数据创新与知识产权保护冲突与协调

4.1 数据创新与知识产权保护冲突分析

数据创新强调利用数据挖掘(包括关联规则学习、聚类分析和分类分析等[8])与知识发现(是指从数据中识别出有效的、新颖的、潜在有用的、最终可理解的模式过程[9])等大数据技术对具有潜在价值的休眠数据进行重组与整合,而创新的过程就是知识产权的应用和获得过程。数据的二次利用涉及源数据隐私及商业机密的知识产权保护问题,其产权的保护与归属不仅是相关原有主体间的利益分割问题,更是创新主体持续发展和掌握竞争主动的重要支撑,所以知识产权保护与归属是数据创新的关键所在。在创新过程中,创新主体需要投入优势资源和秘密技术等,同时围绕一项产生的知识产权有很多利益主体,所以知识产权对于数据创新主体更多的是约束而不是激励和促进,这在一定程度上阻碍了创新主体的创新积极性。只有数据创新各方面的利益达到均衡保障,创新主体的潜力与优势才能充分发挥,数据创新活动才能顺利开展。

4.2 营造鼓励数据创新和知识产权保护的相关法律环境

如何平衡各创新主体之间新的利益格局以及使知识产权法律规则更具弹性,是在大数据时代环境下所面临的新的要求。笔者认为上述问题可以简化为两个名词:“平衡”与“弹性”。

(1)平衡。在新的背景下,休眠数据的重新整合以及利用知识产权法对原有数据资源的控制,导致知识产权法的发展必须在更广阔的空间内的各种利益之间进行平衡。一方面,海量休眠数据再利用使得知识产权保护成为一个迫不及待的问题,因为数据的二次利用涉及大量知识产品,而创新主体所生产的本身就是知识产品,如果缺乏法律意义上的知识产权保护,技术的发展就会受到限制,数字化进程就会遇到障碍;而提高知识产权保护标准又可能束缚科技的发展。另一方面,数字化带来的利益冲突是数据创新获得的利益是否受到知识产权的保护,如果应受到保护,保护的范围有多大,与原专利权团体之间的关系又该如何处理。因为新专利可能会侵害到原专利权人的权利,一旦受到保护之后,原专利权人的权利又该受到何种保护,同时对于重新组合的产品,法律风险已经被规避,但是对原专利权人造成的损失又该如何处理[10]。

(2)弹性。弹性与平衡相辅相成,各种利益需要在更广泛的空间内保持平衡,因此就得充分保持法律法规的弹性。就数据创新主客体而言,弹性的需求是显而易见的。因为协调创新主客体之间知识产权的法律法规,而协调本身不可能统一,因此妥协就不可避免,而妥协本身也就意味着弹性,只有更具弹性的法律法规才更具有广泛性。过分原则的法律法规会导致规则范围内所追求的目标无法实现[4]。在大数据时代,弹性这一要求表现得尤为突出,具有恰当弹性的知识产权法律法规,不仅可以使知识产权法能够更好地适用各种新技术所带来的法律问题,又可以使创新主客体之间清晰地理解相关规范。

5 结语

大数据时代,数据创新越来越受到密切关注,且成了新的利益增长点和竞争力,而休眠数据的二次利用并重新释放它的能量,为创新主体注入了新的活力。但如何平衡数据创新与知识产权保护的利益点是科学研究的重要课题。本文初步探析了二者之间的平衡点,为以后的研究打下基础,至于如何建立二者冲突与协调机制,有待于进一步研究。

猜你喜欢

弹性知识产权主体
为什么橡胶有弹性?
为什么橡胶有弹性?
论自然人破产法的适用主体
注重低频的细节与弹性 KEF KF92
弹性夹箍折弯模的改进
重庆五大举措打造知识产权强市
关于知识产权损害赔偿的几点思考
关于遗产保护主体的思考
论多元主体的生成
知识产权