大数据应用中数据确权问题探究
2015-12-26杜振华
杜振华
(北京邮电大学,北京 100876)
大数据应用中数据确权问题探究
杜振华
(北京邮电大学,北京 100876)
随着大数据时代的来临,数据的潜在价值正在被开发和利用。而数据的确权关系到数据市场的发展和数据价值的开发利用问题。文章从数据的所有权、使用权和隐私权方面探讨了数据确权的重要性,特别强调了对隐私权的保护对于大数据产业发展和造福于社会的重要意义。
大数据 数据所有权 数据使用权 数据隐私权
1 引言
随着信息技术的进步,云计算使海量数据存储和处理成本不断降低,引发了人们对大数据潜在利益的关注,同时也触发了数据的流通和使用。从2008年开始,大数据交易市场如“数据市场”、“数据银行”等开始出现。“数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍能不断给予。它的真实价值就像漂浮在海洋中的冰山,第一眼只看到冰山一角,而绝大部分都隐藏在表面之下。”[1]当然,也有人将大数据比喻成“21世纪的石油”或“金矿”、“煤矿”。总之,无论比喻成什么,大数据已成为信息社会离不开的资源,成为一切行业中决定胜负的根本因素。美国在2012年就已将“大数据战略”上升为国家战略,并投资2亿美元拉动大数据相关产业发展。
目前,互联网上的数据每年以50%的速度增长,据IDC预测,到2020年全球将总共拥有35ZB的数据量。大数据可以不断地被挖掘和利用,其使用价值变得比以往任何时候都更加重要。这种使用可以为数据使用者开掘出永不枯竭的财富源泉。“如今,数据已经成为了一种商业资本,一项重要的经济投入,可以创造新的经济利益”[1]。数据作为资源,其流通和应用必然涉及到数据的所有权、使用权和隐私权问题,因此,数据的确权在大数据时代尤为重要,关系到大数据的开发、利用以及产业创新和社会福祉问题。
图1 数据的开发与利用过程
图2 依托英国政府数据平台进行创业的企业
2 大数据时代的数据所有权
数据确权,主要是确定数据的权利人,即谁拥有对数据的所有权、占有权、使用权、受益权,以及对个人隐私权负有保护责任等。北京大数据交易服务平台从大数据交易角度提出了数据确权内涵。认为数据确权是为明确数据交易双方对交易数据在责任权利等方面的相互关系,保护各自的合法权益,而在数据权利人、权利性、数据来源、取得时间、使用期限、数据用途、数据量、数据格式、数据粒度、数据行业性质和数据交易方式等方面给出的权属确认指引,以引导交易相关方科学、统一、安全地完成数据交易。按照1996年欧共体“数据库保护指令”,数据产权被认定为是一种特殊的权利。据相关部门预测,未来三年内,我国大数据市场将以每年超过60%的速度增长,预计到2017年市场规模将达到37.9亿美元[2]。
大数据交易平台的建立,沟通了大数据供求双方的信息,为开发利用大数据、实现创新提供了保障。但在大数据交易平台上交易所遇到的数据确权问题,关系到大数据市场今后的健康发展和数据应用。
数据是产生信息的源泉,是人们获得新的认知、创造新的价值的源泉。数据只有使用价值,没有价值。只有通过对数据进行去粗取精、去伪存真、由此及彼、由表及里的加工制作和提取,形成信息才具有价值。但信息在时间效用失效后,其价值开始衰减,而可对信息进行进一步的归纳、演绎和挖掘,使有价值的高度活性信息和提炼的系统信息沉淀下来,最后转变成知识(如图1所示[3])。而大数据恰恰为信息和知识的产生提供了不竭之源。
数据的开发和利用,伴随着数据使用权的转移,而数据的所有权几乎不变。根据大数据产生的来源以及收集和占有的情况,可分为政府的数据、企业的数据和个人的数据这3个方面。
2.1 政府数据的所有权
政府是拥有社会信息最多的机构。出于政府履行职能的需要,政府几乎采集和拥有社会经济发展的全部基础的原始数据,它们分散于政府的各个部门中,为各个部门所拥有。这些数据作为社会公共资源,除小部分出于国家安全需要必须保密外,大部分都向社会免费开放。一般来说,数据开放程度与其被利用的价值成正比。企业、大专院校及科研人员等不断地运用政府数据进行信息开发和知识创造与创新的活动。大数据的信息积淀,借助于云计算的处理能力,新的价值不断被发现,价值不断增值。图2为依托英国政府数据平台进行创业的企业。目前世界许多国家政府部门和公共事业部门的数据都免费向社会开放,欧美国家的政府和公共事业部门更是如此。美国政府筹建了一个data.gov网站,核心就是实现政府机构的数据公开,从而使政府公开透明,截至目前已经开放了91 054个数据库。2015年5月贵阳国际大数据产业博览会《大数据贵阳宣言》提出,大数据是全人类共同的资源和财富,“政府数据开放是全球共同的目标和责任”。建立全球性的大数据交易市场是经济发展的必然要求。
2.2 企业数据的所有权
信息、物质和能量共同构成人类社会生存和发展的三大资源(如图3所示)。随着信息技术的进步,人类对物质与能量资源的依赖相对减少,对信息资源依赖则不断增加。
图3 资源三角形
图4 各种数据关系图[4]
进入信息社会后,企业出于创新的需要对信息资源的投入越来越多,大数据是信息的主要来源。而大数据只被一部分企业所拥有,如电商、社交网站、金融机构、电信行业、铁路部门、供水供电部门等(如图4所示)。大部分企业不拥有大数据,但又急需要通过数据挖掘来获得企业的发展,如目前正致力于与信息产业深度融合的传统制造业企业等。随着互联网对社会经济生活的渗透,云计算技术的发展,那些原本很难收集、存储、处理和加工使用的庞杂数据,其巨大的潜在价值开始被发现,进而发掘出有价值的信息,通过各行各业的不断创新,将大数据的潜在价值转化为实际利益。拥有数据所有权的企业,具有数据使用控制权、收益索取权,也拥有销毁或修改及复制数据的权利。因此,数据对于企业来说,就好比是取之不尽用之不竭的最原始的矿藏资源,其使用的机会成本为零和边际拥挤成本为零的特点,使其可以不断被重复利用而不断发掘出新的信息;拥有数据的企业不仅可以自己挖掘利用,也可以通过买卖进行交易流通,使数据发挥更大的效能,给自身带来更大的利益。
3 数据的使用权
有价值的信息埋藏于大数据资源之中,只有通过分析、挖掘和探究,才能发掘出有价值的信息,才能将潜在的价值变为现实的价值。数据的价值不限于某一特定的用途,它可以被多次使用,也可以以其他目的被使用。但大数据只有通过流通才能转移到最能发现和挖掘其内在价值的人的手中,因而就需要有大数据市场便利数据供求双方的买卖或交换。与其他资源不同的是,数据资源的使用权比所有权重要。
今天数据积累的速度远远超过数据被处理和被利用的速度。2013 年全球产生的数据中只有大约5%的数据被分析应用(IDC)。照目前数据产生的速度来看,预计到2017年,全球又会积累超过4倍于今天的数据量。因此,数据能被分析、处理和应用变得比以往任何时候都重要。
3.1 政府数据的使用权
各国政府和国际组织,都有向社会免费开放的数据库。作为政府开放的数据,由于具有纯公共产品的性质,具有非竞争性与非排他性,同时又具有正外部效应,人们在数据资源的使用上绝不会出现物质资源那样的“公地悲剧”。因此,从某种意义上说,政府数据的使用权属于全社会。
政府数据开放作为政府的责任,实际上是提升整个社会对于数据资源的充分利用性,从而减少对物质和能量资源的消耗。通过开放政府数据,能够向用户提供具有高速数据读取和实时分析服务的大量平行数据库,允许数据科学家和产业分析师对大数据进行管理和分析。政府数据开放也有利于提高政府透明度,加强公众对政府的监督,提升政府治理能力和效率,促进社会创新,提高整个社会的福祉。
3.2 企业数据的使用权
企业所拥有的数据通常被视为附属于企业经营核心的一部分,或被归入知识产权的类别,而在大数据时代,所有的数据都是有价值的。企业数据不具有竞争性但具有排他性,不能免费与其他企业或社会成员共享,只能通过数据市场供求均衡决定的价格来出售。麻省理工学院计算社会科学家阿莱克斯•彭特兰(Alex Pentland)说:“这些数据是新的资产。人们希望它是流动的,而且能为人所用。”维克托·迈尔-舍恩伯格在《大数据时代》一书中通过许多例证,用来说明在大数据时代要用大数据思维去发掘大数据的潜在价值,关键是寻找“一份钱两份货”。
由于数据可以无限复制、无限共享,数据的流通和使用也不会减少其价值,数据库制作者或数据所有人可以在与数据分离的情况下继续获取利益,这使得数据产权的关注点不再是数据的实际控制和占有,而是数据的流通与使用。数据的利用率越高,数据给其所有者带来的利益就越大;当然,也会给其使用者带来更大的利益。百度、腾讯、阿里等拥有数据的企业,纷纷针对自身的平台用户提供数据分析业务,并且向金融、环保、交通、医疗等行业的数据分析应用逐渐渗透。目前也有一些企业帮助有数据的企业利用它,比较典型的是IT咨询和服务企业,如埃森哲、IBM等,把大数据作为一种产业,这种产业实现盈利的关键在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
4 数据的隐私权
大数据时代,若使数据能够在世界范围内流通,发挥最大的效能,就必须解决数据的隐私权与使用权之间的矛盾问题。许多数据特别是企业数据与个人信息相联系,个人数据是与个人相关联的各种数据被采集后,可由本人授权给第三方进行处理和使用,并获得第三方提供的数据服务。个人数据主要包括用户行为数据、用户消费数据、用户地理位置数据、互联网金融数据、用户社交等UGC(User Generated Content,用户原创内容)数据和基因组信息等,个人用户留下的各种痕迹被企业收集储存起来,这一切都涉及到个人隐私问题。
从各国的实践看,大数据分析技术正在开启高效利用数据的大门,但隐私问题却成为阻碍其发展的最大障碍。以往,全球范围的隐私规范都让人们自主决定是否、如何或经由谁来处理他们的信息。而大数据时代,数据的价值很大一部分是从二级及以上的应用中开发出来的,数据不断被转手和使用。因此,使用数据的企业就要为保护个人隐私承担责任,对涉及个人的数据利用行为进行风险评估,规避或减少潜在伤害,确保个人免受无妄之灾。2013年世界经济论坛发布的《解锁个人信息的价值:从收集到使用》的报告提出依靠技术来保护隐私,并将隐私保护的重心从限制数据收集转向限制数据的使用,由此让个人控制自己的信息,同时还能让重要的数据资产可以相对自由地流动。
目前,中国还没有专门的法律法规来界定用户隐私,处理隐私问题一般采用其他相关法规条例来解释。但随着民众隐私意识的日益增强,合法合规地获取数据、分析数据和应用数据,是进行大数据分析处理时必须遵循的原则。“有远见的国家战略和政策一定是在保护公民隐私权的前提下,加速数据信息的自由流动,鼓励创新、催生新产业创造新就业、进而促进国家的经济繁荣”[5]。
5 结束语
大数据时代,一个国家的数据产业能否快速健康发展,关系到一个国家巨大潜在利益能否实现的问题,也关系到国民经济各产业创新和人民福利提升的问题。而大数据确权问题特别是处理好使用权和隐私权是数据产业发展重要和关键的一环。
[1] 维克多·迈尔·舍恩伯格,肯尼恩·库克耶. 大数据时代:生活、工作与思维的大变革[M]. 盛杨燕,周涛,译. 杭州: 浙江人民出版社, 2013: 8,127.
[2] 巴里. 交易服务打通我国大数据产业“最后一公里”[EB/OL]. (2014-12-18). http://news.ccidnet.com/ art/1032/20141218/5709175_1.html.
[3] 杨林. 数据挖掘(DM)的全视图[EB/OL]. (2008-01-08). http://www.zdnet.com.cn/managesoft/2008/0108/700355. shtml.
[4] James Manyika, Michael Chui, Brad Brown, et al. Big data: The next frontier for innovation, competition, and productivity[EB/OL]. [2015-06-27]. http://www. mckinsey.com/insights/business_technology/big_data_ the_next_frontier_for_innovation.
[5] 金言. 大数据的国家战略[EB/OL]. (2015-03-24). http:// news.xinhuanet.com/info/2015-03/24/c_134093032.htm.
[6] 腾讯科技. 福布斯:今年大数据工厂营收预计达50亿美元[EB/OL]. (2012-02-20). http://www.cnii.com.cn/it/ content/2012-02/20/content_957353.htm.
[7] 私人医生. 解析大数据概念及应用[EB/OL]. (2014-10-29). http://www.68dl.com//research/2014/1029/16191. html.
[8] 柯武刚,史漫飞. 制度经济学——社会秩序与公共政策[M]. 韩朝华,译. 北京: 商务印书馆, 2000: 212.
[9] Naturexes. 日益凸显的数据产权问题:从隐私权、人格权、交易费用等多方面解析电商是否应与用户分享来自数据的收益[EB/OL]. (2014-05-04). http://news. ittime.com.cn/news/news_480.shtml.
[10] 涂子沛. 数据外部性这把“大数据之剑”[EB/OL]. (2015-01-04). http://tuzipei.baijia.baidu.com/article/ 41606. ★
杜振华:现任北京邮电大学经济管理学院国际经济与贸易教研中心教授,硕士生导师,主要研究方向为应用经济学,通信服务贸易、产业经济学等。
工信部电信经济专家委员会赴陕西调研“互联网+”产业引发专家热议
7月1日—3日,工信部电信经济专家委员会组织专家学者赴陕西西安、咸阳开展了“互联网+产业:信息服务创新”专题调研活动。调研组通过深入了解陕西“互联网+”通信业创新发展的实践情况,并召开2015年第三季“经专对话”专题会议,研讨“互联网+产业”的发展方向与落地实践。
7月1日,调研组对陕汽重卡、618研究所、西北工业大学智慧校园项目以及振兴嘉苑智慧社区项目进行了调研,了解陕西在“互联网+产业”、“互联网+教育”、“互联网+民生”方面的最新进展及成功经验。
7月2日,调研组赴咸阳,考察西咸新区产业园区、武功县电子商务以及咸阳市智慧城市建设,了解到当地政府主动与IT企业对接,建设陕西乃至西部领先的互联网+示范城市,应用互联网大数据等信息技术,实施机房、网络、数据库基础资源共享工程,搭建全市统一的政务平台和大数据中心。
7月3日,第三季“经专对话”研讨会在西安邮电大学举行,来自政府、企业、高校的近40位专家学者参加研讨。西安邮电大学校长崔智林、陕西省通信管理局局长高彩玲、原国务院发展研究中心企业研究所所长陈小洪分别致辞。
西咸新区是西部唯一国家级云计算试点示范城市。作为西部省份,如何落实国务院“互联网+”行动计划?高彩玲表示,第一,坚决落实提速降费,加快以宽带网络为重点的信息通信基础设施建设。第二,加强和改进行业管理,主动适应新业态和新发展的要求。第三,推动基础运营企业的升级与转型。第四,营造良好环境,推动协同创新。第五,促进信息服务与经济社会各个领域的深度融合。
同时,调研组提出陕西应加快立法、加大产业政策扶持力度、深入挖掘与共享数据资源、发挥人文优势推动互联网+旅游产业发展等一系列发展建议。(人民邮电报)
Research on Data Confi rmation Right in Big Data Application
DU Zhen-hua
(Beijing University of Posts and Telecommunications, Beijing 100876, China)
With the advent of the era of big data, the potential value of data has been developed and exploited. Data confi rmation right matters to the development of data market and exploitation of data value. From aspects of data ownership, usage right and privacy right, the importance of data confi rmation right was discussed in this paper. The signifi cance of privacy right protection to development of big data industry and progress of society was emphasized.
big data data ownership data usage right data privacy right
10.3969/j.issn.1006-1010.2015.13.002
F49
A
1006-1010(2015)13-0012-05
杜振华. 大数据应用中数据确权问题探究[J]. 移动通信, 2015,39(13): 12-16.
2015-06-29
责任编辑:刘文竹 liuwenzhu@mbcom.cn