赋权与重构:区块链技术对数据孤岛的破解
2018-10-23周茂君
周茂君 潘 宁
互联网技术改变了人们的生产和生活方式,也带来商业领域的一系列变革。在这场颠覆性变革中,最引人瞩目的是信息社会的来临和在技术驱动下大数据时代的到来,数据已然成为与自然资源、人力资源同等重要的战略资源。[1]在商业领域,数据的重要性日益凸显,从市场调查到用户画像,从媒体策略到精准投放,数据往往成为决定商业成败的关键。然而,数据生态中参与各方由于利益博弈,往往造成数据割据并进而形成数据孤岛现象。在此情形下要想获取真正有价值的数据并非易事。
技术对数字行业的引领作用十分明显,数字媒体的产生,数字营销公司的运作,数字经济的发展,都离不开数字技术的驱动。继互联网技术之后最有发展前景的区块链技术,其分布式账本技术、数据加密技术等核心技术,带来“去中介化”和保障数据的安全性、可靠性,这无疑为摆脱数据市场困境,提供了一个可供操作的解决方案——基于区块链技术重构数据产业的生产关系,以去中介化、高度自治的数据账本为基础,打破由数据割裂造成的数据孤岛状况,理顺数据生态中数据生产者、数据垄断者和数据使用者之间的利益关系,充分激发出每份数据所蕴含的价值,使数据在各方之间流通与共享,最终形成充满活力的数据市场。
一、大数据、区块链及其内在关联性
大数据不仅是一项技术,更是一种理念和解决问题的思路。从“大数据”一词被正式提出至今的20年中,学界和业界都在尝试从不同角度对其进行定义,虽然至今仍未达成广泛共识,但麦肯锡公司有关的大数据定义得到了学界较普遍的认可:大数据是指无法用传统数据库软件对其进行内容抓取、存储、管理和分析的数据集合。[4]体量大、类型多、更新处理速度快和精确性成为大数据的四个基本特征,亦即4V特征(Volume、Variety、Velocity、Veracity)。[5]正是大数据的这些特征和随之产生的各项技术,使得大数据在社会各行业中都发挥了巨大的作用。随着对大数据研究和挖掘的深入,数据尤其是商业数据在应用过程中产生的一系列问题也引起学界广泛关注,具体表现为数据整合挖掘的难度大、数据更新速度与人工处理速度矛盾和数据隐私泄露等,由此也引发学界、业界及社会公众对于数据成本、实时性和数据安全的关注和担忧。[2]应该说,这些问题至今仍然是制约大数据发展的重要瓶颈,如何解决这些问题成了大数据相关行业必须应对的难题。
正当各界为解决大数据应用阻碍、充分发挥大数据价值而进行积极探索时,一项与之看似无关实则联系紧密的技术,在十年前就开始悄然酝酿并在近两年爆发,这就是区块链技术。2008年,一个身份至今不明的个人或组织中本聪(Satoshi Nakamoto)发表了题为《比特币:一种点对点的电子现金系统》的文章,描述了一种被称为“比特币”的电子货币及其算法,文章称希望可以创建一套新型的电子支付系统,这套系统“基于密码学原理而不是基于信用,使得任何达成一致的双方能够直接进行支付,从而不需要第三方中介参与”[6]。2009年,比特币的诞生标志着区块链技术在金融领域正式得到应用,也正是由于这篇文章及其应用,比特币被视为区块链技术的第一个成功实践,这份文件也被公认为区块链技术的开端。
区块链概念自诞生之日起,国内外对它的讨论与争议就从未停止过。在国外,《经济学人》杂志将区块链称为“比特币的底层加密技术……为互不信任的人们提供一种制造和保存真相的方式”[7]。Iansiti和Lakhani认为“作为比特币和其他虚拟货币核心技术,区块链是一种开放的分布式分类账,能够以可验证和永久的方式有效地记录双方之间的交易”[8]。Swan将其定义为“另一种类似互联网的事物——一种具备多种级层和多种类型应用的综合信息技术……是任何事物所有量子数据呈现、评估和传递的一种新型组织范式”[9]。麦肯锡中国认为区块链本质上是“一个去中心化的分布式账本”[10]。国内的区块链研究要晚于国外,但其讨论热度毫不逊色。业界对其定义多从技术角度出发,如腾讯研究院认为区块链是一种“由多方共同维护,以块链结构存储数据,使用密码学保证传输和访问安全,能够实现数据一致存储、无法篡改、无法抵赖的技术体系”[11]。科技创投媒体36氪认为区块链是“分布式账本的一种,它既具备了多节点完全冗余的分布式数据库即‘去中心化’的特点,又具备了‘环环相扣’即‘最长链共识’的特色,最终解决的是价值传输的问题”[12]。区块链行业代表长铗和韩锋在其著作中阐述区块链是“一个去中心化的分布式数据库,该数据库由一串使用密码学方法产生的数据区块有序链接而成,区块中包含有一定时间内产生的无法被篡改的数据记录信息”[13]。学界对区块链技术的研究大多结合国内外业界实践而逐渐展开,认为区块链技术“最大的创新点就是以时间戳(Timestamp)的方式把各个数据区块依次链接起来,形成一个不可篡改、不可伪造的信息可追溯的链条式数据库”[14]。当前,得到普遍接受和认可的定义来自国家工信部,它将区块链定义为“分布式数据存储、点对点传输、共识机制、加密算法等计算机技术在互联网时代的创新应用模式”[15]。其含义有广义和狭义之分:狭义的区块链技术指“一种按照时间顺序将数据区块以顺序相连的方式组合成的一种链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本”[15]。而广义的区块链则指“利用块链式数据结构来验证与存储数据、利用分布式节点共识算法来生成和更新数据、利用密码学的方式保证数据传输和访问的安全、利用由自动化脚本代码组成的智能合约来编程和操作数据的一种全新的分布式基础架构与计算范式”[15]。因此,国内外关于区块链技术的讨论,大多集中于技术层面——即区块链是一个去中心化的分布式数据库账本,包含“区块+链”的数据结构、分布式存储、加密算法、共识机制、点对点传输等核心技术,涉及密码学、数学、经济学、网络科学等多种学科。
大数据与区块链技术的内在关联性是与生俱来的——从本质上说区块链本身就是一个去中心化的数据库系统,其运作的过程就是各种数据的处理和交易的过程;从价值上说区块链中分布式计算存储、加密算法、共识机制和点对点传输等核心技术,能够有效解决目前大数据生态中存在的数据整合和数据安全等问题,从而有效降低数据的应用成本和充分激活数据价值。正如工信部在《2018年中国区块链产业白皮书》中所言:“区块链技术几乎在所有的产业场景都能落地应用,因为当前的经济环境和制度下所有的产业场景都涉及交易,都有降成本、提效率、优化产业诚信环境的需求,而这正是区块链技术落地应用后能够迅速发挥作用的原因。”[16]当前大数据领域的最大问题在于无法协调多主体之间的信任关系——互联网加速全球化和社会协作进程,在带来巨大价值的同时,也随之产生了巨大信任鸿沟,表现在大数据生态中就是现有的私密且中心化的数据库结构无法解决价值转移和互信问题。[17]而区块链作为一种特定分布式存取数据技术,通过网络中多个计算节点同时参与数据的计算和记录,并互相验证其信息的有效性,使得数据库能够获得基于全网共识的数据整合和可信性。
二、数据孤岛:零和游戏下多方利益博弈的必然结果
当前数据交易市场是一个多方参与的复杂生态系统,各参与主体之间的利益不同决定了它们之间存在着一种复杂的博弈关系——以广大用户为代表的数据生产者由于自身数据被转移、滥用,或出于数据安全的考量,缺乏数据分享动力;以各大运营商为代表的数据垄断者利用数据垄断地位,为了追求利益最大化而建立起数据壁垒;而介于二者之间的数据使用者则因以高额代价换取数据使用权,为保持数据秘密,不得不割据数据。由此,多方利益博弈导致数据孤岛形成,数据孤岛正是数据交易市场零和游戏的产物。
(一)数据孤岛的概念与研究趋向
1948年克劳德·香农(Claude Shannon)提出信息论,现代通信科学由此发端。信息论也为现代大众传播研究奠定了理论基础。而数据作为信息的载体,其在商业领域的应用日渐突出。随着人类社会进入信息时代,尤其是数据库技术的发明和大数据时代的到来,数据的内涵由原本“有根据的数字”,即对客观世界测量结果的记录,转变成为信息的代名词。[18]
(1)系统为存储应用程序中的所有数据访问提供实时审核。我们使用电子数据文件作为数据单元,对数据对象的所有操作进行审计,并使用区块链进行记录。通过这种方式,可以收集和监测控制所有电子数据访问情况。
在日益庞大和复杂的社会中,无论是个人的生产生活还是整个社会的协调运作,所有的决策和判断都要依靠数据来进行,数据成为个人、组织、社会乃至国家的战略资源。尤其在商业领域,数据逐渐成为企业的重要资产和竞争力来源,因此数据垄断和数据割据也就成为数据市场的必然。当前,学界和业界已经意识到数据割据问题的存在,并将其形象地命名为“数据孤岛”——数据被割据和垄断形成一个个彼此隔绝的孤零零的数据岛屿。数据孤岛在早期多被用来形容企业内部因技术壁垒或部门分隔而形成的信息孤立现象,被称为“IT环境中最基本元素——数据的离散状态”[19]。由此引发了关于数据集成的技术和理念之争。后来“数据孤岛”一词开始应用于不同的行业和领域中,如图书馆信息系统和城市信息系统建设、政府治理和国家层面的信息化建设中。随着营销传播领域对于数据需求的逐渐强烈,数据获取过程中的种种困难使得数据孤岛概念开始在营销传播行业中盛行开来。如赵伟在《封建的BAT》中将数据孤岛定义为“因为技术差距和遗留问题等形成的数据分散与无法集中共联的现象”[20],其主体就是垄断数据的数据方;而秒针系统首席营销官赵洁则从秒针的第三方媒体和用户数据检测角度,将数据孤岛定义为同一用户的不同终端设备上的数据孤立状态。[21]可见,数据孤岛是营销传播行业中因利益割据而导致的涉及多方的数据离散状态。
如果以数据孤岛、信息孤岛为关键词在中国知网上进行文献检索,会发现一个十分有趣的现象:当前国内学界对数据孤岛的研究呈现出两种不同的趋向,一方面,在研究领域上,文献大多从比较宏观或微观的两极层面研究问题,如探讨国家层面的信息化建设中出现的“信息孤岛”问题[22],或讨论子系统内部出现的“信息孤岛”问题,如图书馆系统[23]、医疗系统[24]或企业内部[25],而极少有针对性地涉及数据市场本身的研究成果;另一方面,在应对措施上,文献较多采用一些较为传统的技术方案和解决思路,如采用面向服务的体系结构(SOA)的数据集成技术[26]、建立内部的数字资源整合系统[23]和运用企业架构理论[25]等,较少关注当下的新技术、新理念。上述研究工作开启了对数据孤岛问题的讨论,引起学界对此问题的关注,具有重要的价值和意义。但客观地说,既有研究还存在一些不足之处——对数据市场本身存在的数据孤岛问题关注不够,对数据孤岛产生的深层原因缺乏深度挖掘。
(二)数据产业生态系统三方主体:生产者、垄断者和使用者
在信息社会中,数据的重要性与其价值是成正比的,因此数据产业化便成为一种必然趋势。围绕数据的生产、获取、分析和使用这一条产业链便会形成众多利益点,众多的互联网企业、营销传播代理商和咨询策略公司等聚集在这条产业链的上下游展开竞争,从而形成庞大的数据产业生态系统。
其实,早就有学者对这个数据产业生态系统进行论述。从企业数据资产的构成来分类,数据可分为设备数据和用户数据;[2]从数据价值来源类型来分类,当前的大数据公司可分为三类,它们分别是数据本身、数据技能与数据思维,这三类公司分别依靠搜集占有数据、专业技能运用数据和产生数据创新思维来获取数据价值和竞争力;[27]按照参与者类型来分类,数据生态系统参与者可分为数据设备、数据收集者、数据整合者、数据使用者和数据购买者;[28]按照数据变现模式来划分,数据商业模式可分为出租或出售数据、出租或出售信息、数字媒体精准营销、数据分析业务、运营数据空间和大数据处理业务。[29]然而,既有的这些研究无论从何种角度对数据产业生态系统进行描述,大都忽略了最重要的数据的产生和来源问题。在数据产业生态系统中,能够为企业带来巨大价值的数据基本属于用户数据,而用户便是这些数据的生产者。既有研究和实践表明,数据生产者是作为“透明人”被排除在数据产业生态系统之外的,或者至少是被边缘化的,这种刻意忽略和剥夺用户主体性的“做法”是导致当前数据交易市场出现数据孤岛的深层原因之一。
在“重新发现”数据生产者这一角色以后,再来审视数据产业生态系统,数据生产者、数据垄断者和数据使用者三者之间几乎是零和游戏的博弈,由利益割据造成数据交易市场中的数据孤岛现象——以用户为代表的数据生产者形成第一方数据孤岛,以百度、腾讯、阿里巴巴等运营商为代表的数据垄断者形成第二方数据孤岛,以咨询策略公司、技术供应商和数据营销公司等为代表的数据使用者形成第三方数据孤岛(见表1)。
表1 当前数据市场中参与者
(三)数据交易市场中三方生产关系结构失衡导致数据孤岛形成
数据交易市场中的数据孤岛现象之所以形成,是因为在数据产业生态系统中数据生产者、数据垄断者和数据使用者之间生产关系的结构失衡,尤其是数据生产者(用户)和数据垄断者(新媒体、APP运营商等)在地位关系、权力关系、作用关系、利益关系等方面的不平等,突出表现在数据生产力和数据收益方面的失衡(见图1)。
图1 数据孤岛中三者生产关系(圆圈大小代表占有的数据量大小)
在当今的话语体系中,大家似乎都达成了这样一个共识:数据挖掘和数据分析比数据获取和占有更加重要,但在实践中,数据的获取、占有仍是居于分析利用之上的。舍恩伯格认为:“大数据最值钱的部分就是它自身,所以最先考虑数据拥有者才是明智的。”[27]无疑,在大数据时代早期,人们通过数据的挖掘、分析获得技术应用和创新理念在当时是最有价值的,但最终大部分的价值还是必须从数据本身中挖掘。谁掌握了大数据,谁就掌握了信息化时代的话语权,更掌握了未来商业竞争的主动权。
正是基于这种潜在共识,如何获取并占有更多数据便成为当前数据产业生态系统运作的核心要义。以BAT为代表的运营商便依靠其技术和渠道优势在这个数据产业链中占据优势和核心地位,并占据了数据垄断者的位置——一方面,他们不直接生产数据,但是掌握了接触、使用和授权他人使用用户数据的权力,使得他们占据了数据产业链的顶端位置,掌控着产业链上下游的最大价值,因此能够获取最大部分的数据收益;另一方面,数据成为这些数据垄断者的核心资产和竞争力来源,最大程度上占有并垄断数据便成为保持其竞争壁垒的必然选择,由此以数据垄断者为中心就形成了最为明显的数据孤岛。与此相对应的则是以用户为代表的数据生产者——直接生产数据却不能拥有数据的群体。一方面,他们通过使用和消费运营商所提供的硬件和软件设备而产生大量用户数据,这些数据被运营商搜集占有并产生商业利益;另一方面,他们在没有获取任何数据收益的情况下,还要冒着数据被滥用而造成个人隐私和数据安全受损的风险。在这种投入与产出极不对称的情况下,个人用户更倾向于保护数据而非分享数据,而众多个人用户汇集则形成了一个分散却数据庞大的隐形数据孤岛。介于二者之间的则是依靠数据进行决策与运作的数据使用者,他们不能够直接生产或者获取所需数据,而只能从数据垄断者手中购买数据,在商业利益的驱使下,他们选择数据保护主义而形成以其为中心的数据孤岛。所以,数据交易市场中的数据孤岛问题是一个多方利益博弈的必然结果,在原有的多方参与的数据生态中,各主体之间是一种非合作的零和博弈关系,突出表现在数据生产者和数据垄断者,即用户和企业(尤指腾讯、百度、阿里巴巴等互联网运营商)之间的对立,这些硬件或软件设备运营企业的收益是建立在用户的损失或完全无收益基础上的,具体表现为用户的数据收益权和支配权的丧失。因此,三者之间的利益割据促使相互之间数据孤岛的形成。
数据孤岛的危害是显而易见的,从长期来看,数据产业生态系统中的任何一方都不会是最终的赢家,即任何一方都是数据孤岛的“受害者”。首先,在缺乏数据监管的背景下,运营商对用户数据的滥用导致用户的数据隐私和安全问题,这被看成互联网企业的“原罪”,即对个人数据和信息的过度采集和无法无规的利用。[30]其次,数据保护主义必然加剧数据的离散程度,一方面用户在个人数据安全保护的考量下拒绝分享数据,另一方面企业在商业利益驱使下进行数据垄断,因而数据浪费和数据缺乏整合便会大大降低数据价值。显而易见,当前的数据交易生态是一种不可持续发展的系统,长此以往,数据割据和数据安全隐忧便会导致整个数据行业陷入停滞状态,甚至引发严重的舆论和公共危机。
三、用户赋权:区块链技术激活数据价值
是否掌握数据主权是衡量一个主体在数据产业生态系统中地位的重要指标,对于组织来说,掌握数据主权就能够收集数据,并用数据观察问题、分析问题,然后提出解决方案。[31]对于个人用户而言,能够掌握数据所有权、使用权、支配权和收益权便代表其掌握了全部的数据主权。让个人用户掌握自身的数据主权并非是一个理想主义者的“乌托邦”,早在2012年舍恩伯格就设想一个个人用户成为数据拥有者的“个人数据市场”。[27]他寄希望于出现一个可信任的数据中间商来充当数据中介,但是这个“可信任的数据中间商”并没有出现,至少是暂时还没有现身。在当前的数据市场,数据垄断者以数据中间商“自诩”,但用户并没有成为自身数据的拥有者和受益者,反而变为丧失数据主权,沦为被迫“愿意用隐私换取便利”的受害者。显然,在当前的数据交易市场中,作为数据生产者的用户虽然人数众多,但却始终处于弱势地位,究其根本,缺乏技术支持和制度保障是其重要原因。
2009年,比特币的诞生让区块链技术在金融领域成功落地,但必须强调的是,区块链并不等于虚拟货币,随着区块链技术的不断完善,以及人们对它认识的逐渐深入,其产业发展效果越发显现出来,其应用已经从金融领域延伸到实体行业,如版权管理与交易、产品溯源、物联网、智能制造等。区块链技术与大数据之间存在的内在关联属性,使得运用区块链技术解决数据产业生态系统中存在的数据孤岛问题成为可能,而将用户纳入数据交易市场中并赋予相关数据主权,则成为解决这一行业难题的突破口。换言之,通过技术赋权来保障用户在数据交易市场中的数据所有权、使用权、支配权和收益权,进而在保障用户数据安全的基础上激励用户分享数据,充分激发数据的价值和活力。区块链业界人士数矩科技(北京)有限公司总裁、麻省理工学院博士庞华栋充分肯定了这一理念,他将区块链技术在数据市场的用户赋权称为“让数据和价值最大化地回归个人”。[32]
(一)构建共享共治的“数据账本”,归还用户的数据所有权
在传统数据交易市场中,用户是处于边缘状态的弱势群体,他们直接进行数据生产却不拥有这些数据的所有权,具体表现为用户在使用消费运营商提供的各种硬件和软件设备、资源的过程中产生了大量数据,包括位置数据、兴趣数据、通信和社交数据、身份信息数据和金融数据等,但这些数据属于电信运营商、社交媒体、购物网站、搜索引擎等,却唯独不属于用户自己,这种数据所有权的被迫让渡、转移和丧失是用户数据主权丧失的最直接体现。
在区块链技术介入和构建新型“数据账本”理念指导下,利用区块链中的分布式账本技术将用户直接纳入数据生产者、数据垄断者和数据使用者三方共治的“数据账本”中,此时的数据虽然仍然存储于各大运营商的服务器中,但运营商在使用和支配用户数据时需要获得用户同意,即获取各个节点的授权,并将所获数据收益按照一定比例与用户分成,真正做到归还用户的数据所有权。
(二)加密算法保障数据安全,提升用户的数据使用权和支配权
在以往的数据交易过程中,因为技术和人为等原因,不可避免地会出现用户隐私数据泄露和数据造假等数据安全事件。然而,在区块链技术支撑下的新型“数据账本”中,数据加密技术使得用户可以通过“秘钥”来对个人数据进行保护与授权,并辅之数字签名和“时间戳”来确保数据真实性和不可篡改,在保障用户数据安全的基础上提升用户对自身数据的使用权和支配权。
(三)激励机制激活数据市场,明确用户的数据收益权
传统的数据交易市场中,用户作为边缘群体是被排除在数据收益之外的,甚至还要承受个人数据泄露等负收益后果。在这种背景下,用户缺乏分享数据的足够动力,往往会主动选择冻结数据,这样久而久之必然会造成数据市场中数据规模的持续萎缩。在区块链技术构建下的新型数据账本中,通过给予用户一定额度的实际权益或可流通的加密数字权益证明(即通证)来激励用户进行数据分享,并允许用户通过终端平台管理自身收益,即通过明确用户的数据收益权来激活用户数据市场。
当前已经投入市场进行实际应用的个人数据区块链平台有公信宝(GXChain)、京东万象和网易星球,它们都以让个人用户“做自己数据的主人”为宣传口号,通过建立企业与个人用户“点对点的数据交易平台”,从而形成与以往数据中间商主导的数据平台不同的差异化竞争点。而小米也在布局数据区块链,MIUI商业产品部做了两年多的营销数据协作链“米链”就是其中的代表——2017年12月27日,在“创新无界:2017 ECI Festival国际数字商业创新节”上,小米MIUI商业产品部数据业务负责人周茂华发表《基于区块链的营销数据协作探索》主题演讲,对外展示了小米营销数据链的功能与应用场景。他表示:“小米营销数据链的愿景,就是在保护用户隐私和数据安全的情况下,通过营销数据协作,实现数据效率和数据价值最大化。”[33]但从目前所得的资料来看,小米的营销数据链仍是一个只包含组织化的公司和机构而排除广大用户的联盟链,致力于解决的也是数字营销行业面临的用户隐私、数据协同、品牌安全、广告反作弊等问题,但作为将区块链运用于数据治理的先行者,小米的营销数据链已经得到行业的认可。2017年12月26日,数字营销行业领先者利欧数字旗下子公司聚胜万合(Media V)加入小米推出的“营销数据链”平台,并完成了首次测试联调,由此可以看出数字营销行业对于区块链技术的肯定。
四、走向共赢:共识机制重构数据市场主体的相互关系
从技术层面来说,区块链技术并不是一个单一的、全新的技术创新,而是多种现有技术整合的结果,甚至在理念层面,业界更愿意称之为用来解决人和人之间生产关系的底层技术。正如著名经济学家约瑟夫·熊彼特的创新理论所论述的那样,创新是各种创新主体、创新要素复杂作用下的一种复杂涌现现象,创新是生产要素的重新组合,即建立一种新的生产函数,把一种从未有过的关于生产要素和生产条件的新组合引入生产体系。[34]区块链技术在本质上是一个多方参与的数据不可篡改的数据库账本,因此在区块链技术对用户充分赋权、提升用户在数据交易市场中的主体性后,通过共识机制构建一个数据生产者、数据垄断者和数据使用者三方共治的区块链“数据账本”,便成为数据孤岛的最终解决方案。
对于区块链技术对生产关系的变革能力,业界早有论述,火币区块链研究院院长袁煜明将区块链改造市场关系归纳为五点:降低信用门槛、打破公司组织边界、削弱渠道价值、组织长尾供给和改变企业追求垄断天性。[35]究其根本,区块链对数据市场关系变革的主要思想就是借助共识机制和社区激励机制,明确“数据账本”参与者的职责、权利,实现新兴“数据账本”内各方的利益绑定。共识机制是区块链技术中的主要技术之一,是区块链系统中实现不同节点之间建立信任、获取权益的数学算法。[16]在数据账本中,需要各方明确自己的权利职责和利益分配,在“弱信任”的环境下实现数据账本的共同治理。针对当前数据治理中的数据孤岛现象,需要采用利于多方的社区激励机制改变各方的利益割据,如以所分享的数据量大小和数据价值高低来对数据分享者进行奖励,并通过利益分成来调节运营商和用户之间的利益关系。因此,“数据账本”中的三方相互关系应该是这样的:以用户为代表的数据生产者使用运营商所提供的硬件和软件设备并产生大量数据,以运营商为代表的数据垄断者转变角色,成为数据整合者,他们负责搜集并存储用户数据,当数据使用者想要使用这些数据时,则需要向用户发送授权申请,用户通过“秘钥”对自身数据进行授权并同意数据整合者进行数据分享,此时数据使用者则需要支付一定利益,这份数据收益由运营商和个人用户按比例分成(见图2)。
图2 区块链介入下数据市场中的主体关系(圆圈大小代表占有的数据量大小)
因此,整个基于区块链技术的“数据账本”本质上是在“弱信任”的环境中实现多主体的数据流通和协作的,数据交易各主体在共识机制下平等交流,实现数据共享,进而降低数据交易过程中的信任成本和提高交易效率,从技术角度重新建构数据交易各方的生产关系,激活数据价值,这也印证了区块链3.0阶段的“价值互联网”的发展趋势。在区块链技术重构数据市场各主体的相互关系,进而形成的新型“数据账本”。其主要特征是:
(一)从数据到商品,借助激励机制实现个人数据资产化
通过激励机制赋予数据生产者、数据整合者和数据使用者不同的数据价值和收益,再辅之区块链的去中心化、超级账本和数字货币等技术支持,将使数据摆脱以往的附加产品或隐形资产状态,依靠自身的价值走向专门的数据交易市场成为真正的商品,也使个人数据资产化成为可能。
值得注意的是,在中国政府“无币区块链”的政策倡导下,保护个人用户数据隐私并将其资产化的代表性操作方式是私钥加密、授权访问和用户优惠反馈。而来自硅谷的汽车保险类创业公司Car-Block[36]便是运用这种操作手法的典型代表——它将个人用户的汽车数据在行驶过程中自动加密并存储在区块链技术系统IPFS上,用户通过个人私钥对数据进行加密并自由授权给任何一个申请个人数据共享的保险公司,而保险公司则以额外的保险折扣等优惠反馈给用户,由此完成用户对个人数据收益的获取和管理。
(二)从数据垄断者主权到多方共治
作为一项用来解决人和人之间生产关系的底层技术,区块链技术对数据市场中各参与主体的相互关系带来了颠覆性的改变——通过点对点交易、分布式账本技术和共识机制降低数据交易中的信任成本,形成利益绑定、去中心化的“数据生态社区”,社区中各参与方之间权责一致,数据垄断者转变为数据整合者,实现由传统数据垄断者主导的数据交易市场向多方共建共治的新型“数据账本”的转变。
(三)从以服务器为中心到统一的分布式平台
在传统的数据生态系统中,大量的用户数据存储在各大运营商的一个个大型数据服务器中。这导致大量的数据被“冻结”在这些超大型、封闭和中心化的运营商服务器中,阻碍数据流通与整合,也成为传统数据交易模式中数据割据的典型体现。而在区块链技术介入下,新型的“数据账本”将逐渐打破传统的以各大运营商服务器为中心的数据存储和割据状态,促进“冻结”的数据在统一的分布式数据平台上进行充分流动,进而弱化渠道价值,激活数据流通。
总的来说,解决当前数据市场中的数据孤岛问题的路径是建立在区块链技术基础之上的,以用户赋权为突破口,以区块链中分布式计算存储、加密算法、共识机制和点对点传输等核心技术来平衡各参与主体之间的权责和利益关系,重构数据市场主体的相互关系。一方面,使数据生产者、数据垄断者和数据使用者三者从零和博弈走向互利合作;另一方面,打破数据割据和垄断形成的数据孤岛,提升数据流动性并充分激活数据价值,真正实现数据市场中的多方共赢。