基于区块链技术保障数据流通、交易和共享安全
2023-09-14栾国春
栾国春
我国当前正处于数字经济高速发展时期,数字经济作为高质量发展的“稳定器”和“驱动器”作用将日益凸显。数据作为新型生产要素,是整个数字经济发展的基础,数据只有流通交易和共享才能创造更多价值。因此,如何更好地保障数据流通、交易和共享是构建数据基础制度的重点,也是充分释放数据要素价值、发展数字经济的关键。
一、当前数据流通、交易和共享存在的主要问题
一是确权难,存在数据主体多元,数据流通、交易和共享过程多变,对数据的贡献不明确等问题。在数据市场实际应用场景中,判定数据归属以及数据是否被限定的用户使用,属于数据所有权中的重要内容。当前大多隐私保护技术一般由数据拥有者制定相关的访问规则,然而接收方一旦获得数据,数据拥有者就对这些数据失去了控制。为此,在数据流通、交易和共享之前,应该明确数据资产的各项权利,包括数据的所有权和使用权。当前数据行业大多用服务换数据,这种方式混淆了数据的所有权和使用权,使得数据所有者无法管控自身数据的使用情况。个人日常活动所产生数据的所有权毫无疑问属于个人,然而,数据不同于传统的商品,具有看过就等同于拥有的特征,难以清晰地界定所有权。
二是互信难,数据来源不可信、质量不可靠、隐私安全风险较高。真实可信的数据是数据流通、交易和共享的基石。由于有些数据源单位之间缺乏相互信任,导致不愿或不敢主动共享核心数据,目前也无有效手段推动数据自由地跨区域流动,数据要素价值得不到充分挖掘,而且数据易被复制的特性使得数据主体担心用户隐私泄露,导致不愿共享数据。此外,很多数据中包含着大量的敏感信息,数据市场的隐私保护对于敏感数据的流通、交易及共享尤为重要。隐私保护问题诞生自数据共享场景中,制订数据的安全防护措施时,需要在充分地考虑数据使用场景及数据主体知情的前提下,发挥数据使用价值,但这可能会降低对隐私的要求。攻击者可能会在数据传输的过程中窃取用户的隐私信息,造成数据用户的敏感信息泄露等問题。目前由中心节点集中存储数据信息的方法,可能存在存储节点单点故障,一旦被攻击导致服务器宕机,整个系统将不再可用,同时,管理员的权限比较高,有可能从内部造成数据泄露。
三是监管难,数据流通、交易及共享的过程比较复杂,对其进行有效的监管面临着较大挑战。在传统的数据市场模式下,由于中心化系统的黑盒特性,数据流通、交易及共享记录容易被篡改和删除。数据应限定使用范围并保证被有限次使用。然而由于无法对数据的使用进行有效地监管,可能存在数据被二次售卖、并造成数据无法追溯的情况。因此,对数据流通、交易及共享进行有效监管是一个亟需解决的问题。
二、基于区块链技术的数据流通、交易及共享安全保障体系
(一)建立数据流通、交易及共享安全保障体系
区块链技术具有去信任化、去中心化、不可篡改性、可追溯性、密码算法安全性和不可否认性等安全特征,可以有效解决确权、互信等问题。笔者以区块链技术为基础,结合访问控制、加解密等多种数据安全保护方法,设计建立一个保障数据安全流通、交易和共享的体系。主要是利用联盟区块链对用户身份进行认证与管理,实现用户身份注册、证书管理、公钥管理、身份认证等功能。同时区块链网络提供的数据信息存储与搜索过程,记录数据的摘要信息、数据流通、交易和共享过程等信息。通过智能合约机制验证搜索的密文所需要的属性和数据请求者的权限。采用分布式文件系统IPFS(Interplanetary File System),能够降低区块链上数据存储的成本,当数据拥有者将数据文件上传至 IPFS以后,它就会为每个数据文件分配唯一的哈希值,具体如图1所示。接下来以此图为基础架构,分别就如何保障数据流通、交易和共享安全进行说明阐述。
(二)数据流通安全保障
据统计,单个组织或机构一般仅仅存储15%与其业务关联的数据,其他所需的数据是来自于其它组织或机构。联盟式的数据流通系统不断出现,加入联盟系统的用户提供数据信息,同时能够获取其他用户提供的数据。通过数据流通能够打破“数据孤岛”,从而深度挖掘数据的价值。
目前我国数据流通面临着数据隐私保护不足、数据权属界定不清晰、流通各阶段标准缺乏共识等问题。因此,对流通的数据建立完善的追溯体制非常重要,即在机构之间的数据流通过程中,在跨不同利益主体之间追溯与控制数据流转。利用区块链技术可以解决以上问题。一是完成对敏感行为的记录与控制,为数据流通系统提供可审计性。二是分布式数据存储结合区块链审计能够保证数据隐私。三是清晰地界定数据权属,在不同系统之间统一身份认证,使得数据访问的行为被正确地审计。四是通过区块链技术保证数据的流通可追溯、不可篡改,促进安全可信的数据流通的生态建设。
(三)数据交易安全保障
数据交易是指以数据作为商品进行分类定价、流通和买卖的行为,它将有效发挥数据价值,实现从数据资源到数据要素到数据资产再到数据资本的多重转变。随着数据需求的存在,数据交易的市场也在逐步形成。目前市场上主要存在两种数据交易方式:第三方数据交易平台和双方定向交易。其中第三方数据交易平台,我国现存有两种较主流的形式:一种是由政府主导的政府或国企独资或政府和民营合资的大数据交易中心;另一种是以企业独资或合资运营为主导的数据交易平台。
当前数据交易市场处在初步发展阶段,整体还不够成熟完善,存在数据定价机制不明确、数据价格与其价值不符、数据存储缺乏安全性、数据交易过程不透明且难以追溯等问题。此外,数据交易是一种新兴商品交易方式,与传统的商品交易存在明显的区别,数据拥有可见即可得、易获取、易被复制、易传播等特征,且复制前后的数据在本质上并无太大差异,数据一旦被复制甚至被传播后,会大幅度降低其价值,因此在数据交易过程中安全问题至关重要,如何保证数据隐私不被泄露是亟待解决的一大问题。
根据区块链的不可篡改性、可追溯性、去中心化、匿名性等特点,若将区块链技术用于数据交易平台的数据存储部分,将极大程度上解决目前数据交易面临的问题。不可篡改性确保数据在定价之后不被人为恶意修改;可追溯性能够对平台上价格变动、交易过程全记录等信息进行溯源;去中心化确保各主体的权益得到充分保护等;匿名性可用于保护数据交易平台用户隐私。
数据交易过程中主要包括三大类主体:数据拥有者、数据消费者、数据交易平台。数据拥有者首先将隐私数据上链,然后根据某种定价策略对上传的数据商品进行定价。加入区块链技术后,区块链网络主要用于存储各种数据信息,包括数据商品概要信息、数据价格、数据内容和数据交易记录等信息。数据存储采用将真实数据内容存放在 IPFS 网络中的存储方式,将 IPFS 返回的哈希值地址,同数据信息一起存储在区块链。但存储在IPFS中也并不能完全保证数据的安全性,为了降低内容被泄露的风险,运用对称加密算法、非对称加密算法、代理重加密算法对数据访问进行有效控制,从而保障数据内容的安全性。数据消费者购买数据商品后,可请求下载数据,经过一定过程,生成加密密钥和解密密钥,最后数据消费者即可获取到明文数据。
(四)数据共享安全保障
现在各行业中均存在“数据孤岛”“数据烟囱”等现象。究其原因主要是无法保证数据隐私性、保密性和数据的确权。目前应用最广泛的数据共享方法是以第三方平台作为中介,数据所有者将数据上传到第三方平台后,其他用户再获取。然而,这种传统的数据共享方式采用中心化服务器和中心化存储,主要存在以下问题:一是管理员权限过高,如从内部主动作恶,窃取用户的隐私数据,容易造成数据泄露;二是中心化服务器容易被黑客攻击,从而导致单点故障,一旦中心化服务器宕机,整个数据共享系统将不可再用;三是传统的数据共享方式共享过程不透明、数据所有权归属难以确定。
将区块链技术与数据共享结合起来,能有效解决传统中心化数据共享方案存在的问题。区块链技术可以将用户间共享数据过程在智能合約中实现,能够将用户的共享数据的记录呈现在区块链账本上,实现用户数据确权和数据共享过程透明可追溯。数据申请者从基于区块链的数据安全共享平台中获取所需数据信息,并输入自身属性对称密钥解密,只有当数据申请者拥有该数据的访问权限时,才能够获得解密密钥。经过一定流程,数据申请者可获得密文并解密密文,从而获得所需数据。当申请者发出申请并执行搜索时,基于区块链的数据安全共享平台会将用户的行为记录到区块链上,便于追溯及监管。
(作者为国家公共信用信息中心副处长、高级工程师)