APP下载

基于区块链技术的政府数据开放路径研究

2020-07-08帅文明

决策咨询 2020年2期
关键词:敏感数据分布式区块

◆帅文明

当前,我国政府信息公开逐步向政府数据开放过渡,政府数据开放是政府信息公开在大数据时代新的发展阶段。相对于以构建信任政府为目标的政府信息公开强调公众知情权和政府透明度,政府数据开放更加强调数据的共享和价值实现[1]。政府数据开放能创造社会价值,为经济发展注入能量,提高公众参与政府数据治理积极性,提升政府数据治理能力[2]。随着云计算、大数据、人工智能、物联网、区块链、5G等新一代信息技术的快速发展和普及,政府数据规模大幅度增长,公众越来越意识到政府数据的潜在经济和社会价值,对政府开放数据的质量提出了更高的要求。整体上,我国政府数据开放发展缓慢,落后于欧美各国,国家级政府数据开放平台尚未构建,地方政府数据开放平台也普遍存在数据量少、价值低、缺乏便捷获取渠道、多为静态数据等问题[3]。据《2019年中国地方政府数据开放平台报告》显示:2019年一季度,82个地方政府数据开放平台中,超过五成的地方平台没有更新数据,超过六成的地方平台存在无效数据集,超过九成的地方平台上开放的数据未被利用。可见,中国政府数据开放还停滞在共享阶段,尚未形成“开放-共享-价值实现-再开放”良性循环的政府数据开放利用生态系统。

那么,究竟是什么原因导致中国政府开放数据价值释放进程缓慢?一是政府数据开放面临的数据安全和信任问题,导致政府开放数据的价值实现与风险管理之间难以达到平衡。由于一些有价值的数据都包含敏感数据,但如果采取脱敏操作,数据的价值又会大打折扣,如何在保障数据安全且不触碰法律边界的前提下,最大化实现政府开放数据的价值是当前政府数据开放运动中亟需解决的问题。二是随着政府数据量的激增导致数据资产管理的成本大幅度上升和数据管理难度增加,数据质量难以保证,数据的利用价值下降,政府、企业和公众对政府开放数据的需求也会减少。三是政府数据开放的动力不足。政府开放数据的原动力来自构建透明政府,随着政府透明度的提升,开放数据带来的效益逐渐递减,而因管理数据的成本逐渐递增,形成反差。四是公众难以参与政府数据开放。专家学者以及政府早已意识到公众参与政府数据开放有利于推进实现政府数据价值释放的目标,但缺乏可操作性的参与机制。

近年来,区块链作为P2P网络、共识机制、分布式存储、智能合约、加密算法等技术的集成应用,已经成为联合国以及许多国家政府和企业研究讨论的热点[4]。从区块链1.0、2.0到区块链3.0,区块链技术的应用场景从数字货币延伸到物联网、智能制造、数字资产交易等领域,为云计算、大数据、5G等新一代信息技术的发展带来新的机遇,也将激发政府数据开放平台从技术和机制上实现创新和变革[5]。因此,本文提出了一种基于区块链技术的政府数据开放系统框架破解政府数据开放及其价值实现难题。

一、区块链关键技术及其优势

区块链是比特币的底层技术之一,本质上是一个分布式共享数据库,而政府数据开放的本质其实也是数据共享,无论从理论还是技术上来看,政府数据开放必将拥抱区块链。区块链是一种使用密码学技术保证数据安全,能够实现数据一致存储、难以篡改、防止抵赖的分布式记账技术,可以看作是数字世界中进行价值表示和价值转移的技术集合,包括加密技术、分布式账本技术、P2P网络技术、共识机制、智能合约,具有去中心化、自治性、安全性、不可篡改性、激励机制等特性。从区块链这些关键技术及其特性来看,其运用于政府数据开放都有比较明显的优势[6]。

(一)加密技术

加密技术是解决信息网络安全保密性、完整性、可用性及可控性的基础技术,区块链底层实现离不开各种加密技术的结合使用,包括哈希算法、对称加密算法和非对称加密算法。随着区块链技术应用场景不断扩展,除了混合使用以上常规加密算法,区块链还探索采用零知识证明、多重签名技术、同态加密技术进一步增强灵活性和安全性[7]。政府数据常常包含一些敏感数据,甚至秘密数据,在数据传输、存储等过程中常常会遇到恶意盗取、干扰、破坏和伪造的行为,加密技术可以有效保障数据的安全。同时,大量政府数据因为可能侵犯公民隐私权而无法公开或者完整公开,通过加密技术授权可以保证个人隐私不被泄露。区块链源于数字货币,为保证数字资产的安全而生,随着区块链技术应用逐步深入,必将催生效率更高、安全性更强的加密算法,为政府数据开放提供坚强的安全技术保障。

(二)分布式账本与P2P网络技术

所有区块链系统都包括分布式账本和P2P网络这一对必备要素,具有去中心化特性,这是区块链技术与众不同的地方。分布式账本的存储方式本质上是分布式数据库,但与传统分布式数据库不同的是,区块链分布式数据库只允许增加和查询操作,禁止修改和删除操作。另外分布式账本的数据结构是数据块按时间顺序连接起来形成区块链表,单个数据块本身有个哈希值外,还记录上一个数据块的哈希值,从而保证链上数据的一致性。P2P网络能够为区块链提供可靠的去中心化网络架构,在部分网络节点被破坏后,仍然具有存储能力和计算能力,具有容错性、可扩展性和抗毁性[8]。去中心化特性为政府数据开放提供容错机制,有助于提高政府数据可信度,为公众参与政府数据开放提供了思路。

(三)共识机制

去中心网络是一种非基于信任的网络,任何人都可以自由接入和断开网络,所以需要共识机制,使这些自由加入的网络节点达成一致。虽然理论上所有网络节点达成共识是不可能的,但如果加入激励机制,所有维护网络的节点都可以得到有价值的实际奖励,那么节点为了自身利益相互竞争而不会合谋欺骗,最终达成一致。用于去中心化区块链的共识机制主要包括PoW(激励机制)系列算法和PBFT(经典共识)系列算法等,PoW系列共识机制需要代币或者挖矿运算,难以应用于商业领域,而PBFT系列共识机制有可能使整个区块链系统停止运行。然而基于区块链的共识机制都可以看作是以牺牲一部分代价换取适应于某个场景的一致性。对于政府数据开放而言,政府注重数据开放的效率,公众更关心是否真实可靠,而企业更关心经济价值,因此可以根据不同主体的需求场景灵活采用不同的共识机制。

(四)智能合约

智能合约与现实中常见合同并不类同,它是存在区块链上可被触发执行的一段程序代码,这些代码根据预定规则自治代理执行,任何人都可以在区块链上开发智能合约。智能合约的功能就是强制执行,履行约定好的方案,约定的方案和触发时间都可在合约内通过代码设定,从而解决耍赖、不履行以及信任问题[9]。另外,智能合约一般是开源的,区块链上所有节点都能看到事先约定的内容,因此,如果程序代码的实现逻辑存在漏洞就会影响区块链的安全,有必要使用智能合约前经过试用验证或专业检测。对政府数据开放而言,智能合约能够解决管理人员重复性操作或者需要延时完成的任务,大大降低数据维护难度的同时也保证了操作的安全。

(五)区块链即服务

为了有效利用大量的分散的计算资源,云计算以资源共享的方式向公众提供服务,并逐渐普及,深入人们日常生活,但由于云计算所依赖的网络结构越来越中心化,云服务商掌握公众所有信息,公众的数据权利受到挑战,个人隐私保护越来越受到人们的重视。在此背景下,新的云服务模式-区块链即服务成为区块链应用的研究热点,在区块链即服务模式下,用户在享受区块链的安全性的同时也能享受云服务带来的便捷性,这种新的服务模式有可能更适用于政府数据开放。通过构建适用于政府数据开放的云计算基础架构,可以让公众和企业的力量参与数据治理,并且通过智能合约强制参与者遵守保护隐私等约定,通过共识机制保证数据一致性以及激励参与者维护数据,从而构建低成本、智能化、可信的政府数据开放系统[10]。

二、基于区块链技术的政府数据开放机制

我国目前形成了政府、企业和公众为主体,以基于互联网和大数据技术的政府数据开放平台为载体,以政策法规为保障的政府数据开放体系。政府数据开放体系以推动数据价值的开发应用为重点目标,以需求导向、安全可控、分级开放、统一标准、便捷高效、价值释放为基本原则,不断满足企业、公众对政府数据的需求。由于关于个人隐私保护以及数据保护的专项法规尚未出台,政府数据开放多有掣肘,个人隐私保护与价值释放之间的矛盾、数据供给与数据需求之间的矛盾日益突出,当前政府数据开放模式急需创新。鉴于此,本文提出一种基于区块链技术的政府数据开放框架,旨在通过技术手段,消除数据孤岛的同时,扫除立法障碍,进一步激发政府数据开放动力。

(一)基于区块链技术的政府数据开放系统框架

基于区块链技术的政府数据开放系统总体框架主要包括应用层、用户层、区块链信用层、数据层,如图1所示。与传统中心化数据开放架构不同的是,基于区块链技术的政府数据开放架构采取半中心化设计,原因是完全中心化设计将会大大降低区块链网络的可扩展性,根据不可能三角原理,区块链网络无法同时满足安全性、可扩展性以及去中心化。由于安全是政府数据开放的前提而不可放弃,政府敏感数据又必须经过授权才能开放,这种情况就需要集中统一授权管理,而无法通过共识机制实现,因此本文提出政府数据开放架构的前提假设是政府完全可信的。

数据层包括分布式数据库和集中存储数据库,其中分布式数据库主要是指云存储以及DHT等分布式存储系统,集中存储数据库主要是指本地物理数据库。数据层的数据来源于政府部门采集上传、政府各业务系统数据库或物联网设备自动采集。数据层主要功能是基本数据操作,包括数据库增、删、改、查等操作;数据库访问权限验证;数据分类标记等。其中最关键的数据分类的实现,为了最大程度保证数据的可用性、隐私性,并实现数据分级开放、访问控制,数据可分为敏感数据、非敏感数据,每一条数据都有唯一可索引的标识,建立公开、分布式的数据索引字典数据库,提高数据访问效率的同时不泄露数据信息。关键敏感数据采取传统集中式存储方式,为保障数据一致性、稳定性以及安全性,赋予政府部门最高访问控制管理权限。

图1 基于区块链技术的政府数据开放系统总体框架

区块链信任层可以看作是数据层的一道防火墙或过滤器,任何数据访问都要经过区块链信任层,包括去中心化网络、分布式账本、共识机制、智能合约等模块。去中心化网络采用P2P网络技术,遵循最小世界模型来设计和运行,具有容错健壮、隐私保护、负载均衡等特点,用户层面政府机构、企业以及个人用户是P2P网络中的节点簇,根据是否记账,可分为记账节点和非记账节点,通过共识机制判断节点是否参与执行记账活动。分布式账本采取分布式存储,并不记录实际需要访问的数据,而是记录数据操作或交易等关键信息,包括时间戳、操作类型、需要访问的数据标识、前一数据块哈希值、本数据块哈希值等。共识机制的主要功能是为了确保P2P网络节点间协同工作,保证数据一致性,此处使用不需要代币的验证池机制,可实现秒级共识验证。智能合约可根据法律法规制定区块链网络数据访问规则,并自动触发执行,例如一旦有敏感数据需要处理,则自动触发敏感数据的处理规则,进行加密处理,无需人工干预,大大提高数据处理效率。

用户层包括政府机构、企业以及个人用户,他们既是数据提供者,也是数据使用和维护者,政府部门之间、企业之间、个人之间以及他们相互之间都可进行数据交互,用户可免费使用区块链网络,但仍需实名认证注册,对失信或其它危害性特殊群体则禁止使用。用户对数据层的访问权限也有区别,企业及个人无法访问敏感数据,政府是数据的管理者,有最高权限。与常规数据共享平台不同的是,用户可通过区块链可信网络进行数据交换,而无需集中式存储。

应用层是基于区块链3.0构建的基于政府数据的区块链应用,由企业开发的应用则由企业制定使用规则向公众开放收费获取利润,政府部门也可购买企业开发的应用向公众免费开放,企业可成为政府与公众之间的中介,政府、企业、公众之间形成相互合作的协同关系,政府数据价值得到有效释放。

(二)系统运行机制

基于区块链技术的政府数据开放系统的运行过程可以看作是政府数据价值实现的过程,分为数据数字化、数据开放、数据利用两个阶段。

数据开放的前提是数据数字化,否则计算机无法处理,特别是大数据时代,政府数据量是非人力能处理的,但这一步也是最艰难的,特别是一些历史数据由于当时信息化水平不高,没有形成数字化格式。

数据开放流程可分为数据发布、数据请求及数据授权。数据发布由加入区块链网络的某个节点发起,根据数据类型,将数据的详细描述信息写入分布式文件目录,然后将数据发布信息以及上一区块ID写入分布式账本,由区块链网络进行共识并全网同步。数据请求前要注册并加入区块链网络,检索所需数据目录,并通过区块链网络提出数据请求,将请求信息写入区块,由区块链网络进行共识并全网同步。数据授权通过智能合约制定的规则自动进行,如果密钥、权限等级以及身份认证等都满足条件,并且所请求数据在规则允许范围内,则通过请求,否则拒绝。

数据利用主要采取政企合作的方式对数据进行有效开发,以政府数据为基础进行应用开发大赛,对有发展前景的项目由政府或者企业进行投资,如果纯属对社会有益,但经济价值不高的项目可由政府出资,对开发成本高、经济价值高的项目可吸引社会资本进行投资。由于应用开发是基于区块链网络的,因此应用所产生的新数据可直接通过区块链网络进行采集,这些数据的归属可通过智能合约制定规则,实现政府数据开放系统良性循环,最大可能释放政府数据价值。

(三)系统优势及存在的不足

基于区块链技术的政府数据开放系统与传统集中式数据开放系统有优势也有不足之处。

优势在于:其一,提供一种公众参与政府数据开放及利用的机制,这种参与的响应速度与政府或数据量大小无直接关联,只受区块链网络的影响,公众更有参与感。其二,有效提高区块链网络节点资源利用效率,避免浪费网络节点资源,且无须大量存储空间,每个区块只需记录原始数据唯一标识,原始数据无须在网络节点间多次传输。其三,由于原始数据无须在网络节点间多次传输,对敏感数据进行加密并进行集中式存储,对数据访问权限设置分级分类管理,大大提高了数据的安全性。

不足在于:其一,系统非完全去中心化,需要有一个可信任的政府作为保障,政府拥有对数据管理的最高权限,但任何操作依然会被记录,并不可篡改操作记录。其二,激励力度不够,相比政府和企业而言,对个人的激励力度相对较小,个人是否加入区块链网络完全取决于是否对政府数据有需求。其三,对于敏感数据的利用受到一定的限制,由于敏感数据可能侵犯隐私或触犯法律,相关权责不清,技术上无法对此做出反应。

三、基于区块链技术的政府数据开放路径

(一)完善政府数据开放相关制度

国家目前对数据和隐私保护的专门法律尚未出台,对数据开放也没有做过多限制,但如何利用政府数据,也没有法律明文规定,决定权在政府部门,而政府部门害怕犯错也不敢完全开放敏感数据,因此急需一系列专门针对政府数据开放的法律法规,消除政府部门的后顾之忧,不仅如此,还应出台相关政策鼓励政府数据开放,支持政府部门间的数据共享。另一方面明确数据管理者、使用者、拥有者的权责。政府虽然是数据的管理者,但有部分数据是政府与其他机构或者个人所共有,其公开的决定权不在政府,而需要共同决定;同时建立数据违法行为惩罚制度,认可区块链取证。

(二)构建数据开放激励机制

政府开放数据的动力不足、公众参与政府数据开放的热情不高是造成政府开放数据质量不高、价值密度低的重要因素。区块链技术为公众参与政府数据开放提供了一个新的途径,从技术上在一定程度上可激励公众参与政府数据开放,但目前仅限于企业,前提是有利可图,而对政府的激励也仅限于可减少工作量,对个人而言则是没有明显激励作用,因此需要从体制机制上对个人和政府进行有效激励。一方面对政府部门因开放数据而取得社会和经济效益给予物质奖励,对参与政府数据开放的个人,则根据区块链记录的工作量进行减税或数据生活补贴,对企业则采取政府购买服务、补贴奖励的方式进行激励。另一方面,鼓励公众对政府数据存在的问题或者错误进行质疑,并强制相关政府部门进行核实和改进;关注公众对政府数据的需求并积极回应,在全社会形成政府数据开放氛围。

(三)进行区块链技术创新

区块链技术从理论上有利于政府数据开放及其价值实现,但目前尚处于理论阶段,区块链技术脱离数字货币进入更广阔的应用场景还需要时间,相关技术还有待突破。一方面创新数据加密技术,传统数据加密技术计算复杂,无法实现海量数据有效加密存储,该项技术的突破将大大提高数据的安全性。另一方面跨链技术创新,实现由不同方式构建的区块链之间的有效互通是当前研究的热点,也是难点和关键点。最后,需要构建区块链技术生态,将区块链技术与社会各个领域进行有效结合,以需求为动力,推动区块链技术创新。

猜你喜欢

敏感数据分布式区块
干扰条件下可检索数字版权管理环境敏感数据的加密方法
基于大数据的智能数据脱敏系统
区块链:一个改变未来的幽灵
实现虚拟机敏感数据识别
区块链:主要角色和衍生应用
基于透明加密的水下通信网络敏感数据防泄露方法
区块链+媒体业的N种可能
读懂区块链
分布式光伏热钱汹涌
分布式光伏:爆发还是徘徊