APP下载

统计数据共享方式应用研究

2022-09-10王习涛

统计理论与实践 2022年8期
关键词:资源共享加密区块

杨 鹏 王习涛 侯 芳

(1.河南省统计局,河南 郑州450008;2.河南信息统计职业学院,河南 郑州 450008)

随着经济社会及信息技术的快速发展,统计数据生产速度越来越快,数据越来越多,但条块分割、资源分散、重复利用率低等问题依然存在。如何利用现代信息技术手段,有效整合各方数据资源,充分发挥统计整体功效,提高统计服务能力,一直是研究的热点。

一、国内外研究情况

按照联合国统计司的《国家统计组织手册》分类标准,现有政府统计类型分为集中型、分散型、混合型三种,其中集中型指政府统计工作由国家综合统计部门承担(如加拿大),分散型指统计工作以部门或地方统计为主(如美国),混合型指既有国家综合统计部门,也有部门统计,通过分工合作,共同完成国家统计工作(如中国)。不同的统计组织模式决定了不同的统计共享需求,尽管美国等发达国家在统计数据共享理论和实践方面取得了一些成果,但针对政府综合统计与部门统计间数据共享研究的文献却不多见。

国内对政府综合统计与部门统计间数据共享的研究较多,其中叶长法(2005)从政府综合统计与部门统计关系出发,提出建立统计信息共享机制[1]。王华莹和徐晓音(2011)提出加强政府综合统计部门的监管职能,进一步提高部门统计人员素质,推动政府统计数据共享工作[2]。肖引(2010)、刘华(2020)、李志友(2010)等从管理和制度层面研究统计数据共享中存在的问题[3-5]。但多数研究仍停留在剖析共享力度不够的政策、机制,没有从技术角度提出具体可行的解决方案。本文通过分析、梳理河南省统计数据共享的现状和存在的问题,依靠现代信息技术,提出解决统计数据共享问题的应用技术方案。

二、统计数据共享的重要性

随着大数据、人工智能、区块链、云计算等信息技术的快速发展,统计数据采集技术实现了从纸介质填报到网络自主填报的跨越,充分利用“5G+物联网”技术,生产数据的自动采集已在部分行业实现。在此时代背景下,推动统计数据共享具有十分重要的意义。

(一)安全、可靠的统计数据共享是依法统计的体现

2017 年8 月1 日起施行的《中华人民共和国统计法实施条例》明确规定:统计资料能够通过行政记录取得的,不得组织实施调查;部门统计调查项目的主要内容不得与国家统计调查项目的内容重复、矛盾。因此,加强统计数据共享,充分利用部门统计资料,可以有效减少重复调查,减轻基层统计负担,是提高统计公信力、依法统计的重要体现。

(二) 快捷、高效的统计数据共享能提升统计数据质量

部门统计是我国统计工作的重要组成部分,是政府综合统计的重要补充。充分利用部门统计数据能够更加准确地圈定统计调查范围,更加精确地开展统计审核,更加高效地实现统计评估分析,有效提高统计数据质量,大幅提升统计服务能力。

(三) 全面、广泛的统计数据共享能发挥“ 大统计”整体功效

全面覆盖的统计数据共享能够最大限度发挥统计信息资源的经济和社会价值,实现统计信息资源跨行业、跨部门、跨单位广泛、深入利用,保障统计数据真实、协调,全面、精确地展现统计调查对象的实际情况。

三、统计数据共享现状

我国政府统计类型是混合型组织方式,既有政府综合统计部门(统计系统),也有部门统计,通过分工合作,共同完成统计工作。因此,数据共享主要发生在综合统计部门内部、综合统计与部门统计之间。

(一)综合统计与部门统计的数据共享

当前,综合统计与部门统计之间的数据共享主要通过电子邮箱、自建信息交换系统、VPN+统计业务网数据存放等方法。电子邮箱安全性较低,自建系统和VPN 方式存在维护压力大、安全性逐步降低的问题。当前常规性、周期性的统计数据共享都可以依赖各级政务资源共享平台。

政务资源共享是我国电子政务发展、升级的趋势,是建设服务型政府、提高政府服务效率的必然追求。我国通过“十二金工程”(金税、金关、金财等)建设,关键信息生产领域得到快速发展,相关部门信息化程度大幅提高,形成了上下联通、互相隔离的部门信息系统。2016 年9 月,国务院印发了《政务信息资源共享管理暂行办法》,是国家推进政务信息资源管理制度建设的重要文件,从国家高度规范了各级政府部门政务资源管理、共享行为,为全国政务资源信息共享、交流奠定了制度基础。在随后的新一轮机构改革中,各省(自治区、直辖市)逐步设立大数据管理局,进一步夯实政务信息资源共享的机构基础。

如图1 所示,当前政务信息资源共享主要采用集中与分布相结合的交换方式。各级大数据管理部门在本级政务外网设置数据交换中心,并为各数据交换部门设置前置机。各数据交换部门根据需要创建共享目录,按照共享目录向前置机推送数据,大数据管理部门通过交换中心建立各部门前置机间的数据通道,数据使用部门即可获取所需数据。

图1 政务资源共享系统部署示意图

目前河南省各省直部门共创建数据共享目录1202 个,其中河南省统计局、河南省税务局、河南省市场监督管理局等共享目录数位居前10 的单位共创建793 个目录,占比66.0%;河南省统计局创建目录272个,占比22.6%,居首位。

政务资源共享平台由河南省行政审批和政务信息管理局主导,通过政务外网联通各省直部门,通过市级政务资源共享平台联通各省辖市(示范区),满足周期性、规律性数据交换的业务场景需求。

(二)综合统计内部的数据共享

综合统计内部数据共享主要依托统计业务网中的业务信息系统实现企业数据的实时共享,实行一次报送、各级共享、分级评估的工作模式,有效地提高了统计工作效率。

如图2 所示,企业通过网络认证后在线报送统计数据到河南省统计局,并实时同步到国家统计局,各级统计人员进入统计业务网审核、评估、验收数据,审核、评价、验收结果各级实时共享。

图2 联网直报系统拓扑图

此外,统计系统内部数据共享还使用统计业务网内的统计邮箱、统计网盘等技术手段。

四、统计数据共享中存在的问题

( 一) 对共享重要性认识不足, 推动数据共享的主观意愿不强

受重生产、轻开发的统计工作模式影响,各级统计人员对数据共享的意义认识不够,推动统计数据共享的意愿不强。归结起来大致有以下原因:一是对数据共享工作的认识、重视程度不够。国家《政务信息资源共享管理暂行办法》要求“以共享为原则、不共享为例外”,统计数据作为重要的政务信息,在信息共享主观认识上仍有大幅提高的空间。二是受传统“本位主义”影响,认为数据是统计生产的结果,只限于本单位使用。尤其是强势部门,认为拥有信息是本部门权力及优势的体现,人为设定信息共享壁垒,不愿进行信息共享。三是对数据开发应用认识不足,不能适应大数据时代要求,缺乏对政府统计数据协调、统筹使用的大局观,满足于条块分割、各自为政的工作模式。

(二)对统计数据共享的法律、法规支撑不足,共享积极性不高

虽然《统计法》和《政府信息公开条例》中有要求政府信息公开的内容和程序,但是《保密法》等其他一些相关法律法规更多强调的是政府信息资源的保密,政府统计工作人员对统计数据共享安全心存疑虑,导致能不共享就不共享,能少共享就少共享。

此外,数据共享中存在权责不清的现象,数据提供方提供数据要承担数据的正确性和解释责任等义务,数据使用方享受数据带来的成果却不承担任何相应的责任。应落实数据共享使用责任,使用方在获得数据的同时应充分理解并合理使用数据,承担正确使用数据的责任,对数据使用方面的质疑具有做出合理解释的责任。这就迫切需要完善统计信息资源共享的相关法律法规,明确政府统计信息资源采集、储存、分析、公开、发布、交换、共享、监督等信息应用过程中的法律地位。

( 三) 数据共享手段落后,进一步降低了统计共享的积极性

目前常用的数据共享方式都是基于非涉密网(邮箱、FTP 服务)、非涉密介质(普通U 盘等),数据共享渠道标准不统一,多数基于手工操作,数据申请和获取需要单独协商,共享行为没有形成常态,直接影响数据深度利用和开发,没有充分发挥政府统计数据价值。

(四)政务资源共享系统不适合统计数据共享

由大数据管理局主导建设的政务资源共享系统提供接口、库表和文件三种共享模式,适合一条记录一件事的业务模式,主要以行政记录共享为主。统计宏观数据中每一个价值量指标都具有报告期、调查范围、计量单位、地区分组等多个属性,且存储方式较复杂,往往以文件格式共享,共享及调用效率较低,不太适合目前的政务资源共享方式。

五、进一步加强统计数据共享的对策及技术手段

阻碍统计数据共享的因素有多个,既有思想认识的不足,也有规章制度的不健全,更有信息技术的落后。因此,提高统计数据共享效率要多管齐下,共同发力。

( 一) 以建设服务型政府为目标,转变工作思路,提高统计数据共享意识

推进统计数据共享首先要提高相关部门领导和工作人员的共享责任意识,要形成数据是公共财产,在符合安全保密要求的情况下,共享是常态,不共享是例外,逐步转变工作思路,杜绝习惯性拒绝共享的工作态度。

统计共享管理部门要以点带面、以案促教,积极宣传统计数据共享的重要性和优秀案例,引导相关人员形成正确的认识,调动各个业务部门参与数据共享的积极性。

( 二) 建立健全统计数据共享的法律保障机制, 提升统计数据共享积极性

对外,要严格遵守《河南省政务数据共享交换平台管理暂行办法》,依托省政务资源共享平台,坚持“我为人人,人人为我”的共享思想,积极申请部门数据共享,主动申请共享统计数据,提升统计数据质量,展现统计良好形象。

对内,要建立健全共享流程管理,厘清权利、责任。数据共享过程要有发起申请、审批申请以及共享执行,做到环环相扣、层层落实。数据提供方提供了数据,拥有数据的最终解释权;数据使用方获取了数据,要充分理解数据的准确含义,担负正确使用相关数据的责任,并主动承担数据的直接解释义务。杜绝数据使用方获得了工作成果,却将数据的解释任务都推给数据提供方。

( 三) 充分利用信息化发展成果, 提高统计数据共享效率和安全性

从政府统计共享中存在的问题可以看出,培养对统计大数据的认识,提高统计数据共享意识需要过程,而当前阻碍统计数据共享的最直接原因是共享途径和手段的缺乏。没有高效、安全的共享手段,数据共享过程及共享效果就会大打折扣,共享意愿和积极性会大幅降低,对共享带来的顾虑会更多。因此,如何建设高效、安全的共享渠道,从技术层面提升数据共享效率,提高共享数据安全是亟须解决的问题。

1.应用区块链技术提升统计数据共享安全水平

区块链是一种去中心化、网络健全、安全可信的技术,基于区块链的统计信息共享能够从技术上解决当前信息共享中存在的问题。

(1)区块链技术的优势

区块链是比特币的底层技术,伴随着比特币的风靡而受到关注。区块链通过哈希函数、非对称加密、数字签名等相关技术实现了非可信网络状态下的可信交易,通过共识机制实现数据一致。区块链的核心技术使区块链具有安全、透明、防篡改、可追溯的优点(见图3)。

图3 区块链结构

①安全性。区块链采用哈希算法和非对称加密技术实现数据摘要、签名及加密,数据一旦上链就不能修改,修改任何数据都会导致整个数据链的崩溃,在链尾增加节点需要获得全网50%以上的算力,极大提高了数据安全性。数据的分布式存放确保部分节点的故障不会影响其他网络共享行为,提高了系统可服务性。

②透明性。由于区块链的分布式存储,除用户加密信息外,所有共享数据可以对入链的任何用户开放查询权限,而且数据一旦上链不能修改,加强了对政府统计数据的监测,可以督促规范政府统计行为,提高统计数据质量。

③防篡改性。上链数据的哈希值存储在区块头上,而下一个节点将存储上一节点的哈希值,从而成链,任何对节点数据的修改将会导致该区块哈希值的变化,进而导致后续所有区块的哈希值与原有账本对不上,导致原链的崩溃。

④可追溯性。区块链成链后不能修改,所有数据共享记录将按照节点顺序一一存放,沿区块链向上逐块读取可恢复所有数据共享记录。

(2)区块链节点的生成过程

每当记账服务器需要生成新的区块时,区块生成模块会读取上一区块的根散列值(哈希值),按照Merkle 树规则生成本节点的根散列值(哈希值),再增加时间戳和随机数等其他信息生成区块头,将区块头和包含所有统计共享记录的区块体一起加入区块链末端。

由于每个区块都包含上一个区块所有数据包的数据指纹(根散列值),计算当前区块的数据指纹(Merkle 树根散列值)时,同时包含了上一个区块的数据指纹(根散列值)和所有统计共享记录,因此任何节点共享记录的修改都会导致后续所有节点的修改,否则区块链必将断裂,从而实现区块链的不可篡改性。

(3)使用区块链实现统计数据共享需要解决的问题

区块链的技术特点决定了其在非可信网络环境下具有较高的数据安全性能,但安全是一个相对的概念,使用区块链提高安全性的同时也带来了一定的负面影响,如共享操作延时长、带宽占用率高等问题。因此,需要针对统计共享需求和环境合理选择技术方案。

(4)采用更符合政府统计共享需求的区块链

区块链主要分为三种类型:公有链、私有链、联盟链,分别用于不同的场景。公有链建设在互联网上,对所有参与者开放,无须注册,可匿名加入,每个参与者都有争取记账权的权利,都可保存一份交易记录,随着参与者的增多,交易效率必然大幅度降低。私有链建设在内部网络里,由组织管理者指定部门用户负责记账,可以设定相关用户权限;私有链实现了数据在内网透明、防篡改、可追溯的共享,参与成员数量有限、身份透明,且无须竞争记账权,数据分布存储节点有限,因而十分高效。联盟链介于公有链与私有链之间,部分公开,通常用于部门间数据共享,链上部门用户有限,授权加入,共同记账,具有较高效率。

通过对比分析可以发现,在统计业务网内部或单位内部网段,可以使用私有链建设,实现高效应用;在各统计部门之间或省统计局与各省辖市统计局之间可采用联盟链建设,具有兼顾安全、透明、高效的优点。

(5)解决大型文件的共享需求

政府统计数据格式不同于传统逐条生成的行政记录,大多以Excel 表格、Word 文档以及其他数据格式存储。如何将区块链技术与统计工作实际相结合,设计符合政府统计数据共享需求的数据存储模式也是研究的重点。

一种方式是将要共享的信息资源直接写到区块中,区块链既用于信息资源的查询或查找,同时也用作信息资源的存储载体。节点只需要对本地账本的数据进行遍历,就可以获得共享信息。这种方式解决了实时的问题,但会造成整链存储空间的快速增加,不利于长期数据共享。

另一种方式是将要共享的信息资源的目录、文档摘要以及对称密钥存储在区块中,信息资源本身仍存储在区块链外的存储设备中。区块链于信息资源查询或查找、共享申请和授权、权限管理及完整性验证,但不参与信息资源的交换。信息资源的交换和传播由共享网络的传输机制来实现,还可以利用智能合约来保证信息共享行为顺利完成。这种方式的特点是数据储存在区块链之外,可以用于大容量数据的共享,也是目前多数已落地项目采取的方式。

(6)兼顾效率与安全

区块链通过非对称加密实现数据签名和加密。非对称加密安全性高,但加密时间长,对统计数据共享的效率影响较大;对称加密效率高,但安全性有所降低。可根据政府统计工作实际,合理组合使用对称、非对称加密手段,合理使用流对称加密和块对称加密,既保证数据安全,又满足统计共享效率。

2. 应用基于PGP 的邮件系统保障共享传输安全可靠

PGP 是Pretty Good Privacy(很好的隐私)的缩写,是1990 年由菲利普·齐墨尔曼编写的密码软件,现在依然被广泛使用。统计系统可以利用联网直报系统配置的PKI(公钥基础设施)认证系统实现基于PGP 的安全邮件系统开发、部署,尤其是使用国产计算机配置的认证U 盘可提供高级安全的信息认证、加密服务。

(1)PKI 工作原理

PKI 系统包括PKI 策略、软硬件系统、证书机构CA、注册机构RA、证书发布系统和PKI 应用等。证书机构CA 负责发放证书、规定证书的有效期和通过发布证书废除列表(CRL)确保必要时可以废除证书。注册机构RA 负责收集用户信息和确认用户身份的功能。证书发布系统负责证书的发放。

PKI 是数据加密、认证的核心。数据加密技术分为对称加密和非对称加密。对称加密中信息发送方加密和接收方解密使用的是同一把密钥,对称加密具有算法简单,加密解密容易,效率高,执行快的优点,但只有一个密钥,如果密文被拦截,且密钥也被劫持,信息很容易被破译,所以相对来说不够安全。非对称加密需要两个密钥:公开密钥(publickey,简称公钥)和私有密钥(privatekey,简称私钥),公钥对外公开,私钥由所有者保存,绝不在互联网上传送,且不能从公钥计算出私钥。非对称加密用数据接收方的公钥加密,从而确保加密数据只能由接收方解密打开。发送方使用自己的私钥对消息摘要加密,接收方使用发送方的公钥解密,并与消息摘要比对,从而确认发送的信息没有被篡改及验证发送方身份。非对称加密利用公钥、私钥实现数据加密和信息认证,既可完成信息加密传输,防止泄露篡改,又可实现用户信息认证,防止抵赖行为,但存在加密和解密花费时间长、速度慢等问题,仅适合对少量关键数据进行加密。

(2)统计系统内部基于PKI 认证、加密的邮件传输服务

使用PKI 系统发送加密邮件流程如图4 所示。首先对邮件内容进行压缩,随机生成对称密钥,使用对称密钥对压缩后的邮件内容加密,使用摘要算法对压缩邮件生成内容摘要,并将内容摘要和对称密钥拼接,并使用发送方的公钥进行加密,再将非对称加密内容与对称加密的压缩邮件拼接,进行转码生成发送内容。最后,依靠现有邮件系统发送加密内容。

图4 增加内容摘要的P G P 协议加密过程

解密过程是加密过程的逆过程。接收方收到邮件后首先进行转码,然后使用本机存储的私钥对非对称部分解密,获得发送方加密的消息摘要和对称密钥,使用对称密钥对传输的数据解密,利用摘要算法生成信息摘要,对比解密摘要和本地生成摘要,验证信息是否被篡改,如无篡改则解压获取邮件内容,从而完成信息安全发送。

通过组合使用对称加密和非对称加密,在保证加密解密速度和安全性的基础上实现邮件安全发送,能有效提高统计业务网数据共享安全性。

3.建设宏观数据共享系统,全方位提升数据共享水平

依托统计业务网建设统计宏观数据管理系统,实现宏观数据的指标、数据全流程管理,为各统计专业建设逻辑独立的宏观数据专业库,实现生产库(联网直报)到宏观专业库及宏观发布库的一键摆渡,实现专业宏观库间,以及到各市县专业宏观库的一键同步,解决专业间、上下级间数据共享的需求。

由于推动政务资源共享工作的需要,各省直单位间通过政务外网可达,因此,可建设部门统计资源共享系统并部署在政务云上,从而实现各省直部门数据共享交换,减少信息系统互联网服务模块,提高系统的安全性。

采用HTTPS 协议实现对称加密的数据安全传输。HTTPS 是身披SSL(Secure Socket Layer)外壳的HTTP,运行于SSL 上,SSL 运行于TCP 之上,是添加了加密和认证机制的HTTP。

HTTPS 协议通信过程:

(1)客户端浏览器发起连接(HTTP 通信的第一步),端口是443。

(2)WEB 服务器将公钥发给客户端。客户端生成一个session key,并且将session key 用公钥加密后发送给服务器。

(3)服务器用私钥将session key 解密出来。

(4)客户端和服务器用session key 做对称加密通信(HTTP 通信的第二步)。

统计数据共享是提升统计工作效率,挖掘统计数据价值的重要手段。推进统计数据共享既要不断健全统计数据共享的规章制度,引导统计人员形成常态化的共享工作模式,也要充分利用现代信息技术,保障统计数据共享的安全性和便捷性。只有同时拥有制度和技术双重保障,才能真正调动各级统计人员参与共享的积极性,才能为政府决策和社会治理提供更好的数据服务。

猜你喜欢

资源共享加密区块
交通运输数据资源共享交换体系探究与实现
一种新型离散忆阻混沌系统及其图像加密应用
福建省交通运输信息资源共享平台
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
针对大数据背景下工程造价信息的资源共享
一种基于熵的混沌加密小波变换水印算法
区块链将给媒体业带来什么
区块链+媒体业的N种可能
加密与解密