APP下载

新型政务数据开放开发模型设计

2020-07-09吴敏

现代信息科技 2020年23期

摘  要:针对当前政务数据开放共享存在的障碍和问题,文章提出将多方安全计算技术应用到政务数据开放共享领域,设计新型政务数据开放开发模型,从政务数据汇聚共享、开发开放和数据交易市场发展三个方面设计基于多方安全计算的政务数据开发开放解决方案,攻克政务数据开发开放过程中的数据安全和隐私保护问题,实现跨部门数据的融合共享及开发利用,充分发挥政务数据资产的价值。

关键词:多方安全计算;政务数据开发开放;数据资产目录;数据产品;联合模型

中图分类号:TP309;TP311.13      文献标识码:A 文章编号:2096-4706(2020)23-0144-03

A New Design for Opening and Development Model of Government Affair Data

——A Multi-Party Secure Computing Design Scheme to Solve the Difficult Problem for Developing and Opening of Government Affair Data

WU Min

(Fujian Nebula Big Data Application Service Co.,Ltd.,Fuzhou  350003,China)

Abstract:In view of the obstacles and problems existing in opening and sharing of government affair data at present,this paper proposes to apply multi-party secure computing technology to the opening and sharing domain of government affair data,designs a new opening and development model of government affair data,and designs an opening and development solution of government affair data based on multi-party secure computing from three aspects of government affair data aggregation and sharing,opening and development,and data trading market development. It solves the problems of data security and privacy protection in the process of opening and development of the government affair data,realizes the integration,sharing,development and utilization of data across multiple departments,and plays fully the value of government affair data assets.

Keywords:secure multi-party computation;opening and development of government affair data;data asset catalog;data product;joint model

0  引  言

2020年4月,中共中央、国务院印发《关于构建更加完善的要素市场化配置体制机制的意见》,首次将数据同土地、劳动力、资本、技术等传统要素并列作为新生产要素,并明确要求“推进政府数据开放共享”。中国80%以上的数据资源掌握在各级政府部门手里,发挥数据的应用价值离不开政府数据的开放共享。政府数据的开放共享程度和数据的开放共享管理机制直接影响到数据利用效果,进而影响社会经济的整体利益最大化。但是当前的政务数据开发开放还停留在初级阶段,出现诸多难题阻碍了政务数据开发开放工作的顺利进行,成为我国实施大数据战略、发展数字经济的最大桎梏。

1  政务数据开发开放存在的问题

当前,政务数据开发开放成为电子政务信息化建设的热点,推进政务数据开发开放,是加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护的重要途径。当前,政务数据开放工作还面临一些问题、存在一些挑战:

(1)政务数据开发开放缺少数据基础。政府原有的信息管理系统主要是国家的金税、金关、金财、金审、金盾等“金字”信息工程以及各部门自建的信息管理系统,由于组织管理体制的条块化,决定了业务系统的条块化,形成一个一个“信息壁垒”,客观上造成数据共享障碍。

(2)数据所有权和使用权无法分离。当前,将初級数据挂在政府网站或者直接提供给企业、社会的政务数据共享方式,在企业和社会获得了政务数据使用权的同时也就相当于获得了政务数据的所有权,导致政府难以管控开发开放出去的初级数据的使用范围、用途、用量和有效期,使政务数据的开发开放受到严重制约。

(3)数据开放技术存在不足。当前在数据处理方面,存在数据格式和质量参差不齐、没有统一的标准等问题,导致数据质量不高、数据分类不清晰、数据更新不及时、数据格式不规范;另外,开放数据平台功能相对简单,数据互操作功能和个性化服务、可视化服务等功能不完善,未能满足使用者需求。

(4)个人隐私保护造成数据不流通。个人数据正在成为一种新的资产,政府机构对其持有的个人数据必须给予充分的保护,以对抗黑客的信息窃取,但隐私政策使得数据在政府部门之间难以流通,政府部门难以利用分散的个人信息来进行分析,提供决策支持。

因此,目前亟须一个覆盖从政务数据共享到政务数据开发开放,既能保护数据隐私又能实现数据流动起来最大化其价值的解决方案。

2  多方安全计算技术可行性论证

多方安全计算(Secure Multi-Party Computation,MPC),

是一种保护数据安全隐私的多方计算算法,主要解决无可信第三方的情况下,如何安全地计算一个约定函数的问题。在整个计算协议执行过程中,每一个物理隔离的参与方对己方数据始终拥有控制权,数据在不泄露的情况下联合其他各方的数据进行计算并得到明文计算结果,并且参与各方拿到计算结果后也无法推断出其他参与方的原始数据。

安全多方计算经过多年的发展和研究,技术和应用上都比较成熟。安全多方计算效率已初见成效,行业中涌现了大批的多方安全计算平台,比较出名的有阿里系蚂蚁集团的蚂蚁链摩斯多方安全计算平台、百度系百度安全的MesaTEE安全计算平台等等。

采用多方安全计算的优势有以下几点:

(1)保护数据隐私。用户将计算节点部署到本地,多方安全计算平台作为代理,节点间通过代理进行加密通信。各个计算节点在数据和模型不离开本地的前提下,协同进行模型更新和迭代。整个计算过程无私密数据的明文信息或原始数据集的传播。

(2)打破部门壁垒。公安、人社、医疗等政府部门各自建设的信息化系统在为各部门工作带来便利的同时也形成各行业数据孤岛。多方安全计算使得各部门在保证自身私密信息不泄露的前提下,安全利用跨行业的数据资源,为本部门创造更大的价值。

(3)模型训练与预测分析。使用MPC技术将多方数据联合在一起,通过MPC预处理保证数据格式统一和数据的隐私性,在多方数据基础上训练出的模型将更加准确,从而对未知情形提供更加合理的预测。

3  应用于政务数据开发开放的多方安全计算解决方案设计

福建省星云大数据公司于2020年规划分布式超融合大数据运营总体框架并依据此框架规划了数据资源中心产品,目前产品正在不断研发迭代过程中。笔者在公司主要负责以数据为核心的行业应用规划和顶层设计工作,在分布式超融合大数据运营总体框架规划过程中,提出用多方安全计算框架破解政务数据开发开放难题,并研究设计了应用于政务数据开发开放的多方安全计算解决方案。

3.1  基于多方安全计算的政务数据汇聚共享体系设计

政务数据汇聚共享中采用多方安全计算整体解决方案,解决传统的政务数据汇聚共享数据必须“拷贝搬家,数据存储多套”的做法,在确保数据不离开部门的前提下,充分整合数据,实现跨多部门数据的融合共享以及开发利用,实现“1+1>2”的效果。该方案可以有效解决政务数据汇聚共享中的难点,即满足部门数据安全性、敏感性不离部门管辖要求,又能充分整理利用数据价值,并为下一步的政务数据开发开放奠定基础。整体架构模型如图1所示。

在每个行业部门建设行业数据资源中心,部署行业多方安全计算(MPC)节点,负责对接省级多方安全计算(MPC)枢纽节点,接收枢纽节点发布的模型,执行模型训练任务,形成数据产品反馈给枢纽节点。MPC安全节点还负责对接行业部门业务系统,具备实时从业务系统获取数据的能力,参与模型训练的数据可以实时从相关业务系统获得。

在省级数据资源中心建设多方安全计算(MPC)枢纽节点,包括数据资产目录、模型发布管理、联合模型训练、数据产品管理、产品绩效管理等方面功能。数据资产目录,负责整合各个行业数据资源中心的数据资源目录,形成省级数据资源目录,省级数据资源目录包括初级数据目录和数据产品目录,在此基础上对初级数据和数据产品进行赋权形成数据资产目录,理清省级政务数据的家底,为下一步的政务数据资产开放目录建设奠定基础。模型发布管理,负责生成并发布数据模型到相关的行业MPC安全节点。联合模型训练,负责整合多个行业MPC模型训练成果,修订参数,完善模型,形成数据产品。数据产品管理,对MPC枢纽节点运行生成数据产品进行赋权、登记、发布等方面的管理。产品绩效管理即对数据产品的应用情况,各个行业MPC贡献情况进行管理,为下一步的数据产品运营收入分成奠定基础。

3.2  基于多方安全计算的政务数据开发开放体系设计

政务数据开发开放作为政务数据价值实现的主要方式,应在确保国家利益、公共安全、商业秘密、个人隐私等重要数据安全的前提下,破解公共数据资源开发利用体制机制障碍,主动释放政务数据资源的经济价值和社会价值,释放更多数据红利,有效推动数字经济发展。基于多方安全计算框架可以有效支撑政务数据开发开放,其整体业务逻辑如图2所示。

省级政务数据开发开放平台部署在互联网上,负责发布开放数据资产目录、开放数据产品管理、模型发布管理、联合模型训练、产品计费管理等功能。开放数据资产目录,列出可以开放的初级数据和数据产品目录,根据“政务数据可用不可见”的要求,可以开放的初级数据也不允许以数据的形式直接提供给企业,需要加工成数据产品后方可提供。开放数据产品管理,对MPC开放节点运行生成数据产品进行赋权、登记、发布等方面的管理。模型发布管理,企业可以在MPC开發开放节点上研发、测试和发布数据分析模型。

企业根据MPC开发开放节点上的开放数据资产目录结合MPC企业节点的企业数据资产目录设计数据分析模型,并将数据分析模型在MPC开发开放节点上开发、部署和发布。MPC开发开放节点将发布的数据分析模型分别发往MPC枢纽节点和MPC企业节点。MPC枢纽节点和MPC企业节点收到模型后,根据模型匹配自身数据进行训练,将训练所得参数提交到MPC开发开放节点。MPC开发开放节点将两方(也可以是多方)的参数进行联合训练,输出训练结果,形成数据产品,提供给企业。企业可以根据输出的数据产品开展经营活动。

3.3  基于多方安全计算的数据开发开放市场发展模式设计

采用多方安全计算框架(MPC)进行政府、企业多方数据融合分析挖掘的过程中,能确保政务数据不出政务网,企业数据不出企业的数据资源中心,物理上隔离了参与方的初级数据的传递,为数据使用的数据确权问题奠定技术基础,使数据的所有权和使用权可以实现分离,从而具备了将政务数据作为一种重要资产在数据市场上进行交易的条件,也为政务数据开发开放铺平了道路。基于MPC开放开发节点,政府部门可以规定开放政务数据的用途、用量、有效期等使用属性,企业在拿到MPC输出的数据产品后只能在授權范围内合理地使用数据,并能够将数据产品的使用权再次转让给第三人。多方安全计算框架(MPC)应用于政务数据开发开放上将极大提升政务数据开发开放的水平,将政务数据开发、开放、交易的本质由数据所有权转移转向数据使用权授权,重构政务数据交易模式,从而有效遏制初级政务数据泄漏,降低政务数据泄漏引起的数据流通风险。

4  结  论

发展数字经济要加快推进政务数据资产化,政务数据资产化、资本化是数字经济发展的必然趋势,数据财政将成为驱动政府开发政务数据资源主要力量。采用多方安全计算框架(MPC)可以加快推进政务数据资产化,推动建立数据的产权规则和数据要素市场体系,方便政务数据资源进行确权、定价,妥善解决政务数据开发开放过程中的难题,快速建设政务数据开发开放体系。

参考文献:

[1] 新华社.中共中央  国务院关于构建更加完善的要素市场化配置体制机制的意见 [J].中华人民共和国国务院公报,2020(11):5-8.

[2] 孟显印,杨超.我国开放政府数据应用开发的现状与问题 ——基于开放政府数据平台的分析 [J].情报杂志,2020,39(3):163-171+197.

[3] 王婷.安全多方计算理论研究综述 [J].信息安全与技术,2014,5(5):41-44.

[4] 苏冠通,徐茂桐.安全多方计算技术与应用综述 [J].信息通信技术与政策,2019(5):19-22.

[5] 邵晓红.政府数据开放的概念辨析、公共价值和先进实践 [J].通信与信息技术,2020(3):76-78.

作者简介:吴敏(1985—),女,汉族,福建宁德人,中级工程师,本科,研究方向:政府信息化顶层规划与信息系统设计。