数据主权交换平台方案模式研究*
2022-05-06房殿军郑卓远韩佳良向佳豪蒋红琰
房殿军 ,郑卓远 ,洪 晟 ,韩佳良 ,向佳豪 ,蒋红琰 ,4
(1.同济大学 机械与能源工程学院,上海 200092;2.青岛中德智能技术研究院,山东 青岛 266000;3.北京航空航天大学 网络空间安全学院,北京 100191;4.江苏科技大学 机械与动力工程学院,江苏 镇江 212000)
0 引言
数字经济时代的到来意味着全球行业现有商业模式的快速和重大变革。 对于制造业而言,工业4.0 和智能制造带来的信息化技术快速发展更使制造业在各方面面临着挑战和产业革命。为了迎接这些挑战, 数据主权交换是不可或缺的先决条件。企业需要分析挖掘大量内部和外部数据,以支持智能制造定制化生产的快速响应要求,同时保证数据主权和数据安全也是许多工业公司的基本需求。
在此背景下,数据主权交换的重要性不断凸显,能够自由高效进行数据交换,同时确保数据安全性和主权控制的数据主权交换平台的建立将成为构建数字经济生态的重要支点。 数据主权交换平台首先要保证在交换过程中对数据主权的控制;其次,要实现跨设备、跨网络的异构性数据主权交换;最后,要建立多样化、跨行业领域的数据主权交换渠道。
目前,全球各国均积极推进数据主权交换平台建设。 美国以大型云服务商亚马逊网络服务平台和微软旗下的软件和服务技术平台Azure 为领头羊,拓展全球数据市场;英国推出《国家数字孪生体原则》,计划在英国实现高效、安全的国家级数据共享;欧盟委员会发布《欧洲数据战略》,计划建立八大数据空间,打造欧洲数据经济和数字社会[1]。 我国“十四五”规划中也提出加快构建智能制造发展生态,持续推进制造业数字化转型、网络化协同、智能化变革的战略[2]。
对于我国的数据主权交换平台发展,首先要明确数据主权和数据主权交换的概念,同时借鉴国外成功的实践经验,理清我国数据主权交换平台的发展路径和架构搭建模式,探索符合我国国情的战略思路。
1 数据主权交换平台概述
1.1 数据主权和数据主权交换
1.1.1 数据主权
数据主权可以定义为自然人或公司实体对其数据完全自主的控制和管理能力。 数据主权要求数据所有者必须能够决定、控制和监控其数据发生的操作、数据的接收者以及数据的用途。
对于数据主权的控制不仅发生在数据传输的过程中,数据主权保护应是全流程的。 在数据提供者和数据接收者进入数据主权交换平台时,应存在认证流程;数据在传输过程中,应进行可追溯的加密传输;数据在使用过程中,应有进行操作监控、权限控制和拷贝修改控制等。
数据主权的目的是在保护数据的需求和共享数据的需求之间找到平衡。 所以针对数据类型和数据类别应采取不同的保护级别。 数据主权被视为发展数字经济中的关键能力,数据主权的建立与保护是数据主权交换平台构建的基础。
1.1.2 数据主权交换
数据主权交换是指在保护数据提供者的数据主权的同时,支持用户进行数据主权交换,实现数据交易、数据分析挖掘、加密传输、数据使用控制等一系列功能的实现。
以供应链的角度来看,数据交换有两种情形:第一, 数据交换发生在链内企业的垂直合作中,用以支持、形成或优化供应链和价值链;第二,数据交换发生在跨供应链的企业纵向和横向协作中,通过从数据中挖掘附加价值来实现新的业务模式。 传统的数据交换平台多为数据的链内交换,对于数据主权的保护并不重视,但随着跨链交换的场景越来越多,数据主权交换需要通过以下几个手段,实现在保证数据主权的前提下进行数据交换。
第一,认证与准入机制的完善。 在建立数据主权交换平台时,要对参与者进行完备的信息登记,并通过第三方认证确保其合规性,建立可信的协作网络环境。
第二,数据交换过程的加密。 在进行数据传输时,采取技术手段,如区块链技术、密码学技术对数据进行加密,防止传输过程中的数据泄露并保证交换过程的可追溯性。
第三,全流程的主权控制。 通过访问控制限制可访问数据的人员,同时在数据使用者端通过使用控制限制数据的修改、拷贝、传输等操作,保证数据全生命周期的主权控制能力。
1.2 国际数据空间
为适应工业4.0 的发展,解决数据互联和流通难题,德国联邦教研部于2014 年底正式提出了“工业数据空间行动”,旨在构建一个安全可信的工业数据主权交换空间,排除企业对数据主权交换不安全性的种种担忧,弗劳恩霍夫协会成为该项行动的领头羊[3]。 2018 年 11 月,“国际数据空间协会”(International Data Space Association,IDSA) 正式成立。 目前,已有超过 20 个国家的118 家企业和机构加入,实现了50 个应用案例[4]。
国际数据空间(International Data Space,IDS)的目标是要构建一个完整的数据生态,而非简单的交易平台,以解决数据主权管理问题和确保数据安全交换共享。 在将视角从单个用例场景扩展到平台结构时,国际数据空间将自己定位为一种架构,构建起安全数据主权交换和可信数据共享的策略和机制,也即数据主权原则[5]。 通过 IDS 连接器,国际数据空间的核心组件、工业数据云、个人企业云、本地应用程序和个人设备都可以连接到国际数据空间[6]。图1 为连接不同云平台的国际数据空间。
图1 连接不同云平台的国际数据空间
国际数据空间将通信和基础数据服务底层架构与智能数据服务高层架构连接起来,支持建立从数据源到数据使用的安全数据供应链,同时确保数据所有者的数据主权[7]。 如图 2 所 示,2019 年 4 月发布的国际数据空间参考架构3.0 模型包含五层架构、三个视角维度,涉及四大主体和三大运作流程。
图2 国际数据空间参考架构
其中,业务层定义了IDS 参与者可能承担的四类主体角色并对其分类,同时还指定了这些角色之间的基本交互模式。 除此之外,还给出认证和使用合同的定义;功能层定义了IDS 的基本功能要求,以及要达到这些功能所必须要实施的更细节的功能;处理层指定了国际数据空间的不同组件之间发生的交互,包括三个主要的运作流程:身份注册、数据主权交换及数据应用程序的发布和使用;信息层指定了 IDS 信息模型,即 IDS 的通用语言,是 IDS的参与者和组件共享的基本协议,目的是促进兼容性和互操作性;系统层将业务层指定的角色映射到具体的数据和服务架构上,以满足功能层指定的需求,从而可以被认为是国际数据空间的技术核心,系统层根据功能层确定的需求囊括三个基本的核心组件:IDS 连接器、IDS 代理及应用商店。
对应于五层架构,IDS 给出了从三个视角下的要求和责任。 从安全视角来看,IDS 安全架构提供了识别参与者、保护通信和数据主权交换以及在交换后控制数据使用的方法,在基础连接器上提出了可信连接器,划分了安全等级,并对整体平台的安全性提出要求;从认证视角来看,架构保证参与IDS的任何组织、个人及其用于交换数据的核心组件都有认证,且使用统一的认证流程确保参与者和核心组件认证的一致过程;从治理视角来看,架构从可治理性和合规性的角度定义IDS 的角色、功能和流程,定义了业务生态系统要满足的要求,以实现安全可靠的企业互操作性。
总体而言,国际数据空间作为一个虚拟数据空间,利用现有的标准和技术以及数据经济中广为接受的管理模型,促进安全和标准化的数据主权交换和数据生态系统链接,为创建智能服务场景和促进创新的跨公司业务流程提供了基础,同时保证了数据所有者的数据主权。
1.3 欧洲 GAIA-X 计划
为改变欧洲的数字基础设施目前掌握在少数主要的非欧洲企业手中的现状,2020 年6 月,德法两国提出“GAIA-X”计划,同时在比利时成立 GAIA-X基金会,旨在欧洲构建开放、联合、安全和可信的数据和云基础设施,作为数字生态系统的基础[8]。
GAIA-X 计划的目标是设计和实施数据共享架构,包括数据共享标准、案例实践、技术工具和治理机制,以及泛欧盟的云基础设施和相关数据服务。
为此,GAIA-X 计划和 IDS 相互补充,以确保联合生态系统云中端到端的数据价值链和数据主权[9],图 3 显示了 IDS 架构到 GAIA-X 架构的映射。
图3 GAIA-X 计划参考架构
GAIA-X 专注于主权云服务和云基础设施,而IDS 专注于数据主权交换和数据主权,GAIA-X 与IDS 的交互主要有三项任务:自主数据存储、可信数据使用和可互操作的数据主权交换,形成了基础设施生态系统和数据生态系统两大生态系统,并形成了四项主要原则:身份和信任、数据主权交换、联合目录及合规性。
与国际数据空间相比,GAIA-X 将形成一个更庞大和完善的网络,推动 GAIA-X 在地区、国家和国际上的合作实施[10]。 在这个网络中,一方面可以解决国家或部门的具体问题,另一方面可以组织跨国界合作,并将促进中小企业融入GAIA-X 生态系统,最终形成数据驱动的全新商业模式、创建跨界和跨网络的数据生态系统,使利益相关者能够在其中行使数据主权,从而维护和扩大工业竞争力。
2 国际数据主权交换平台建设案例
目前,已有众多企业加入了国际数据空间组织,并利用IDS 架构开发数据主权交换平台。 这些平台以实现数据主权交换传输、跨设备、跨网络数据互操作为目的,走在了建设数字经济的前列。
2.1 基于IDS 连接器的智能工厂网络平台
智能工厂网络(Smart Factory Web,SFW)是由弗劳恩霍夫IOSB 研究所和韩国电子技术研究所(KETI)共同开发的一个智能工厂平台[11],支持实现工厂资产和资源的灵活共享和管理,以最大限度地提高效率并提供全球市场的可见性。
SFW 通过 AutomationML,即基于 XML 的自动化描述语言进行本体建模,自动从导入参与者工厂的资产相关信息,以支持对资产和资源的共享[12]。 在工程内部,SFW 通过设置 OPC UA 服务器,通过通信协议提供来自工厂的实时数据。 此外,考虑到生产数据多为关键且涉密的,因此SFW 基于IDS 控制策略为数据所有者提供控制机制,保证通信安全和数据主权[13]。
图4 展示了SFW 的平台架构和工作原理。 SFW以IDS 连接器为基础建立SFW 平台连接器和工厂连接器,各连接器间的通信遵循 IDS 信息格式。 这些连接器利用 Apache Camel 技术在 IDS 基础连接器的基础上拓展工业组件,例如使用OPC UA 客户端从生产中实时读取数据,并对数据采用加密、证书认证等安全措施。
图4 SFW 平台架构及工作原理
SFW 平台连接器和工厂连接器使用MQTT 代理和MQTT 客户端来发布或订阅数据流。 用户在SFW 门户搜索工厂,打开配置文件时,SFW 门户向SFW 连接器发送实时数据的HTTPS 请求,请求被转发到工厂连接器,工厂连接器向OPC UA 服务器请求实时数据。
之后,OPC UA 服务器将返回数据传输到工厂连接器上的 MQTT 代理,SFW 连接器将订阅该 MQTT数据流,并通过HTTPS 协议返回新的数据值到SFW,通过可视化页面展示给用户。
SFW 数据主权交换平台专注于工厂间的生产数据主权交换和共享,利用生产能力的灵活调整来提高工厂资产的利用率。 工厂所有者可以在智能工厂网络上提供和获取生产能力、工厂资产和资源等数据,从而创造附加价值。
2.2 基于IDS 连接器的物联网数据主权交换平台
通常情况下,物联网设备难以直接接入数据主权交换平台,为此德国罗斯托克大学与弗劳恩霍夫研究院开发了针对物联网设备的数据主权交换平台,使独立于工厂或企业的物联网设备也可以进行数据主权交换共享[14]。 图 5 展示了物联网数据主权交换平台的架构。
图5 物联网数据主权交换平台架构
该平台借助 IDS 参考体系架构,基于 IDS 连接器开发 IoT 连接器(Internet of Things Connector)构建物联网设备和数据平台之间的接口。 并利用开放地理空间联盟(Open Geospatial Consortium,OGC)提供的物联网开放互操作性标准SensorThings API,搭建IoT 连接器和物联网设备之间的互操作层[15],实现来自物联网设备的数据的共享。
物联网数据主权交换平台使用MQTT 代理和REST 来订阅数据流,图6 显示了平台的工作原理。数据消费者连接到物联网数据主权交换平台,并使用自己的IDS 连接器检索希望获得的物联网数据。 在IoT 连接器获得订阅通知后,连接器可以通过MQTT订阅发送实时数据,也可以通过连接器中的OGC 组件将利用RESTful 服务和基于 JSON 的编码,对数据进行语法、语义互操作性的转换,并调用HTTP/RESTful接口向数据消费者提供历史数据。
图6 物联网数据主权交换平台工作原理
物联网数据主权交换平台通过IoT 连接器的开发,解决了独立物联网设备难以接入数据主权交换平台的问题,实现了广泛性的数据主权交换。
3 国内数据主权交换平台发展思路
面对数字经济时代的大发展趋势,各国先后将数据作为颇具战略意义的国家资源进行维护,探索数据主权保护、数据主权交换技术将是未来抢占国家核心竞争力的要点。 我国应充分借鉴德国、欧盟等发达国家或区域的先进实践经验,充分发挥我国在数据基础设施建设上的优势,从主权保护、平台架构、规则标准等多方面,制定符合我国现实状况的发展战略,打造国际接轨、国家主导、行业统一的数据主权交换平台。
3.1 发展思路和技术重点
3.1.1 发展思路
在第二节的案例中,各数据主权交换平台均将“数据主权”“实时交换”和“互操作性”作为其核心竞争力,并在构建数据主权交换平台时注重必不可少的六大要素:数据主权、可信认证、互联架构、统一标准、安全保障和运行机制。
在搭建数据主权交换平台时,我国要充分保证六大要素的实现,应从以下几点着手,逐步扩大发展格局,打造我国主导的数据主权交换体系:
(1)构建数据主权保护核心竞争力
对于数据主权的保护决定了我国所产生数据的实际价值,数据主权的充分保障是建立可信协作数据网络的基础。 数据作为一种虚拟商品,如同现实商品一样,其产生、储存、转移、使用、清除的过程也应受到监督和控制。 对于所有参与数据生命周期的参与者而言,必须在受控和受限的条件下进行数据的交换。 构建成熟的数据认证评估与监督体系将消除数据主权交换平台参与者间的信任危机,而在数字经济中,这一体系将不再停留于法律文件的书面约束,而是通过加密传输、使用控制、电子证书等技术手段实现更强有力的保证。
(2)构建多层次、多角度的立体数据主权交换
我国应充分审视数据主权交换平台的覆盖范围,拓展交换平台的兼容性。 随着电子商务、5G 通信等社会信息化技术的发展,数据主权交换将不仅局限在工业互联网中。 在构建平台体系时,对于众多物联网设备和移动设备应考虑其接入平台时认证、传输协议的标准统一;对于跨网络、跨行业的数据应寻找技术手段实现异构数据的互操作性;对于跨国数据传输,应考虑各国间数据政策和安全的合作,实现多网络层次、多行业区域角度的数据主权交换。
(3)构建广泛、多样的数据生态系统
在实现数据主权交换的基础功能之上,着眼打造完整的数据生态系统。 首先,关注底层数据基础设施的建设,构建全国性的主权云服务和云基础设施;其次,关注中层数据的利用,打造数据分析、数据挖掘与数据主权交换相结合的智能应用程序;最后,关注上层标准规范的统一,建立国际接轨、国家主导、行业统一的数据标准,扩大数据生态系统覆盖面,打造我国数据价值链。
3.1.2 技术重点
在建设我国数据主权交换平台时,应充分考虑数据主权保护和数据主权交换与新技术的结合。 目前,云技术、人工智能、区块链等技术的迅速发展,为数据主权交换的技术实现提供了先决条件,我国应重点关注以下技术的应用和集成:
(1)云平台
云平台的当前发展呈现多样化的趋势,以多种架构模式为特征,从以高度集中化的方法,如数据湖,到促进最大程度分散化的方法,如使用去中心化的分布式平台[16]。 多样化的云平台的出现使得数据消费者可以根据其想要交换和共享的数据产品的业务重要性和经济价值进行选择。 由于各平台之间需要发展安全和可信的数据主权交换和共享的能力,多样化的云平台也将推动数据主权标准的发展。
(2)物联网与工业物联网
物联网和工业物联网将包含越来越多的设备,并产生越来越多的数据[17]。 物联网和工业物联网架构的标准化,以及其数据主权交换和数据共享的标准化将促进数据市场的建立并推动实现数据经济。物联网和工业物联网中所产生数据的广泛使用将催生全新的智能化的以数据为中心的服务与新商业模式。
(3)大数据与人工智能
目前大数据应用程序通过附加数据(例如开放数据、来自其他公司的数据或来自数据市场的数据)来补充公司内部数据[18]。 通过数据主权交换扩展数据组合,将显著改进分析结果或开发全新的使用场景。
人工智能被越来越多地使用,将持续导致对外部数据(例如人工智能模型的训练)的更大需求,数据主权交换和数据共享的标准化架构的建立,将支持大数据和人工智能在工业生产中的研发与应用。
(4)区块链技术
区块链技术的使用,将推动数据主权和安全数据主权交换和共享的实现[19]。 区块链技术的可追溯性、高加密安全性等特点将支持数据市场中数据资产交易的流程,保证数据在交易过程中的一致性和透明性。
3.2 数据主权交换平台参考架构
依托国际数据空间的参考架构模型,本文提出一种建设数据主权交换平台的参考架构。 在本参考架构中,数据主权交换平台以连接器作为门户,与数据提供者和数据消费者端的连接器在可信数据主权交换网络中连接。 数据提供者端的连接器连接并控制数据源,数据消费者端的连接器连接并控制接收数据池。 同时,代理与认证端提供使用者的注册、身份管理、数据描述和查询管理等元数据。 此外,应用商店提供数据处理应用程序下载。 图7 描述了所提出的参考架构。
图7 数据主权交换平台参考架构
在认证流程中,数据提供者和数据消费者加入数据主权交换平台前,均需向代理与认证端提供其身份、设备信息及其拥有数据的描述信息,并经过认证中心颁发电子证书认证后,方可加入平台。
在数据主权交换过程中,数据消费者可以通过连接器B 在平台中的数据市场通过数据描述元数据进行检索,寻找所需要的数据,如连接器 A 所提供的数据。 之后,数据提供者和数据消费者将首先交换身份证书确认动态属性,交换协议的元数据并充分交换意愿,在达成交换共识后,数据将通过加密传输进行交换。 元数据和数据的传输过程将受到平台的严格监控和管理,并通过可追溯的方式,如区块链技术进行记录,保证传输安全性和数据主权。
在数据使用过程中,当数据消费者接收到来自数据提供者的数据后,该数据将被存储在受连接器B 控制的数据池中。 数据消费者应按交换协议中所规定的范围和权限使用数据,对数据的各类操作,包括存储、修改、阅览、拷贝、计算等应受到连接器B的严格使用控制。 此外,数据消费者可以在应用商店中下载受信应用程序进行数据分析、处理等操作。
在构建数据主权交换平台时,如表1 所示,参考架构从三个层面考虑其中的要点原则并关注其中的技术重点。首先在个体层面,要为设备、服务与参与者创建数据身份并进行认证,建立互信环境。在交互层面,主要考虑如何通过技术手段实现互操作性中数据安全交换、数据格式统一及交换流程标准化。 在生态系统或市场层面,则应考虑如何通过自我描述建立市场检索机制,同时在数据主权交换后如何实现数据操作限制,并通过值得信赖的运行环境拓展生态系统功能,实现数据应用程序的集成。
表1 数据主权交换平台参考架构
基于以上所述的几项要点原则,本数据主权交换平台参考架构具有以下几点优势:
(1)可信的协同网络环境
参考架构为加入平台的设备、服务和参与者创建可追溯的电子身份证书,并通过认证流程,确保加入平台的参与者拥有可信的设备和能力。 在可信环境下,参与者将更愿意进行数据的交换与共享。
(2)优良的数据互操作性
参考架构基于合规性认证的连接器实现对用户数据库的控制和管理,保证互操作的安全和简便。 通过资产和数据描述模型,双方可以在充分交换意愿的前提下进行数据主权交换。 同时,建立统一的数据格式标准,将大幅增强数据的互操作性。
(3)数据传输的安全性保证
要求进行加密、记录可追溯的数据传输过程,在数据市场中进行的数据交易将被统一监控和管理。此外,通过连接器进行使用控制,保证数据不会出现滥用,保护了参与者的数据主权。
(4)集成的数据应用程序
参考架构构建了应用程序商店模块,其中可以集成大数据挖掘、人工智能模型构建等数据分析程序,能够提升数据主权交换的价值。
4 结论
本文基于国际数据空间架构,提出一种数据主权交换平台参考架构体系,首先明确了数据主权与数据主权交换的概念与要点,并介绍国际数据空间和欧洲GAIA-X 计划构建数据主权交换平台的理念与架构。然后分别介绍了智能工厂网络平台及物联网数据主权交换平台的平台架构及模式,展示了国外基于IDS 架构建设数据主权交换平台的先进实践经验。结合国际数据空间与相关案例在实践探索中提出的可信认证、数据主权保护和数据连接器等理念和技术解决方案,本文提出的参考架构将有助于我国在发展数据主权交换平台时解决相关核心问题。