从德国数据空间的实践探索看如何构建数据流通共享生态
2020-12-30邱惠君王梦辰刘巍
邱惠君 王梦辰 刘巍
培育数据要素市场、构建数据生态是发展数字经济的重要一环,也是当前业内普遍关注的热点话题。由于数据资产的特殊性,如何开展数据确权、建立定价机制和确保数据流通过程中的可信可控等问题是数据生态建立中遇到的难点和痛点。德国6年前启动了数据空间行动,其实质就是探索在行业内建立可信的数据市场、构建数据流通共享生态。当前,在新冠疫情防控和“新基建”的大背景下,我国正在大力推进工业互联网平台和数据中心的建设,在建设过程中必然会遇到如何解决数据流通共享的核心问题。德国在实践探索中提出的可信认证、数据自主权管理和数据连接器技术解决方案等一些理念和做法,可供参考借鉴。
一、德国数据空间的由来与进展——适应工业4.0 发展的产物,其理念已融入到泛欧数字基础设施项目
为适应工业4.0的发展,解决数据互联和流通难题,德国联邦教研部于 2014 年底正式提出了“工业数据空间行动”,旨在构建一个安全可信的工业数据交换空间,排除企业对数据交换不安全性的种种担忧,弗劳恩霍夫协会成为该项行动的领头羊。为了加强合作,汇集更加强大的科研力量,在德国各界专家人士的推动下,弗劳恩霍夫协会、安联集团、拜尔医药与大众汽车等 18 家成员企业又于 2016 年 1 月成立“工业数据空间联盟”,共同助力构建“工业数据空间”。2017 年,“工业数据空间参考架构模型 1.0 版”问世,模型详细阐述了工业数据空间的理念、目标与空间的详细构架。而此时距“工业 4.0”理念的提出已过了几年,对工业信息化的需求远远超出人们的预期,因此德国人很快意识到,仅仅在德国范围内构建数据空间是远远不够的,应当将这个空间延伸至整个欧盟甚至是全世界,数据共享也不应局限在工业领域,而是要辐射到整个产业链,要让各行各业都加入到数据互联的大家庭中。2018年11月,联盟正式更名为“国际数据空间联盟”。2019年4月,“国际数据空间参考架构模型3.0版”诞生。目前,已有超过20个国家的118家企业和机构加入,建立了50个应用案例。
通俗地讲,德国数据空间就是一种基于标准通信結构、实现数据安全流通共享的虚拟空间架构。该项目早期获得了德国联邦教育与研究部提供的资助。德国数据空间的理念已经融入到泛欧数字基础设施项目中,如最近德国和法国联合发起了名为“GAIA-X”的数字基础设施建设行动,其目的是要建立欧洲自主的云基础设施和数据生态,而德国数据空间的理念完全融入到该行动项目中。不仅如此,德国还正在努力将其数据空间的理念和标准上升为国际标准,实现全球推广的目标。目前,该联盟正在为欧盟数字经济战略提出的建立9大数据空间发挥积极的作用。
二、德国数据空间模型的五层架构、三个维度、四类主体、三大流程——形成相对完整的数据流通共享生态
数据空间是一个虚拟的空间,以解决数据权属管理问题和确保数据安全交换共享,其目标是要构建一个完整的数据生态,而非简单的交易平台。2019年4月发布的国际数据空间参考架构模型3.0版包含五层架构、三个维度,涉及四大类主体和三大运作流程。
(一)五层架构
整个模型主要包括业务层、功能层、流程层、信息层和系统层。
业务层:主要是数据空间参与方提供的各类数字化业务模式和核心业务。
功能层:主要以技术独立的方式定义了数据空间的功能要求,数据连接器是驱动生态系统各方参与者连接的主要界面方式。
流程层:即处理层,主要描述了数据空间不同部件间的动态交互过程。
信息层:规定了信息模型,每一个数据来源在信息层进行描述。
系统层:主要涉及数据安全交换的技术设施。
(二)三个维度
三个维度包括认证、安全和治理,五层架构中每层都考虑了治理问题,治理思想和要求贯穿于参考模型的每层架构中。
(三)四类主体
在数据空间虚拟世界中主要存在四类主体,即核心参与者、中介 、软件与服务提供者、治理监管机构,这四类主体共同营造一个相对完整的数据生态系统,并在系统中找寻适合自己的商业模式。
核心参与者:主要包括数据所有者、数据提供者、数据使用者、数据消费者与数据应用(app)提供者。通常情况下,数据所有者与数据提供者,以及数据使用者与数据消费者是同一个主体,然而在某些情况下,上述两类主体的二者可以产生分离。从法律层面定义数据所有人比较复杂,参考架构模型主要从实际操作层面对数据所有人进行了界定,即创建数据和(或)实际控制数据的法人或自然人。
中介:数据空间中的中介机构由数据代理人、数据交易结算所、身份提供者、数据应用商城和词汇提供者构成。身份提供者是数据空间生态系统的守门人,负责签发、管理、监控所有想参与到数据生态系统中主体的身份信息。数据代理人匹配数据供给和需求,向数据使用者提供元数据,为数据提供者提供注册界面,为数据消费者提供咨询界面。数据交易结算所主要负责数据交易的备案登记与结算,监督和记录数据交易日志,提供数据会计处理平台,无论买卖双方最后是否成功完成数据交易,都应一起到数据交易结算所进行登记,便于买卖双方在日后遇到争议时确定双方责任。数据应用商城负责维护和管理其上架的数据 App,提供数据可视化、数据质量、数据治理等数据服务。词汇提供者提供并管理数据空间的信息模型,这是描述数据资源的基础。
软件/服务提供者:服务提供者所提供的数据服务是非常广泛的,例如数据分析、数据集成、数据清洗和丰富语义等。软件提供者主要为企业提供独立的数据软件,根据特定客户的特殊需求为其量身定制数据软件。
治理监管机构:数据交易监管是国际数据空间的最大亮点之一。监管机构由认证机构、评估机构和国际数据空间联盟三者组成。认证机构与评估机构共同负责所有主体以及其他相关核心成员的“空间准入”审查,评估机构主要负责实质性审查,而认证机构则负责形式审查,并同时全程监督评估机构的评估工作。国际数据空间联盟是一个非盈利性组织,支持和管理参考架构模型的开发和迭代更新,以及参与认证流程,但联盟不直接参与数据交换活动。
(四)三大运作流程
虽然数据空间是一个全新的理念,但它的基本运作流程却并非想象中那样复杂,主要涉及三大运作流程:落户、数据 APP 上架及使用、数据交换。
“落户”数据空间:国际数据空间是一个虚拟的数据生态系统,所有想进入的主体首先必须要通过身份评估认证。除此之外,这些主体所提供的软件(例如 APP)以及服务(数据处理、分析等)也纳入到监管部门的监督之下。通过审核后,企业必须立刻向软件提供者定制属于自己的“连接器”。连接器是数据空间的关键设施,它是这个生态系统中所有参与者的必备品,没有它便不能加入数据空间,它是一种特殊的网关。每一个连接器都由内部链接器与外部连接器两部分构成,内部链接器主要负责数据的预处理,例如过滤、匿名化等,而外部连接器则负责储存那些拟交易的数据。每一个连接器需要经过电子身份认证。企业还需要为自己的连接器进行“自我描述”,自我描述的意义在于方便其他参与者了解企业自身以及是否与其进行交易。自我描述的内容包括连接器所有者以及其所提供业务的基本信息,例如服务提供者需要描述自己所提供的服务都有哪些,数据提供者需要描述自己所提供的数据类型与具体内容、使用政策与定价机制等等。在完成自我描述后,为了确保自我描述的准确性与安全性,身份提供者要对自我描述提供一个“动态属性记号”,这个特性记号表明连接器内所陈述的信息是有效且准确的,今后每当与其他连接器进行互动时都需要互相出示这个记号以确保双方的信用级别。
数据交换: 数据交换又分为两个步骤,即数据检索和数据交易。在数据检索阶段,数据消费者有两种基本选择:可以自己独立寻找数据提供者,也可以借助代理人寻找合适的数据提供者。多数情况下,数据消费者都需要代理人的帮助,如告知代理人所需要的服务内容,包括需要获取什么样的数据、价位要控制在什么范围内、需要获取多少家数据提供者的信息等等。代理人会根据请求收集、筛选合适的数据提供者自我描述信息并发送给数据消费者。当数据消费者与数据提供者形成长期的合作关系后,二者就可以直接对接交易,不再需要代理人的帮助。一旦找到了心仪的数据提供者,便可以进行交易。交易的第一步便是谈判,而谈判的核心内容就是“数据使用政策”,即哪些数据可以用、怎么用、用多久、用多少次等等问题,都需双方在谈判阶段达成一致。谈判可以是全自动进行的,也可能是半自动进行的,一旦双方达成一致,将签署数据使用合同。一般情况下,数据使用合同由技术与非技术两部分构成,技术部分主要关注技术界面和使用政策,而非技术部分则主要关注相关的法律问题。数据使用合同将同时记载到双方的连接器中被秘密且永久保存起来(区块链技术会为此提供支持)。随后,双方需要到数据交易结算所进行备案登记。数据交易结算所会提供一个被称为“溯源追踪器”的设施,以实施更新数据交易结果。
数据 APP 上架与使用 :数据 APP 上架是“落户”在 APP 领域的具体表现。APP提供者和其连接器需要通过双认证后获取准入资格。连接器内的自我描述应当包含相应的基本信息,例如数据应用所处的领域、使用政策等等。APP 的使用同样包含两个阶段:APP 检索与 APP 下载。通过连接器发送给应用商城,数据应用商城会根据客户的需求为其搜寻、推荐恰当的 App。之后,应用使用者同样需要和应用提供者就 App 使用进行谈判磋商并最终达成协议。
四、构建数据流通共享生态必不可少的六大要素——可信认证、数权管理、数据质量、统一标准、安全保障和运行机制
如何构建数据流通共享生态需要不断探索。我国一些企业也结合行业实际提出了若干促进数据互联共享的综合性解决方案。从国内外实践来看,要构建数据流通共享生态,必须处理好可信认证、数权管理、数据质量、统一标准、安全保障和运行机制等关键要素。德国国际数据空间的实践探索带给我们不少启示,除了统一标准、提高数据质量和探索有效运作机制外,以下三方面的做法尤其值得借鉴参考。
加强可信认证确保数据生态环境的可信任。确保信任是构建数据生态的基本要求。德国国际数据空间从静态和动态两个层面进行严格认证,首先对一开始加入数据空间的参与方进行事先认证,每一位数据生态的参与者必须首先经过身份认证,身份认证是确保数据生态安全的第一道屏障。其次对活动中的有关事项进行动态认证,如对数据APP和数据连接器的认证也要开展认证。只有通过严格认证,才能使参与各方彼此建立信任。
运用“数据连接器”作为数据空间的网关设施以实现分布式存储数据的安全交换。随着数字化的不断推进,数据将会分布式存储在不同设备中,如何使这些数据进行安全交换是数据流通共享生态建设需要解决的问题。德国设计了一种“数据连接器”技术解决方案,把其作为完成数据空间分布式数据安全交换的一项重要网关设施。德国国际数据空间不要求数据集中存储,即数据在提供给可信的使用方前可以保存在不同物理位置中,但是数据空间的每一参与者要配备数据连接器,并将数据连接器接入其信息环境,没有连接器就无法参加交易。不同连接器之间可以交流,通过连接器定义数据流,完成数据的交换和共享,数据连接器成为数据空间的一项重要技术设施。
“数据自主权”理念和采用智能合约方式为破解数据确权管理和定价机制难题提供新思路。数据确权是平衡数据权利人利益和推动数据共享的一个关键点。德国数据空间在实践探索中提出了“数据自主权”( Data Sovereignty)的理念,所谓“数据自主权”即自然人或法人可以完全自主掌控其数据的能力,在此称其为“数权管理”。数据作为一种无形资产,由于其自身易复制、不具有排他性等特点,传统的所有权制度无法规制数据这种新兴资产,如何从立法上确立数据权利和进行更好的保护成为数字时代的一项重要课题。德国数据空间联盟认为,当前从立法层面为数据这项特殊资产提供一套全新的法律框架面临很大的困难,而从技术角度来解决这个问题无疑是更加实际的,就是构建一个大家都认可的数据流通共享机制,这套机制包括标准化的数据交换规则与数据使用政策,数据所有者有权决定谁能访问和使用其数据、数据使用限制要求,以及拟定数据使用合同具体条款、决定定价方式等,并且通过智能合约方式加以实施。德国这一实践探索为我们开拓了“实践先行”的新思路。在当前相关法规政策还未出台之前,有关行业组织或第三方机构可以利用各自优势,借鉴国际经验,结合国情,从技术和管理两个维度开展数据流通和共享的实践探索,在注意发挥市场主体作用的同时,应在加强对数据使用政策和使用合同的规范指导上下功夫,推动建立一套機制,以实现数据有序合理流动。
作者单位:国家工业信息安全发展研究中心