跨境贸易区块链溯源数据上链方式研究
2020-08-31郭媛媛
郭媛媛,李 赓,牟 华
(天津海关,天津 300171)
中共中央政治局就区块链技术发展现状和趋势进行第十八次集体学习,中共中央总书记习近平在主持学习时强调,区块链技术的集成应用在新的技术革新和产业变革中起着重要作用。在跨境贸易溯源领域,区块链技术手段和治理思想具备巨大的应用价值。区块链在跨境贸易溯源领域对促进数据共享、优化业务流程、降低监管成本、建设可信体系有着非常大的潜力。
1 研究的目的与意义
1.1 区块链溯源的优势
传统溯源行业存在的业务痛点主要有:(1)数据中心化存储,存在因为数据维护方因为自身利益考虑而篡改溯源数据的问题;(2)传统溯源系统间存在着溯源主导权的竞争关系,导致系统无法互联互通,形成“信息孤岛”。
基于区块链技术的跨境贸易溯源,通过区块链的共识算法、哈希加密算法、分布式技术、时间戳、数据签名的可追溯等特性更适合于跨境贸易区块链溯源业务的应用。
1.2 数据上链中存在的问题
然而在实际业务场景,境外跨境贸易溯源参与者对溯源数据上链意愿较低,根据分析主要因素为如下三条:
技术因素:进行溯源数据上链需要一定的技术支撑和基础信息化设备,大多数跨境贸易溯源参与者并不具备相关的技术积累。
成本因素:跨境贸易溯源参与者如果自行搭建环境进行溯源数据上链,所需的设备、技术支撑和人力投入成本较高,从另一方面加剧了对区块链溯源的抵触。
政策驱动:由于当前缺乏对区块链溯源的驱动性政策支撑,即便企业完成区块链溯源亦属于“费力不讨好”。
1.3 开展跨境贸易区块链上链方式研究的意义
将跨境贸易产品溯源信息上链是开展跨境贸易产品溯源的前提。只有跨境贸易产品从开始到结束全生命周期的各方参与者,都将溯源信息上链,才能形成完整的、诚实可信、不可篡改产品溯源信息链条。本文主要从技术和成本因素出发,通过梳理和设计便捷的进口产品溯源原始数据上链方式,来克服跨境贸易溯源参与者溯源数据上链的困难。
图1 区块链溯源上链参考架构图
2 溯源数据上链的实现
2.1 跨境贸易溯源参与角色
要解决跨境贸易参与角色上链难的问题,首先要做的就是要梳理跨境贸易溯源究竟有哪些参与角色,只有明确了参与角色,才能根据各种角色的普遍问题,进行针对性设计和解决,做到有的放矢。
图2 跨境贸易区块链溯源上链角色示意图
跨境贸易产品溯源的业务应包含从产品的生产者到最终消费者全流程的过程追溯,须尽可能多的考虑到跨境贸易产品溯源的参与者,包括但不限于生产商、进口商、出口商、货代公司、物流承运商、中间商、口岸和机场、货站经营者、仓储业经营者、第三方检测机构和分销商等。
2.2 身份真实性验证
溯源的业务应当包含从产品的生产者到消费者的全流程过程追溯,只有上链者的身份是真实可信的,溯源链条才具备可追溯性。因此,要开展跨境贸易区块链溯源,首先要对各参与者身份真实性进行验证。
跨境贸易区块链溯源的各参与者,经过身份真实性验证,可得到一对秘钥:公钥与私钥。公钥用于标识系统内用户的身份,私钥用于数字签名,确保用户身份的真实性,允许数据的接收者用以确认数据的来源,防止被人伪造。在区块链溯源领域,通过公钥与私钥,我们可以实现对上链溯源数据的签名和链上企业商业隐私的保护。
可以用CA数字证书作为用户私钥载体,大部分联盟链本身提供一个可选的证书颁发机构服务,可以选择使用该服务生成证书和密钥材料。另外大部分联盟链未对证书颁发服务机构加以限制,任何可以生成ECDSA证书的CA都是可以使用的。
图3 区块链溯源数据签名逻辑图
图4 隐私保护逻辑示意图
2.3 上链节点部署方式
跨境贸易区块链溯源各参与方,需要通过各上链节点完成溯源数据上链。考虑到上链节点的部署须具备专业的技术能力与基础的信息化条件,然而跨境贸易产品溯源参与角色经济体量不同,信息化基础各异,宜采用不同的节点部署方式,以满足各方参与者的上链需求。因此笔者这里建议了两种节点部署方式:自建节点部署方式与代理节点部署方式。
图5 区块链溯源节点部署示意图
2.3.1 自建节点部署方式
对于具备专业的技术能力与基础的信息化条件的企业、相关机构、地方政府等,可以考虑在自身在机房部署区块链节点。可通过以下几步实现自建节点数据上链。
首先,应在区块链溯源技术标准上达成一致,自建节点与目标区块链溯源系统采用同一技术架构,只有在采用统一的区块链架构、统一的标准溯源数据体系、统一的数据接口规范,才能完成与目标区块链溯源系统的对接。
第二,按相应的技术标准在本地服务器上搭建区块链基础环境,将搭建好的本地节点接入目标区块链网络内。
第三,跨境贸易区块链溯源要接入目标区块链溯源系统,要申请可信的身份真实性验证,通过验证后,获取身份签名及秘钥。
最后,采用标准的数据规范将自身溯源数据进行上链。
2.3.2 代理节点部署方式
对于不具备专业的技术能力或基础的信息化条件的企业,或从成本角度出发,愿意通过代理服务进行溯源数据上链的企业,可通过上链代理服务企业搭建的区块链溯源节点进行数据上链。区块链溯源节点布设有大型服务器,并开辟多个虚拟主机,通过云节点服务,为不同参与角色提供身份认证与数据上链服务。
虚拟主机是使用软硬件技术,把一台服务器“分割”成多个虚拟的主机,每一台虚拟主机都具有独立的域名和IP地址(或共享的IP地址)。虚拟主机可以实现在同一台服务器和同一个操作系统上,同时为多个用户提供并行的服务器程式且互不干扰。虚拟主机技术可将物理服务器“一台变多台”,充分利用了服务器硬件资源,从而大大节省了服务器硬件成本。
云节点是通过将大规模的服务器组成集群,虚拟成多个性能可配的虚拟机,同时提供大量的数据存储和处理服务。云节点突破单个物理机的限制,通过动态的资源调整与分配,消除了服务器以及存储设备的单点故障,可用性很高。采用云节点的上链代理服务有很多优势:一方面是计算能力和存储功能的提高,有利于区块链溯源应用的快速部署;另一方面云节点的安全性非常好,天生就具备了云服务所提供的更好的安全容错和容灾备份能力。
跨境贸易产品溯源参与者通过代理节点实现上链,相对而言比较简单。只需要先向代理服务节点申请,完成身份真实性验证,获取身份签名及秘钥,再采用标准的数据规范完成自身溯源数据进行上链即可。
2.4 溯源数据上链存储
区块链本质上是一个去中心化的数据库,溯源数据的上链存储通常只需要将溯源数据上链即可。但是区块链上的存储空间是极其宝贵和有限,另外基于国内外学者的普遍研究共识,由于区块链执行速度不可能足够快以支持高容量数据流,因此区块链不适合存储大量数据。然而,由于跨境贸易产品溯源数据完整性要求,产品溯源数据应尽可能多而全的由区块链技术予以保障,因此,我们需要对跨境贸易区块链溯源原始数据的上链存储方式进行设计。
首先,溯源数据分为结构化数据和非结构化数据。结构化数据也称行数据,是可以用二维表结构来逻辑表达和实现的数据。结构化数据严格地遵循数据格式与长度规范;非结构化数据字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成,通常占用的存储空间较大。
其次,笔者考虑了溯源数据的上链存储方式的几种类型:
内容存证:将溯源数据的全部内容直接上链存储;
哈希存证:将溯源数据内容的哈希值上链存储;
链接存证:将溯源数据内容的哈希值+存储地址上链存储;
隐私存证:将溯源数据的内容采用对称加密算法加密后上链存储;
分享隐私存证:将溯源数据内容采用非对称加密算法加密后上链存储。
2.4.1 对于结构化数据上链存储
结构化的溯源数据最好处理,对于结构化数据可以采用内容存证方式保存上链,且对区块链执行速度不会造成较大影响。以内容存证方式上链后,数据在区块链上公开,便于其他溯源参与方的使用与监督。
2.4.2 对于非结构化数据上链存储
跨境贸易产品溯源中的非结构化数据大多是一些带有产品认证信息的表、证、单、书。以一张图片数据为例,小一点的几十上百KB,大一些的几MB到几十MB,甚至更大。区块链的节点同步存储,每一张图片都要在每个节点都存一遍,容易造成存储资源的极大浪费。本文针对非结构化的溯源数据的上链存储,主要采用以下两种思路:
(1)化解为结构化数据。在跨境贸易产品溯源中,我们重视的是溯源信息本身的准确性,而非信息传递的载体形式。这种方法通常是对现有的表、证、单、书中的信息进行统计整理,总结出信息的所有类别与区块链溯源各参与方真正关心的信息,对关键数据进行提取,形成结构化数据后采用内容存证方式保存上链。
(2)原始非结构化数据存储方式。虽然我们对表、证、单、书中的溯源信息进行了提取,但出于对存证及安全方面的考虑,我们可以采用成熟的资源描述框架RDF存储技术进行非结构化原始溯源数据的存储。资源描述框架(Resource Description Framework)是一个使用XML语法来表示的资料模型(Datamodel),用来描述Web资源的特性,及资源与资源之间的关系。对大容量非结构化数据,通过链接存证方式保存上链,即可以保障数据的完整性与不可篡改,又避免了大容量数据上链造成的系统拥堵与存储浪费。以链接存证方式上链后,上链的溯源数据的哈希值与存储地址在区块链上的公开,通过数据的哈希值可验证数据是否被篡改,通过存储地址链接,其他参与方可访问并查看原始溯源数据。
2.4.3 公开数据与私有数据上链
跨境贸易溯源各参与方的溯源数据从隐私属性上来分,可分为公开数据与私有数据。
对于公开数据,由于区块链上的公开透明性,所以把公开数据通过内容存证或链接存证方式上链即可。
对于私有数据,比如企业的商业机密或者隐私保护需求的内容。我们则可以采用分享隐私存证的方式保存上链。通过采用非对称加密的分享隐私存证方式,我们可以指定某一方可以查看该数据,以便于企业隐私数据的保护。
此外,哈希存证方式与隐私存证方式虽然可以做到用户隐私数据的保护,但不能完整验证私有数据并实现链上的安全共享。在跨境贸易区块链溯源领域,采用这两种上链存储方式的意义不大。
图6 区块链上链存储示意图
2.5 上链信息的可追溯性
搭建可信的区块链溯源系统,所有参与方需要对其上链信息的真实性负责。一旦发生质量事故,可以快速的通过链上数据的签名,追溯到该货物的相关责任方,进行问责;另一方面可以快速的根据问题货物的流向,进行查封或召回。区块链的不可篡改、不可抵赖的特征,可以避免传统溯源中,出现质量事故后各方推诿扯皮,数据造假,不承认自身溯源数据的情况。对于出现质量问题的相关责任方,还可以依据企业信用管理的机制,对企业的信用积分进行扣除。
3 跨境贸易区块链溯源的价值与展望
跨境贸易溯源领域是一个极为复杂的体系,传统的跨境贸易溯源系统,以中心化的手段来进行溯源信息的采集与管理,无法做到广泛而可信的溯源。
区块链技术给跨境贸易溯源应用带来了新的契机。区块链以其开放、可信、去中心化、共享等核心治理思想,有助于打破跨境贸易溯源各方参与者之间的信任壁垒,弱中心化的治理思想将弱化各主导方的竞争关系,促使其转变成合作共建关系,合力共建“溯源全球”的区块链溯源网络。
由于商业竞争及政治复杂性,很难实现通过单一的区块链溯源系统覆盖全球所有跨境贸易产业。因此,唯有推进全球统一区块链溯源技术标准,实现不同国家或地区的区块链平台的数据互通,方可构建全球溯源的区块链网络。区块链全球溯源的实现对跨境贸易数据互通、增强国际互信、方便跨境产品监管、质量问题追溯、便捷通关、改善营商环境等具备巨大的价值与潜力,可能成为我国经济由高速增长阶段转向高质量发展阶段重要突破点。
4 结束语
对于跨境贸易区块链溯源业务的开展,溯源数据上链犹如木本水源,是开展业务的第一步。笔者通过对区块链技术的探索性研究,结合跨境贸易溯源的业务特点,探究便捷化、规范化的溯源数据上链的方式,为跨境贸易区块链溯源的应用与监管提供参考。