基于智能合约的数据跨境流动风险识别机制

2022-06-27覃浩华

中国人民警察大学学报 2022年6期

覃浩华，李志

中国人民警察大学 a.研究生院； b.智慧警务学院，河北廊坊 065000

数据跨境流动指全球化背景下各国主体通过网络形式进行国家间的数据传输和数据应用，而数据跨境流动风险是存在于数据跨境传输和数据应用中影响国家安全、经济利益和个人权益的不确定性因素[1]。数据跨境流动风险管理机制是否完善，是一个国家数据主权掌握能力的重要体现。高效的识别机制不仅可高效判定风险态势，而且能从风险源中挖掘出公安网络安全保护价值、公安情报价值。然而，现有数据跨境流动风险识别机制仍存在影响数据风险识别过程中价值提取的步骤，缺乏效率显著的技术作为机制的支柱。智能合约是一项具有去中心性的数据流动技术，在区块链辅助下，将交流过程以密钥加密形式直接实现，并让交流双方获得奖励机制，同时合约内容具有安全、不可篡改的特性。对于数据跨境流动风险，公安网安部门应当在技术上实现突破，构建基于智能合约的数据跨境流动风险识别机制，以利于构建风险感知屏障，提升风险识别水平，有效防范数据跨境流动过程中的复杂风险。

一、数据跨境流动风险识别机制存在的问题

数据跨境流动风险识别是通过识别数据流动风险源、影响范围、事件及其原因和潜在的后果等，生成一个全面的数据跨境流动风险列表的过程。数据跨境流动风险识别的目的不仅是掌握有关安全风险可能带来的损失，而且要从中获取数据安全风险蕴含的机会和价值。已有的数据跨境流动风险识别机制以识别中枢为核心，从数据跨境中识别风险因素并判定风险级别，最终挖掘出异常动向以及价值，如图1、图2所示[2-3]。然而，严格的风险识别机制在提升数据跨境流动风险评定效率的同时，也存在一些问题：

(一)风险识别组织缺乏可靠性和统一性

《中华人民共和国网络安全法》(以下简称《网络安全法》)提出了关键信息基础设施领域数据跨境的安全评估制度，其中第三十七条规定：关键信息基础设施的运营者在中华人民共和国境内运营中收集、产生的个人信息和重要数据应当在境内存储[4]。就有关政治外交等国家安全数据而言，安全部门之间在共同领导部门的指挥下能够协调有序地进行风险识别。对于行业以及个人跨境数据而言，由于风险识别组织不在网安部门统一管理之下，在没有进行深入了解的前提下，各组织活动的安全程度难以评估与确认，风险识别内容的真实性也难以确认。所以，目前允许参与风险识别的组织需要通过《网络安全法》规定的识别程序进行认证,程序依然复杂繁琐。而近几年出现的大部分问题，主要原因是不知名服务器通过非法手段通过安全认证，从而未被成功识别。同时，虽然当前一些部门与企业进行开放性合作，然而，不同部门要将部门数据整理汇总到统一的数据开放平台，部门间以数据为载体的交互更加频繁，相应产生了大量行政交易成本。在资源配置环节，不得不通过购买服务和外包的方式，将这类专业性职能委托给有资质和能力的企业代为执行，可能滋生一定风险[5]。未来数据跨境流动组织的趋势将趋于多元化，风险识别组织可靠性的提升成为重要任务。

图1 数据跨境流动风险识别流程图

图2 风险识别初步判定标准

(二)风险识别机制中缺乏灵活的补救预案

进行风险识别时要掌握相关和最新的信息。基于数据本地化政策，需要进行风险识别的数据在境内部署后，根据法律条文规定的级别和条件进行风险识别，根据等级进行出境活动或者本地储存。该数据进行风险识别后所识别出的安全因素和提取出的价值要素会反馈到风险识别组织，并根据条件进行登记储存。由于对风险识别的基本要求、运作规律以及可能产生的巨大影响认识不足，使得识别周期中各部分功能不协调，未能有效平衡各环节数据管理目标，实现优化信息流、效用和信息责任的平衡，各部门开放数据缺乏协调和统一标准的现象也较为常见，以上不足造成当前数据跨境流动风险识别机制难以适应数据复杂多变的特点。若出现新的安全问题，或数据跨境存在新应用与新需求，原有风险识别机制就不能及时驾驭新情况。因此，应当建构数据开放风险的补救预案，对可能发生的数据风险及其后果进行理性预判，通过及时的补救举措实现数据损失的快速修补[6]。

(三)风险识别过程效率还需优化

在数据风险识别流程中，识别中枢的运作内容为：识别内容、审核识别内容、筛选以及二次筛选风险因素内容、判定风险级别、初步安全审批措施等。在《网络安全法》的风险识别流程中，由于其树立了第二道识别机制，即为数据跨境流动搭建一座更高的防护墙，所以处在中心地位的安全中枢具有关键作用。然而，每一个数据跨境流动活动的风险识别都需要经过中枢机制，会消耗过多成本，若风险识别的发送方和接收方点对点进行风险识别，将会方便且快捷。不仅如此，伴随数据跨境流动在体量和频率上的指数级增长，其在全球政治经济生活中的重要性日渐提高，而国际局势变迁放大了数据跨境流动之于国家安全影响的重要性，进而改变了全球治理的机制与体系[7]。若数据跨境流动风险管理一味谋求自保而不是数据的共享和技术革新，不脱离数据孤岛，不培养面向全球治理体系大格局的人才，不完善风险预知体系，那是否能稳定立足就还会存在大量的悬念[8]。

二、智能合约技术在数据跨境流动风险识别中的适用性

1996年，Nick Szabo在SmartContracts:BuildingBlocksforDigitalMarkets中提出了智能合约的概念。大量学者结合行业特点对智能合约进行理论研究，通过不断完善密钥验证技术，提出构建智能合约安全屏障，逐步解决了消耗成本高、工程浩大等问题，同时也解决了许多行业中数据流动的数据安全问题、数据流动的用户认证问题。相关学者就智能合约运行过程中存在漏洞的解决方式也进行了深入研究。虽然该知识体系尚未完全成熟，但是可有条件应用于数据跨境流动风险识别机制的构建中。

(一)数据跨境流动风险类型

在现实中不同国家的服务器具有的风险因素不同，且采取不同的数据流动安全保护策略，与《中华人民共和国数据安全法》(以下简称《数据安全法》)的根本目的和处理方式有所不同，我国面对的数据跨境流动风险呈现复杂、不可控的态势，在不同领域中具有多样的风险类型。以风险影响对象为标准，将数据跨境流动风险分类如下：

1.国家政治安全风险。国家政治安全风险根本来源于部分国家和联盟的数据保护策略与数据霸权挑战，较为典型的有2000年美国和欧盟签署的《安全港协议》与欧盟GDPR在网络安全监管立法上的冲突，“棱镜门”事件更加凸显了部分发达国家企图占据数据领导权的野心。相关政治不安定产生领土信息、文化入侵信号、国家安全数据侵犯等潜在不安全因素。

2.行业、个人安全利益风险。数据跨境流动伴随着潜在的行业核心策略和经济利益损失的风险，也充斥着个人数据隐私泄露的风险。《安全港协议》在近几年曝出的监控丑闻侵犯了许多行业的经济利益和隐私，欧盟GDPR在解除与美国的协议的同时，对个人信息数据制定了更高要求的访问条件。

(二)智能合约的运行方式和价值

所谓智能合约，就是非人工、自动化的合约。单个和多个用户之间通过计算机算法、代码，以只有用户知道的指令进行自动输入和输出，完成某项合同，随后将交易经过以代码进行自动备份和保存。智能合约提出之初并未受到太多青睐，随着区块链和以太坊的出现，让智能合约有了运行和应用的可能性：区块链技术下的智能合约能够连接到链外数据，为合约添加额外的执行条件，同时能让合约分布式执行[9]；而以太坊运用先进算法为智能合约提供强有力的存储介质让合约不易被篡改，且会通过世界状态对代码进行更新，在算法上让智能合约的编写更为方便[10]。目前，借助区块链和以太坊的底层技术作用，智能合约为以太坊应用平台的核心，本质上是以公开的形式随着区块链一同部署在应用网络之中的一段程序代码，能够根据设定的规则，完成决策、资料储存以及传输，如图3所示。

图3 智能合约流程

智能合约的基础架构如图4所示[11]。

图4 智能合约基础架构

1.智能层是以技术支撑合约主动对数据实施操作的层面，界定了智能合约运行的方式。该层展示了合约运行的方式为：根据输入好的代码对流动过程进行安全感知和密钥认证，用于感知来自数据发送方的数据内容，再将具体操作流程交予运行层；将感知到的数据进行处理，通过区块链节点进行共享存储进知识库，主动学习数据发送方的行为方式以及数据流动形式；根据识别认证结果，合约会根据信任机制决策是否传输。

2.运行层基本展现了智能合约相关业务的流程，是智能合约的主要组成部分。在每个区块中，运用共识算法，将发送方所传输的信号进行密钥识别和信任机制认证，识别发送方是否为合约中正确的发送方。确认身份后，将数据传输各个节点进行扫描，结合合约层中法律、规则、技术协议的条件进行安全检查，同时进行轻量工作量证明，作为数据交流的奖励机制。最后，对该数据流动行为进行级别判定，根据判定结果决策是否进行传输活动，根据判定结果，数据流动过程会以不同的代码自动备份。

3.合约层为智能合约运用提供基础和来源。用于辅助智能合约运行的系统会在运行过程中，以代码的形式读取合约层的内容，并根据内容做数据流动认证。合约层内容最基础的部分是技术协议，技术协议是为流动双方提供密钥和信任机制的纽带，而根据实际需要，合约层的内容也可以囊括国家之间协议、双方国家法律、跨境公司交易活动规则和跨境执法行动准则等。合约一旦生成，在各个区块中便不可篡改。

4.辅助层是为智能合约提供技术支持的层面。在区块链2.0时代下，区块链和以太坊技术为合约双方制定信任机制和交易密钥，双方通过密钥进行身份识别以及数据传输，交易结束后，流动过程的各个环节会被自动标上标签，当需要追溯相关信息时，通过区块链的区块信息即可查看。用户可以将这段合约代码部署在以太坊或类似的区块链上[12]，部署成功则该智能合约不可再被修改，只要底层区块链不被销毁，这段合约就一直存在。

总之，智能层展现了运行层的作用，合约层和辅助层为运行层提供了安全的基础。

(三)智能合约在数据跨境流动风险识别中的适用性

新型全球化背景下，数据跨境流动亟须服务于公安情报领域的情报合作以及国家安全领域的执法合作。结合上文阐述，智能合约的三大特征可以总结为：去中心化、安全、可追溯。我国与合约国家服务器开展科学高效的数据跨境流动活动，强化数据资源管理，注重数据安全保护，建立跨境数据流动安全监管制度，是保障国家基础数据和敏感信息安全的要求[13]。假如将智能合约应用于数据跨境流动风险识别，根据智能合约运行方式，将数据跨境流动风险要素和规则所涉及的字段进行读取并写入代码，运用严密的合约运行层对数据进行识别处理、风险分析、存储管理，其与当前我国传统的风险识别机制相比，拥有以下具有实际效用的特征：

1.信任机制严格。认证作为网络安全保护的第一道防线，发挥着不可替代的作用[14]，通过认证可以识别攻击者，从而使其无法进行恶意攻击或非法访问隐私数据。由于运用了智能合约，数据传输时只需发出代码或代替字，用户在合约下以只有用户知道的隐秘方法进行传输和审核。虽然当前我国仍采用数据本地化政策，但采取智能合约规制的措施为数据本地化赋予了低成本监管和治理的能力，在进行数据跨境流动合作的过程中能够在《网络安全法》原有严格程度的基础上更加方便地获取数据属性、发送方和接收方的具体状况。

2.储存反馈高效灵活。《数据安全法》和《中华人民共和国个人信息保护法》规定了严格的分析处理机制和细化的处理条件。目前，自动化安全监测和应急反馈只存在于网安部门内部人员使用的内部网络以及互联网后台的屏蔽系统。若将相关规则写入智能合约，在承载有《数据安全法》《网络安全法》等法律的基础上，根据规定描述的内容利用智能合约为数据存储及监管提供一种自动化、可信的形式，在这样的形式下将数据调取和使用的方式和权限、是否损坏个人或国家利益进行自动分析和审批，能够省去很多职能部门的人工审核。当有潜在数据跨境流动风险时，底层区块链能够为事故调查提供权威、客观、真实的数据支撑，监管主体在存储介质中能更方便地找到引起事故的数据来源，找到损害数据安全的服务器，实现应急处理。

3.要素呈现普及性、分布性、去中心化。去中心化是区块链技术最为突出、最为统一的本质特征，可利用区块链去中心化、不可篡改、可追溯等特点，提供一种可信的形式。设备与管理机构由各区块进行独立管制，基于协商一致的协议，通过分布式核算和存储，所有节点便能够在系统内进行自动安全的自我验证、数据交换和管理。数据跨境流动风险识别将以数据安全部门为中心，从各服务器将感知到的风险因素集中传输到数据安全部门，由数据安全部门进行统一处理[15]。智能合约将数据流动中的风险要素分散到各个数据跨境流动活动中，在各自所在板块进行。流动相互方的服务器以及监管部门运用具有信任机制的加密语言进行数据审核与流动，待流程完成后将数据存储入各个区块中。这样的流程分工实际更为高效，当需要进行数据跨境流动时，我国相关服务器能够便捷地发出流动信号，基于密钥代码实施风险识别流程，更胜于核心集中的数据本地化方式，有利于我国在各领域各地域实现全球数据合作共赢。

三、基于智能合约的数据跨境流动风险识别机制构建

(一)基于智能合约的数据跨境流动风险识别机制模块分析

智能合约应用于数据跨境流动风险识别机制的结构中，意味着以识别中枢为核心的结构被广域化、分散化。由合约知识、密钥代码等构成的智能合约能够在多个区块下分别进行风险识别，适用于复杂、动态、受别国服务器保护的数据跨境流动，具体功能如下：

1.合约知识层。由合约知识库内容组成，包括双方行动规则、两国协定、别国国情等。目前，我国学者致力于借鉴欧盟的条例，结合我国国情建设完善有关数据权的法律体系，明确数据权内容、使用范围、使用目的以及相关主体的权益等具体信息，为侵权风险识别提供法律保障[16]。随着国家之间的交流变得更为密切，国家之间的合约由少量变为海量，而海量的合约以海量数据的形式存储到我国用户终端，这些内容经过识别、筛选、学习转变为知识。在使用智能合约的过程中，合约知识层会不断更新。在进行特定的数据跨境流动时，特定的合约会直接从海量的知识层被抽取，为风险识别提供判定标准和条件准则。

2.密钥代码层。智能合约的智能化离不开代码的设计，代码由算法及程序语言构成。算法设计的用途包括工作量证明、用户身份认证、奖励机制等。设计者设计相关的关系式，当满足数值条件时，数据跨境的特定流动就会实现。通过不断完善密钥验证技术、拓展适用新型智能追踪干扰工具，建立有效阻止未经授权之再识别的安全屏障；通过出台相关的聚类、分布、去真、关联等技术标准，采取限制措施避免侵害合法数据信息，确保活动源于明确的合法协议或特定事由[17]。以SOLIDILITY为例，代码中的num字段将算法和合约运行，当满足条件时，用户双方基于共识的数据流动就会实现。代码能够根据实际情况活跃地进行数据处理，且当不法用户企图篡改代码以让流动利益外流时自动防御，极大减少了利益与信息保护的工作量。

3.风险识别。数据跨境流动风险识别机制为整个机制的主要组成部分，每当一项数据跨境流动行为进行时，就会在区块中独自产生风险识别流程。具体流程为：数据输入→密钥识别→识别风险因素、风险源、风险事项等→挖掘异常与价值。在密钥的运转下，数据输入过程中用户的身份自动得到认证识别；在辅助模块的支撑下，数据跨境流动的每一个详细步骤都会被记录，数据跨境流动活动中的风险因素、风险源、风险事项都会被记录与研判，识别结果会自动备份于区块中。

4.区块。合约传输的应用层以及风险识别的运行层，为风险识别提供可信的执行环境。在以太坊2.0的支持下，区块中的功能会根据风险识别的内容进行标记，分别记录识别的难度、对应的数值、时间戳、识别路径等，对风险识别进行工作量证明。每一区块的运作都不会相互影响，当中的任一节点失效，其余节点都可以不受失效节点的影响而保持正常工作。在独立的区块中会将失效的流程进行修复，其他区块中的数据跨境流动和风险识别受其影响的程度甚微，依然能够实现流动效益和风险识别。

5.以太坊底层介质。和区块处在同一区域，实时更新接收数据跨境流动风险的异常状态，学习吸收其价值，同时发挥数据备份的作用，应用于备份以及应急反应。根据识别判定的标准，对相应数据进行处理。以太坊最基本的特点是承载了具有灵活性的代码，能够使智能合约下的风险识别机制在复杂环境下运行。在整个风险机制的运行过程中，要求网安部门人员应当熟练运用以太坊2.0的代码与算式，运用智能合约技术处理错综复杂的数据跨境流动活动。

(二)基于智能合约的数据跨境流动风险识别机制模型构建与运行

由于智能合约是一项去中心化的数据流动项目，当一项甚至多项数据跨境流动活动开始时，各个活动都不需经过智能合约而直接在用户终端间相互进行。由数据跨境流动风险评估组织人员统一编辑的基于以太坊2.0的密钥代码、共识算法以及合约内容分别部署于各个区块中，在区块中的数据跨境流动风险识别机制流程如图5所示。

图5 基于智能合约的数据跨境流动风险识别机制

1.数据输入与认证。数据跨境流动起始阶段，在数据访问方(发送方)发送访问请求(发送数据)的同时发送密钥值，共识机制中的共识算法对密钥值进行计算。当计算结果呈现满足共识机制要求的算式时，密钥代码会指示该方用户身份通过认证，访问方(发送方)和接收方形成共识机制，访问方就获取了访问权限，机制权限识别阶段结束。随后，将访问方(发送方)的基本信息和行为输入识别流程中，同时将访问方的身份信息、数据输入任务和使用行为备份及保存。

2.数据识别与研判。风险识别阶段，智能合约对输入的访问方(发送方)的数据跨境流动活动进行筛选，提取出数据流动活动的目的、影响、方式等。根据活动呈现的不同内容识别风险因素、风险源、风险事项，运用工作量证明算法从内容计算出所对应的数值关系，根据风险评判标准对数值关系进行分级。工作量证明代码会对每个步骤进行记录，包括每个内容的识别难度、步骤时间戳、函数碰撞值等。风险三大要素计算结果和步骤计算结果融入同一代码，计算出最终结果，根据结果数值大小判断其风险值是否异常。

3.数据分链与预处理。经过数据跨境流动风险识别评判标准分级后的数据流动活动会进行分链和预处理。分链包含公共链、私有链、联盟链。公共链和联盟链分别记录安全可访问的跨境合作数据流动活动以及公共网络可发布的新闻数据，私有链对数据流动中的国家安全数据、行业内部数据和个人隐私数据进行保护。对于识别出异常状态的数据流动活动，智能合约会自动将该数据活动进行否定并防御。同时，海量的数据跨境流动活动之间存在相互影响的可能性，要求风险识别人员运用智能合约覆盖各个区块，在确保各个区块单独运行的同时，计算各个区块之间联系的函数值，判断活动之间的相互关系[18]。

4.数据反馈与应用。以太坊2.0能够灵活地发挥存储备份的作用，回顾并学习风险与价值，挖掘其在实际应用中的价值。本地数据库将识别后的数据流动活动内容以及风险进行存储，当需要应对应急风险事件时，以太坊能够从本地数据库中调取备份后的数据。

(三)机制构建启示

1.提升专业水准。由于数据跨境流动要求特定权限的人员或组织才可通过防火墙进行传输，所以不论是数据访问方还是发送方，都应当向风险识别人员发送数据访问国与我国共同协定的权限证明。作为风险识别主体，无论是公安机关还是国家安全人员，在学会运用共识机制进行认证的同时，应当提升专业素养，学会运用数据跨境流动认证与预警工具，学习以太坊智库以充实自身能力，掌握诸如情报指挥作战系统、国家反诈等系统的使用能力。识别组织要始终统筹规划，依照《网络安全法》相关内容对访问权限证明材料进行认证，对各个步骤的记录和评判标准进行整合，筛选出数据跨境流动流程中的风险价值，提升风险识别的专业性和严谨性。

2.树立数据流动大格局。当前，海量的数据跨境流动存在有益的机遇与未知的危险性，数据流动活动之间存在相互影响的可能性，风险识别与研判要突出长期性与全面性。数据安全问题和数据霸权主义、美国和欧盟等经济体从20世纪末构建的全球数据管理模式与我国数据外交所追求的合作共赢理念产生了强烈冲突，是否掌握技术核心竞争力来应对日趋复杂的风险是一项重要议题。因此，风险识别人员应树立数据流动大格局，放眼国家、经济、文化安全形势，探索融入国际合作机制流程的中国方法，坚定不移地维护我国数据主权理念的创建和数据合作共赢的体系构建。在风险识别过程中，要甄别出有益因素与危险因素，为数据主权和合作共赢理念进行智慧性分类[19]。识别组织应当积极组织数据跨境安全与合作的会议会谈，宣传我国数据合作共赢的体系构建，表明我国坚定不移的主权意识，争取数据跨境境外服务器组织的支持。

3.提高安全意识。综上所述，数据跨境流动风险不只是数据化的非传统安全风险，还有数据传输安全问题，如国家政治形势、行业可信度、访问用户身份是否需要风险评估人员提高重视程度、列入预警范围等。风险识别组织人员应当考虑是否需要将特定研究的风险识别活动的相关要素如识别难度、智能合约使用权限等内容进行重点分析和学习，以改进智能合约的安全识别，提高合约的安全系数。

四、结语

构建“网络空间命运共同体”是长久之计，智能合约下数据跨境流动风险识别机制的构想与实施将会实现数据新秩序的大跨越。在构建新型机制的趋势下，下一步如何对网安人才能力进行精准评估，使其满足多行业、多领域人才需求，并协助相关机构完善网安人才培养模式，考察解决实际问题的能力，培育实战型攻防兼备人才，具有重要的现实意义。与此同时，应呼吁并推动各国致力于维护开放、公正、非歧视性的营商环境，实现互利共赢、共同发展。