基于多链式区块链的互联网金融犯罪情报共享模型研究*
2021-06-22张成虎李鹏旭
张成虎 李鹏旭
(西安交通大学经济与金融学院 西安 710061)
互联网金融以其低成本、高效率、普惠化的优势,在解决小微企业融资难融资贵问题、推动我国创新创业战略的同时,也被不法分子作为打着金融创新的旗号实施犯罪的重要工具。互联网金融犯罪不仅严重危害人民群众的财产安全,更导致金融本源功能丧失、系统性金融风险聚集,危及国家的金融安全稳定。因此,发展以情报共享和数据驱动为基础的现代预测警务、构建基于大数据分析的互联网金融犯罪精准防控体系,对于维护金融安全稳定、促进社会经济健康发展具有重要的现实意义与应用价值。
犯罪情报共享是指为了预防和打击违法犯罪活动,不同地区、不同层次的情报主体所采取的情报交换和共用的行为。互联网金融犯罪情报共享能有效提升情报信息的质量和准确性,对指导互联网金融犯罪预警决策、提升情报战斗力具有重要意义,是构建互联网金融犯罪精准防控体系中的核心问题之一。然而,由于我国在互联网金融犯罪情报共享方面缺乏统筹规划,尚存在技术标准不一致、现有技术创新不足、情报共享机制不完善等问题,导致部门间情报共享动力不足、信息孤岛现象严重,共享情报在完整性、准确性、丰富性等方面无法满足互联网金融犯罪精准防控体系的数据需求[1-2]。
区块链作为前沿的分布式数据存储结构,拥有分布式账本、非对称加密、共识机制等独特的技术规则,能打破互联网金融犯罪情报共享部门间的信息壁垒,实现共享情报的不可篡改、隐私保护和数据追踪,有效保障共享情报的数据权属和安全保密,从根本上解决互联网金融犯罪情报共享部门间的利益冲突和信任缺失问题,为海量情报信息安全存储、快速响应和跨部门协同共享提供全新的思路和有力的技术支撑[3-4]。本文结合区块链的原理和特点,构建基于多链式区块链的互联网金融犯罪情报共享模型,为实现高效、安全、可信的互联网金融犯罪情报共享提供新的理论框架和有效的技术支持。
1 文献综述
犯罪情报共享的关键是解决异构情报如何实现跨部门协同交互的难题,为此众多学者从不同角度对此进行了深入的探讨。王奇等(2017)[5]借助博弈论经典模型分析了公安情报共享的利益机制,提出了公安情报共享的最优决策和改进机制。张苗苗等(2018)[6]从价值共创视角出发,分析了公安情报共享中利益冲突的类型、特点、成因和运作机制。孙敏等(2019)[7]借助演化博弈方法分析了影响情报机构共享策略选择的关键因素,提出了促进跨部门情报共享长期发展的激励机制。Walsh(2010)[8]针对欧盟成员国在情报共享中的不信任问题,提出了仅实现小成员国情报共享的解决对策。FIELD(2010)[9]针对英国在情报共享中的技术标准不一致和组织分工不明确问题,提出了统一开发信息系统、创建多部门共享文化的建议。此外,美国自“9·11”恐怖袭击后相继提出了《国家犯罪情报共享计划 1.0》(2003)[10]和《国家犯罪情报共享计划 2.0》(2013)[11],为情报共享的发展奠定了扎实的实践基础。谢晓专(2019)[12]、张鹏等(2018)[13]从演进视角出发,分析了美国情报共享的发展轨迹、特点及成功因素,为我国情报共享建设提供了借鉴。
区块链作为分布式的链式存储结构,拥有分布式账本、非对称加密、共识机制、时间戳技术等独特的技术规则,不仅能为数据提供一个去中心化、点对点传输、集体维护的安全可靠的存储环境,而且能增加数据的不可篡改和可追溯属性,在数据的整合、权益保障和安全保护等方面具有明显优势,目前已经应用在信息共享管理的许多领域。Maxmen(2018)[14]探讨了基于区块链的百万乳腺X光照片的共享系统,为解决医疗数据难获取问题提供了新思路。刘丰源等(2018)[15]设计了基于区块链的教育资源共享框架,为解决教育资源共享的产权保护难题提供了新的理论参考。谷俊等(2019)[16]构建了基于联盟链的人文社科数据共享模型,解决了人文社科数据共享中溯源难题。沈凯旋等(2019)[17]构建了信息资源安全共享模型,解决了数字图书馆的技术标准和管理机制不一致、信息资源共享难问题。张冬冬(2020)[18]构建了基于区块链的反恐情报协同共享体系架构,为实现反恐情报跨部门的安全、扁平、高效共享提供了新的参考依据。
综上所述,学术界已经对犯罪情报共享进行了比较深入的研究,但尚存在以下不足:一是现有研究多以犯罪情报共享的影响因素和共享体制、机制为对象,应用现代信息技术、从技术实现视角探讨犯罪情报共享系统构建的研究较少;二是根据犯罪类型有针对性的情报共享研究较少,针对互联网金融犯罪情报共享的研究尚未见到。利用区块链的技术特点,实现数据共享的研究也在不断丰富,但怎样应用区块链技术,解决互联网金融犯罪情报共享的研究尚为空白。鉴于此,本文基于区块链理论,在分析互联网金融犯罪情报共享现实困境的基础上,探讨区块链的应用优势,并针对联盟链单链在实际应用中面临的高成本和低响应速度、吞吐量问题,引入多链式区块链构建互联网金融犯罪情报共享模型。通过对模型的架构、数据及存储结构、业务智能合约、权限管理与身份认证机制进行详细设计,并对模型的运行流程和特点进行具体分析,希望为高效、安全、可信的互联网金融犯罪情报共享提供新的理论和实践参考。
2 互联网金融犯罪情报共享的概念、特点及技术选择
2.1互联网金融犯罪情报共享的概念及特点互联网金融犯罪情报共享是指为了预防和打击互联网金融犯罪,公检法、金融机构、监管机构以及工商、税务等部门联合采取的一种情报信息交换行为,目的是将海量、零散、异构的涉及互联网金融犯罪的网络数据和各部门的记录数据组合在一起,通过识别与选取、分析与研判、传递和融合形成最终对预防和打击互联网金融犯罪有价值的情报信息。
我国互联网金融犯罪情报共享主要以公安机关牵头,通过访问合作单位的信息系统数据接口获取并中心化管理相关信息,包括银行账户信息、证券账户信息、互联网金融账户信息、金融产品发布信息、纳税信息、资产转移信息、社交网络信息、违法犯罪历史信息和各类行政奖罚信息等。目前我国互联网金融犯罪情报共享尚存在以下问题:其一,信息系统建设缺乏统筹规划,建设技术标准不一致,导致互联网金融犯罪情报数据的资源标准和交换技术不统一,情报无障碍实时交流和共享受限。其二,现有技术创新不足,存在较大的信息泄露和被篡改风险,导致互联网金融犯罪情报数据的安全和权益无法保障,各部门共享意愿不足。其三,情报共享机制不完善,安全保密工作和利益分配落实不到位,导致各部门共享关系不密切、协同共享动力不足。
2.2互联网金融犯罪情报共享的技术选择区块链是一种利用共识算法生成数据、采用加密链式区块结构存储数据、借助智能合约操作数据的分布式存储架构,具有“信息不可篡改”“隐私保护”“可溯源”等属性。目前,根据参与节点的范围不同,区块链可分为公有链、私有链、联盟链。其中,公有链是完全去中心化的,参与者有平等的权力匿名查看区块、获取数据、发送交易和参与共识,但这种公开透明的运行模式不利于互联网金融犯罪情报共享的数据管理和保护;私有链是中心化的,仅针对某个组织或机构,只有被许可的节点才能查看数据,适用于单一主体的大规模部署;联盟链是多中心化的,针对联盟成员开放,且共识过程受预选节点控制,能有效提高跨部门协同共享的效率且可控性强,可以较好地借鉴和应用到互联网金融犯罪情报共享中。联盟链具有如下优势:
a.为多部门的情报交互提供高效、便捷、统一的技术支撑。联盟链采用去中心化的情报管理方式,通过P2P网络分布式存储和传输情报数据,能够保证各部门具有整个链上数据的完整备份。更重要的是这种P2P的情报传输模式省去了中心机构,且不需要进行大量资源的在线传输,能有效提高情报查找和提取的传输速度和效率。目前,Linux基金会已经发起了关于联盟链的超级账本(hyperledger)开源项目,其中的子项目(Fabric)能为互联网金融犯罪情报共享联盟链的单链、多链、跨链的开发提供统一的框架和技术支持。
b.为情报信息提供安全有效的加密手段。联盟链采用非对称加密技术,在情报传输双方间设置公钥和私钥对情报数据进行加密和解密处理,能有效实现对身份的验证和情报的加密保护。
c.为多部门情报共享提供有效的数据权益保护。联盟链集成了时间戳和Merkle树技术,通过赋予每个区块唯一的标识特定时间的字符串和区块信息的编码哈希值,能有效实现对共享情报的追踪、溯源和查验,保障共享情报的权属和防篡改,维护情报提供者的权益。
d.为多部门情报共享提供低成本的可信环境。联盟链中各成员是经过机构的认证和许可的,可信任度较高。另外,联盟链在传输情报过程中要对其进行一系列的验证,并通过共识机制有效排除问题节点,保障情报的完整性、一致性和准确性,解决多部门情报共享的不信任问题。
面对跨部门的互联网金融犯罪情报共享,联盟链能有效解决数据加密和权益保护等问题,为多部门的情报共享提供一个安全、高效、可信的共享环境。但在实际的情报共享中,由于各部门的所有情报数据都要上链,基于联盟链的情报共享单链模型将不可避免地面临着海量情报数据共享所带来的较高成本、较低交易验证、共识形成速度和较低吞吐量的制约。
多链式区块链作为联盟链的改进版[19],是在联盟链的多中心思想基础上,将联盟链中的各节点替换成节点加私有链的组合形式,通过将大多数数据储存在私有链上,而仅将少数有价值的需要共享的数据通过服务器传输到私有链对应的联盟链节点上存储,变联盟链单链储存模式为联盟链与私有链相结合的混合存储模式,为解决联盟链单链存储负担过重、吞吐量过低等问题提供有效办法。因此,本文以多链式区块链为基础,构建了基于多链式区块链的互联网金融犯罪情报共享模型,为有效解决互联网金融犯罪情报共享问题,促进数据驱动下互联网金融犯罪预警警务发展提供有效的技术支撑。
3 基于多链式区块链的互联网金融犯罪情报共享模型设计
基于多链式区块链的互联网金融犯罪情报共享模型是以联盟链为主、私有链为辅的用以实现跨部门情报共享的数据模型。该模型以多链式区块链为思想构建数据模型架构,以分布式帐本和IPSF网络技术为基础构建数据及存储结构,利用智能合约对数据进行操作,并通过身份认证与交易认真机制对数据进行约束,保障数据的完整性、有效性。以下分别对该数据模型的架构以及对应的数据及存储结构、数据操作、数据约束三要素进行详细设计。
3.1数据模型架构基于多链式区块链的互联网金融犯罪情报共享模型的架构如图1所示。该数据模型包括公检法、工商、税务、金融机构、监管机构等各主体的内部私有链以及主体间联盟链、LevelDB(称为世界状态,是联盟链中用以维护账本状态的键值对状态数据库)和IPSF网络(称为星际文件系统,是一个旨在创建持久且分布式存储和共享文件的网络传输协议)。私有链搭建在局域网中,由各主体内部的不同部门设立部门节点组成的私有链节点集群和CA机构组成。其中,各私有链节点仅负责存储主体内各部门的情报数据,并通过私有链发送到其他私有链节点,实现主体内部的情报共享,不参与主体间的情报共享;CA由身份认证机构ICA和交易认证机构TCA组成,负责身份认证证书ICert(Identity Certificate)和交易认证证书TCert(Transaction Certificacate)的颁发和撤销,并在RCA的协助下验证共享请求发起方的身份以及共享请求的合法性。
图1 互联网金融犯罪情报共享模型架构图
联盟链搭建在互联网中,由各主体节点组成的联盟链节点集群和RCA机构组成。其中,各主体节点负责存储主体间的情报共享交易信息,实现主体间的情报共享;RCA机构负责对主体的身份进行审核,实现主体节点的准入和清退,同时为每一个主体内私有链中的CA机构提供其他主体的身份和交易的验证信息。联盟链支持gossip网络协议,链上的各主体节点间通过gRPC通信,且各主体节点是部署在主体内网中的,但与私有链相互隔离,需要通过代理服务器实现共享情报的传输。
LevelDB和IPSF网络为线下数据文件的存储和查询提供技术支持。情报数据在私有链和联盟链中的存储格式为数据文件的Hash值,真实的数据文件被存储在IPSF网络,通过利用LevelDB的状态查询文件Hash值并访问IPSF网络可获得。
3.2数据及存储结构本文利用分布式账本和IPSF网络技术设计了共享情报数据链上与链下相结合的存储方式。在链上,利用分布式账本构建数据结构,私有链和联盟链中各节点均是以区块首尾相连形成的链式数据结构。如图1所示,私有链节点的区块体中存储着文件数据,联盟链节点的区块体中存储着交易信息。同时,账本的状态保存在levelDB中,通过利用levelDB存储帐本中各交易的键值对(交易ID-偏移量),为帐本添加了索引,便于快速查询交易信息。链上存储的数据均是经过Hash函数处理后的ID值,真正的数据文件存储在链下的IPSF网络,需要用户通过访问IPSF网络获取,具体的获取流程如图2所示。
图2 互联网金融犯罪情报共享模型数据获取流程图
3.3业务智能合约智能合约是部署在区块链合约层中的能在达到一定条件后自动触发执行的脚本程序,其核心思想是代码及法律,通过利用代码代替传统的人为审核,实现各交易流程的制定、执行、验证的去中心化。本文利用其去中心化的特点,针对私有链和联盟链的业务需求,分别设计了对应的业务智能合约,为有效提升情报数据共享的效率提供参考。
私有链业务智能合约数据结构主要包括用户信息、数据信息和操作信息。其中,用户信息中包含正在进行数据操作的用户的所有身份信息,包括所在部门名称以及用户所对应账户的公钥私钥和地址;数据信息包括所操作数据的ID以及文件账号;操作信息包括编号、账号地址、生成时间以及操作类型。通过部署私有链业务智能合约,私有链上的所有节点能随时进行情报数据的添加、删除、修改和查询,而不受其他部门的限制。
联盟链业务智能合约数据结构主要包括交易信息和操作信息。其中,交易信息包括交易发起方地址、交易接收方地址、交易数据ID、交易时间和交易状态。操作信息包括编号、账号地址和操作类型。当主体发起共享交易时,存储在私有链中的情报数据才会被共享到联盟链上,并通过联盟链业务智能合约完成本次交易,在后续添加、删除、修改和查询中也需要用到联盟链业务智能合约。
3.4身份认证与交易认证机制本文设计了联盟链-私有链多级CA认证机制,通过构建CA与RAC相结合的证书信任链,保证各级授权的合法性。CA机构由身份认证机构ICA和交易认证机构TCA,分别负责对节点身份和交易进行认证。其中,ICA为主体内各节点颁发身份认证证书ICert,用于后续工作的身份认证。身份认证证书ICert是长期有效的,一旦注册,可以长期使用。当有新的节点申请加入私有链时,身份认证机构ICA会通过颁发身份认证证书ICert授权其加入,并将证书同步到RCA中,为多主体间身份认证提供前提;TCA为主体内各节点颁发交易认证证书TCert,用于授权节点的共享交易申请。该证书仅限于一次交易认证,在下一次交易时需要重新获取。当用户节点发起交易申请时,由ICA首先认证节点的身份信息,再确认节点身份有效后由TCA向申请节点颁发交易认证证书TCert,授权本次交易,同时将证书同步到RCA中,以为多主体间交易认证提供前提。
RAC中包含所有节点的身份认证证书ICert和交易认证证书TCert,在共享交易过程中能帮助交易接收方节点对交易发起方节点的身份和交易的有效性进行认证。
4 基于多链式区块链的互联网金融犯罪情报共享模型运行流程及特点
4.1模型运行流程基于多链式区块链的互联网金融犯罪情报共享模型是以联盟链为主、私有链为辅的多层区块链数据模型,其中私有链和联盟链分别负责主体内部和主体间的情报共享交易,运行过程基本一致。因此,本文以公安机关上传情报数据请求为例,介绍互联网金融犯罪情报共享模型中联盟链如何实现公安机关的跨部门情报共享。
每个机构的主体节点在联盟链中都不止一个,且在情报共享过程中扮演着不同的角色。其中公检法、工商、税务以及金融机构节点主要负责对所提交的共享情报信息进行背书和广播,充当背书节点、主节点角色;监管机构节点主要负责对共享情报信息进行排序和打包处理,充当排序节点角色;且所有主体节点都存储共享情报信息,均充当记账节点角色。通过不同职能的各主体节点的分工配合,联盟链能实现高效、安全、可靠的运行,具体流程如图3所示,主要分为5个阶段。
图3 互联网金融犯罪情报共享模型运作流程图
a.证书申请。公安机关主体节点首先判断自身是否已获得Icert及Tcert,其中Icert是公安机关主体节点的身份证书,用于自身的身份认证以及后续的交易签名;Tcert用于授权公安机关主体节点本次交易申请。若公安机关主体节点尚未获得Icert及Tcert,需要通过ICA和TCA申请颁发证书。接下来,公安机关主体节点针对本次上传申请生成一个交易预案,同时通过代理服务器调用内部私有链中对应的情报数据到交易预案中,并在对交易预案签名后,利用背书策略将交易预案发送给对应的背书节点,开始本次上传情报数据的交易。
b.背书验证。背书节点在接收到交易预案后,根据背书原则验证交易,并给出背书结果。具体流程为:首先,利用CA验证公安机关主体节点的签名以及交易请求的合法性;其次,按照交易预案,调用智能合约模拟执行交易以验证交易是否符合规则,同时生成读写集,注意此时写集不写入账本;最后,对验证通过的交易进行背书操作,添加背书节点的数字签名,并返回给客户端。
c.客户端校验。公安机关主体节点在收到背书响应后,首先验证背书签名并检查背书结果的一致性;接着,在收到规定数量的背书响应后,把背书预案中得到的读写集以及所有背书节点签名发送给排序节点。
d.共识排序。排序节点只进行排序操作,不会读取交易内容。排序节点在收到来自公安机关主体节点的交易后,借助kafka消息队列对交易信息进行排序,并以一段时间或一定数量为单位将交易打包成区块,发送给确认节点。
e.广播记账。确认节点在收到来自排序节点打包好的区块后,对交易数据块做最后一次验证,包括验证区块结构完整性、背书签名的正确性,并在确认正确后,将区块广播给记账节点,同时更新LevelDB状态。
至此,经过背书、排序、打包、广播和记账等环节,公安机关所上传的情报数据能有效实现跨部门的情报共享。
4.2模型特点基于多链式区块链的互联网金融犯罪情报共享模型具有以下典型特点:
a.安全性。该模型的安全性主要体现在情报数据的完整性、不可篡改性和可追溯性等方面。其一,私有链和联盟链采用分布式账本技术,对数据进行多重备份,能有效保证各主体内部及主体间的情报共享数据的完整性。其二,私有链和联盟链中各成员都经过身份认证,可信度较高。情报数据采用链上链下相结合的方式存储,以加密的情报数据Hash值在链上流通,可以通过线下对应的真实数据实时验证其真实性,且情报数据在流通过程中会经过二次加密,并通过非对称加密技术的共识机制有效保障情报数据的不可篡改性。其三,私有链和联盟链中的帐本是以时间为链条、父子区块首尾相连的数据链,能通过时间和Hash值的逆向连接,有效实现数据信息及数据使用情况的回溯,保证各区块的可回溯性和可审计性。
b.经济性。该模型的经济性主要体现在成本和运行效率等方面。其一,该模型的运行是去中心化的,各业务操作在实施过程中不依赖于第三方,能解决不信任问题,有效降低交易时间和成本。其二,该模型是以联盟链为主、私有链为辅的多层区块链模型,情报数据主要存储在私有链中,仅有少量需要共享的情报数据被上传到联盟链中,从而避免了过多冗余数据在联盟链中的流通;同时情报数据采用链上链下相结合的存储方式,在链上是以Hash值形式存储,能在减轻模型存储负担的同时,有效提升模型的吞吐量和响应速度,提高运行效率。
5 总 结
本文针对当前互联网金融犯罪情报共享面临的困境,提出了基于多链式区块链的互联网金融犯罪情报共享模型。该模型利用分布式账本、共识机制等保障互联网金融犯罪共享情报的可信性,利用身份认证、非对称加密等保障互联网金融犯罪共享情报的安全性,利用多中心的统一化区块格式保障互联网金融犯罪共享情报的一致性,利用时间戳等可追溯特性保障互联网金融犯罪共享情报的权属。该模型能破除互联网金融犯罪情报共享部门之间的信息壁垒,实现互联网金融犯罪情报信息跨部门的高效、安全、可信的共享。从实证角度模拟和仿真该模型,将是下一个阶段需要深入研究的问题。