人工智能模型赋能区块链生态安全的应用研究
2023-12-18王浩张建平唐崇麟连晓磊王二玲
王浩 张建平 唐崇麟 连晓磊 王二玲
1.河北省承德市公安局 2.北京中科链源科技有限公司
引言
数字经济新时代,以区块链、人工智能、大数据等为代表的前沿数字科技作为全新的生产要素,正为人类社会的生产生活与思维方式带来创新范式、方法与决策思路,并引发新一轮科技和产业革命。区块链技术创新发展至今,已凭借自身技术生态系统从最初的虚拟货币领域延伸至金融、政务和公共服务、医疗、供应链、物联网等诸多领域,为传统领域应用提供了全新模式。但随之而来的安全问题也呈指数级增长,逐渐成为阻碍区块链发展的重要原因之一[1],引发全球各界对区块链生态安全的重视。
在公安执法领域,涉虚拟货币犯罪是区块链应用安全风险的重中之重。这类新型网络犯罪不仅对人民财产及社会安全构成严重威胁,也对执法部门与现有法律提出了全新挑战。因此,亟须切实有效的安全措施与智慧解决方案在公安智慧警务建设与治理工作中发挥作用,以提升警务运行质效与实战能力。本文旨在探讨人工智能模型如何赋能区块链生态安全,并通过具体的数智警务实践应用案例,详细论述如何充分利用新一代人工智能的强大能力实现链上安全护航的多目标协同优化,以及在提高打击涉虚拟货币犯罪效率与精确度层面取得的成效。希望为人工智能技术赋能区块链生态安全和智慧警务平台建设等相关工作提供参考和借鉴,并对相关领域的从业者产生有益启示。
一、安全现状与挑战
近年来,作为深耕金融领域的热门话题,区块链技术已展现出颠覆传统金融运作方式的巨大潜力,其应用成果在带来更高效、更安全、更便捷、更具可扩展性解决方案的同时,也因区块链系统交易难以追踪和审计的问题,为不法分子提供了犯罪平台。在DeFi(去中心化金融)领域中,黑客攻击和智能合约漏洞等问题频发,导致投资者资产被盗或被锁定;虚拟货币交易平台也可能存在欺诈和操纵市场等行为;而区块链及其衍生品虚拟货币的匿名性和跨境流动性特点使得洗钱、诈骗、贩毒、恐怖融资等犯罪行为更加难以追踪和打击。区块链技术在金融业的应用,使监管机构在部分业态之下收集交易信息存在障碍,难以确保信息的准确性与全面性,导致监管存在真空地带,为犯罪行为的滋生提供了机会[2]。
(一)安全风险
当下,各类新型网络犯罪行为与虚拟货币相互交织渗透,主要形态包括传销、诈骗、网络赌博、洗钱、涉毒等危害民众利益和社会稳定的犯罪活动类型,各类涉币案件呈高发频发态势,案件类型也趋于多样化、复合化。在涉及虚拟货币的犯罪活动中,USDT(泰达币)是主要的犯罪媒介,多发生在波场链上。此外,也有利用BTC(比特币)、ETH(以太坊)、XRP(瑞波币)、XMR(门罗币)等其它虚拟货币作为犯罪载体的常见案例。
(二)技术手段
随着跨链技术、匿名币以及混币器等新兴工具的出现,虚拟货币交易的匿名性与隐私性得到了显著提升,为犯罪分子创造了毁灭追踪路径的“迷雾地带”。这些因素的综合作用使得虚拟货币犯罪具有更高的隐秘性和难以追踪性,为执法部门打击犯罪带来了更大的难度与挑战。
混币器是一种完全去中心化的非托管协议,通过打破源地址和目标地址间的链上链接来提高交易隐私;跨链行为则是突破区块链的界限,允许虚拟货币在两条不同的区块链上进行转移,跨链项目的存在,将资金的传递链条切割成分属不同“账本”的两部分,切实为资金追踪带来困扰;匿名币如门罗币,高度强调不可追踪和匿名性,利用环签名、混淆地址、换机密的方式,较好隐藏掩盖了交易发起者、接收者、交易金额等信息痕迹[3]。
混币器、跨链技术和匿名币等新兴技术与工具在提高交易隐私和便利性的同时,也呈现出黑灰产洗钱适用性的特点,被广泛应用于违法犯罪活动相关的场景中,即经过多层混淆转移的复杂化处理,达到彻底清洗目的,使原本清晰可见的交易过程变得交织不清,难以查阅,这使得涉虚拟货币犯罪的追踪溯源和治理打击变得尤为困难。
(三)实战挑战
在区块链上进行活动,所有交易或交互数据及信息都会被如实记录,任何区块链参与者都可查询,这为执法机关的实战分析研判提供了海量数据支持。传统的分析策略和方法需进行更自动化、智能化的拓展和优化,以有效应对区块链庞大交易数据的复杂性。
综上,格伦德曼不仅批驳了西方环保主义者曲解“支配自然”观念的理论根源,而且还对马克思的“支配自然”观念作了积极解读和有力辩护。格伦德曼对“支配自然”观念的积极阐释具有重大而深远的理论价值。
当前,业内针对打击虚拟货币犯罪的专业数智执法产品普遍存在壁垒:(1)技术壁垒。尽管近年来技术发展迅速,但在打击涉虚拟货币的犯罪行为方面,数智执法产品在创新研发和部署应用中仍然面临诸多挑战,如数据安全与隐私保护、技术标准与规范的缺失,以及智能化程度不足等问题。(2)应用壁垒。一些数智执法产品缺乏有效的业务战略规划,导致平台功能无法完全满足实际的执法业务需求,造成实际应用中的局限性。(3)行业壁垒。由于涉虚拟货币犯罪打击及链上资金追踪分析等应用场景特殊的专业性和复杂性,导致行业关注度相对较低。随着虚拟货币犯罪高发频发以及打击力度的加大,对涉虚拟货币的数智执法产品的需求也在逐渐增长。解决上述壁垒问题,提高数智执法产品的创新研发和应用效果,对于打击涉虚拟货币犯罪极具意义。
二、应用分析思路
在新技术革命背景下,人工智能与区块链之间的碰撞交汇、融合创新,已显现出惊人的协同效应,并解锁出前所未有的数据能力与价值转换。通过将新一代人工智能强大的数据解析学习、算法学习和决策推理能力[4],嵌入至由区块链技术驱动赋能的数智执法系统中,利用大数据和机器学习技术分析海量链上数据,协助发现难以通过人力识别的犯罪线索,从而追踪到犯罪分子的踪迹,以高效应对涉虚拟货币新型网络犯罪侦查挑战。业内已有数智执法产品根据具体的场景需求先行部署应用,将人工智能与区块链技术共融,不仅在于提高执法的效率和精确度,更在于其很大程度上引领了未来执法工作的新方向。
(一)需求分析
以涉虚拟货币传销洗钱案件为例,起始收款地址是用于归集所发展的下线传销人员充值的出入金地址,该地址在案件资金穿透中扮演着实战开端的角色,是揭示案件资金流动和涉案人员的关键切入点。在起始线索地址的基础上,对该地址进行追踪和分析,以寻找传销高层的核心职能地址,这一过程可能会涉及链上数以十万计的关联地址。鉴于链上数据的隐匿性和复杂性,在大量地址中快速准确筛选出可供进一步追踪和分析的可疑地址,是案件侦破的核心所在。
①疗效:显效、有效、无效,总有效率=显效率+有效率;②第1秒用力呼气容积(FEV1)、用力肺活量(FVC),指标均是越高越好。
(二)侦查痛点
将模拟的三维CAPE场沿苏南32°N作垂直剖面(图15),与图11中的垂直运动剖面进行对比。090604过程中,15时(图15a)120.5°E处为一较为深厚的CAPE大值区域,该区域正处于海风锋的前部,垂直上升运动强盛区。15时该CAPE大值区显著,量值在800 J·kg-1以上;16时该处CAPE值因不断释放,强度减弱至600 J·kg-1;17时强对流过程已结束,该处CAPE值已减弱到200 J·kg-1,垂直厚度也已从深厚减弱成空中的浅层。数值模式给出了Ⅱ类海风锋强对流过程中不稳定能量及其释放的时空精细化演变,显示了海风锋系统对环境强对流的影响。
1.区块链节点数量、层级限制
在区块链网络中,节点规模庞大,节点数量可能达到数万甚至数十万个,这为侦查工作带来巨大挑战。由于技术和资源的限制,传统的侦查方法在节点数量和层级展开方面有限,通常最多追踪至3层。在实际侦查过程中,追踪核心关键地址受限,阻碍了案件的深入分析和打击。
2.人工操作侦查效率低下且易出错
经计算,其平均地震影响系数曲线与振型分解反应谱法所采用的地震影响系数曲线在统计意义上相符。每条时程曲线计算所得结构底部剪力均大于振型分解反应谱法计算结果的65%,且3条时程曲线计算所得结构底部剪力的平均值大于振型分解反应谱法计算结果的80%。
由于人工操作自身的局限性,即使投入大量的人力成本,追踪覆盖数十万个地址的可能性仍然非常有限。即使经过大量培训和拥有丰富经验的侦查人员,也难以避免在分析数据时出现误差。
画家范曾说过:长年累月,我都是每天早上四点起床,就是为了给自己偷点时间来读书作画。美国著名篮球球星科比每天早上四点起来练球,有人问他为何如此成功,他反问一句:你知道洛杉矶早上四点钟是什么样子吗?文学家鲁迅的成功,则是把别人喝咖啡的时间都“偷”来写作了,所以才成为现代文学的高峰。
3.人力难以并行处理大量特征
在传统侦查中,办案人员主要依靠经验进行分析。当涉及分析案件特征时,人力处理的特征数量极限通常最多是10个,无法同时处理更多维度特征,这也制约了办案人员在面对复杂案件时的工作效能。
梅兰芳(1894.10.22—1961.8.8),名澜,又名鹤鸣,乳名裙姊,字畹华,别署缀玉轩主人,艺名兰芳,我国京剧表演艺术大师。
一款机器学习产品的成功落地应用,是业务、算法和工程三方面多维度的综合实力体现。案件分析师团队借鉴大量传统法币案件的侦破经验,并结合虚拟货币交易特征,针对几十起具体涉虚拟货币案件的情况深入分析研判,积累了极具价值的“特征判定规则”。图计算模型的成功开发落地首先根植于分析师团队对大量案例实践沉淀的业务理解;其次,算法团队通过机器学习的方法,结合业务团队的“特征判定规则”进行模型的训练;最后,通过大数据工程建设和前后端软件开发落地,部署相应的数智执法产品。
涉虚拟货币案件是近年来新兴的犯罪形式,相关分析人才极为稀缺。现有分析人员专业水平不仅参差不齐,且每个办案人员的方法和实战经验都有所不同。在分析案件的过程中,相关判断结果会因人而异,无法形成统一标准。
(三)解决方案
在公安执法领域中,为了提高打击涉虚拟货币新型犯罪案件实战工作质量和效率,应当采取“实战专家+数智作战系统”的双驱动模式,该模式强调了数智化技术应用的数据分析能力和实战专家专业能力相结合的共同作用,以高效、精准的解决方案提供强有力的支持和保障。
Bin 2:有“澳大利亚勃艮第”雅号,却由西拉和慕合怀特两个“强劲”品种混酿而成,口感柔润。1960年开始生产,70年代停酿,后再复产。
检查已提交的控制点观测记录、成果精度、点之记以及计算过程等。主要内容有:(1)分析判定控制网的布设是否合理,控制点的点位和密度能否符合碎部测量的需要。(2)进行控制测量时外业观测的精度是否满足相应等级的规范要求。(3)标石的类型能否满足规范的要求,埋设标石是否稳固坚实。(4)布设图根点的位置、密度是不是符合解析法细部测量的规定。(5)平差计算软件是否正规,平差计算的结果是否正确,所有精度指标是否符合规范限差的要求。(6)资料提交是否完整。
其次,实战专家的专业知识和经验在打击虚拟货币犯罪中也具有不可替代的作用。通过与行业内的专业机构和专家合作,引进具有丰富实战经验和专业能力的案件分析师,共同参与案件的分析和研判,应对虚拟货币犯罪的复杂性和变化性,提供更精准的研判结果,为实战工作提供更高效的指导。
此外,引进培养涉虚拟货币案件分析师复合型人才也是非常重要的措施之一。通过加强“虚拟货币办案”相关培训和教育,支持该领域案件研判人才的学习和发展,提高案件分析师的专业技能和知识水平,使其能够更好地应对虚拟货币犯罪的挑战,提升公安业务能力以及执法质量。
首先,数智作战系统是打击虚拟货币犯罪的重要工具。通过开发或引入先进的创新技术或智慧警务平台资源,可以提供自动化和智能化的支持,提高数据分析的精准度和速度。将大数据、人工智能等技术手段应用于案件的研判和分析,通过交易监控、模式识别和关联分析等方法,为案件分析师在侦案实战中精准赋能,协助发现隐藏在数据中的异常和规律,挖掘犯罪线索,提升案件侦破效率。
(四)部署原理
图计算模型的兴起,为大规模、复杂高维的数据集处理提供了一种全新的解决方案。作为一种新颖的数据分析和机器学习方法,图计算模型通过构建图形的方式对数据进行表达,并利用图计算和网络分析技术来探索数据中隐藏的关系与规律。利用图计算模型落地产品进行涉虚拟货币犯罪的打击,为公安部门进行案件侦查分析提供了全新的视角与思路,并贡献了有力的侦破支持。
4.人为主观因素影响案件判断
三、图计算模型落地——以“判断涉案地址关联度”的场景应用为例
基于“图计算模型”的解决方案,可通过“点和边”的呈现形式将涉案团伙的成员、成员相关职能以及相关交易等多维的数据信息进行整合,构建出复杂、不限层级的全币种全链路的网状分析图,并自动学习其中包含的信息。不仅如此,网状图的拓扑结构同时释放了高价值的信息,可深入揭示出团伙内部的组织关系、资金流向路径及犯罪收益分配等关键线索与证据,如图1所示。
(一)图计算模型训练步骤
基于图计算的交易数据分析方法,用于提取全量交易数据、构建网图、提取特征、训练模型并产出结果。具体训练流程如下:
以涉虚拟货币传销洗钱案件为例,要在大量地址中寻找到可供案件继续追踪的可疑地址,传统的侦查痛点:
2.构建网图(Graph)
Variation of the days of extreme precipitation in Ningxia in summer and its causes
获取起始线索地址(该地址通常为案件初始资金的归集地址)。从数据库中搜索并提取由该地址出发的所有下游交易数据,并根据案件类型灵活设置向后搜索的层级。随着搜索层级的增加,对计算资源要求也呈指数增长,但并不会发现更多高价值的涉案地址,增量价值递减。
1.搜索提取全量交易数据
根据交易数据构建网图,网图的“节点”代表交易对手方的地址,“边”代表两个地址之间的交易关系,链路则是一个起始地址到一个终点地址之间的交易通路。由于起始线索地址与任意一个终点地址之间,可能存在多条不同长度的链路,因此在该过程中将构建一个包含数十万节点与边的复杂网络。
3.提取特征
生成网图后,根据链路维度从每个地址和每笔交易中提取关键特征。这些特征可分为五大类,共计超过100个,为深入研究网络中节点间的关系和行为提供了重要线索和依据。
5.建立多元化的评价体系。教师核心素养和能力建设的重要影响因素之一就是科学合理的评价体系。同时,它也是学校能够长久发展的基石。目前,一些院校在考核教师时只关注教学能力,考核体系单一。在“双创”时代背景下,高职院校应该把教师的管理能力、创新能力、实践能力、科研能力和服务企业能力等都纳入教师能力评价体系中,实行多元化的动态评价体系。
服务精细才能提升用户满意度,用户满意才能保持市场稳定。天脊集团销售公司办事处对区域销售规划、代理商考核、经销商培养所做的工作中,“服务用户”占最大比例。
(1)交易时间特征:如时间戳分布(是否有特定的交易活动时间段)以及交易时间重合度等;
(2)交易模式相关特征:如平均交易频率、交易频率的标准差、交易总次数以及交易间隔等;
(3)交易金额相关特征:除了平均值、中位数和标准差等基本统计量,还考虑了异常大额交易等;
(4)地址资金余额相关特征:如平均账户余额、账户余额的标准差以及最新余额等;
(5)社交网络相关特征:用户的连接度(用户连接的其他用户数量),用户的社交网络位置(中心性)以及用户所属社群的数量等。
4.训练模型
①为防止堵塞,应随时检查混凝土级配和坍落度;防止过粗骨料进入和堵塞管道;防止泵入空气,造成堵管或气爆。
搭建了基于特征的规则模型,并使用机器学习方法不断迭代规则阈值和注意力权重。规则模型为每个特征进行打分,最后加权求和得出各链路的分数。再根据链路数量和各链路分数,综合计算出起始线索地址与某个终点地址之间的“关联度”。
5.产出结果
计算从起始线索地址到所有终点地址的“关联度”,并进行排序。这些涉案地址可作为下一步分析研判的对象,例如向所在交易所发函要求调取证据,如图2所示。
(二)图计算模型场景应用
要快速实现上述大规模计算任务,需特别关注区块链技术对数据积累、数据处理、数据存储和模型计算的贡献。通过自建全节点和实时解析处理交易数据,来确保数据的及时性和准确性,例如SAFEIS安数区块链安全智能大数据技术平台自建了三大区块链(以太坊、币安智能链和波场链)的全节点;为增强数据的安全性与可信度,将数据存储到实时和离线两套数据库中,获得从创世区块到最新的所有完整交易数据,这种存储方式有利于后续的数据分析和挖掘;为满足模型特征计算的需求,在数据仓库中建立了按天更新的业务中间表,以确保数据的新鲜度和准确性,同时提高计算效率,在接到大规模计算任务后,调用业务中间表可在30分钟内完成计算并产出结果。
模型计算在底层技术平台完成后,其结果通过中科链源自主研发的SAFEIS安士区块链AI信息作战系统前台界面进行便捷展示。该系统的核心组件是以区块链交易资金流向形成的网状视图,在此视图上点击任意地址,展开其交易关联的相关地址,从而形成一张总揽全局的网状图,便于结果分析和地址追踪。由于该组件使用场景高度适配图计算模型功能,因此AI模型技术便深度融合至该数智执法产品中,同时释放技术能力以供实际办案应用。通过点击右键菜单中的“去向交易所关联分析”,可对任意地址进行AI模型的调用,如图3所示,让模型协助进行高关联涉案地址的计算分析,并将计算结果展示在网状图中,直观呈现出犯罪行为的动态演变过程,方便案件的进一步研判与分析。
(三)图计算模型结果验证
模型训练后,将其能力部署至SAFEIS安士区块链AI信息作战系统中,然后将模型投入实际案件的实战分析中对结果加以验证。以涉虚拟货币传销洗钱案件为例,为针对涉案资金归集地址(即收取传销洗钱资金的起始地址)进行深入分析,采用图计算模型计算出每个地址的Top30下游可疑涉案地址,并按照相关度由高至低进行排序。同时,案件分析师在不知模型结果的前提下独立进行人工分析,然后将两者结果进行比对验证。
从评估指标的角度来看,侦破案件对准确性和时效性具备极高要求,关键在于快速找到一定数量的高质量线索进行突破,而无需将所有涉案线索找齐。因此,在评估中重点选择关注分析结果的准确率和效率,忽略了召回率。由于网络的复杂性,人工也很难穷尽所有的涉案相关节点,因此评估召回率显得异常困难。
从分析结果的效率来看,图计算模型在30分钟内便可产出案件分析结果,人工分析则需要近一周的时间。
从分析结果的准确率来看,由图计算模型计算的Top30下游可疑涉案地址中,约有60%左右的地址与人工分析的结果相匹配,准确率符合预期,且其效率远高于人工分析;此外,另有15%的地址未被人工分析发现,但经人工分析验证后发现其较高相关度,这部分可视为模型的增量价值,它能够发现人力难以察觉的信息。
综上所述,通过对脑卒中偏瘫患者进行呼吸肌反馈训练,可以有效地改善患者的呼吸功能障碍,呼吸功能的改善促进了患者的吞咽,患者吞咽功能的改善又进一步改善了患者的呼吸功能,呼吸功能改善与吞咽功能改善就形成了一种良性循环。并且该训练方法简单有效,可以在临床推广应用呼吸肌反馈训练仪对脑卒中偏瘫患者进行呼吸功能的训练。但本研究也存在局限性,比如样本量小,训练时间不够长,同时未对呼吸功能改善与吞咽障碍功能改善的相关性进行进一步探究。以后的研究中会加大样本量,延长训练时间并进一步探究呼吸功能与吞咽功能之间的关系。
四、图计算模型在涉币资金分析中的优势
图计算模型可以通过高级算法深入挖掘海量链上数据背后的关系与规律,并以直观、清晰、流畅的方式呈现分析结果。利用图计算模型的AI算法技术,可将隐藏在数据中复杂的资金关联交易图谱可视化,从而帮助洞悉犯罪分子背后的多种隐秘关联。自动快速处理和分析海量链上数据的模型优势,在解放人力的同时也提高了工作效率。
图计算模型与人类处理信息的能力不同,可以突破人类信息处理极限,在大规模数据集上展开分析,覆盖数十万计的数据节点。同时,模型能够自动从数据中提取有价值的特征,并综合考虑多特征进行自主分析,包括统计特征和图特征等,相比人工分析,可以提供更