利用多维主体画像技术防范洗钱风险研究
2022-06-03严坚等
严坚等
(中国人民银行柳州市中心支行,广西 柳州 545001)
《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出,健全金融风险预防、预警、处置、问责制度体系,落实监管责任和属地责任,对违法违规行为零容忍,守住不发生系统性风险的底线。《国务院办公厅关于完善反洗钱、反恐怖融资、反逃税监管体制机制的意见》提出,要探索建立以金融情报为纽带、以资金监测为手段、以数据信息共享为基础、符合国家治理需要的“三反”监管体制机制。随着经济社会的快速发展,金融产品不断丰富,反洗钱数据呈爆炸性增长,但反洗钱“数据孤岛”和行业数据信息壁垒问题依旧存在,如何有效利用金融科技打破数据信息壁垒,整合多维度金融主体数据信息,精确监测异常交易,研判洗钱风险趋势,进而有效打击洗钱犯罪,对于防范化解金融风险、保障我国金融安全、推进国家治理体系和治理能力现代化建设具有重要意义。
一、文献综述
(一)防范金融业务洗钱风险研究
Vaithilingam &Nair(2009)提出洗钱犯罪已成为社会普遍关注的问题,新的技术手段有助于反洗钱工作。金融科技发展迅速催生大量金融衍生品,交叉性金融模式的形成带来了跨部门、跨行业的交叉性洗钱风险,需要运用科技手段防范洗钱风险(覃盈盈,2021)。程东亮(2018)表示随着时代和科技的进步,犯罪分子的洗钱渠道和手段日趋多元化,为达到隐蔽资金用途和来源的目的,犯罪分子会将犯罪资金分别存放在不同机构、不同行业,“信息孤岛”下单一机构难以掌握同一客户的完整信息资料,从而无法准确判断可疑交易,反洗钱监管难度增加。于惠贤(2021)认为在大数据、人工智能迅速发展的时代,全球商业银行已迈进数字化4.0,金融科技在银行经营管理中扮演愈加重要的角色,利用金融科技等手段有效提升客户身份信息数据质量,对金融机构不断提升反洗钱管理能力和风险应对能力、切实防范风险具有至关重要的作用。
(二)多维主体画像技术在反洗钱领域的应用研究
多维主体画像技术在反洗钱领域的研究主要通过大数据技术采集参与金融活动的所有主体的所有信息,包括身份信息、金融信息、交易行为及关联关系等,并在此基础上使用人工智能算法对海量数据进行挖掘、分析和预测。张煜和孔繁颖(2017)认为使用反洗钱全息数据抽象主体画像,关键在于利用数据挖掘技术、机器学习等技术工具对全息数据进行深入挖掘、转换、分类、预测,构建主体洗钱行为监测模型;可视化方面可通过社区挖掘算法识别群体洗钱行为模式,将反洗钱主体画像应用于洗钱风险分布、洗钱风险趋势分析以及可疑主体排名。刘丽洪和朱彤(2019)认为大数据将积累并引入多渠道的海量客户信息,一旦账户交易情形与可疑交易监测模型匹配,依靠大数据建立起来的智能可疑交易监测系统会自动预警,而人工智能技术将根据客户以往轨迹分析其行为特征,从客户交易行为中找出异常交易,发现背后隐藏的违法犯罪行为,弥补“模型筛查+名单监控+人工甄别”监测模式的局限性,提高金融机构反洗钱工作的有效性。张洁(2020)提出引入大数据模式的反洗钱监管可以提升反洗钱数据质量,引入用户画像可对客户群体精准定位,结合各主体提供的信息,从而对客户洗钱风险进行全面、准确、有效的识别,从源头打击洗钱犯罪。Abdul(2021)基于SNA设计关系模型识别大量交易流水中疑似洗钱行为,研究认为该模型可以识别参与洗钱活动的可疑客户与集团之间的关系,有助于金融机构甄别洗钱活动。
已有研究普遍认为通过多维主体画像可以对客户活动情况进行全方位的精准分析,有效提高洗钱风险识别能力。本文在已有成果基础上,创新性地提出基于多维主体画像防范洗钱风险的技术方案,主要思路是:充分整合金融机构以及各行业的大数据信息,对以客户为单位的金融主体进行画像,构建多维主体画像技术架构;建立多维主体画像数据体系;研究反洗钱数据标签,并对数据标签进行建模;使用人工智能算法对海量数据进行挖掘、分析和预测,准确甄别客户洗钱风险状况及追溯可疑交易资金链,为反洗钱工作提供有力支持。
二、防范洗钱风险的多维主体画像技术方案
(一)建立多维主体画像技术架构
多维主体画像技术架构重点是利用分布式架构实现金融机构反洗钱数据源对接,根据大数据技术构建多维主体画像数据体系,研究洗钱风险数据标签并对可疑风险数据进行建模,利用人工智能相关算法进行挖掘、分析和预测,探索洗钱风险分布、洗钱风险趋势,从而实现金融主体洗钱风险“穿透”识别。如图1所示,技术架构包括三层:一是放置探针对接金融机构反洗钱数据源,各金融机构将各类反洗钱相关的业务系统数据、结构化数据、非结构化数据按照规定的标准转换、汇聚并存储到数据集市,监管机构通过管理中心向数据集市部署探针,实现监管规则的实例化配置与发布、运行管理、上报洗钱风险信息和推送洗钱风险提示,同时监管机构可利用管理中心对跨机构上报的洗钱风险信息进行关联分析,精准识别风险点,进而通过二次定向下发监管规则进行深入分析追溯,有效解决“数据孤岛”问题。二是管理中心以大数据技术为基础构建多维主体画像数据体系,将反洗钱信息整合成数据标签,并对数据标签进行建模,实现股东画像、机构画像、交易画像和关系画像,针对复杂多变的洗钱手段,不断形成新的监管规则,定期向数据集市下发探针,更新版本、运行方式与周期,实现画像、模型算法的实时升级。三是基于人工智能算法主动分析和发现异常洗钱风险,研究适应于分布式的、异步的模型算法,构建智能规则引擎,基于多维主体画像形成的数据基础,在各机构数据集市深入分析各类洗钱交易风险,利用社交网络分析等算法对已发生的案件进行追溯反查,利用聚类算法对不同洗钱案件进行串并分析,利用最短路径算法对资金交易路径进行分析等。
图1 多维主体画像技术架构示意图
(二)建立多维主体画像数据体系
建立多维主体画像数据体系需要深入利用各金融机构的数据源,本文设计基于主流的微服务、分布式技术构建管理中心和前置系统,对金融机构数据源进行对接和分析利用,如图2所示。管理中心部署在监管机构内部,其功能包括探针规则配置与发布,使用规则配置的方式定义监管探针的输入数据项、规则运算条件与触发条件、监管报告结果输出。前置系统部署在各金融机构中,运行管理中心下发的探针专家规则,以各金融机构反洗钱数据集市为基础进行反洗钱风险分析。
图2 金融机构反洗钱数据源对接示意图
各金融机构目前已建有的反洗钱数据库信息主要包括客户交易信息和客户身份基本信息、客户洗钱风险信息、机构外部拓展客户信息等,因而可以建立以客户为单位的反洗钱监管数据集市,搭建多维主体画像数据体系。
1.客户基本信息及交易记录数据。金融机构保存的客户基本信息及交易记录数据主要是根据《金融机构客户身份识别和客户身份资料及交易记录保存管理办法》等规章制度要求采集客户身份信息和交易信息(如表1所示)。
表1 多维主体画像数据体系明细表
2.客户洗钱风险信息数据。客户洗钱风险信息包括客户在金融机构内部的洗钱风险等级、被划定为当前风险等级的风险点、触发异常交易监测记录、受司法查询和冻结记录。
3.机构外部拓展客户信息数据。金融机构在开展客户尽职调查时利用外部渠道(如媒体、第三方机构、官方渠道等)获取的客户信息,主要包括客户负面新闻信息、社会关系信息、社保缴纳信息、税务信息等。
(三)建立多维主体画像标签体系
利用反洗钱监管数据集市构建多维主体画像标签体系,包括客户身份标签、风险属性标签、交易属性标签三个域和资金交易规律特征、洗钱风险因素两个子域,多维度识别客户的身份、资金交易行为并刻画客户的洗钱风险画像。
客户身份标签信息包括客户基本信息数据和机构外部拓展客户信息数据的社会关系信息、社保缴纳信息、税务信息、工商网站公布的信息等。风险属性标签包括洗钱风险因素子域和触发异常交易监控记录、受司法查询和冻结记录、客户身份资料完善度、负面新闻信息,其中洗钱风险因素子域标签包括客户风险等级划分情况及划分为当前风险等级的原因。交易属性标签包括交易时间、交易对手行名、交易对手账户、交易对手户名和交易金额等信息,以及资金交易规律特征子域,包括分散转入集中转出或集中转入分散转出特征、交易渠道、现金交易偏好、交易金额规律以及大额资金交易情况等。
构建标签体系可以通过层级、权重以及预测三个步骤进行。标签的层级划分可以采用层次化迭代的方式,对上一层标签的不断迭代提炼。原始数据包括社会关系信息、社保缴纳信息、税务信息、工商网站公布的信息等,主要来源于客户日常金融行为产生的基础数据,利用文本挖掘、统计算法对原始数据进行分析提炼可得到事实标签。在事实标签中按照分类算法将客户进行分类、聚类,使用关键词算法挖掘客户的风险权重,从而预测标签。
(四)建立多维主体画像监测模型
基于大数据技术构建多维度主体画像监测模型,对以客户为单位的金融主体进行客观精准画像,实现监测金融主体的状态和行为特征,监测金融主体经营动态全息面貌,监测集群关联关系、挖掘集群派系和族谱关系,分析金融主体交易行为,大幅提升金融主体的风险信息提取和洗钱风险分析能力,如图3所示。
图3 多维度主体画像监测模型示意图
多维主体画像主要包括四方面:一是股东画像,主要涉及金融主体的股东信息、各股东持股比例、股东的身份背景、社交信息、亲属关系等。基于采集的与股东相关的数据为基础,精确计算分析金融主体背后的股权结构,向上识别金融主体的主要股东、最终实际控制人、上下游关联方和最终实际受益人,向下识别产品的底层资产,包括其持股类型、持股比例和历史变更情况等,实现穿透式股权结构分析,逐层识别金融主体的股权结构直至最终受益人和幕后实际控制人层级,给出每层级股东取得相应权益的时间、出资方式、资金来源和流向等信息。二是机构画像,实现有效整合客户身份基本信息及行为特征信息等,包括金融主体建立业务关系时初次身份识别时收集到的客户身份基本信息以及不断完善的身份信息、机构背景、经营特征等。三是关系画像,包括自然人关系和机构关系两方面,其中机构关系是根据机构画像、股东画像的基础数据,深入挖掘分析机构的股权穿透、股权控制路径、关系图谱、投资族谱、幕后关系、最短路径关联、供应链上下游关系等,这些关系的识别描绘了关联机构的业务发展脉络以及经营圈,理清金融主体关系情况,全面挖掘集群关联性金融主体各维度利益属性和控制影响关系,通过对上述关系的递归分析,最终形成全域企业间完整的关联图谱,可以追溯到关联图谱中的任意主体,并标记其与实际控制人的关系距离,直观立体展现集群企业的关联关系。四是交易画像,利用账户数据、结算数据、历史交易数据等进行分析,构建动态、完整、全面的交易图谱,在一张信息准确完整的关联网络上刻画金融主体错综复杂的交易往来情况。利用多维主体画像模型将企业之间、经营者之间的信息融合,建立基于海量数据的交换、汇聚、整合、挖掘、分析、传递和利用的连续性机制,充分发挥大数据技术在各类金融主体洗钱风险分析方面的价值。
三、多维主体画像技术在洗钱风险防范中的应用
2021 年人民银行发布新版《可疑交易类型和识别点对照表》(以下简称《对照表》),归纳总结各类洗钱交易特征。结合该表特征标签,本文以聚类分析算法监测金融主体网络赌博交易洗钱风险、利用社会网络分析法追溯资金去向和挖掘隐藏可疑交易团伙为例,阐述基于多维主体画像技术方案在洗钱风险防范中的应用。
(一)聚类分析算法监测金融主体网络赌博交易洗钱风险
根据新版《对照表》中网络赌博可疑交易类型特征,把可识别特征设计为可标识、可衡量的指标,建立涉及客户身份、风险属性和交易属性内容共3个标签类型的9个标签指标名称,并根据标签指标监测数据匹配情况进行赋值,存在关联匹配则该标签指标为1,无关联则为0,由此对多维主体画像标签体系数据进行聚类分析,如表2所示。
表2 网络赌博监测标签指标体系
(二)利用社会网络分析法追溯资金去向和挖掘隐藏可疑交易团伙
社会网络分析算法(SNA)可以用于复杂网络中各个节点的信息度量,衡量节点在一定的网络范围内的重要程度,通过节点度、聚类系数、节数、中心性的分析建立对这些网络的理解,有利于挖掘出网络中发挥关键性作用的节点和集群。
当前犯罪团伙交易形式复杂多变,以利用银行账户周转非法资金为例,跨境赌博和非法经营地下钱庄的犯罪团伙会租借大量银行账户接收、过渡和转移非法资金,交易过程错综复杂且掺杂正当交易掩人耳目,使资金最终去向难以甄别,这些违法行为综合起来构成了一张复杂的网络。而利用社会网络分析算法分析非法资金来源与去向,对挖掘众多交易账户中隐藏可疑交易团伙具有较大的帮助。
1.关键账户节点。利用社会网络分析(SNA)算法,分析网络图中各个节点(账户)的信息度量,可以发现可疑交易团伙的关键账户。常用的SNA 算法指标包括度中心性、紧密中心性、中介中心度等。
度中心性是对复杂网络进行分析时,刻画一个节点在网络图中的重要程度的最直接度量指标,在一个复杂网络结构中,一个节点的边越大则该节点的度中心性越高,表明该节点在网络中越重要,在反洗钱数据分析中,一个节点的度中心性越高,表明该节点活跃度也随之增长,在可疑交易团伙中起到关键作用。某个节点度中心性计算如公式(1)所示。
其中,kx表示与节点x直接相连接的所有节点个数,N-1表示节点x与其他节点相连的边数。
紧密中心性是用于分析一个节点到其他所有可达节点最短路径的平均长度,在反洗钱数据分析中,一个节点距离其他节点越近,则紧密中心度越高,表明该节点在网络中的可达性越高,在可疑交易中该节点重要作用越高。某个节点x的紧密中心性计算如公式(2)所示。
其中,d(y,x)是某个节点x到其他节点y的平均距离,距离总和∑d(y,x)越小,C(x)就越大,说明该节点x的紧密中心性越大,则该节点距离网络中其他节点更近。
中介中心度是一个节点作为其他两个节点之间最短路径桥梁的次数,在反洗钱数据分析中,一个节点x到其他节点经过某个节点v的最短路径数目越多,说明该节点重要性越高,对整个网络的影响越大。某个节点x的中介中心度计算如公式(3)所示。
其中,d(x,y)表示x到y的最短路径数,d(x,y|v)是从x到y的最短路径中经过节点v的数量。
在多维主体画像中经过以上算法对可疑资金交易案例数据进行分析,如图4 所示,图中两个账户较明显的节点分别是交易行为网络中的度中心性、紧密中心性、中介中心度最高的节点,可以看到这两个账户在网络中和其他节点的连接是最多的,可以判定是转账交易中最活跃的账户,在可疑交易团伙中属于关键账户。
图4 利用度中心性发现关键账户节点示意图
2.挖掘隐藏可疑交易团伙。金融主体的资金交易网络中,发现异常交易行为主要是从复杂的交易网络中主动发现一些模式化的异常资金结构,例如频繁汇入汇出、集中转入转出、分散转入集中转出、链式交易结构、环状交易结构和其他异常交易结构,采用阈值过滤算法分析某一时间段集中转入转出情况,同时根据交易时间锁定频繁汇入/汇出异常问题。
在洗钱风险分析中,可将交易的付款方账户、收款方账户、交易金额信息抓取出来,金融交易数据抽象为社会网络,复杂网络中的节点代表各金融主体或其名下账户,属性为客户基本信息和账户信息,联系各个节点的边代表各金融主体或交易账户之间的资金网络交易信息,如图5所示。
图5 金融交易网络图示意图
金融交易网络会随着时间的推移以及交易活动的开展而变化,因而可分为时点交易网络和时段交易网络。时点交易网络代表某交易团体在某时间点所发生的资金往来交易情况;时段交易网络则代表该时段内交易团体在各个时点发生所有交易情况的集合。犯罪团伙通过控制大量银行账户接收非法资金并在各个账户之间来回周转,使资金向某个或多个账户沉淀,最终达到非法转移资金的目的。在整个非法交易过程中,会存在个别账户隐藏于众多正当交易和非正当交易账户中负责周转或沉淀非法资金,该团体则称为隐藏可疑交易团体。隐藏可疑交易团体在不同时间段可能会出现在交易网络中或退出交易网络,该情形主要是受交易时段资金转移时间的紧迫度影响。如果资金转移时间较为紧迫,犯罪团伙则会利用惯用的账户进行接收和转移非法资金;而在时间较为宽松的情况下,犯罪团伙则会增加隐藏可疑交易团体账户作为非法资金交易链中的中转过渡环节或沉淀环节,扩大交易环节,使资金交易链更为复杂和更难追踪。如图6 所示,将金融交易网络划分为四个时段,时段T1和时段T3代表非法资金转移较为紧迫情形下的金融交易网络,可疑交易账户团体A、B、C、D 四个节点之间无隐藏可疑交易团体账户E作为外部连接点;在时段T2和T4时段中非法资金转移时间较为宽松,非法交易网络中增加隐藏可疑交易团体账户E 作为中转站连接A、B和C、D两个交易链。
图6 隐藏和非隐藏可疑交易团体交易网络示意图
利用金融交易网络分析甄别隐藏可疑交易团体和非隐藏交易团体的第一个步骤是聚合交易数据信息。因为在实际交易中,会存在同一金融交易主体名下开立多个银行账户,账户资金会在同名账户或交易团体成员账户之间往来,因而在识别交易团体成员时需要将交易数据聚合,将不同账户同一户名的数据聚合归类或删除重复部分,随后进行网络社交分析,识别隐藏和非隐藏可疑交易团体。
3.追溯异常交易资金去向。追溯多阶段非法资金转移的路径是反洗钱工作的难点,研究金融主体资金交易网络中各交易节点之间的个体、群体之间的联系,可以从交易网络中找到一些模式化的异常资金去向结构。金融主体合法的资金交易行为过程中,为了节省人力、物力的额外开销,一般都会遵循成本最低和时间最短的原则,而非法的洗钱活动为了掩人耳目经常指挥资金在交易网络中以非正常的模式流转。因此利用最短路径算法,包括迪杰斯特拉、弗洛伊德、约翰逊等算法,通过这些算法来挖掘寻找金融主体之间最直接的链路,最短路径可以直接定位到可疑的非法交易。在反洗钱工作中,利用最短路径算法,以一个节点为起点,并作为中心向外扩展,扩展到终点为止。由此计算该节点到其他所有节点的最短路径。
通过这些特征分析可发现节点间为汇聚到某一节点的关系或者单向的转出关系,其中最主要的特点是每一笔交易都可以确定起始节点和最终节点,从而追溯完整的资金交易链条。
四、结论与建议
通过大数据技术并充分利用金融机构的海量客户数据,如账户、存贷款、银行交易流水、企业信息等海量数据对金融主体进行多维度指标模型画像,能够为监管机构提供一个全面的金融主体知识图谱,完成金融主体信息、交易行为的统一归集,为监管机构、金融机构提供高效率的金融主体信息查询与关联关系分析,并穿透识别可疑交易主体、探索洗钱风险趋势及分布、深入洞察和精准识别潜在的洗钱风险,为反洗钱工作提供有力支持。为了提高多维主体画像在反洗钱领域监测风险应用水平,进一步整合各业务条块的分散数据,发挥金融领域的大数据优势,本文提出以下建议。
(一)政府部门
一是加强监管科技发展的顶层设计,加快制定符合我国金融监管实际的监管科技发展规划,从国家战略的高度全面加强监管科技的研究和应用。二是建议由政府部门牵头建立跨部门、跨机构的信息共享和沟通机制,通过整合技术、人才和资金等要素形成部门合力,促进金融监管科技的协同发展。三是加强国际合作,加强与国外金融监管机构的沟通交流,学习先进国家、地区的监管理念及技术,不断完善我国金融监管科技的发展。
(二)反洗钱监管部门
一是不断探索完善多维主体画像技术发展的良性生态环境,从监管逻辑、技术升级、资金及技术保障、产品配套等方面全方位支持多维主体画像技术乃至监管科技的健康有序发展。二是及时关注技术应用中可能产生的风险问题,对相关的流程和环节进行规范,全面跟踪基础架构、应用情况、升级完善等环节,不断提升多维主体画像技术的应用水平,提高监管效率。三是完善反洗钱保密相关法律法规建设,建立信息共享和信息安全保密机制,整合各部门的信息数据,为大数据分析提供更广泛的数据基础,提高决策可信度。
(三)义务机构
一是强化客户身份识别,不断完善客户身份信息和金融交易信息,确保金融主体数据信息的真实性和完整性。二是在资金交易监测方面,应改变资金交易监测思路,由单一经验型可疑交易监测分析向经验型加预测型的复合型监测思路转变,增强可疑交易监测指标模型的时效性。三是加大和反洗钱监管部门以及公检法部门的沟通联系,不断收集各类洗钱风险因素以及洗钱案例和交易手段,积极向上级反馈,完善监测模型及指标,提高画像的准确率,提升反洗钱监测质效。
(四)社会公众
社会公众作为金融交易的主体,应不断增强反洗钱意识,在开展金融交易活动时主动配合金融机构履行客户身份识别义务,登记真实、完整的身份信息,同时注意保护自身合法利益,远离陷阱,避免被不法分子利用洗钱。当发现洗钱交易行为时应积极向监管部门或公安机关举报,为洗钱风险监测及时提供有价值的信息。