关于构建外汇管理大数据平台研究
2018-09-10陈永富
陈永富
〔内容提要〕 随着我国对外经济的快速发展,以及经济金融形势变化的复杂性和开放性,外汇交易呈现出主体日趋多样、交易方式层出不穷的态势。因此,外汇管理部门开展的各类专项调查或检查对大数据的分析应用依赖也愈加强烈。在大数据视角下,外汇管理部门应顺新时代要求,正确认识大数据分析的核心理论,综合运用数据发掘技术,利用现有外汇数据资源,开展外汇管理大数据分析,并依托外汇跨境资金监测分析平台,提升外汇管理的针对性和有效性。
〔关键词〕 外汇管理 大数据 模型构建
一、外汇管理大数据应用的内涵与特点
(一)外汇管理大数据应用的内涵
从目前情况看,在外汇管理工作中,利用大数据平台开展外汇管理研究和检查分析发现的违规问题,为外汇管理提供决策依据和提供异常线索,已经成为外汇管理工作的常态。外汇管理大数据应用是指通过银行、跨国公司外汇收支指标体系,对数据的交叉分析和深度挖掘,确保外汇管理部门能够进行跨区域、跨主体和跨业务的立体监测,有助于提高外汇管理精度和准度。
(二)外汇管理大数据应用的特点
利用大数据开展外汇管理具有以下特点:一是全面性。大数据的内容包括历史所能统计到的所有数据,突破原有的采集随机样本的框架且范围广,覆盖了广泛的涉及外汇交易主体以及国际收支、经常项目、资本项目各类外汇交易信息。以外汇检查为例,在开展外汇检查工作时,利用大数据平台,能够在更加广泛的范围内筛查可疑数据,实现对所有线索的全覆盖分析,异常跨境资金流等问题的监管效力也较以往更加全面系统,确保了监管所必需的广度和深度。二是高效性。通过从大量的外汇交易数据当中筛选出的交易数据和线索,有利于较快锁定违法违规主体和行為,极大地提高了外汇管理的针对性和有效性,确保对管理对象的实时监控、持续监控和全过程监控,对于外汇管理中发现的重大问题,可以立即处置,防止外汇管理损失的扩大化。三是可分析性。通过大数据分析,能够从错综复杂的外汇交易数据中筛选出可疑或违规交易线索,并勾画出可疑或违规交易主体资金流动的整体轨迹,迅速准确锁定外汇违规违法主体,从纷繁复杂的数据系统中寻找线索和规律,通过各类数据算法预测未来趋势。四是独立性。在外汇现场检查工作中,检查人员更多地依赖被检查单位或部门所提供的纸质报表等材料,存在被抵赖或篡改的可能性,而大数据引入以后,检查人员主体依据系统内数据开展工作,有助于检查人员的独立判断思考,具有更大的独立性和灵活性。
二、外汇管理大数据应用的思路与模型构建
(一)外汇管理大数据应用的思路
目前,国家外汇管理局加快外汇信息化建设进程,优化资源配置,对现有的外汇业务系统进行了大幅整合,形成了比较完善的数据仓库。在此基础上,开发形成了外汇管理应用服务平台,应用服务平台基本覆盖银行、非银行金融机构、企业及个人等广泛的涉及外汇交易主体,以及国际收支、经常项目、资本项目等各类外汇交易信息,全口径监测直接投资、货物贸易等众多的结售汇交易、外汇收支及交易对手和业务经办行的信息,具备监管数据的查询统计、共享加工和分析预警等综合功能。在日常应用中,业务管理人员可根据分析、调研、监管或检查工作的需要,开展主题分析,厘清监管思路和方法。通过运用强大的数据仓库分析技术,进行数据切片和数据挖掘、数据钻取,围绕主题自定义相关指标,运用综合分析技术,筛选可疑的交易线索,最终锁定相关主体。
(二)外汇管理大数据应用的模型构建
当前,鉴于外汇监管业务实际和大数据处理流程要求,我们按照数据获取、数据整理、数据挖掘和数据应用决策四个流程构成了外汇管理大数据平台模型,模型如图。
1.数据获取。目前,外汇管理大数据分析的基础数据来源于三方面:一是外汇局内部数据的收集和分析。数据内容包括国际收支、经常项目、资本项目等各类外汇交易信息,全口径监测直接投资、货物贸易等众多的外汇收支、结售汇交易及交易对手和业务经办行的信息。二是涉及外汇交易主体报告报送数据分析。内容包括金融机构和个人报送的大额可疑数据、检查笔录等报告数据。数据形式已经不局限于传统意义上关系型的、结构化二维表数据,可以直接利用分析的数据,数据运用的范围已经扩展到不同格式生成的异构、复杂和多样化的数据,内容格式包括交易对手往来邮件等格式文本、检查记录等音频、视频文件。三是人民银行、海关、税务等外部门共享数据。该阶段主要围绕确定的主题,通过DB2 DATA TOOL等数据转换工具,获取、维护和更新相关数据。
2.数据整理。该阶段在全面分析数据质量的情况下,运用数据库各表之间的对应关系,剔除垃圾数据,转换、清理、载入和验证提取的数据,建立一个主题分析数据库,提供适合联机分析处理和数据挖掘的数据存储环境,目前应用的外汇检查非现场应用系统应运而生。
3.数据挖掘。该阶段使用简单分析、多维分析工具对数据库进行数据分析,采用联机处理分析的切块、切片、旋转和钻取等技术,对检查数据进行比较分析、比率分析、趋势分析等。但在大量数据情况下,必须采用诸如统计分析、决策树、人工神经网络和关联规则等数据挖掘算法,对数据库进行数据全面挖掘。
4.数据应用。该阶段在数据仓库基础上,全面了解整体外汇收支形势及变化趋势,围绕主题,定义相关指标,快速筛选变化较大的交易项目,科学运算,利用关联规则,帮助工作人员有效确定监测分析重点,从而准确查找引起跨境资金波动的交易主体,围绕重点主体和关键环节开展专项检查。
三、外汇管理大数据应用可能存在的问题
(一)数据质量难以保证
数据应用过程中存在数据质量不能反映真实情况,或者数据采集不全、采集的数据格式错误、数据类型混乱等问题,数据缺乏完整性和连续性,影响到数据的准确性、完整性。在大数据形势下,外汇风险具有渠道隐蔽、方式先进的特征,这也对未来的外汇管理工作提出了一定的挑战,如何提升大数据的内容和质量成为当务之急。
(二)数据应用层次较窄
当前,对大数据的应用缺乏模式上的创新,各应用系统之间相互独立,信息共享程度差,系统缺乏灵活性,尤其是对大数据的应用方式较为原始,缺少地域性、产业性特色分析,无法针对检查对象的差异性开展多层次的筛查,并且还存在着检查的重点不突出、主次不分明的问题,目前还无法有效地满足外汇业务监管的迫切需求。
(三)业务技术尚未融合
鉴于业务与技术的脱节,现有检查准备阶段中,数据处理算法、数据监测模型和预警指标较为单一,缺乏对被查机构相关电子数据、分析数据库、风险模型评价、发现可疑线索等规程的了解。也没有通过深入的现场检查来进行补充和完善非现场监管数据、信息,实践操作环节的现场检查报告及后续处理情况等材料,对于技术改进的反作用没有得到充分展现,更没有及时自主开发适应于各类外汇管理的检查软件和方法。
(四)挖掘技术平台欠缺
当前,外汇管理工作主要应用的是两个平台,在实践过程中也表现出了自主性较差的弊端,缺乏对数据的整理、挖掘及统一规范分析的跟进与配套系统。各部门的数据共享难以实现,由于填报口径有所不同,使得分析结果缺乏可比性和指导性,對检查对象难以作出合理的评价,对存在风险无法实施有效的科学评估,从而影响检查的顺利进行。
(五)外汇科技队伍单一
当前的外汇检查工作亟需一批素质高、专业能力强、掌握一定计算机技术的外汇科技人员,其中包括:统计人员、分析人员、数据管理人员、研发人员。检查人员的计算机检查技术水平将直接影响到外汇管理工作的效果。而现有的外汇管理队伍中,各岗位的工作人员往往各行其职,缺少全面人才,以至于工作的衔接较为生硬。
四、外汇管理大数据平台应用的建议
(一)夯实数据基础,实现数据质量提升
为准确刻画跨境资金交易行为范式,需要进一步完善数据共享的制度和法规,同时要在数据的获取、传输、存储等方面夯实基础,尽可能及时、完整、准确地收集和分析客户行为的各个方面的特征数据,逐步实现数据质量的提升。
(二)拓宽应用层次,不断创新数据使用
应当从交易项目、交易动机等多角度入手,不断拓宽和优化外汇检查非现场应用系统的非现场分析方法和指标体系;还可以开发有地方特色的分析系统,转变思维,不断创新对大数据的使用。如实行差别化的外汇管理,通过设置合规指标,筛选出涉及外汇违规业务频率较高的金融机构、企业和个人,设置专门模块对其进行定期重点筛查。
(三)优化分析环境,实现外汇监管科学化
虽然目前已经搭建了外汇管理非现场应用系统和跨境资金监测平台,且在近两年的资金流出专项行动中发挥了重要作用,但是我们要进一步把握大数据环境下发展趋势,通过实践不断完善和改进数据处理算法,同时完善、丰富数据预警指标和监测模型,积极引入数据分析工具,优化数据模型,大力开展海量数据持续和深层次分析,大力创新外汇非现场检查方式方法,实现非现场监管手段的模块化、规范化和标准化。
(四)加快升级改造,提高管理分析效率
应当在现有平台的基础上,进一步整合现有的外汇资源,开发具有人工智能判断功能的主体监管系统,优化网络通讯,合理分配各项数据传输、处理的软硬件资源,确保资源的最优配置和效用最大化。通过系统结合时间序列、行业属性、交易对手、宏观形势等因素,自主分析判断该主体的外汇收支和结售汇业务是否存在异常,并对异常数据进行关联分析,自动查找异常线索,进一步提高外汇管理分析的效率。
(五)加强人才培养,锻造复合外汇队伍
要加强大数据在外汇管理中的应用,亟需具备数据挖掘和信息技术创新应用能力的数据分析师、精通外汇管理业务和懂得构建业务主题的业务分析师专业人才,大力加强人员培训和人才培养,统筹专业分析人才与数据分析人才、普遍应用人才与高层次人才全面发展,锻造一支实践能力强、理论水平高的复合型外汇队伍,推进大数据在外汇实际工作中的广泛应用。
(作者单位:中国人民银行朝阳市中心支行)
责任编辑:宋 爽