APP下载

大数据技术在银行反舞弊审计中的应用
——基于J 银行审计实证研究

2021-01-06

市场周刊 2020年12期
关键词:舞弊内审结构化

尹 蕾

(江苏银行内审部,江苏 南京210001)

一、 引言

近年来,银行内外部舞弊案件频发,且往往涉及金额巨大,社会影响深远,银行舞弊案件对我国金融体系的安全稳定运行产生了不良影响。巴林银行员工尼克·李森利用开立的特殊账户掩盖损失,为了弥补损失不断补仓杠杆效应放大几十倍的期货合约,最终给巴林银行带来了灭顶之灾,一名员工的舞弊行为导致一家百年银行倒闭。许多舞弊行为是隐藏在海量的大数据下发生的,这给内审工作带来了极大的挑战,把握大数据技术发展的契机是进一步提高内部审计发现能力的重中之重。近年来各银行内部审计在大数据技术应用方面不断探索,开发非现场审计系统,加大数据挖掘力度,让数据“说话”,提高审计工作质量和效率。商业银行内部审计团队能否抓住大数据技术发展的契机,深入应用大数据技术,借鉴外部大数据技术使用的成功经验,将成为内审人员有效履职、推动内部审计高质量发展的关键因素。

二、 文献综述

(一)关于反舞弊审计的文献综述

美国特雷德维委员会(Treadway Committee,1987)的调查报告中提出企业反舞弊四层次机制理论,企业可通过建立下列四道防线来预防企业舞弊:高管的管理理念、内部控制、内部审计、外部独立审计。

Albrecht 和Wrens 等(1995)提出舞弊三角理论,指出影响舞弊行为发生的三要素分别为压力、机会与借口。Albrecht(2015)认为,商业银行舞弊行为具有隐蔽性,内审人员必须要采用先进的技术手段查找隐藏的舞弊痕迹。

Dumitrescu(2014)认为有效的内部审计是银行内部控制的重要环节,内部审计可以有效识别已发生的舞弊行为,堵住潜在舞弊风险,有效遏制员工为牟取私利损害银行利益,提高银行的资产安全性与声誉。

Ogara(2016)认为,商业银行的管理层舞弊行为产生的损失金额比员工舞弊产生的金额更大,管理层容易凌驾于内审人员之上;随着手机、网银等电子支付渠道的便捷,很多舞弊案件的资金流发生在行外,进一步加大了审计排查的难度。

(二)关于大数据技术应用于内部审计的文献综述

Connolly(2012)认为审计大数据是企业交易数据、互动数据和观测数据组成的集合,他将审计大数据用一个关系等式表现出来:审计大数据=交易数据+互动数据+观测数据。

白涛(2013)认为,建设以“云计算”为基础的“大数据处理平台”,是内审信息化建设的基石。该平台将实现数据共享,打破信息孤岛,实现全过程、全覆盖审计。

郑伟等(2016)分析了大数据给审计模式带来的影响,提出从审计流程、模型架构、应用工具等角度,进一步完善大数据环境下的数据式审计模式,提供研究和实践数据式审计模式的新思路。

程平等(2016)认为,大量结构化和非结构化数据存储在云平台中,使得内审人员能够更加便捷、快速地获取非标准化数据,进行聚类分析,确定审计重点,并将其存入知识库,可实现对审计经验的积累和再利用。

中国银行(香港)有限公司非现场审计课题组(2018)认为,大数据的统计技术和可视化分析技术可以应用于银行内审工作,如授信客户行业真实性核查、洗钱客户群多层交易分析、授信审批效率评估等。

(三)文献述评

查阅近年来大数据技术发展和银行反舞弊审计的相关文献,国内外专家学者从不同角度、不同层次探讨舞弊,舞弊方面包括舞弊三角理论、反舞弊四层次机制理论、内部审计对反舞弊的重要性等,以及大数据技术对审计的影响、应用于审计的大数据技术、如何搭建审计大数据平台等。理论研究的学者较多,将理论和应用实践结合的较少,且由于内部审计的非公开性,大数据技术在银行反舞弊审计中的实践案例研究更少,论文尝试从内部审计实务出发,研究如何通过大数据技术发现员工舞弊行为,从而治理和预防舞弊。希望通过研究如何利用大数据技术提高反舞弊审计的发现能力,提升内部审计防范员工舞弊案件的方法和手段,提升银行内部控制水平,为J 银行以及整个银行业的实践应用提供一定的参考价值。

三、 大数据技术在J 银行反舞弊审计方面的主要实践

近年来J 银行加大对非现场审计系统的建设力度,在反舞弊审计中通过大数据技术的运用和探索,助推了审计事业的快速发展,带来审计“创新力”的大幅增长,有效降低了审计的抽样风险,提高了反舞弊审计的效果和效率。

(一)J 银行非现场审计系统建设

J 银行近年来不断改进审计技术,开发了非现场审计系统,该系统数据架构采用Gbase 集群列存储数据库环境,通过建立数据接口,完成与生产数据库或数据仓库的对接,实时加载核心系统、信贷管理系统、资金系统、影像系统等多个业务系统数据,为非现场分析提供数据基础。再利用审计系统,通过调集所有机构的有关业务数据,运用计算机辅助技术,从系统海量的数据中进行关联、分析和挖掘开发审计模型,实现对被审计单位问题的快速定位,最终输出疑点数据。具体审计流程见图1。

图1 审计流程图

(二)打造员工关系图谱,构建内部反舞弊排查体系

J 银行充分运用大数据分析技术,通过打造员工关系图谱,深挖违规行为特征,构建了较为完善的员工行为排查体系,实现了对全行员工违规行为的实时扫描。

在技术层面,针对员工圈、客户圈,挖掘“三层员工及员工亲属账号”、识别“三重控制关系”、挖掘“五类交易对手方”、识别“四种交易特征”等模型群组。在业务层面,关注以员工为中心组成的员工圈与以客户为中心组成的客户圈之间的资金往来,以及员工圈利用他人信息申请授信、员工圈财务状况异常失范行为等。

(三)运用聚类算法,调校收单业务反舞弊焦点

近年来,为了与支付宝、微信开展竞争,多家银行推出了基于二维码的收单业务。在业务拓展初期,银行往往采取降低或减免手续费的方式开展营销,这就给某些商户进行信用卡套现等舞弊交易提供了机会。J 银行在开展支付业务合规性内部审计时,使用聚类算法对交易行为分析进行了一些积极的研究和探讨。

J 银行通过对商户交易数据的统计分析,最后选定五个统计量作为最后参与聚类分析的输入参数,运用SAS 统计分析软件①SAS(Statistical Analysis System)是一个模块化、集成化的大型应用软件系统,主要应用于统计分析。进行聚类运算,最终产生聚类结果,根据聚类结果再结合对每类中抽样商户交易流水的人工判断,可以初步分析出该类商户的交易特征,可直接用于对判断存在舞弊交易的商户开展进一步的统计分析,也可作为对行内反舞弊控制过程进行审计评价的依据,较为科学并高效地实现了对舞弊行为的聚焦和锁定。

(四)爬取非结构化数据,辅助监测信贷资金流向

按照银监会相关规定,信贷资产严禁流入股市、房地产、投资公司等高风险领域。P2P 平台大多由民营企业营运,存在较大的风险,在P2P 投资的高峰期往往两三天就会有新的平台冒出,但每个月都可能有平台“爆雷”,而银行收集到的相关信息通常较为滞后。

通过自动爬取“网贷之家”“网贷天眼”等专业信息类网站公布的P2P 平台公司名单、平台问题等信息,高效地将互联网的非结构化数据转化为可分析识别的结构化数据;再结合工商、征信等专业数据,对信贷客户资金流向进行分析,描绘出关联图谱,从而掌握资金流入P2P 平台的情况以及P2P平台在行内的授信情况,做出相关预警。网络爬虫技术的运用,得以进一步提升审计的数据采集能力,通过整合内外部信息,挖掘数据价值,拓宽了审计的视角。

四、 大数据技术应用于J 银行反舞弊审计存在的问题

大数据技术在J 银行反舞弊审计中已有成功的实践经验,但是J 银行反舞弊审计还存在一些问题以及需要改进的地方,从数据采集、数据挖掘、结果展示、分析预测四个方面分别说明。

(一)审计数据采集不够全面

1.外部交易、信息数据缺失

银行内审人员无法获得客户及员工跨区域、跨银行的账户资金流动、账户往来等交易数据,无法获取行外行为信息,使一些线索中断,无法将问题查深查透,产生审计风险。反舞弊审计中需要使用的外部数据包括:客户及员工行外的账户交易;客户及员工的互联网行为、购物、社交等信息;授信客户的工商、征信、税收、诉讼、舆情等信息;授信客户的行外账户交易。

2.未采集半结构化、非结构化数据

目前内审人员多为对结构化数据进行分析,但对于半结构化、非结构化数据,如签订的信贷合同文本、服务电话的录音信息、经营场所的监控视频,该类文本、音频、视频尚未使用文本检索系统、图像识别系统、自然语言处理系统进行大数据技术开发,仅为人工查看,没有有效手段加以利用。未来反舞弊审计的突破口在于半结构化、非结构化数据的采集和处理。

(二)数据挖掘深度不够

1.审计系统数据挖掘工具较为单一

目前J 银行非现场审计系统中的数据挖掘工具主要是关联规则分析工具,缺乏聚类分析、决策树、链路预测算法、趋势分析、回归分析等工具,数据挖掘工具单一。在近期开展的审计项目中审计人员使用SAS 分析软件对收单业务反舞弊进行了首次尝试,并取得了较好的效果,非现场审计系统中的数据挖掘工具有待丰富。

2.数据挖掘思路有待拓展

目前银行规模不断扩大,银行资管、理财、票据等业务交易结构不断创新,银行内外部舞弊形式和手段更为隐蔽,不断翻新,且银行舞弊案往往与银行业务紧密结合,目前商业银行的大数据开发人员以技术人员为主,对银行业务了解不多,大数据技术人员脱离了银行业务往往缺乏模型开发思路,很多模型思路还是沿用以前年度的,该类模型思路的审计发现越来越少。

(三)数据可视化技术尚未应用

1.非现场审计系统中缺乏数据可视化工具

可视化工具目前在非现场审计系统中尚未应用。当存在海量数据时,数据的分布情况无法用散点图、正态分布图等描绘,复杂的人员关系、资金流向无法用不同的图形和箭头描绘,风险程度无法用不同的颜色标注。审计人员无法将人的认知和计算机的计算能力融合,需要耗费较多的时间理解表与表之间的关系。

2.舞弊疑点展示不直观

目前非现场审计系统中疑点数据均用表格来展示,对于每个被审计对象的关系网、资金网没有一个直观的感受,特别是当某个目标对象涉及多种类型的关系人、复杂的资金流向时,现在审计信息的展现方法多样,传统文字和表格已经不能满足复杂的审计思路,无法将聚集的各员工圈、担保圈、客户圈和风险程度展示出来。

(四)审计重发现舞弊,轻预防舞弊

1.对舞弊行为未能实时预警

目前反舞弊审计还是停留在事后对舞弊行为的检查发现,对已暴露的风险事件进行披露,对相关的人员进行责任界定和问责,但是对事前、事中审计开展得较少,对潜在的风险事项缺乏预测和预警。内审人员要通过实时预警功能,减少舞弊发生的机会,才能从根源上治理舞弊。银行有大量的交易数据,为事中预警提供了可行性,目前尚未能够根据已识别出的关联关系,固化关联模式,利用图搜索方式定时、批量地监测疑似员工、客户、担保关系。

2.预防舞弊手段不够

银行业务不断创新,同业、理财、债券、资管、金融衍生产品等业务规模不断扩张,且资产结构越做越复杂,经常交易结构设置成多层嵌套以监管套利,一方面是银行套利,另一方面也是为企业套利,同时为了达到套利效果经常签订抽屉协议、兜底条款,这其中隐藏巨大的道德风险。传统的规则审计模型已难以跟上其变化速度,预防手段不够。

五、 大数据技术在J 银行反舞弊审计中应用的改进策略

J 银行通过进一步加大大数据技术在数据采集、数据挖掘、结果展示、分析预测四个方面的研究和应用水平,可以提高内审管理的科学化水平,提升内审工作质量和效率,推动内部审计高质量发展。

(一)挖掘并维护系统数据资源

1.使用网络爬虫等技术采集外部可用数据

积极吸收与挖掘外部可用数据资源,丰富审计数据来源渠道,加大与外部各机构、行内其他部门之间的沟通。对于可批量采购的,开通与政府机构、人民银行、银监会等机构的数据共享和交互;对于无法直接批量采购的,从政府官网、同业门户、万得资讯、各大媒体、购物网站等外部信息渠道,可以使用网络爬虫等技术采集外部可用数据、舆情信息,抓取网页中需要的信息,再经过数据的清洗和深加工,形成有效的审计疑点。

2.使用自然语言处理等技术采集非结构化信息

通过专业的识别系统,借鉴国内外先进的图像识别、语义分析、智能语音交互、人脸识别技术、光学字符识别、自然语言处理、计算机视觉等技术方法,加大对非结构化数据的采集和挖掘。对文本、图像、音频、视频等数据进行有效的加工和处理,生成对应编号并存储,将非结构化数据转换为表格式电子数据存储,改变非结构化数据的存储方式,对存储空间进一步扩容。

(二)强化非现场审计系统建设

1.增加决策树、链路预测算法等数据挖掘工具

在非现场审计系统中开发决策树、链路预测算法、趋势分析、回归分析等数据挖掘工具,对数据进行深度挖掘,进一步推进智慧审计,提高审计的发现能力。通过聚类分析、决策树等科学的统计方法,找出数据的特征和相互关系。将对内、外部业务风险洞察与智慧审计技术相结合,形成“业务+科技”的智慧审计核心能力与应用场景。

2.加大业务与大数据技术结合,拓展审计思路

加大审计人员业务知识和大数据技术的结合,培育知业务懂技术的专业队伍,审计模型的开发思路离不开银行业务,懂业务的人员同时也能够胜任模型开发的工作,能够减少由于沟通不畅产生的摩擦。培养大数据分析型人才,熟练掌握分析应用工具,善于进行数据挖掘。加强对已引入非现场审计系统数据的价值深挖,通过对业务系统前台界面的使用、字段含义的理解和业务数据之间的逻辑关系的研究和学习,思考大数据分析方法,搭建各专业化的模型体系。

(三)加大可视化技术的应用和研究

1.加强可视化应用工具研究

搭建更先进、工具更加多样的大数据审计工作平台。通过各种途径参与外部SAS、Python、R、Go 语言等先进应用系统编程语言的培训,增加关系网络分析、知识图谱等可视化应用工具的研究学习。使用可视化分析可以直观、高效地洞察数据关系,如散点图可以帮助审计人员迅速找到偏离正常的目标数据;关系网络分析广泛应用于关联关系反查、团伙分析、反舞弊等。

2.利用知识图谱技术展示舞弊人员画像

将舞弊人员画像可视化呈现,使大量的数据表格通过一张图像来展示,并用不同的形状、箭头、颜色表示不同的人物关系、资金流向、风险程度,发掘不合理的关联关系,排查贷款诈骗。知识图谱等可视化技术需要使用Hadoop、Storm、Spark 等具有海量存储功能的大数据开源技术,进一步满足审计大数据存储、查询、分析和图形化展示的功能。

(四)建立反舞弊预警、预测机制

1.建设反舞弊实时监测平台

现代内部审计应当由检查发现问题审计向服务增值审计转变,由监督导向型审计向增值导向型审计转变,搭建事中预警平台,实时监测新发生的业务,发现可疑人员、可疑业务、可疑操作时实时预警,及时预测预警才能尽量避免损失,而不是发现问题后,损失已无法挽回。有效治理舞弊,最能发挥作用的是事前预防而不是事后问责,才能真正实现审计的“免疫系统”功能。

2.使用机器学习技术发现新线索

大数据时代下,“非法集资”“洗钱”“不良客户特征”等犯罪行为的实现手段变得越来越多样和隐蔽,需要引入机器学习算法来识别异常行为,提示新的审计线索,从而发挥相关性分组、估计、预测等功能。机器学习技术通过对历史大量数据学习和分析,一般不预设主题,不断通过数据训练机器,使用各种算法来归纳历史数据的规律,并通过总结的规律来预测未来,发现新的规律。

六、 结语

内部审计工作不仅能够帮助商业银行发现内外部舞弊,而且能够帮助银行提高资源使用效率、提升经营效益。经济全球化的影响下,金融舞弊现象层出不穷,因此,如何通过内部审计更有效地发现舞弊现象,堵塞经营管理过程中的漏洞,从而预防和治理舞弊,提升商业银行市场竞争力,成为内部审计人员思考并亟须解决的问题。

将大数据技术应用到内部审计反舞弊审计中,通过大数据采集工具、数据挖掘技术、机器学习技术等对结构化数据和非结构化数据进行分析和处理,可以发现传统手工审计中所不能发现的隐蔽的舞弊行为。J 银行内审部开展反舞弊审计,在较为先进的非现场审计系统的基础上,还尝试运用了关系图谱、聚类算法、网络爬虫等先进的大数据技术,但审计人员也意识到大数据技术的应用还有很多需要进一步研究和提高的地方,在大数据时代,只有收集海量的内、外部数据,充分理解并掌握大数据技术,采用先进的大数据技术进行深度数据挖掘,才能提高内审反舞弊发现能力,提升内审价值增值,推动银行高质量发展。

猜你喜欢

舞弊内审结构化
基于分级审核模式的质量管理体系内审研究
借助问题情境,让结构化教学真实发生
上市公司财务舞弊的动因及治理研究
企业财务舞弊行为与企业高层相关性研究
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
舞弊行为人特征分析
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
浅析行政事业单位内部审计工作存在的问题及策略
浅析如何加强行政事业单位的内部审计工作