运用大数据和人工智能技术促进内部审计数字化转型
2020-12-28国家外汇管理局浙江省分局课题组
国家外汇管理局浙江省分局课题组
[摘要]内部审计信息化、数字化转型是大势所趋。本文认为内部审计数字化转型的关键是“从数据集合中发现数据逻辑,以数据逻辑反映内审结论”。本文在外汇管理各业务系统基本完善的大背景下,提出外汇局内部审计数字化转型蓝图,认为外汇局非现场审计应起到审前评估、审中指向、审后跟踪和风险提示的作用。本文总结了国家外汇管理局浙江省分局内部审计信息化项目的实践经验,为全国非现场审计分析系统的开发设计提供了参考和建议。
[关键词]内部审计 外汇管理 数字化 机器学习 非现场审计
一、“大数据”与“人工智能”的本质和应用
要探讨以“人工智能”为代表的一系列数字经济时代新技术在内部审计中的运用,就必须首先了解这些技术术语背后的实际应用价值。
(一)“大数据”的本质是挖掘信息之间的潜在关联
近年来,随着计算机存储、处理能力的不断升级,数据处理软件的不断更新迭代,计算机对数据的处理能力越来越强大。当今“大数据”技术的本质是寻找碎片化数据之间隐含的数据逻辑,而不必拘泥于数据量的大小是否超出“传统”数据库软件的处理能力,或是数据类型、价值密度等表面特征。当然,数据量越大、数据来源越多,其中就越有可能隐含有价值的数据逻辑,其隐藏的关联价值就越容易被挖掘发现。故而,对大数据技术的应用探讨应当本着实事求是的态度,根据实际可得的数据范围和实践目标进行合理规划。
(二)“人工智能”的历史及其与“大数据”的结合
人们在实践中发现,计算机发现数据中隐含关联的能力比人类更强大。使用人工智能算法挖掘海量数据中隐含的关联,从而给出特定问题的答案,是当下大数据处理领域常用的解决方案。所以说现代人工智能技术的本质,就是让计算机本身去从数据中发现、学习并应用数据逻辑,也就是“机器学习”。这也是现代人工智能技术与传统的通过固化人类经验来处理问题的“专家系统”的本质不同。在本文后续部分中提及的“人工智能”,都将特指“机器学习”。
(三)了解“人工智能”的应用场景和使用条件
尽管前文将“人工智能”的范畴缩小到“机器学习”,但实际上,这其中仍然包含了众多不同种类的算法分支(见图1)。各种算法并非有先后优劣之分,而是分别适用于不同的应用场景。作为需方,我们应对各类算法的应用场景和条件有大致了解。一是为了能夠从实际出发,构建实际可行的大数据与人工智能的应用框架;二是为了能够向开发方准确地描述需求,缩短系统开发周期,提高成品系统完成度和可用性。
二、探讨外汇局系统内部审计数字化转型蓝图
秦荣生(2018)指出,“我国内部审计鲜有一个完整的数字化内部审计转型蓝图”,“数字化转型将会给内部审计带来颠覆性的改变,需要重新思考战略、内部审计目标、审计流程以及其他方方面面的问题”。正值国家外汇管理局启动新一代内部审计信息化系统升级工作之际,本文接下来将以此为契机,探讨外汇局系统内部审计数字化转型蓝图。
(一)外汇局内部审计的数据来源
外汇局可用于内部审计的数据来源很丰富。通过ASOne(国家外汇管理局网上服务平台)的建设,外汇局归集了大量的数据。第一类是银行等金融机构上报的外汇业务明细数据,根据《金融机构外汇业务数据采集规范》中的规定,银行将向外汇局上报代客业务中涉及国际收支和结售汇的逐笔业务明细,以及大量自身业务月度报表。尽管该部分数据直接反映的是外汇市场的运行情况,但其中也必定包含外汇管理政策实施产生的影响,可作为内部审计的间接依据。第二类是外汇局自身产生的业务控制数据。比如货物贸易企业分级名单、外汇管理行政处罚案件信息、非现场线索核查情况等。目前,大部分外汇管理业务都已经实现电子化作业,因而在各系统中留存有数据痕迹。该部分数据是直接反应外汇管理局履职情景的,可作为内部审计的直接依据。第三类是外汇局与外单位合作获得的数据,多为外汇局出于外汇管理非现场分析角度,与其他监管单位互通获取的,与外汇业务相关的数据,包括海关的进出口报关数据、税务的黑名单数据等。该部分数据可与前两类数据相互印证,提高内审结论的准确性。总体而言,外汇局自有数据数据量大、覆盖面广、种类丰富,能够满足大数据分析的需要,并能够直接或间接地反映出各级外汇管理局的履职水平和内控风险。
(二)外汇局数字化内部审计的审计目标
外汇局内部审计进行数字化转型后,防控内部风险、提高履职绩效的总体目标不会改变。在此基础上,外汇局非现场审计应根据大数据分析技术的固有优势和现有外汇局内部审计的不足,因地制宜设定合理的中间目标,从而参与并优化外汇局内部审计的总体流程。
1. 外汇局非现场审计应起到审前评估的作用。目前外汇局内部审计安排一般是按照上级局在规定年份内对下级局完成一轮全覆盖的“下查一级”,以及在规定年份内完成内部各条线的“同级监督”。这种安排方式的好处在于全面覆盖,缺点则在于没有重点,从而导致内审资源的分散和内审周期的延长。非现场审计应当根据内审数据,采用横向比较和纵向比较等方式,对各分支局履职水平和风险水平作出评估。内审部门可以以此为依据,延长履职水平较高、风险水平较低的审计目标的内审周期,而缩短履职水平较低、风险水平较高的审计目标的内审周期,从而使外汇局内部审计工作更有重点,使有限的审计资源发挥更大的效用。
2. 外汇局非现场审计应起到审中指向的作用。目前外汇局内部审计的开展,完全依赖于审计人员的经验能力。然而不同审计人员熟悉的业务领域不同,对不熟悉的业务,较难发现其中潜在的问题。在此情况下可能导致漏过不熟悉领域中的问题,亦或是选择全面铺开检查,可能导致在不熟悉的领域花费大量时间,降低审计效率。非现场审计无法代替审计人员完成问题的取证、确认工作,但可以根据内审数据生成条线业务风险点预判,一方面为熟练的审计人员提供参考,另一方面为不熟练的审计人员提供指引,最终提高外汇局内部审计的效率。
3. 外汇局非现场审计应起到审后跟踪的作用。目前的外汇局内部审计,主要依靠整改报告和“回头看”的形式来确保审计成果发挥成效。整改报告只能确保被审计单位对内部审计中发现的问题进行了表面整改,但无法反映被审计单位是否建立确实有效的长效机制以防止类似问题的出现;而“回头看”则会进一步占用本就不充足的内审资源。非现场审计应根据内部审计中发现的问题,对相关数据指标开展定期监测,以非现场的方式跟踪审计建议的长期落实情况,从而在节约内审资源的前提下,提高审计结果的利用效率。
4. 外汇局非现场审计应起到风险提示的作用。目前外汇局的内部审计以常规审计为主,对于突发情况缺乏应对机制,响应时间较长,时效性有所欠缺。非现场审计应建立定期全面扫描机制,对于可能出现的重大风险问题,及时发现,及时提示。内审部门可以根据非现场审计的提示和内审资源盈余情况,组织开展机动审计,对于可能存在的重大内部问题,早发现,早整改,防止内控风险进一步发酵,提升内部审计防控内部风险的效能。
(三)外汇局内部审计数字化转型实施阶段
外汇局内部审计的数字化转型需要分阶段、分步骤进行。一是数据的引入需要时间。对于来源不同的数据,接入的难度不同。已在外汇局数据仓库中的一类数据和三类数据易于取得,二类数据则根据各业务系统的具体情况存在较难取得的可能。二是样本的准备需要时间。不论采取何种方式,取得能够满足机器学习算法初始训练所需的样本数量都需要一定的时间和资源投入。三是算法的训练需要时间。不论何种算法,构建、训练、调试到最适合内部审计工作的状态都需要时间。四是人员的培训需要时间。一方面,内部审计人员需要一定的时间去学习和适应非现场审计系统;另一方面,非现场审计系统的初始设计也应当根据内部审计人员的反馈进行一定的修改。
外汇局内部审计的数字化转型可以分为三个阶段。
1. 过渡阶段。在该阶段,新的外汇局内部审计信息化系统开始建立并进行测试。此阶段,使用专家系统作为非现场审计的核心。在此阶段的目标是打基础、造环境、带队伍。此阶段具体目标一是实现外汇局内部数据的逐步接入。二是依据可用的内部数据,构建一套可供专家系统使用的内审指标。三是上线可与非现场审计系统对接的外汇局内部审计电子办公环境。四是通过测试,收集一批一线内审人员对系统的建议,培养一批熟悉电子化内审环境、适应非现场审计系统的审计人员,筛选一批对内部审计数字化感兴趣也具备相应能力的审计骨干。五是通过测试项目和对以往内部审计项目的数字化转换,建立一个可用于机器学习算法初始训练的样本库。
2. 训练阶段。在该阶段,外汇局内部审计数字化转型的核心——基于机器学习算法的大数据分析能力将逐步成型。训练完毕并通过评估的机器学习算法将循序替换过渡阶段非现场审计中的专家系统。此阶段具体目标一是根据过渡階段内部审计人员的反馈,修正外汇局信息化内部审计系统功能需求。二是组织内审骨干与开发方对接,细化引入机器学习算法的具体需求,框定算法选择范围。三是完成对选择范围内机器学习算法的初始训练,并评估其可用性。四是逐步将通过评估的机器学习算法引入非现场审计系统,取代原有专家系统算法。五是扩大系统测试范围,收集更多样本和反馈,通过增加样本数量和调试参数,逐步使得所有非现场审计目标都可通过合格的机器学习算法实现。
3. 应用阶段。在该阶段,外汇局内部审计数字化转型的系统建设已经完成,需要跟进相关制度,全面推开数字化内部审计流程,并持续对更先进的新技术、新思路保持关注。此阶段具体目标一是确保外汇局非现场审计核心算法稳定可靠,反馈机制顺畅,能随着内部审计项目的开展不断自我迭代优化。二是确保外汇局内部审计信息化系统简洁易用,外汇局内部审计人员能够熟练使用。三是对内部审计流程作出相应修改,发挥内部审计数字化转型后的优势。四是完成相关制度的修订,使外汇局内部审计数字化有规可依。
三、外汇局内部审计数字化转型的初步实践
为验证外汇局内部审计数字化转型思路的可行性,积累外汇局内部审计数字化实践经验,国家外汇管理局浙江省分局决定组织开展外汇局内部审计信息化系统实验项目。该项目制定四个主要目标:一是试验基于数据分析的非现场内部审计系统可行性。二是评估非现场审计与现场审计相结合的有效性。三是探索非现场审计专家系统的构建方式。四是组织锻炼一支技术人才与审计人才相结合的数字化内审队伍。浙江省分局计划通过该项目迈出“摸着石头过河”的第一步,为全国外汇局系统内部审计数字化转型提供实践参考。
(一)项目总体设计
为达成上述目标,同时考虑到分局的数据权限、资金条件和人员情况,实验项目组制定了“小切口,大框架,全流程”的实验项目设计思路:一是以经常项目货物贸易外汇管理为切入口。通过对外汇管理各业务条线系统架构情况的综合比较后,项目组认为货物贸易外汇管理主要依托货物贸易外汇监测系统,数据来源单一,利于提取和引入。且同时包含业务数据和控制数据,能够支持非现场合规检验和绩效评估,适合作为外汇局内部审计信息化系统实验项目的切入口。二是建立可推广、可升级、可拓展的系统框架。由于经费和技术条件限制,不可能在短期内开发出完备易用的内部审计信息化系统用于实验,但为了能够为全国范围内外汇局内部审计数字化转型提供参考,实验系统必须坚持“麻雀虽小,五脏俱全”的原则,建立较为完备的结构框架。三是覆盖从数据接入开始到最终完成非现场与现场相结合的审计项目的一系列全部流程。其中包括系统构建、数据导入、指标运算、非现场分析、现场应用和结果反馈等方面,并在实践中发现问题、解决问题、归纳问题,从而达成锻炼队伍、积累经验的目标。
(二)指标体系构建
项目组围绕货物贸易事中事后监管的重点工作和关键环节,确定指标体系建设需包含三个方面,达到三个目的:一是从“面”上分析被审计对象整体情况。设计宏观贸易指标,量化地区收支形势,通过纵横交叉比较,衡量地区贸易收付汇和进出口差额的偏离程度,判断被审计对象总体履职情况,提示重点审计方向。二是从“线”上分析被审计对象绩效情况。设计微观业务绩效指标,量化各项工作成效,对被审计对象执行货贸企业名录、监测、核查、分类等制度的全面性、及时性和有效性等进行评估,辅助现场审计人员掌握被审计对象各项工作绩效。三是从“点”上分析被审计对象规范情况。设计微观业务合规指标,核验各业务流程电子记录与相关规定的一致性,筛查业务合规风险点,评估被审计对象内部管理的完备程度和执行情况。通过组织省内审计人员和业务专家集中讨论,最终构建出一套共25项的货物贸易内部审计指标体系。微观方面,梳理出5项日常管理指标、6项非现场监测指标、6项现场核查指标,基本完整覆盖了货物贸易外汇业务全流程管理环节;宏观方面,设计了出口收汇、进口付汇偏离度等8项指标,从市场情况反映被审计单位履职成效。最后应用层次分析法对每项指标设定阈值、分值及权重,形成指标体系(见图2)。
(三)在内审项目中实践评估非现场审计效果
经过半年多的开发与测试,实验系统的关键功能全部完成,并命名为“货物贸易外汇管理计算机审计辅助系统”。浙江省分局组织省内部分地区参与项目实践,依托货物贸易专项审计项目,探索应用内部审计非现场数据分析结果,检验非现场审计与现场审计相结合的内部审计方式的实际效果。
1. 发挥审前评估作用,评价货贸监管绩效。系统对各项指标评分结果按照风险等级对应使用“红、黄、蓝、绿”不同颜色进行展示,并进行综合评分,直观展现审计对象总体风险状况(见图3)。比如,对于2家经济总量差异不大的支局,计算其“非现场监测有效性”指标(列入现场核查企业家数/重点监测企业家数)与“企业现场核查影响率”指标(现场核查企业总量差额/本地区名录企业总量差额)。结果显示,“非现场监测有效性”A支局高于B支局,表明B支局非现场监测工作强度相对较低;“企业现场核查影响率”B支局远高于A支局,表明B支局核查工作效能优于A支局。两项指标评分汇总,显示A支局非现场挖掘异常线索的能力、精准性有待提高,B支局非现场监测工作投入有待增加。
2. 发挥审中指向作用,揭示业务流程风险。审计组在审前评估中通过计算“登记表有效性”指标(登记表撤销、作废数/登记表总数),发现C支局与其他支局分差较大,比平均值高出14个百分点,故而在现场审计时加大了对该支局登记表业务的抽查比例,发现该支局此项业务规范性较差,存在出具的登记表要素填写不准确、留存档案有瑕疵、作废后重新出具等问题。就登记表业务而言,非现场审计结果与现场审计结论基本一致。
3. 发挥审后跟踪作用,监测审计结论落实。在完成对5家支局的审计项目后,时隔半年对这5家支局的业务进行非现场审计,将这段时期的审前风险评估指标得分与现场审计前的指标得分进行比对,发现部分支局的问题指标明显改善,部分支局指标总体得分有所提升。比如,C支局“登记表有效性”指标明显改善,据此掌握各支局对审计发现的问题和建议的长期落实情况,并依托该审后定期监测数据结果确定需“回头看”的支局名单以及需开展“回头看”支局的先后次序。
4. 发挥风险提示作用,预警监管薄弱环节。审计组在审计中发现“辅导期企业报告超期限比率”指标(超过10个工作日完成辅导期报告/辅导期报告完成家数)和“辅导期企业报告率”指标(辅导期企业实际报告家数/辅导期企业到期家数)有超半数支局评分较低,表明辅导期企业报告制度落实不到位。审计组随即对全省各中心支局的该两项指标数据进行了计算、比对,发现3家中心支局的指标远低于平均水平。审计组向省分局经常项目管理处通报了这一情况,及时通知相关地市开展辅导期到期未报告企业集中清理工作,要求加强对新名录企业的指导及报告管理,进一步扩大了审计成果。
(四)总结实践经验,制订前瞻计划
货物贸易外汇管理计算机审计辅助系统的开发,为外汇局内部审计的数字化转型提供了一个样本。同时,该系统在应用阶段显现出的一些情况,也印证了外汇局内部审计数字化转型是一项长期的工作。
根据前文所述“数据集合中发现数据逻辑,以数据逻辑反映内审结论”这一内部审计数字化转型思路,项目组重点关注计算机审计辅助系统前期应用关键环节中反映出的问题,并提出相应的解决方案或思路。
1. 简化数据提取方式,便利“数据集合”进行。审计组成员反映,当前系统指标数据的计算,主要依托审计人员手工导入相关文件,该步骤实施程序较为繁琐,且审计对象越多、期限越长、业务量越大,过程越费时。这一方面是由于经费限制和开发周期的制约,数据引入功能只顾及了“可用性”而没有考虑“易用性”;另一方面是由于分局层面没有业务系统数据接口的权限,只能以人工导出方式获取业务系统数据。为节约审计人力成本、缩短现场审计时间,项目组建议未来全国范围内的非现场审计数据导入应由总局统筹规划数據接口,直接从各业务系统后台引入数据,使数据处理能完全自动化运行。
2. 完善指标反馈机制,加强“数据逻辑”分析。在指标设计阶段,吸纳的是项目组审计人员与部分货物贸易岗位人员的意见与建议。在应用实践阶段,发现部分指标较好达成设计意图,但也有部分指标需要根据实际情况进行调整优化。若要将指标体系进一步推广至全省乃至全国,就必须考虑到各地区的经济特征与发展程度等客观差异,一方面需要对指标阈值、分值与权重的设定进行综合考量的需求:另一方面也不能假定指标体系一经设计就无需调整,必须考虑到在实践中不断改进、增减指标甚至变动指标体系组织计算模式的需求。项目组建议,在应用专家系统进行内部审计数据分析的阶段就应加入现场反馈功能,将实际审计结论反馈到对应的计算和分析指标中,供指标设计维护人员参考,使非现场审计和现场审计双向紧密联系,不断明晰数据逻辑,优化内部审计非现场分析指标体系。
3. 注重结果展示方式,回归“审计结论”本质。在系统测试初期,整体界面设计、指标结果说明等均为技术人员视角,主要用于展示数据来源、计算公式等方面。而在实际应用过程中,审计人员反映指标结果展示不直观,难以从冗长的公式和数值中获取有效审计信息。项目组建议,非现场审计应服务于现场审计,非现场审计结果应转化为现场审计人员最易于接受的形式。科技人员迅速对系统界面进行了改进,使用“红、黄、蓝、绿”直观展示风险等级,对指标结果的解释更注重业务背景和审计建议而非数值计算,最终获得了审计人员的认可。项目组还建议,随着非现场审计扩展至经常项目以至外汇管理的全部领域,其指标体系将更庞大,需要展示的信息也更繁复,应当设计专门的数据利用功能,通过各种形式将指标计算结果中蕴含的审计内涵清楚直观地展现给现场审计人员,这不仅仅是对系统的人性化改进,更是对“非现场审计与现场审计相结合”这一总体思路的贯彻。
目前,该系统的设计框架和应用成果获得了外管局总局的充分肯定,总局将参照该项目的思路,统筹开发应用于全国范围,涵盖外汇管理所有业务条线的非现场审计分析系统。
[作者单位:国家外汇管理局浙江省分局,邮政编码:31000,电子邮箱:luodog@126.com(执笔:谢梓平 沈文 罗帆 王婧文 孔志伟 曹若瑶)]
主要参考文献
郭成.机器学习算法比较[J].信息与电脑(理论版), 2019(5)
秦荣生.数字经济时代:内部审计的机遇[J].中国内部审计, 2018(10)
张润,王永滨.机器学习及其算法和发展研究[J].中国传媒大学学报(自然科学版), 2016(2)
朱大鹏.大型集团企业内部审计信息化研究:以中国石化集团为例[D]哈尔滨:哈尔滨商业大学, 2017