基层央行内部审计知识图谱构建思路
2022-02-21张淼淼中国人民银行江苏省无锡市中心支行
◆张淼淼/中国人民银行江苏省无锡市中心支行
进入新发展阶段,我国内外部发展环境发生深刻变化,面临许多重大理论和实践问题,对内部审计在防范风险、推动发展、促进实现组织高质量发展目标方面提出了更高的要求。近年来,人民银行内审工作以风险为导向,扎实开展各类审计项目,大力推动问题整改,为人民银行系统加强管理、规范履职、维护声誉做出了积极贡献。但随着信息技术在金融领域的应用领跑和人民银行管理信息化水平的提升,业务管理中形成的各类数据呈现指数级增长,内部审计对各类数据资源的分析利用程度和效果成为影响审计工作质量的重要因素。本文探索构建内部审计领域知识图谱,深度挖掘信息数据间的关联关系,促进内部审计全面系统地识别组织内控缺陷和各种隐患,充分发挥防控风险、促进发展的增值作用。
一、相关理论与文献综述
(一)知识图谱概述
目前,学术界并没有对知识图谱进行统一定义。知识图谱的概念由Google公司于2012年首先提出,最初定义为用于增强其搜索引擎功能的知识库。知识图谱的本质是将真实世界中存在的各种实体或概念及其之间的关系用语义网络图的形式予以表现,现在泛指各种大规模的知识库。目前,除了搜索引擎,知识图谱还广泛应用于营销、医疗、电商、教育、司法、金融等领域。
知识图谱主要由实体、关系、属性三要素组成。实体是指具有可区别性且独立存在的某种事物,可以是具体的人、事、物,也可以是抽象的概念,如城市、商品、民族等,它是知识图谱中最基本的元素。关系用来表示不同实体间的某种联系。实体和关系都可以有各自的属性,如面积、数量等。知识图谱的构建与应用其实是提供了一种理解和管理海量信息的能力。
(二)知识图谱在审计领域的应用研究综述
目前国内关于知识图谱在审计领域应用的研究文献主要集中在以下几方面:一是利用知识图谱的可视化工具分析学术研究进展情况,如张莉(2018)、吴金柯(2019)运用 Cite Space作为技术手段对国家审计研究前沿热点进行可视化分析,通过共词网络图谱展示了研究演进历程;二是从技术层面研究知识图谱的构建,如王瑞萍等(2020)、卢民军等(2021)探索基于Neo4j图数据库进行审计数据知识图谱构建;三是有关知识图谱技术对于特定审计项目的应用,如樊世昊(2018)研究了知识图谱的大数据审计方法解决医保审计中数据分散、精确度低等问题。
虽然我国学者对知识图谱的研究已逐步从概念等理论层面向技术与具体行业相结合的实践层面发展,但关于将这一技术与内部审计领域相结合的研究成果还相对较少,因此基于知识图谱技术的内部审计方法及应用场景分析是本文的创新点。
二、内部审计知识图谱构建的基本思路
(一)构建框架。内部审计知识图谱的构建,主要是对不同渠道数据源进行处理,最后根据不同应用场景设计相应表现方式的过程。
1.数据获取。原始数据主要源自单位内部渠道和外部公开渠道,具体来说主要包括:一是从各类业务系统导出的、以EXCEL等固定格式存储的结构化数据;二是从相关部门获取的组织基本情况、人力资源分布情况、单位规章制度汇编、内外部监督检查结论等半结构化或非结构化数据;三是运用爬虫技术等信息化手段从网络获取的人民银行履职应遵循的法律法规、违规案例通报及其他有关信息,该类信息以文本、图片等非结构化数据为主。
2.构建流程。从原始数据到形成知识图谱,需要经历知识抽取、知识融合、知识加工等关键阶段。知识抽取,简单来说就是采用不同的技术方法,将获取到的数据转换为“实体—关系—实体”等基础三元组的形式,形成结构化的知识。知识融合,是将多个知识库中的知识进行整合形成一个知识库的过程,重在排除冗杂或错误信息,如不同报表、报告等文档对日期数据有不同格式的表达,知识融合阶段就是将此类不同格式进行统一,形成标准化的数据表示。知识加工,可以看作对经过抽取和融合后的知识进行补全和评估,旨在实现高质量知识的网络化。
下面以财务收支审计为例展示知识抽取的主要思路。
(1)实体抽取。鉴于财务活动相对单一,人民银行分支机构都遵循统一的记账规则,设置有标准化程度较高的会计科目,体系较为简单,因此财务实体抽取可以基于《中国人民银行会计基本制度》《财务科目设置标准化指引》等制度依据自上而下搭建概念框架,如表1所示。
表1 会计科目设置示例
业务活动则相对复杂,标准化程度较低,不同机构的业务内容差异较大,因此业务实体抽取主要是对内设机构设置和业务分类等数据进行归纳、抽象、分层,自下而上搭建概念框架。
(2)关系抽取。一是要建立会计科目与会计科目间的关系。会计科目根据所归属的会计要素予以分类,且有明确的级次关系,关系抽取时可以直接利用分支机构的实际财务数据中“科目编码”“科目名称”列进行提取。二是要建立业务活动与业务活动间的关系。主要依据的是业务类别之间的逻辑关系,如固定资产管理包括不动产管理、车辆管理、电子设备管理等。三是要建立起财务活动和业务活动间的关系。两者间的对应关系可以理解为业务活动产生的经济信息都会在财务的对应会计科目中进行核算。但在实务中,财务与业务的对应关系是复杂的,可能是一项业务对应多个会计科目,也可能是一个会计科目适用于多种业务场景。由此,既要从业务出发找对应的会计科目,又要从会计科目出发找对应的业务场景,完成关系抽取(如表2、表3所示)。
表2 业务活动与会计科目对应关系示例
表3 会计科目与业务活动对应关系示例
(3)属性抽取。这一环节主要是提取具体数据,如单位人数,会计科目对应的借方金额、贷方金额等。
传统审计方法主要对报表、账簿、凭证等核算数据开展检查,是将财务活动孤立起来作为审计对象。知识图谱的构建则是基于财务业务一体化的审计理念,从挖掘财务活动与业务活动间的关联关系入手,发现风险隐患,提供增值服务。
3.迭代更新。知识图谱的构建是一个长期迭代的过程,其内容需要与时俱进。迭代更新主要是随着新知识的加入,不断进行知识抽取、知识融合、知识加工等环节的循环,实现增量更新。
(二)预期效果。当前,人民银行内部审计信息化水平落后于各项业务信息化进程,在实施非现场数据分析和现场审计的过程中,审计人员难以从海量信息中快速获取所需目标资源,主要还是依靠审计人员个人的胜任能力和职业判断力,存在一定审计风险。构建不同类型业务活动的语义网络,有利于实现对信息数据间关联关系的深度挖掘,有效进行风险预警,助力内部审计统筹安全与发展,促进组织增值。
1.强化风险预测。知识图谱聚焦的是组织运行中各类内外部信息间的关联关系,与内部审计防风险的履职需求十分契合。除了有形的数据,行业专家的审计工作经验也可以经过技术处理转化成计算机可以理解的语言,通过数据挖掘算法与语义引擎进行数据结构化储存;根据关系规则和审计经验进行数据读取、信息匹配和异常检测,实现数据疑点审查全覆盖,增强风险隐患的可发现性,提高预警能力。
2.助力持续发展。当前,内部审计已全面迈入风险导向模式阶段,并逐步向战略导向模式发展,需要内部审计机构及时研判组织发展现状,结合战略目标,提出有针对性的改进建议。知识图谱集中整理分析了内部审计日常工作成果,直观呈现了组织数据的知识网络,有利于审计人员形成完整清晰的业务逻辑,更好地发挥咨询功能,助力组织充分利用规则和政策抓住发展机遇,推动建立更加科学的管理体系。
三、应用场景分析
随着人民银行内部审计工作持续深化,各级分支机构内部审计范围不断拓展,审计活动日益复杂,不论是审计项目实施,还是审计组织管理,都可以考虑构建知识图谱来进一步提升审计增值作用。下面对拟优先运用的几大场景作简要分析。
(一)经济责任审计领域。在领导干部经济责任审计中,普遍存在审计对象画像不够精准的困境。构建经济责任审计领域知识图谱,从领导干部个人履历、任期分工、分管业务工作数据对比、内外部检查揭示问题等方面设置关联规则,基于领导干部履职评价指标体系、相关政策文件形成知识库,直观展示审计对象所在单位经济活动的横向纵向分析、业务管理与存在问题的关联性分析,为准确界定领导干部责任提供更加齐全的素材。
(二)采购管理审计领域。选定供应商的决策环节历来是采购管理审计的重点,但面对复杂的市场环境以及企业间的多重管理关系,内部审计人员难以全面识别潜在风险。构建供应商数据知识图谱,集成企业的工商、投资、融资、诉讼、担保等信息,从千丝万缕的关联关系中获取完整的企业关系网,提升多源异构数据处理和分析能力,切实防范风险。
(三)重要业务审计领域。比如,征信管理领域,近年来内部审计对征信管理的审计监督已从职责履行规范性的定性层面拓展至对征信数据的量化分析层面,但面对海量的查询数据仍显得力不从心;又如,支付结算管理领域、反洗钱管理领域等,同样可能接触大量的交易数据,其中包含了各维度的信息,但内部审计监督却还停留在小规模抽样检查的初级阶段。构建重要业务领域知识图谱,搭建分析模型进行深度分析,通过交易数据挖掘不同主体、不同账户之间的关联关系,通过关联比对实现疑点挖掘,直接定位风险隐患。
(四)智能检索。知识谱图还可以作为基础的知识平台予以应用,通过对审计方案、工作底稿、结论性文书、审计依据等各类信息的整合,抽取实体、属性和关系进行梳理并建立逻辑关联,实现快速定位依据条款,推荐常见问题案例等功能,有效解决问题定性五花八门、引用依据不准确等问题。
综上,知识图谱技术的运用,对于人民银行内部审计助力组织防风险、保安全,抓机遇、促发展能起到积极推动作用,但鉴于知识图谱的实践应用对于内部审计来说尚在创新尝试的起步阶段,还需要在多系统数据融合、自然语言处理等具体技术上加强研究探索,同时加强内部审计人员能力培养,着力实现以金融科技为内部审计赋能。