面向电网企业内控审计的知识图谱建模研究
2021-10-08邵磊落周成轩黄琪华张铖怡余建波
邵磊落 周成轩 黄琪华 张铖怡 余建波
【关键词】 电网企业; 内控审计; 知识图谱; 关系挖掘; 深度学习
【中图分类号】 F239.1;TP301.6 【文献标识码】 A 【文章编号】 1004-5937(2021)20-0122-07
一、引言
随着我国人工智能发展进入全新阶段,数字化和智能化已成为企业提高自身竞争力的核心力量。为了跟进智能化的发展,电网行业逐渐推进全新内部审计技术。电网企业进行内部审计过程中,涉及大量文本数据、财务数据。如何从这些数据中高效、精确地挖掘重要审计信息,构建数据之间的关联,是提升内部审计工作的关键。
针对电网公司内控审计数据复杂和智能内控审计技术匮乏导致的效率低下的问题,本文提出了一个设想,将内控审计与知识图谱进行集成,采用知识图谱中的关系挖掘技术建立内部控制方法和内部控制实施下财务报表上资金的状态和流动中增值性的因果关系,协助判断内部控制实施效果,最终形成内控审计综合评价方法。电网企业内部控制审计和财务报表审计对企业提升信息披露质量、增强相关方信任有直接影响。本文将知识图谱应用在电网企业的内控审计中,探索财务数据和内控审计的内在关联以及相互影响,开拓从财务数据出发实施内控审计的新思路,开辟智能内控审计的新途径。
二、文献综述
在大数据的背景下,数据挖掘技术的发展积极推动了内部审计模式的转变,各类数据挖掘技术的应用能有效提高内部审计人员运用智能化技术核查问题、评价判断和分析问题的能力。尤其是人工智能技术的发展,给内部审计工作提供了新的可能。张庆龙等[1]讨论了在人工智能发展下的内部审计的转变,构建了内部审计智能化的应用框架。余从容等[2]研究了基于大数据的电力行业审计平台建设和基于知识图谱的大数据审计方法。高效的内部审计工作能让企业更好地实现自我评估和完善,同时增强企业风险防控能力[3-5]。在电网企业的主营业务中,当前电力调度、生产、财务、人力资源、合同管理、协同办公等数字化的程度已有了大幅度的提升,在营销收费、企业资源管理等领域,大量的被审对象数据发生了巨大改变。例如财务数据、经营数据等不但量大,而且具有高度敏感性,然而数据特征和数据间关联难以仅凭人工获取,这造成了内部审计工作困难、效率低下。各类业务数据在各业务系统间的流动,构建了跨部门、跨系统、跨应用的内部审计环境,这使电网系统大数据分析技术的发展迫在眉睫。
基于人工智能的数字化技术能够将复杂多变的非结构化数据转化为数字数据,通过知识图谱、数据挖掘、关系检测等方法实现非结构化数据与结构化数据的特征融合,挖掘两者间关联关系,提供审计线索。知识图谱将客观的概念、实体及其关系以结构化的形式呈现,以更直观的方式对信息进行表达。知识图谱已经在医疗、商业及金融等领域得取得了良好研究效果。在这些行业领域中,各类信息系统的普及积累了海量行业数据,如何从这些数据中挖掘隐藏信息并加以管理、共享及应用,是推进行业智能化的关键问题。知识图谱能对从各种渠道所获取的行业数据进行加工处理,然后提取出对构建知识图谱有价值的知识,它已成为促使计算机从海量数据中获取认知能力的重要方法。目前,我国学者专注于知识图谱的构建方法和算法。比如,侯洪■等[5]认为,知识图谱技术不仅能够清楚地分析处理知识,并且能实现知识可视化,在推动知识的发展方面具有潜力。袁凯琦等[6]采用自底向上的构建方法建立面向跨语种、专业性强以及结构复杂的医疗数据的知识图谱,涉及医学知识表示、抽取、融合和推理以及质量评估等方面。目前知识图谱在医疗、商业、金融等领域应用较为广泛,且取得了较好的效果。张德亮[7]针对金融图谱缺乏问题及知识图谱补全模型的缺陷,爬取大量金融股票及企业信息进行金融知识图谱构建,然后提出基于组合关系路径的知识图谱补全方法对金融知识图谱进行补全任务验证。胡扬等[8]研究了面向金融知识图谱的实体和关系抽取算法,提出了基于能识别重叠关系的Bi-LSTM+CRF模型,通过参数共享实现两个任务联合学习。甘云强[9]从文本数据中识别出金融实体,并判断实体间存在的语义关系。
企业的内部控制审计主要针对财务数据的可靠性和完整性[10]。知识图谱不仅能够实现知识表达,同时又在信息检索、智能问答等方面具备巨大优势,知识图谱的应用可以有效地解决内部审计过程中任务繁重的问题,弥补审计力量的不足。王倩玉[11]研究了基于知识图谱的财务与业务指标间的关联对应关系的构建方法,提出了基于机器学習的财务审计知识图谱构建,设计并实现了财务与业务指标对应关系语义网络。崔婧等[12]将知识图谱引入医保审计,以解决数据量庞大带来的医保审计低效问题。目前我国关于将知识图谱这种智能化技术和审计领域相结合的研究成果还相对较少,研究方法也较为单一。
三、知识图谱
知识图谱的概念由谷歌公司于2012年提出。知识图谱技术能像人类大脑一样建立不同类信息之间的关联,得到关系网络。Jiang et al.[13]最早发现可以使用马尔可夫逻辑网来提取事实之间的关系。知识图谱采用了新型的信息检索方式,知识图谱在信息检索中加入智能推理,操作性更强,并且它能建立知识网络,将知识图形化,以结构化形式呈现。知识图谱的主要作用在于对数据的整合与规范,向用户提供有价值的结构化信息。
近年来,研究人员将人工智能、深度学习、自然语言处理等技术融入知识图谱构建过程,提高了知识图谱构建效率,使其在信息搜索、自动问答、决策分析等领域被广泛应用[14]。知识图谱可分为通用知识图谱和领域知识图谱,目前,国内外代表性通用知识图谱有搜狗知立方、百度知心、YAGO、DBpedia、Worldnet等,通用知识图谱主要包含常识性知识,例如Worldnet包含人、地点、音乐、电影、组织机构、物种、疾病等定义。它能从多种语言的维基百科中挖掘知识,构建名词、动词、形容词和副词之间的关联。领域知识图谱一般面向某个特定领域,例如学术领域的Acemap、生物医学领域的Drugbank、新闻领域的ECKG等[15]。知识图谱的可视化技术中能将抽象数据进行可视化展示,从而增强用户对数据的认知及数据获取效率。