APP下载

大数据审计文献综述

2021-10-11张春钰杨颖红

合作经济与科技 2021年19期
关键词:结构化审计工作流程

□文/张春钰 杨颖红

(沈阳化工大学经济与管理学院 辽宁·沈阳)

[提要]当前大数据技术不断渗透到审计领域中,使得传统审计手段面临转变。为了更好的了解大数据审计研究现状以及发现存在的不足之处,本文通过对近年来关于大数据审计的文献进行梳理,指出大数据审计对传统审计产生的多方面影响;总结学者们提出较多的大数据审计流程框架,同时对数据采集、存储、分析三方面的技术方法进行概括;并针对现有研究文献做出总结。

引言

随着我国社会与经济的不断发展,各行各业的信息量呈井喷式的增长,这给传统审计工作带来了极大的挑战,采用更强大的技术手段来提高审计工作效率十分必要,2016年刘家义明确地提出了“要运用大数据,创新审计技术方法。”关于大数据审计的含义,陈伟、居江宁(2017)认为大数据审计可分为大数据背景下的电子数据审计和信息系统审计两方面内容,而对于注册会计师行业来说,其工作重心更多在于对数据进行审计,Deniz Appelbaum等(2017)提出在大数据技术不断渗透到各领域的今天,会计师事务所想要保持竞争力同时满足客户的需求,注册会计师行业需要走向大数据。本文通过对近年来关于大数据审计的文献进行总结,概括了现阶段大数据技术对审计产生的影响、审计数据的采集方法、数据存储方法、数据分析挖掘方法,以及大数据审计面临的风险,并总结出面对不同的审计业务,大数据审计的工作流程需要进行有针对性的优化的结论。

一、大数据技术对传统审计影响文献综述

(一)大数据对审计抽样的影响。目前,注册会计师在审计工作中频繁运用到审计抽样,但这种方法存在不可避免的抽样风险,无论是在控制测试工作还是在细节测试工作中这种风险会导致注册会计师发表不恰当的审计意见亦或是降低审计效率。秦荣生(2014)认为利用大数据相关技术可以对审计所需的数据进行跨行业、跨企业式的收集与分析,不再采用传统随机抽样模式,转而使用收集和分析被审计单位全部数据的总体审计模式;顾洪菲(2015)认为在总体审计模式下运用数据分析,能够消除抽样风险使审计结果更加准确,同时数据无需预处理进一步保持数据原本特征,从而让数据分析更全面、更真实;张敏(2020)提出随着大数据、人工智能等技术的不断发展,抽样审计重新回归详细审计的可能性大大提高,并且风险评估、内控测试通过机器学习更易实现智能化。

从相关文献中可以了解到,利用大数据技术对审计对象的总体进行审计能够消除抽样风险,同时利用大数据分析能更加全面的找出审计疑点,这显著地提升了审计工作的质量。

(二)大数据技术对审计取证的影响。审计人员在取证过程中受制于审计证据来源的广泛性、多样性,审计证据的充分性与适当性的要求,使得审计取证面临效率低、周期长的问题,同时,成本效益原则又要求审计工作在人员与时间的配置上进行良好的控制,这些问题通常使得审计人员极大地依赖自身的职业判断,从而导致审计证据的质量良莠不齐。鲁清仿、梁子慧(2015)认为大数据技术运用到审计工作中颠覆了传统审计取证的思维,使得审计人员能够采集更多的信息,进一步使审计证据更充分、更适当,减少依赖注册会计师职业判断,降低了审计风险。Helen Brown-Liburd、Miklos A.Vasarhelyi(2015)提出在大数据技术下审计证据的充分性不再是主要问题,而如何及时获取审计证据并利用数据分析工具有效地分析和解释数据将是工作重点。阳杰、应里孟(2017)提出在审计中使用大数据手段深度搜查审计数据,对以往的审计证据作出补充,其在充分性、可靠性两点上更加优于传统审计证据。郑石桥(2020)认为大数据时代下审计载体发生了改变,审计证据载体更加电子化,这影响了审计取证,传统取证思路是风险评估和风险应对,而大数据审计则变为“数据采集”、“数据分析”和“疑点核实”。

学者大多认为依靠大数据技术获取的信息与以往相比无论从数量还是维度都更加丰富,从逻辑上看,在与被审计单位的内部信息结合后,审计证据的相关性、充分性都有所增强。

(三)大数据技术对事后审计的影响。以往的审计模式可以称之为事后审计,而这种审计模式的弊端在于其时效性较差,即问题的发生与发现时间间隔较长也会给被审计单位造成较大的损失。Paul Byrnes等(2014)认为从企业的角度出发,如果其依靠XBRL技术便可以频繁、连续的在线编制财务报告,而不像以往那样每年发布一次,那么在大数据背景下审计人员很可能接近实时审计或者至少在一定期间内频繁的监视和审计一个实体。黄舒(2017)认为随着大数据技术的发展和使用,审计的实时处理和快速决断将变得可能。审计人员运用数据分析平台能够实时监控并更可能发现企业的错误和舞弊行为,从而及时纠正问题,提高审计工作的质量。秦荣生(2019)认为非现场实时审计是一种新的方法,该方法通过互联网与被审计单位的内部系统实施连接,实现非现场实时监控,提高审计工作的及时性与效率,是现代审计发展的新方向。

非现场实时审计将会是今后审计方式演变的重要方向,现阶段,关于实时审计的文献已经为实践提供了可参考的路径和可行的技术方法,同时涉及到具体业务时也还需进一步探索和灵活转变。

二、大数据审计流程框架文献综述

传统审计工作流程总体为接受业务、计划审计工作、识别评估重大错报风险、应对风险、出具审计报告,但在大数据审计下这一流程将发生改变。

陈伟、Smieliauskas Wally(2016)将大数据电子数据审计原理分成四大步骤:数据集成、数据存储与管理、数据分析、可视化展示。(图1)

图1 大数据电子数据审计流程图

刘国城、陈正升(2019)认为大数据审计的总体流程包括了数据的采集、处理、取证、可视化呈现四项基本流程。(图2)

图2 大数据审计流程总体框架图

目前,在大数据审计流程设计的文献中均包括了数据采集、数据存储和数据分析三个模块,这对应用大数据技术进行审计提供了一定的指引。此外,对不同审计目标,若能根据现有框架进行相对应的匹配或许能实现更高的效率。

三、审计数据采集方法文献综述

大数据审计在取证时需要从被审计单位内外部获取各种各样的数据,这些不同来源的数据在格式上存在较大区别,需要使用多种采集方法。陈琦、陈伟(2015)基于C#语言实现了将文本数据、Excel数据和Access数据库中所需数据采集到Visual Studio 2008的相关组件中,对审计数据的采集具有指导作用。陈伟、孙梦蝶(2018)将数据来源概括为三个方面:上级审计部门数据、审计部门所领导的各机关单位数据、被审计单位数据,同时提出了直接复制、通过中间文件、通过ODBC接口、通过备份与恢复、网络爬虫五种数据采集方法。魏祥健(2019)将审计数据概括为结构化、半结构化、非结构化三类,同时给出了软件接口、数据库接口和底层数据直接交换三种采集方式。徐超(2020)基于网络爬虫技术设计了数据采集框架,流程包括数据预定义、网络爬虫模块、实时监控,并在具体案例中对企业的征信、工商、诉讼等数据实现了爬取。

审计数据采集是一项重要工作,现有文献对审计数据的分类较为完善,方法多样,不过非结构化数据的获取相对困难,因此,预期需要将更多的研究集中于非结构化数据的采集上。

四、审计数据存储方法文献综述

数据存储是大数据审计工作流程中的重要一环,面对不断累计增多的大量数据如何科学合理的存储以实现数据的高效利用是推动大数据审计的关键。Kumar Setty、Rohit Bakhshi(2013)提出交互式技术与Apache Hadoop平台的结合能够存储多种结构的原始数据并通过聚合与转换将数据结构变为可使用的格式。郑伟等(2016)认为提高审计大数据处理和存储的效率,获取的数据需经过预先处理(集成、清洗、冗余消除)后才能储存到相应数据库中,可以利用Hadoop平台,围绕HDFS系统、Hbase数据库、Map Reduce程序设计模型三项核心实现存储管理。刘国城、王会金(2017)在大数据审计预处理平台搭建中提出利用分布式数据库储存结构化数据,而简单半结构化的利用数据分布式键值储存,分布式表格储存复杂半结构化数据,非结构化数据则利用分布式文件储存。郭红建、梅轶群(2017)提出数据存储可以通过云平台,云平台再联合网格、分布式系统来共同工作,并对外提供审计数据的存储和访问功能。

关于存储方法的研究,学者们热衷于搭建功能强大、处理效率高的数据分类平台,这种平台构想的优点在于功能集成度高。当然,这也要求操作人员需具备多种技术才能使用。

五、审计数据分析挖掘方法文献综述

面对庞大的数据,审计人员在进行总体分析时必须使用分析能力较强的技术方法,这样才能够符合大数据审计的要求。Christine E.Earley(2015)在文献中阐述了在审计中使用高强度数据分析给审计人员带来的机遇和挑战并认为,数据分析能够提高审计质量,更好的发现舞弊行为,比传统CAATs技术效果更佳。Adrian Gepp等(2018)通过总结大数据技术在金融欺诈、股票市场预测等领域的运用,提出审计人员也可利用数据分析预测企业财务困境,并结合专业判断,更好地对企业持续经营方面作出评价。胡荣、陈月昆(2004)、吕新民、王学荣(2007)在相关文献中都提到了在审计工作中对被审计单位的大量数据采用统计分析、关联分析、聚类分析等技术进行建模并完成数据的分析和挖掘。羌雨(2016)提出利用R语言作为分析工具来实现可视化分析。张志恒、成雪娇(2017)提出运用HDFS文件系统、Hbase数据库、Map Reduce计算模型搭建平台,利用文本挖掘技术进一步实现对非结构化数据的分析与挖掘。陈伟(2019)根据大数据审计案例,利用Python语言进行数据分析展现了多种可视化分析图。

可以说,数据分析是大数据审计最重要的一环。目前,相关文献已提出了多种工具和方法,将其综合利用能够使数据分析和挖掘效果更好,不过还需要对程序的针对性做出优化。

六、大数据审计面临的风险综述

未来随着大数据技术在审计中的不断应用,其风险也将逐渐暴露出来,使得大数据审计的发展面临较大挑战。Helen Brown-Liburd等(2015)通过研究大数据如何影响审计人员的判断,提出了审计人员在信息量过多、信息相关性、识别模式等方面,面临分析结果的信息量较大,识别无关信息难度高等风险。刘星等(2016)认为大数据审计在数据采集环节、存储与调用环节、处理环节、分析环节均存在风险。付达院和杨静怡(2019)认为互联网时代审计人员存在三个方面的风险,即系统风险、控制风险、测试风险。裴春燕(2020)将大数据审计的风险概括为五点:一是审计人才短缺,分析能力弱;二是审计程序的针对性差;三是传统思维有待转变;四是方法技术落后;五是软件开发费用高。

现阶段关于大数据审计风险的研究多数是客观的、充分的,文献中反映出大数据审计在多个环节存在风险,也能够了解到对风险的解决方案,今后可以进行更深入的探索与研究。

七、总结

在关于大数据审计的现有文献中,早期学者从大数据对审计抽样、审计取证、事后审计的影响等方面进行研究,逐步设计出大数据审计流程框架,进而走向对数据采集、存储、分析挖掘等技术的研究,研究方面逐渐完备。而当下的研究更多的涉及到了具体审计业务,研究方向更加细化。但是,现阶段关于大数据审计的研究还存在不足之处,大数据审计中非结构化数据的采集难度大,价值密度不高,还需要更好的数据采集手段。审计业务范围大、内容复杂,今后对大数据审计的研究可以围绕具体审计业务对大数据审计流程进行有针对性的优化,以推动大数据审计的快速发展。

猜你喜欢

结构化审计工作流程
吃水果有套“清洗流程”
促进知识结构化的主题式复习初探
结构化面试方法在研究生复试中的应用
会计集中核算制下的内部审计工作
本刊审稿流程
析OGSA-DAI工作流程
基于图模型的通用半结构化数据检索
基于软信息的结构化转换