APP下载

大数据环境下数据挖掘在审计中的分析与应用

2018-09-13孙北伐张高煜徐倩蓉

无线互联科技 2018年10期
关键词:审计数据挖掘大数据

孙北伐 张高煜 徐倩蓉

摘要:目前,国家提倡“应审尽审,凡审必严”的观念;同时,审计数据的海量和维度特性使得审计大数据研究成为热点,数据挖掘技术也被越来越多地运用到审计实务之中。如何系统有效地分析海量数据;如何将大数据、数据挖掘及审计联系起来,进行综合研究,是一项理论和实践的空白。因此,在大数据环境下,文章提出基于数据挖掘的审计模型,即利用数据挖掘技术来提高审计工作的效率以及质量,从而降低审计风险。

关键词:大数据;数据挖掘;审计

现今,在信息技术、管理模式不断更新的情况下,随着所有行业的信息系统的规模不断扩大,尤其是大数据、云计算等技术的涌现,审计行业发生了翻天覆地的变化。对审计而言,应对大数据、云计算技术时代带来的深刻变革,创新已经必不可少。

赵楠楠[1]认为,目前审计机关的审计模式还是没有从根本上解决审计工作中海量数据的问题。开发和使用基于数据挖掘的审计技术和审计框架,决定了审计范围和审计程度甚至决定了审计的未来发展。

曾德胜[2]阐述了当下审计的线索、范围、工作环境、工作对象等都发生了变化,传统的方法不适应这种变化。文章提出了审计系统,利用数据挖掘技术,提高审计的质量和效率,降低审计风险。

吕新民等[3]阐述了传统审计数据分析技术的不足,提出了运用数据挖掘技术于审计数据分析中的必要性,在此基础上对数据挖掘在审计数据分析中的应用进行了研究,总结了应用数据挖掘实现审计数据分析的过程。

Jim Peterson对于大数据的环境下,制度的制定者将如何对审计面临的巨大变革进行了一些讨论,表现了大数据已经对审计产生的极大影响,迫切需要相应的研究,并提出有效的策略。

综上所述,国内外针对大数据环境下数据挖掘在审计中的应用,大都处于理论和定性研究阶段,没有形成有效分析模型和审计实务执行规则。本文提出在大数据环境下,基于数据挖掘的审计模型,利用数据挖掘技术,提高审计工作的效率和质量,降低审计风险。

1 大数据背景下与审计的关系

1.1 大数据对会计、审计的影响

伴随着云计算技术的发展,大数据也促进着现代审计技术和方法的进一步发展。秦荣生[4-5]在提出“云计算”定义、特征与商业模式基础上,分析了云计算的发展对会计、审计带来的5个方面的挑战。

其中,在会计上的挑战包括:(1)对会计资产的确认,由于企业数据和资源离开用户控制进入“云”,不仅云端数据的安全不可控,而且改变了传统意义上对资产确认的“存在性”认定,使资产确认、计量等都面临巨大冲击。(2)对收入的区分与确认,在“云计算”产业链中参与的各类主体之间交易纷杂,颠覆了传统的交易收入模式,造成各主体的收入及比例无法分割并严格区分。(3)对成本计量与配比,与收入无法区分并确认一样,要对云计算的成本进行及时的计量、配比、分割等也很困难。⑷难以提供合法、有效的会计凭证。(5)应用推广上阻力较大。关键是考虑会计数据的安全性问题,目前国内绝大部分公司、企业仍不敢将自己的会计、经济数据放在公共“云”上。

对审计带来的挑战包括:首先是“云计算”环境下对内部控制的评审面临的挑战。在面对多个用户共享云设施的环境下,一方面企业要保持独立、有效的内部控制制度会面临许多新问题;另一方面,审计人员还要对每个用户的内部控制进行评审,并判断用户的内部控制是否有效也比较困难。另外,还包括云审计平台建设、审计信息安全、如何搜集审计证据和实施审计程序等方面面临的挑战。

1.2 研究大数据方法

本文主要使用文献分析、案例分析、系统分析的方法。

(1)文献资料法。通过搜集、鉴别和整理文献,并研究文献,形成对在大数据环境下数据挖掘在审计中的应用的概念、联系与区别的科学认识。

(2)案例分析法。通过具体的案例,来验证具体的操作和执行,将理论和案例结合起来,使得理论有了案例的支持而更具有说服力。

(3)系统分析的方法。通过规范研究的演绎推理来评价大数据环境下数据挖掘在审计中的应用的可行性。从系统论的角度,对大数据环境下的审计进行研究。

1.3 大数据下对审计服务的应用

1.3.1 以大数据角度来抽取審计数据

大数据的一个重要特点是多样性,数据类型极为繁杂,对数据的抽取和收集就显得极为重要。本文从宏观层面分析了解,对会计项目的收支数据作多维度的特征抽取与评价,并采用统一定义的结构来存储这些数据,最后以大数据的角度来进行项目的画像。

1.3.2 将随机森林和决策树用在审计建模中

由于审计项目数据具有多维度、多特征的特点,通过决策树是针对项目的一组维度来进行推理评判,同时对于审计项目的多组维度,运用决策树,构成随机森林,对项目数据进行全面的评判。

1.3.3 实现了审计过程的动态分析

在以前的文献研究中,大多仅仅通过大数据和数据挖掘结合或者从数据挖掘结合审计层面单一论述,人为地割裂了大数据、数据挖掘及审计业务三者,结构显得较为封闭。本文同时基于大数据、数据挖掘和审计进行联合分析,在设计过程中,更多考虑了大数据、数据挖掘及审计的横向联系,所设计出的审计过程是动态的过程。

2 服务平台的构建

首先,大数据库是构建大数据平台必需的基础,没有数据库的“云审计”一切都是空谈。但出于对数据安全性考虑,企业、客户、事务所将数据存入“云”端是一个极大的考验。

其次,如王海洪[6]调查显示,目前国内会计师事务所只是运用审计软件在客户结构化财务数据收集基础上进行,没有建立一个基于大数据和云技术下的工作平台,软件使用后形成的数据难以实现集中存储、分析和再利用,不能实现互联互通,仍然是信息孤岛。因此,只有构建了数据库和系统平台,审计师才能运用实时的数据和资源,科学有效地掌控审计过程实时掌握审计对象情况,客观评估审计风险,形成审计报告。

2.1 大数据环境下的审计框架

首先,前提数据准备是建立审计模型的,所以本项目对海量审计数据进行抽取、清洗、统计属性分析,提取基本特征,为挖掘算法分析提供可靠的特征数据。其次,将数据挖掘技术与审计实务相结合。判别被审计项目的数据合理与合法时,会计准则和审计规则就可以被映射成若干组的决策树,采用投票机制对所有决策树结果进行表决。最后,是在大数据环境下数据挖掘技术在审计实务中的应用。建立随机森林审计判别模型,分析提取到的真实审计案例数据和提取出来的特征信息,验证审计判别模型的有效性和可靠性。

基于大数据的时代背景和环境背景下,可以预见到审计行业结合数据挖掘之后所发生的变化。我们在此背景下改进了审计的流程,审计的流程一共是准备阶段、实施阶段、处理阶段、审计结论、审计报告5项。我们可以改良的是其中相当重要的实施阶段和数据处理阶段。

实施阶段主要是从目标单位采集数据,因为在大数据的背景下,传统的渠道和评价体系发生了相当大的变化。随着单位的数据披露越来越多,政府信息越加透明。不仅要考虑企业传统的评价,也要将其他数据也纳入评价体系使得审计更加专业和准确。数据的来源不仅由被审计单位提供,也将第三方数据一同纳入参考。

最为核心的数据的处理阶段,就是对杂乱无章的数据进行清洗和转换等操作,变得有序和具体。通过数据背后的逻辑来分析出实际存在的事实问题和真实情况。此阶段就要运用到大数据的数据处理技术以及数据挖掘算法,最终形成新的数据集合,反映出背后的联系,方便审计机构使用,来生成初步的审计结论。最后通过人工和数据的结合,以及专业的考量,确定完整的审计结论以便进行下一步的深究,最终形成审计报告并归档。

2.2 建模

2.2.1 风险导向审计

审计发展到现在,最热门的技术方法就是风险导向深基地,本文也结合了这一最先进的思路,在大数据环境下,推进审计的发展。

目前,因为风险因素集比较广泛,而且对各个因素分别评估,影响到能否准确地评估风险。因此,研究风险后果与重大错报风险的形成原因之间的传导方式,对降低风险关系较大。

财务报表重大错报风险,是审计前,存在重大错报的可能性,这些风险,有的可控而有的不可控。当外部环境中某因素影响发生后,会影响到内部机制,使得其他的因素也处在风险状态中。风险事件有财务困境、业务压力等,都会造成重大错报的可能性。

本文采用贝叶斯网络算法,结合随机森林、决策树等机器学习的思路,来验证重大错报风险与各风险因素的传递关系。运用结构方程模型,和路径分析法,分析因素传导规律,对重大错报的影响程度。

2.2.2 以风险导向审计为基础建立决策树模型与随机森林模型

(1)决策树模型。建立决策树的过程中,首先考虑了函证这一环节,包括银行函证,应收关联方函证,预付关联方函证,应付关联方函证等。以博康进行决策树分析,首先以博康的银行函证为例,博康因为相当于是格力博的子公司,仅有中国建设银行清凉路支行和兴业银行武进支行这两家银行的支行,只需要函证博康在这两家银行的业务的真实性,即可形成博康银行函证的决策树,如果函证中收支、往来、存款、贷款等业务有一项不合格,即为函证不合格,输出警告,若这几项均正确无误,则输出银行函证合格的结果。

(2)随机森林模型。利用已经构建好的决策树模型,继续构建随机森林模型。首先主要从經营风险评估开始进行审计,项目合格后进行内部控制的系统评审,然后进行重要性水平测试、审计抽样、分析性程序等步骤,最后给出大数据环境下的初步审计结论。

3 结语

大数据、云计算技术正逐渐渗透到社会经济生活的各个方面。在大数据的背景下,传统的审计技术、方法等受到严峻的挑战。面对大数据下时代的海量数据,以及财务下数据采集、数据处理方式的转变,本文基于大数据下的数据挖掘方法构建平台系统框架,充分利用大数据平台、数据挖掘技术,更好地服务审计行业。

[参考文献]

[1]赵楠楠.浅析数据挖掘在审计中的应用[J].福建电脑,2015(10):135.

[2]曾德胜.基于数据挖掘的审计系统研究[J].长春工程学院学报,2011(1):124-127.

[3]吕新民,王学荣激据挖掘在审计数据分析中的应用研究[J].审计与经济研究,2007(6):35-38.

[4]秦荣生.大数据时代的会计、审计发展趋势[J].会计之友,2014(32):81-84.

[5]秦荣生.大数据、云计算技术对审计的影响研究[J].审计研究,2014(6):23-28.

[6]王海洪.大型会计师事务所审计信息化调查研究[J].注册会计师,2015(6):48-50.

猜你喜欢

审计数据挖掘大数据
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究