数据挖掘对审计数据分析的影响
2021-03-01叶曾静
叶曾静
摘 要:通过数据挖掘技术,不仅可以发现数据的显现关系还可以发现数据的潜在关系,节约了大量人力物力,极大便捷了审计工作。
关键词:数据挖掘;审计数据分析
一、引言
以前,审计人员基本是运用决策树、线性回归等方法,再结合MATLAB、R语言等进行结构化数据分析,却忽略了对非结构化数据的分析;并且,一般采用的是因果关系的思考方法,但数据之间的关系极其复杂,深入分析会消耗大量的人力与物力。而数据挖掘不仅可以进行非结构化数据分析,还能自动发现潜在问题,增强审计的客观性与可靠性。在大数据环境下,平台提供数据挖掘模型,审计人根据审计目标的不同,进行多维数据的挖掘与分析,节省人力物力,转换审计数据分析的思维。
二、传统的审计实施框架
首先,审计准备阶段。在開始审计前,审计人员核查被审计单位的内部以及外部文件,包括纸质和电子等形式的文件,对财务报表上所包含的信息进行审查。然后,检查被审计单位的有形资产,例如存货的盘点、固定资产的盘点等。询问相关人员后,了解被审计单位的信息以及内部控制的运行情况。通过函证了解被审计单位的财务信息及相关披露信息,以及了解被审计单位现存情况。最后,对于一些数据化的文件借助计算机辅助审计技术验证其准确性。
其次,审计实施阶段。一般,通过对企业的会计凭证、会计账务与财务报告进行核查,对于有形资产实地进行勘查等,审计人员自身实施审查和取证。目前,对于中小企业,普遍的情况是自身会计制度不健全,对于凭证、账本等资料的保存并不完善,虽然大部分的企业已经采用会计电算化,但电算化与非电算化的信息的结合还不是很好,导致审计人员很难将两者结合运用,增加了审计时间;对于大企业,会计制度比较健全,但数据繁多,靠审计人员人工审查将耗费大量的时间。
最后,审计终结阶段。审计人员依据之前的实施阶段审计出的情况反映在工作底稿上最终给出审计意见。
三、传统审计程序下会出现的风险
通过上一部分,我们可以了解到整个审计程序,但从中也能发现,现在的审计实施阶段还存在着大量的风险。比较明显的几点。第一,被审计单位文件数据保存不完善,没有最初的会计凭证,审计人员很难判断被审计单位的会计分录与财务报告中的数据是否真实可靠。第二,非财务信息很难真实了解,传统程序下,非财务信息一般是通过被审计单位内部人员来了解,而这些人员一般基于心理压力,很难真实反馈甚至是不配合。第三,数据繁杂审计人员难以在短时间内了解清楚,在繁杂的数据下,审计人员只能凭经验着重审查某些地方,被查出的地方一般是表面的问题,难以追其根源,且被审计单位可能存在虚假数据的情况,加大了审计难度;随着数据总体的增加,手工审计明显力不从心了。
四、数据挖掘技术有效避免大部分传统下的风险
目前,大部分运用的是Hadoop框架。第一阶段,审计数据采集阶段。审计人员一般从三个方面采集。第一,结构化数据,是指被审计单位的财务数据和业务数据,是审计数据的基础。第二,通过互联网、各大社交网站等寻找非结构数据。第三,内部审计资料和内部管理数据,通过内部控制管理了解被审计单位。采集到上述的资料,整合到数据库为下一阶段的数据处理做准备。第二阶段,这一阶段是运用数据挖掘与人工审计和单节点审计的最大区别点,首先对数据进行预处理,把数据集成,进行清洗去除冗余的数据最后进行数据质量检查,在这期间数据会通过基础数据库、标准数据库到达数据仓库,这样,整个数据都已准备完毕,接下来结合统计分析、数据挖掘、数据可视化到达数据分析阶段。
在第二阶段与第三阶段中间的数据分析是对最后审计人员能找到审计疑点的重要一环。审计人员运用不同的方法进行挖掘分析,找出其中的异常关系,作为判断舞弊的有效审计证据。在此部分,介绍两种方法。第一种关联分析。关联分析将各个知识进行关联,运用推理规则和语义分析等技术来展现文本信息之间是否存在某种隐含的关系。第二种则为文本聚类。首先,采用文本聚类的算法找出以特殊形式藏在大数据之中难以发觉的信息,推测是否有舞弊和违规行为;其次,进行文本聚类,将每一类文本进行具体的分析、比较和总结,找出异常数据的原因。最后再进行结果可视化,以简单便于理解地方式表达出来,结果可视化通过可视化的视觉符号,例如网状图、树状图、思维图、坐标等,将各文本之间的关系清晰地展示出来,审计人员根据不同的审计目标,进行多维度分析。
由此可见,大数据时代下的数据挖掘技术,能够提高审计数据分析能力,找出隐藏的问题,降低审计风险。
参考文献:
[1]胡珊珊.数据挖掘技术在现代审计中的应用研究[J].老区建设,2015(08):44-45.
[2]程平,张雅頔.大数据时代基于云会计的审计实施框架构建[J].会计之友,2015(24):134-136.
[3]谢志明,蔡琴,李俊杰.云计算与大数据体系下的审计模式转变[J].财会月刊,2016(04):68-70.
[4]胡洪斌.大数据时代数据式审计方法重构[J].财会通讯,2017(19):117-119.
[5]张志恒,成雪娇.大数据环境下基于文本挖掘的审计数据分析框架[J].会计之友,2017(16):117-120.
[6]赖丽珍.大数据背景下云审计平台系统的构建[J].财务与会计,2017(03):43-45.
[7]肖雅文,王佳.基于数据挖掘的审计体系构建[J].现代商业,2018(25):140-141.
[8]陈天佑. 数据挖掘技术在税务审计中的应用研究[D].江西财经大学,2019.
[9]张娟. 大数据环境下内部审计信息化研究[D].北京交通大学,2019.
[10]霍欣.大数据审计下统计分析方法研究[J].财经界,2020(10):227-228.
[11]王良,鲍喜,王云,周建成,张海超.基于数据挖掘算法的审计数据分析及案例应用[J].中国注册会计师,2020(06):101-105.
[12]太自红.关联规则算法在审计数据分析中的运用[J].审计与理财,2020(05):18-19.