基于数据挖掘技术在审计领域的研究
2020-10-21李嘉欣
李嘉欣
摘要:在信息化的时代,常规的审计方法慢慢不满足时代发展的要求,审计行业面对着巨大的挑战。为了适应现代化的要求,改进审计方法,做到多学科融合发展,变成了一种趋势。而数据挖掘技术作为信息时代的一个突出产物,吸引了审计人员对其进行关注。挖掘数据,选择有用信息,构造数学模型,结果分析,能使审计从大规模审计过渡到在数学模型的异常信息中寻找问题这一阶段,有针对性的进行审计,降低审计人员的工作量,提升了审计效率和准确度。本文对数据挖掘技术在审计领域的现状进行描述,阐述了审计与数据挖掘之间的关系与应用以及数据挖掘在审计中的利弊。
关键词:数据挖掘;审计;利弊
一 、数据挖掘在审计领域的研究现状分析
在信息化时代,常规的审计方法慢慢不满足时代发展的要求,审计行业面对着巨大的挑战。为了适应现代化的要求,改进审计方法,做到多学科融合发展,已变成了一种趋势。当今社会对审计的要求、范围、工作环境、审计对象等都发生了巨大的变化,无论是会计师事务所还是国家审计部门都面临着传统审计方法受限,海量数据审计困难等问题。开发和使用基于数据挖掘的审计技术,可以扩大审计范围,提高审计的质量和效率,降低审计风险。
二、数据挖掘在审计中的应用
一般在确定审计对象之后的准备数据和数据进行预处理之后进行建立数据挖掘模型(以决策树为例)、聚类,结果分析。数据挖掘技术最大的优势就是利用计算机代替人做复杂重复的海量數据运算,从中挑选出与审计对象或者是同行业数据不符的财务数据或非财务数据,也符合当前以风险为主导的审计原则,同时也符合成本效益原则。
但审计进行中一定要按照需求对信息进行挑选,有针对性的进行数据挖掘。在整个审计过程中在,审计主体的需求可能会发生改变,是一个逐渐完善和改进的动态过程,在审计与数据挖掘结合的过程中也会出现诸多问题。
1、 准备数据,对数据进行预处理
确定审计对象后,准备数据就是进行财务报表数据和非财务报表数据的采集和整理工作。然后在该基础上进行数据的整理和计算,主要根据所接触的一般财务规律来制定数学模型。例如:应收账款的周转率应该和收入按比率同时增长或下降、毛利率应该和整个经济环境和经济周期相适应、存货减少应该和成本的增加呈反比例变化等。在进行预处理时,我们运用统计学的相关性检测方法建立模型,用公司的财务报表数据来进行检测是否符合构建的模型。
在数据预处理后,对于不符合模型的数据要进行原因分析,不一定就是财务舞弊。对于处理中的缺值,查明缺值原因判断其是否真实无法获取。另外分析各属性中存在的缺失值个数以及缺失率,可以作为数据质量好坏的一个数据指标。如果该数值对模型的运用产生直接影响,要考虑转变数值形式,如:负数变正数、0变0.00001等。此外,在选取数据套用模型时要注意数据的单位要一致。
2、建立数据挖掘模型——以决策树为例
决策树是一种用于决策的树状模型,每个决策结点都表示某个决定选项,不同的分支分别代表不同的输出,最后的叶结点用以得出最后的决策结果。决策树主要解决是否按规定进行分类的问题。由于该模型需要涉及其他领域的知识较少,仅需要设置某些特殊参数,且能够从复杂的数据中发现是否有与决策不符合规定的可能性。我们可以将该方法应用于对于商业银行的审计中,对于银行贷款的分类是否恰当,是否存在遮掩贷款风险的情况。
3、结果分析——聚类分析
聚类分析根据在数据中发现的描述对象及其关系的信息,将数据对象进行分组。目的是,组内的对象相互之间是相似的,而不同组中的对象是不同的。组内相似性越大,组间差距越大,说明聚类效果越好。
在结果分析中,企业通常使用聚类分析的方法,目的是找出匹配被审计单位情况的审计意见。首先会计事务所对不同审计意见应有自己的标准来构造一个意见数据库,里面包含了事务所对出现不同问题,严重程度给予的意见类型。其次针对审计过程中发现的问题进行整理,进行数字化描述。使用聚类分析进行分类,即达到了避免人为操作审计意见得效果,提高了公众对审计期望值。
三、审计过程中应用数据挖掘技术的利弊
1、审计过程中应用数据挖掘技术的优点:
(1)数据处理能力强大
当今社会发展快速,企业规模不断扩大,公司财务数据和非财务数据数量庞大,人为进行审计不仅工作量大而且效率低下。利用数据挖掘,能对大量数据进行整理和计算,使审计人员能更直观和快速的了解被审计单位。
(2)审计过程更加客观
社会审计工作的性质导致审计本来就是一份相对主观的工作,需要与被审计单位讨论。因为审计的局限性,有时被迫听取被审计单位的一些意见。当各个会计师事务被强制采用聚类分析出具审计意见报告类型时,出具的审计意见就会更叫客观。
2、审计过程中应用数据挖掘技术的弊端:
(1)实施成本过高
在审计过程中应用数据挖掘技术,对审计人员的要求有所提高,不仅熟练掌握审计知识,还得学习统计学、编程技术、数据库技术等各种知识。会计事务所培养费用增加,招聘难度也会加大。
(2)建立执行审计意见数据库困难
因为被审计单位涉及各行各业,每个被审计单位都有各自不同的经营情况。
要针对不同的经营情况设计各种财务报表意见数据库,还需要很长时间的调研和实践。不同的企业也会审计出不同的审计问题,在审计意见数据库不包含其情况的同时,还需要人工对其进行判断,耗费的人力和物力同时上升。
综上所述,在审计中运用数据挖掘技术既有值得推广的一面,同时也存在着不可忽视的问题。数据挖掘给予了审计一种新的方面和前景,为提高审计质量提供了新的思路。因此,审计人员应加强相关领域的学习,发挥数据挖掘在审计过程中的无限潜力。
参考文献
[1]赵妍妍,秦兵,刘挺.文本情感分析[J].软件学报,2010(8):1834-1848.
[2]苏兵杰,周亦鹏,梁勋鸽.基于XGBoost算法的电商评论文本情感识别模型[J].物联网技术,2018(1):30-32.
[3]赵力,钱向民,邹采荣,等.语音信号中的情感识别研究[J].软件学报,2001,12(7):1050-1055.
[4]赵力,将春辉,邹采荣,等.语音信号中的情感特征分析和识别的研究[J].通信学报,2000(10):606-609.
[5]李梦可, 高雪玉, 唐俪婷.企业财务舞弊迹象数据挖掘的审计模型研究[J].中国集体经济,2019 (7) 81-83
[6]钱楚云.企业财务舞弊数据挖掘的审计模型研究 [J].中国管理信息化,2019 (20) :63
[7]辛佳颖.基于数据挖掘技术的金融审计风险防范研究[J].经济论坛,2013(7):100-102