APP下载

可视化技术与数据挖掘技术在审计中的配合运用研究

2021-08-09王子豪

市场周刊 2021年7期
关键词:预处理数据挖掘可视化

王子豪

(南京审计大学政府审计学院,江苏 南京211899)

一、研究背景

当今社会已经进入大数据的时代,越来越多的大数据技术被运用到社会的各个领域,审计领域也不例外。大数据背景下,审计工作所需的数据量越来越多,数据类型愈加复杂,因此,为保障审计质量,在审计工作中使用大数据技术已经成为提高审计效率、精确审计结论的必然趋势。

进入大数据时代,数据数量不断增加,数据类型更加复杂,而传统审计软件所能处理的数据数量和数据类型有限,导致其不能满足大数据审计的需要(陈伟和居江宁,2018)。大数据技术中的可视化技术可以将数据类型转换成便于审计人员理解的图像,使审计人员能够直观地观察数据概况,迅速发现数据之间的规律,找出数据背后所隐含的关系及问题。此外,在大数据背景下,传统的审计工具对被审计单位的电子化数据进行审计时存在诸多不足,如无法找出数据背后隐藏的关联信息,先进的大数据技术也可能会被审计对象用于作弊等(吕新民和王学荣,2007)。在此情况下,可运用数据挖掘技术中的聚类分析、关联分析等方法,对被审计单位的财务报表、会计凭证及账簿等财务数据和音视频等资料进行深层次分析,揭示其内在联系,便于审计人员识别与分析。

综上所述,积极使用可视化技术与数据挖掘技术等大数据技术,是审计工作更高效的重要保障。

二、研究意义

目前可视化技术与数据挖掘技术均已用于审计工作中,其中可视化技术借助图形化的手段,可以将信息清晰地传达出来,方便审计人员根据信息进行沟通并快速发现问题(陈伟,2017)。

数据挖掘技术可以运用数据挖掘模型,通过对被审计大数据进行挖掘,得出可用于产生审计结论的证据或相关数据。但在运用数据挖掘模型之前,必须对采集到的原始数据进行如格式转换、提炼等预处理操作。然而从被审计单位获得的原始数据往往是大量且冗杂的,其中会存在一部分无关数据不利于审计人员从中发现问题(陈丹萍,2009)。若想使数据挖掘技术达到使用目的,就必须做适当的预处理,而可视化技术的作用则是对数据进行处理,将其转换成便于审计人员理解及使用的形式。因此,将可视化技术与数据挖掘技术配合使用,可以解决数据的预处理问题,便于数据挖掘技术在审计工作中正常运行。

目前有不少文献研究可视化技术在审计工作中的运用,也有大量文献研究数据挖掘技术运用到审计工作中的情况,这些文献对人们分别了解两种技术在审计中发挥的作用奠定了一定的基础,但若将两种技术进行配合运用,则可以解决数据挖掘技术的预处理问题,文章基于可视化技术与数据挖掘技术在审计工作中的运行流程,设计出将两种技术配合使用的运行流程,并阐述该流程的运用优势。

三、可视化技术与数据挖掘技术在审计工作中的运用现状

(一)可视化技术运用现状

可视化分析是通过图形分析处理复杂数据模型的一种分析方式,将大量数据进行总结概括,将数据转换成便于审计人员理解的图像,帮助审计人员发现数据间的规律,及数据背后存在的问题。常见的可视化技术包括:时间序列图、折线图、散点图、气泡图、地区分布图,以及标签云等技术。目前可视化技术在审计实务工作中被广泛应用。例如,在大气污染防治审计中,审计人员借助其中的时间序列图及散点图等技术,比对不同时期某地大气中不同化合物的占比,来分析该地空气质量有无变差,以此来判断相关部门的绩效情况。此外,在扶贫审计中,由于扶贫资金单项金额较小且覆盖面广的特点,因此需要的数据较多,来源较广,但审计部门所能派出的人力、物力有限。利用可视化技术,通过采集线上数据库的相关数据,就可收集到大量有用数据,减少了审计人员的现场办公时间,保留了审计人员的精力,而且可视化技术还可对收集到的数据按照审计人员的思路进行总结,能够快速且全面地把握被审计单位的基本情况,提高了审计效率。

(二)数据挖掘技术应用现状

数据挖掘技术是以找到数据间的关联性及因果关系为目的对海量、深层次的数据源进行筛查的技术,能够帮助审计人员在短时间内筛选出具有代表性的审计样本,在一定程度上降低了审计风险。其主要技术方法包括数据概化技术、统计分析技术、聚类分析技术及关联分析技术等。

由于数据挖掘技术可收集利用的数据较多,因此该技术常用于外部审计人员对企业财务报表的审计当中。运用统计分析技术,对被审计单位相关财务指标的历史数据进行分析与预测,得出预测值,再与审计值进行比较,若差别较大,则可对此重点关注。此外由于财务造假需要多项科目进行配合,因此难免出现个别科目存在异常数据的情况,对此可运用关联分析技术,对可能存在关联的不同类科目及各类数据进行审查,若存在异常数据,则可对与异常数据相关联的数据进行审查,判断是否存在隐藏的经济活动。

四、数据挖掘技术单独使用及与可视化技术配合使用存在的问题

(一)数据挖掘技术单独使用存在的问题

数据挖掘技术虽有传统审计技术无法替代的作用,但在现阶段的运用过程中,还是会存在一定的风险。例如,2014年外部审计人员对某燃气控股有限公司构建的运用了数据挖掘技术的审计系统进行深层次分析,发现该系统存在一些审计风险。首先,该公司倾向于借助专家的审计经验,以此为基础确定审计目的及需要收集的相关数据,而随着该公司规模的扩大,业务类型也变得复杂,使得专家确定的范围并不能覆盖所有类型的业务,产生了审计盲区。其次,该公司运用数据挖掘技术仅对如财务报表、会计凭证等结构化数据进行处理,而如音频、视频等非结构化的数据则不进行检查,这就会导致一些关键信息遗漏,从而影响审计结论。

由此可以看出,若在进行数据处理时不借助其他辅助技术进行处理,很可能导致数据收集和筛查不全面的情况发生,从而影响审计结论。

(二)可视化技术与数据挖掘技术配合使用存在的问题

由于可视化技术与数据挖掘技术都是对海量复杂数据进行分析处理,因此,目前二者在个别审计案例中配合使用,但在配合使用过程中,依然是进行分开使用,虽然通过可视化技术与数据挖掘技术产生的审计线索可以相互参考,但这样分开使用会造成审计思路不清晰、审计流程不便捷的情况。

2016年7月1日,国家发展改革委发布《推进医疗服务价格改革的意见》,要求各地公立医院调整医疗服务价格,取消药品加成政策。在此背景下,审计部门就是否存在药物加成现象对某市某公立医院进行了审计。由于该公立医院药品类型繁多,且要对2013~2016年的药物价格情况进行审计,涉及数据较多,因此审计部门运用了可视化技术与数据挖掘技术对相关内容进行分析,以保障审查的数据可准确表现该医院药品的整体情况。

审计人员首先使用了可视化技术中的气泡图进行分析,通过将每年的气泡图进行整合,审计人员发现,从2013年到2016年,气泡图中气泡的数量,即加价药品数量虽然在减少,但是每个气泡的面积,即加价率却在增大,在对此情况进一步考察后,审计人员发现该公立医院表面上响应政策的号召,在减少药品的加价情况,但实际上通过增加药品的加价率来变相地对药品进行加成。随后,审计人员利用散点图进行分析,发现加价药品的购入价大多集中在100元以内。而为了探究对什么类型的药品进行加价,审计人员又通过数据挖掘技术中的聚类分析,将药品进行分类筛查后发现,从2015年到2016年,该医院选择加价的药品大多为胶囊药品。最后,针对以上现象实施进一步审计程序后,审计人员最终得出结论:该公立医院为对药品进行加成,选用了购入价较低的胶囊类药品进行加价,由于购入价较低,因此其加价空间较大,且购入价较低的胶囊类药品不易被着重检查。

从以上案例可以看出,可视化技术与数据挖掘技术在审计工作中可同时使用,且能达到审计人员所期望的目的,但是在该案例中,对于两种技术的使用效率并没有达到最优。此案例中审计人员先使用了所有需要用到的可视化技术后再使用的数据挖掘技术,然而使用其中的聚类技术的目的便是找到哪些类型的药品进行了加价,而这一步可以在使用完气泡图后就实施。因为气泡图可以显示哪些药品进行了加价,在此基础上对气泡图所显示的药品直接利用聚类分析即可进行分类筛查,这样在使用数据挖掘技术时就不用对被审计单位的数据进行预处理,因为气泡图的作用就是为了预处理,从而可以优化审计流程。

五、基于运用流程的解决路径

数据挖掘技术在使用过程中,若想建立数据挖掘模型,则必须先对获取的数据进行预处理,但审计人员在这一环节若只使用数据挖掘技术,很可能遇到难以理解的数据形式,阻碍审计人员进行预处理。此外,预处理的结果关系到审计问题的提出,所以单靠审计人员自身很可能不能精准总结出数据的关联性及因果关系。因此,若使用可视化技术对收集到的数据进行预处理,则可以帮助审计人员较为全面准确地总结出数据的基本情况,再配合审计目标,就可提出关键性的问题进行审查,最终使审计结果更加可靠。

(一)可视化技术运用流程

可视化技术在审计工作中运用的基本流程如图1所示,在收集到被审计单位的相关数据后,将数据录入承载可视化技术工具的系统中,再根据审计人员的需要,对数据进行可视化建模与分析,将初步的结果通过图形等方式表现出来。此时审计人员再通过视觉感知,并配合自身的审计经验进行分析,若对结果存疑,还可再次将数据录入系统,转换其表现形式,将此过程不断循环,最终得出让审计人员能够完全理解的数据特征、数据间关系的图像,将其确定为审计证据。

图1 可视化技术在审计工作中的运用流程图

(二)数据挖掘技术运用流程

图2为数据挖掘技术在审计工作中的应用流程,审计人员根据审计目标提出审计需求,根据需求对被审计大数据进行预处理,并对处理结果进行总结与分析,使其转化成数据挖掘问题。再和数据挖掘人员进行交流与沟通,数据挖掘人员根据问题设计出数据挖掘模型,对被审计单位内外部数据进行挖掘。最后由审计人员对产生的数据挖掘结果进行评价,检验结果的有效性,即是否可作为有效的审计线索或审计证据。

图2 数据挖掘技术在审计工作中的运用流程图

(三)可视化技术与数据挖掘技术的配合运用流程

图3为可视化技术与数据挖掘技术配合运用的流程,从图中可以看出,该流程实际上是将数据挖掘技术中原有的预处理步骤换成可视化技术中的分析模块,即从建模到审计人员判断可视化结果是否可作为审计线索这一段流程,然后将由可视化技术分析出的审计线索转化成数据挖掘问题,使可视化技术与数据挖掘技术进行拼接,产生一个新的运用流程,以解决数据的预处理问题。

图3 可视化技术与数据挖掘技术的配合运用流程图

该流程相比于未加入可视化流程的数据挖掘流程而言,该流程在建立数据挖掘模型之前,可对数据进行可视化分析,使得预处理的结果不再完全依靠主观判断,而是依赖于客观技术,使分析出的结果更加接近被审计单位的实际情况,帮助审计人员与数据挖掘人员建立有效且包含面广的数据挖掘模型,使得出的审计结论更加全面可靠。此外,将两项技术流程组合成一个新流程使用,能够规范操作步骤,使审计思路更加清晰。就该流程的应用范围而言,由于该流程既包含了可视化技术,也包含了数据挖掘技术,因此该流程可应用于两项技术单独使用的审计项目中,另外,该流程解决了数据挖掘技术的预处理问题,因此可以将该流程尝试应用到目前数据挖掘技术无法较好发挥作用的审计项目中,进一步检验该流程的应用范围。

六、结语

综上所述,在大数据背景下,将可视化技术与数据挖掘技术进行配合运用,可以解决数据预处理难的问题,可保障审计工作顺利开展。但在现阶段,两项技术并没有得到较好的配合,因此需要审计人员不断提升自身素质,与不同领域的部门进行合作,尽快掌握相关大数据技术,从而优化审计工作流程,提高审计效率。

大数据带我们进入了一个新纪元,使我们对这个世界有了更加深刻、客观的认识,而审计作为经济监督活动的重要工作,审计部门应该对此更加重视,这就需要审计人员既努力学习先进技术,又要掌握大数据背景下新的审计思路,以更加饱满的态度来迎接大数据技术所带来的便利与挑战。

猜你喜欢

预处理数据挖掘可视化
基于数据挖掘探讨慢性肾衰竭处方规律
基于数据挖掘技术的非均衡数据分类研究
干/湿法烘焙预处理对稻壳燃烧反应特性的影响
数据可视化设计在美妆类APP中的应用
手术器械预处理在手术室的应用
污泥预处理-厌氧消化体系的能源经济性评价
思维可视化
污泥预处理及其在硅酸盐制品中的运用
复变函数级数展开的可视化实验教学
复变函数级数展开的可视化实验教学