大数据审计思维与技术的应用初探
2019-02-20朱瑶/文
朱 瑶/文
在信息化时代,很多大案要案都是通过大数据审计发现的,特别是在信息化程度相对较高的金融领域,审计信息化成效显著。大数据时代,数据量的不断扩大、数据结构的多样化等都要求审计人员运用大数据思维、利用全新的审计辅助工具开展具体的审计工作。
一、大数据审计思维与技术概述
大数据时代的到来,给传统的审计技术和方法带来了巨大冲击,面对体量大、类型多的各种数据,审计人员必须适应大数据时代的要求,具备大数据审计思维,了解和应用大数据审计技术。
大数据审计思维可以应用于审计的全过程。在实施审计工作之前,可以运用大数据审计思维对主体信息的分析人员、审计目标的实现、审计工具和技术的选择进行判断选择。例如在考虑信息分析人员的选择时,需要考虑主体是否具有明确的审计思路、跨领域的综合知识是否能够掌握并熟练应用,是否具有整体思维的能力;在进行审计目标分析时,要提前考虑和预测可能存在的问题或异常;根据审计目标,确定适用的审计工具与技术深度挖掘审计线索;在实施审计工作的过程中,根据审计人员、目标和技术工具的确定,进一步采用整体性思维,站在全局的角度看问题,同时可以考虑通过大数据关联分析技术、可视化分析技术等实现审计重点的确定;在完成审计工作之后,可以考虑将局部问题进一步升华,通过考虑大数据审计过程中发现的客观规律推至全局。
大数据技术可以应用于数据采集、数据存储、基础架构、数据处理、统计分析、数据挖掘、模型预测以及结果呈现等。大数据审计技术还可以包括以下几个方面,针对审计主体的特定行为的复杂性,可开发借助地理信息技术、物理化学测量技术等大数据审计技术方法。在进行制度审计,评估制度是否存在不合理之处时,可以采用大数据技术中的文本分析技术等。
下面就重点论述下数据可视化技术,大数据时代的审计数据类型涵盖结构化数据、半结构化数据和非结构化数据三种类型,在数据采集环节,可借助可视化技术针对非结构化和半结构化数据开发数据采集方法。大数据可视化技术还可用于结果呈现。在数据类型方面,大数据可视化技术不仅可以应用于结构化数据,还可以应用于文本、图片等非结构化的数据,其适用性也更加符合大数据审计技术发展的要求。数据可视化不仅可以应用于审计工作实施之前确定审计重点和方向,还可以应用于数据分析过程中,通过数据分析结果可视化明确数据关系,也可以通过进一步的审计挖掘,发现数据之间的关联、规律和发展趋势,当然,也可以通过数据可视化展示最终的数据分析结果,使数据结果更加直观,也更加容易为管理决策提供支持。
二、大数据思维与技术在审计中的应用
(一)大数据审计思维的培养
在实际推进审计人员灵活熟练地掌握大数据审计方法的过程中,要培养审计人员保持大数据思维的习惯,在具体分析某一审计事项时,从整体思维角度出发,跳出这一事件本身来看全局。对于初步实现大数据审计的审计人员来说,可以将自己的大数据方法和思路告知技术人员,在技术人员的帮助下实现大数据审计分析,弥补审计人员和计算机技术人员各自在专业领域的知识短缺。一般情况下,在审计人员提出需求时,往往是一个比较宽泛的概念,例如在养老院护理员津贴发放这项审计事项中,技术人员得到的信息可能仅仅是找出护理员津贴发放不规范的记录,但是却会因为缺乏审计常识或缺乏标准知识,而导致大数据审计技术发挥不出其最大的作用。这就体现出了大数据思维、审计结果预判的重要性。
在大数据审计思维的培养中,审计人员不仅应该提升自己的专业素质能力,同时也要提升综合能力。具体来讲,关于审计人员的专业素质能力要求主要应该是从转变思想、探索方法、改变思想、充分认识和利用这几个阶段来实现;在提升综合能力方面,审计人员要具备跨领域的知识结构、并且能够整合运用知识、加强分析结果预判能力和总体把控能力等。这些是审计人员实现大数据审计的必经之路。
(二)大数据审计技术的应用和发展趋势
1.审计人员常用的审计技术工具
由于不同的企业信息化水平和程度不同,公司层面的要求也不尽相同,因此审计信息化的进程也存在很大的差别。对于一些审计人员来说,基础的数据分析工具,例如Excel就可以满足日常的工作需要了。SQL Server数据库足够满足数据量稍大企业的数据分析和存储。
审计人员大数据审计思维的培养卓有成效。以大数据思维在某保障性安居工程审计项目中的应用为例,如果审计人员需要确定同一户家庭是否重复享受危改资金,如果仅仅关注危改资金发放名单可能无法得出审计结论,但是利用大数据整体思维,发现事物之间的关联性,就会找到突破口。审计人员利用大数据思维,考虑到新型农村合作医疗数据中家庭成员共用一个医疗证号,将医疗证号作为切入点,将危改资金发放名单和新型农村合作医疗数据进行关联,只要审计人员自己学会或者在技术人员的帮助下,利用SQL语句通过身份证号关联,找出具有相同医疗证号的记录,就可以找出重复享受危改资金的家庭。在该案例中,大数据思维再加上大数据分析技术的支持,不需要耗费很多的人力物力,就可以对保障性安居工程进行全覆盖式的审计,审计成效较为突出。
2.大数据可视化技术
大数据可视化技术是大数据审计技术的重要组成部分,也是未来审计技术的发展趋势。大数据可视化技术使审计数据分析结果更加直观。R作为一种开源软件,便于获取,操作简单,分析功能强大,具有出色的可视化展示技术和不断更新的分析包,功能也在不断完善,R语言作为可视化工具拥有优越性。考虑到企业对于数据发展预期的需求以及对于不同的数据分析结果集成到一张图上的信息需求,R语言可以很好地实现其功能,同时企业在进行专用审计软件开发的同时,也可以通过R语言的功能封装,将R语言的相关模块应用到数据可视化分析模块中去,这样审计人员就可以直接通过简单的几步操作完成数据可视化,这样既实现了审计人员数据可视化的需求,同时也大大降低了审计人员学习R语言的时间成本等。
以R语言在某养老院养老床位建设目标达成情况这一审计目标中的应用为例。为了初步确定养老床位数在中心区域和郊区各街镇的分布情况,由于审计人员无法获得各养老院入住的实际老人数,为了确定养老床位建设是否达到了规定要求,审计人员可以直接使用预处理之后的核定床位数做分析,并利用R语言的ggplot2数据包绘制散点图,以各街镇的核定床位数为Y轴,各街镇户籍老人数为X轴,并且通过圆圈和三角形来区分城镇数据和郊区数据,在绘制了该散点图的基础上,画出政策要求的养老床位数达到老年人口数的一次函数。通过观察数据可视化的结果,可以分别分析郊区和中心区域的养老床位建设目标完成的具体情况。可以发现大部分街镇核定床位数都没有达到文件的要求,且养老床位的设置存在区域性不平衡,因此,审计人员可以结合该地区正在新建或者存量改造的床位数,对该区养老床位建设的发展提出建议。
R语言通过散点图、脸谱图、气泡图、地图分布、数据爬虫等大数据可视化技术,突出审计重点,其可视化功能在很多审计项目中都成效显著。例如金融审计中对大额贷款、逾期贷款等重点项目的排查,医保项目审计中对药品加成情况的审计,财政专项审计中利用数据挖掘技术开展经济形式预测等都能直观反映审计问题。
三、大数据审计思维与技术应用的特征总结
(一)大数据审计思维和技术的应用要点
审计人员在实施审计项目前,应时刻保持大数据思维,构建出一个个审计目标,层层深入并结合外围数据考虑针对每一个审计目标可能存在的各项不规范问题,在具体实施审计项目时,即使审计人员还没有独立使用大数据审计技术的能力,也可以把自己的大数据思维转换成具体准确的需求提给计算机技术人员。当然技术人员也需要有一定的审计知识的积累,在做具体的分析工作时,才会更加得心应手,才会更加融洽地与审计人员合作,才会更加顺利地应用和推广大数据审计技术。审计人员必须意识到,大数据审计技术的应用是在审计思路的指导下完成的,如果没有大数据审计思维,即使大数据审计平台构建的再完善,大数据技术再炉火纯青,也无法达到计划中的审计效果。因此,无论是一般审计人员还是技术人员,在期待应用大数据审计技术作出具体的审计实验时,一定要切记首先要始终保持大数据审计思维,进行审计结果的预判。
(二)大数据审计技术的局限性
方法适用、数据真实是大数据审计技术发挥作用的基础,不能为了使用大数据而使用,只有在其能真正为审计工作提供帮助时,才选择大数据审计工具。大数据审计技术可以为审计人员提供审计疑点、确定审计重点,但是有些情况下并不能直接提供审计证据。例如,在数据可视化审计中,散点图的分布会让我们关注到不符合规律的异常散点,但并不能直接作为审计证据,只能作为审计疑点,只有通过延伸审计才能确定审计发现。也就是说,并不是所有的审计疑点都是审计问题,审计人员需要根据技术人员找出的疑点做后续的确认工作,通过传统审计方式和职业判断,最终得出审计结论。