基于可视化分析技术的大数据审计案例研究
2019-06-24陈伟
陈 伟
一、引 言
近年来,大数据技术的研究与发展为审计工作带来了机遇和挑战,目前国内外高度关注大数据技术在审计工作中的应用。2015年12月中共中央办公厅、国务院办公厅印发的《关于实行审计全覆盖的实施意见》指出“要求构建大数据审计工作模式”;2017年3月中共中央办公厅、国务院办公厅印发的《关于深化国有企业和国有资本审计监督的若干意见》提出“创新审计理念,完善审计监督体制机制,改进审计方式方法”;国际内部审计师协会2017年发布了《理解与审计大数据》指南(GTAG,2017);美国注册会计师协会(American Institute of Certified Public Accountants ,AICPA)(2014)分析了大数据环境对审计工作的影响。
国内外学术界也高度关注大数据技术在审计中的应用。Gepp(2018)研究了大数据在审计研究与实践中的现状与未来机遇;笔者分析了大数据审计的现状与发展(陈伟,2017),以及大数据环境下电子数据审计的机遇、挑战与方法(陈伟,2016),研究了大数据环境下基于模糊匹配的审计方法(陈伟,2016),大数据环境下基于数据可视化技术的电子数据审计方法(陈伟,2017),基于Benford定律的大数据审计方法(陈伟,2017),基于大数据可视化技术的审计线索特征挖掘方法(陈伟,2018),以及基于网络爬虫技术的大数据审计方法(陈伟,2018)等。Wang(2015)调查发现:数据审计在审计工作中具有重要的作用,但社会审计和内部人员对数据审计重视和应用还不够。Brown-Liburd(2015)认为要多关注审计人员处理大数据的能力,比如如何对审计人员进行大数据审计方面的培训,如何开发大数据审计工具或借助其他领域的软件工具来开展大数据审计。
综上所述,随着大数据技术在审计领域中的应用,大数据审计成为目前审计工作中的一个重要内容,为了适应审计事业发展的需要,培养大数据审计人才越来越重要。如何设计大数据审计案例,培养审计人员的大数据审计能力越来越重要。本文基于Python工具,以金融审计为例,设计基于可视化分析技术的大数据审计应用案例。
二、大数据可视化分析技术简介
人类非常擅长通过视觉获取有用信息,一图胜千言。现代数据分析也日益依赖通过呈现图形来揭示含义和表达结果。目前,针对审计行业,关于大数据技术的相关研究与应用一般包括大数据智能分析技术、大数据可视化分析技术以及大数据多数据源综合分析技术,其中,大数据可视化分析技术是目前大数据审计应用比较成熟和主流的内容。常见的大数据可视化分析技术包括:柱状图(Bar Chart)、 折 线 图(Line Chart)、小提琴图(Violin plot)、散点图(Scatter Chart)、气泡图(Bubble Chart)、 饼 图(Pie Chart)、 雷达图(Radar Chart)、地区分布图(Choropleth Map)、树地图(Tree Map)、热力图(Heat Map)、标签云(Tag Cloud)等。
在何种情况下应该用何种可视化方法,才能够让审计数据分析达到最佳的效果是大数据可视化分析技术在审计中应用的重点。比如,在分析我国新型农村社会养老保险制度的发展情况时,对每年、每个地方、每个参保人员的信息进行逐一计算后,当把数据在地图软件上可视化之后,其具有的特点就能很好地显现出来,审计人员便可以轻松地看出全国各地新型农村社会养老保险制度近年来的发展变化情况。
三、基于可视化分析技术的大数据审计案例设计
(一)案例背景简介
江汉证券公司是江汉省重点金融机构,根据江展市审计局2018年的审计计划安排,现对该公司进行经济责任审计。其中的重点内容之一是审计该公司2013-2018年期间的股票交易数据中是否存在内幕交易的违规现象。假设现已获得相关大数据,其中,处理后的相关股票交易数据(注:本案例中相关数据已经过脱密处理)示例如图1所示。
目前,常用的大数据可视化分析工具主要包括:(1)开源的、可编程的工具,如R语言、Python等;(2)商业化软件工具,如Tableau、SAS等。考虑到大数据可视化分析工具Python是比较简单的、开源的大数据可视化分析软件,本文根据目前开展大数据审计的需要,以Python为例,分析散点图、条形图、折线图、直方图、气泡图、小提琴图等常用的数据可视化分析技术。
(二)案例内容设计
整个案例内容设计如下:
1.审前准备阶段
掌握如何进行审前准备,如何编写审计通知书、如何编写审计实施方案等文件。
2.审计实施阶段
掌握如何编写审计需求单、如何进行数据采集与分析、如何借助大数据可视化技术探究该公司2013-2018年期间的股票交易数据中是否存在内幕交易的违规现象、如何编写审计取证单、如何编写审计工作底稿等审计文书。
3.审计报告阶段
掌握如何编写审计报告征求意见稿(审计事实确认书)、如何编写审计报告等文件。
综上所述,如何借助大数据可视化技术探究该公司2013-2018年期间的股票交易数据中是否存在内幕交易的违规现象,获得审计证据,是开展大数据审计的关键,因此,本文重点分析实现大数据审计的几种常用可视化分析技术。
图1 相关股票交易数据示例
图2 基于Python语言的散点图分析方法示例
四、大数据审计可视化分析方法的实现
(一)散点图分析
1.散点图分析方法简介
散点图可以用于表示X、Y轴坐标之间数据的变化关系,借助可视化分析工具,X、Y轴坐标之间数据的变化关系可以被可视化地分析并展示出来。
2.散点图分析方法的实现
散点图分析方法在审计工作中具有一定的用途,比如,在金融审计中,通过散点图分析,审计人员可以分析客户购买股票的情况,从而判断客户购买股票的类型是否比较单一。基于以上分析,采用Python语言实现了针对某一股票交易数据的散点图分析方法,其分析结果示例如图2所示。在图2中,X轴表示被分析的客户编号,Y轴表示被分析的客户购买股票的代码。
由图2不难发现:客户编号为C024、C038、C046、C064的客户购买股票的类型比较单一。
(二)条形图分析
1.条形图分析方法简介
条形图是数据分析中常用的图形之一。通过条形图,可以把数据表中列或行数据生成条形图,从而可以直观地显示各个项目之间的比较情况。条形图的主要特点是:方便审计人员很容易地看出各个项目数据的大小;容易比较各个项目数据之间的差别。
2.条形图分析方法的实现
条形图分析方法在审计工作中具有一定的用途,比如,在金融审计中,通过散点图分析,审计人员可以分析客户购买股票的情况,从而判断客户购买股票的类型是否比较单一。基于以上分析,采用Python语言实现了针对某一股票交易数据的条形图分析方法,其分析结果示例如图3所示。在图3中,X轴表示被分析的客户编号,Y轴表示被分析的客户所购买的股票总数。
由图3不难发现:客户编号为C024、C038、C046、C064的客户购买股票的类型比较单一,这些客户是审计人员关注的重点。
(三)折线图分析
1.折线图分析方法简介
折线图是数据分析中常用的图形之一。通过折线图,可以把数据表中列或行数据生成折线图,从而可以直观地显示各个项目数据之间的比较情况。折形图的主要特点是:方便审计人员很容易地看出各个项目数据的大小;容易比较各个项目数据之间的差别。折线图可以显示随时间(根据常用比例设置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势。
2.折线图分析方法的实现
折线图分析方法在审计工作中具有一定的用途,比如,在金融审计中,通过折线图分析,审计人员可以分析客户购买股票的情况,从而判断客户购买股票的类型是否比较单一。基于以上分析,采用Python语言实现了针对某一股票交易数据的折线图分析方法,其分析结果示例如图4所示。在图4中,X轴表示被分析的客户编号,Y轴表示被分析的客户所购买的股票总数。
由图4不难发现:客户编号为C024、C038、C046、C064的客户购买股票的类型比较单一,这些客户是审计人员关注的重点。
(四)直方图分析
1.直方图分析方法简介
直方图是一种展示数据频率的特殊柱状图,利用直方图,可以对数据进行频率分析,从而帮助审计人员了解数据的分布情况。
2.直方图分析方法的实现
直方图分析方法在审计工作中具有一定的用途,比如,在金融审计中,通过直方图分析,审计人员可以分析客户购买股票的频率,从而判断客户购买股票的类型是否比较单一。基于以上分析,采用Python语言实现了针对某一股票交易数据的直方图分析方法,其分析结果示例如图5所示。在图5中,X轴表示被分析的客户编号,Y轴表示被分析的客户购买股票的频率。
由图5不难发现:客户编号为C024、C038、C046、C064的客户购买股票的类型比较单一,这些客户是审计人员关注的重点。
(五)气泡图分析
图3 基于Python语言的条形图分析方法示例
图4 基于Python语言的折线图分析方法示例
图5 基于Python语言的直方图分析方法示例
1.气泡图分析方法原理分析
气泡图可以用于表示X、Y轴坐标之间数据的变化关系,并可以通过图中散点的大小来直观感受其所表示的数值大小。气泡图类似散点图,像给散点图上色,不同之处是气泡图允许在图表中额外加入一个表示大小的变量进行对比。
2.气泡图分析方法的实现
气泡图分析方法在审计工作中具有一定的用途,比如,在金融审计中,气泡图可以帮助审计人员分析客户购买股票的类型是否比较单一,但不能整体了解客户购买股票的获利情况。通过气泡图,审计人员可以整体了解客户购买股票的获利情况。
基于以上分析,采用Python语言实现了针对某一股票交易数据的气泡图分析方法,客户购买股票及获利金额规模情况分析结果示例如图6所示。在图6中,X轴表示被分析的客户编号,Y轴表示被分析的客户所购买股票的代码。
由图6不难发现:客户编号为C024和C064的客户购买股票的类型比较单一,且购买的股票获利较大(如标的为B1608的股票),这些客户数据是审计人员关注的重点。
(六)小提琴图
1.小提琴图分析方法简介
小提琴图(Violin plot)结合了箱线图与核密度估计图的特点,用于显示数据的分布形状及其概率密度。
2.小提琴图分析方法的实现
小提琴图分析方法在审计工作中具有一定的用途,比如,在金融审计中,通过小提琴图分析,审计人员可以分析客户购买股票的频率,从而判断客户购买股票的类型是否比较单一。基于以上分析,采用Python语言实现了针对某一股票交易数据的小提琴图分析方法,客户购买股票及获利金额规模情况分析结果示例如图7所示。在图7中,小提琴的宽度表示客户购买股票类型的数量,小提琴的高度表示客户购买股票的获利金额。
由图7不难发现:客户编号为C024和C064的客户购买股票的类型比较单一,且获利较大,是审计人员关注的重点。而客户编号为C038和C046的客户虽然购买股票的类型比较单一,但购买股票获利很小,没有太多可疑之处。
同理,可以基于Python语言实现热力图分析方法、标签云分析方法等,从而更全面地练习基于可视化分析技术的大数据审计方法。由于篇幅所限,笔者另文讨论。
图6 基于Python语言的气泡图分析方法示例
图7 基于Python语言的小提琴图分析方法示例
五、总结
本文根据目前国内外大数据审计人才培养的实际需要,探索基于可视化分析技术的大数据审计案例设计。由于篇幅所限,关于大数据智能分析技术、大数据多数据源综合分析技术在审计中的应用案例,笔者将另文讨论。另外,今后学术界、实务界以及审计软件供应商应该提供更多的大数据审计案例,以满足大数据审计学习的需要。