基于Power BI和R语言组合应用的可视化审计方法
2023-04-07陈伟张慧汶周红
陈伟 张慧汶 周红
【摘 要】 目前可视化审计方法在大数据审计中得到广泛应用。为了更好地方便审计人员应用大数据可视化审计方法,探索简单易用的大数据可视化审计工具与方法越来越重要。文章首先分析了大数据审计的重要性以及大数据审计方法与工具的研究和应用现状;其次提出了基于Power BI和R语言组合应用的大数据可视化审计方法,并分析了该组合应用方法的优势与原理;最后结合案例探讨了该方法的应用。研究表明采用Power BI和R语言组合应用的大数据可视化审计方法可以充分发挥二者的优势,回避其不足,该研究为今后审计人员开展大数据审计提供了技术方法和经验参考。
【关键词】 大数据审计; 数据可视化; Power BI; R语言
【中图分类号】 F239.1;C931.6 【文献标识码】 A 【文章编号】 1004-5937(2023)07-0128-06
一、引言
近年来,大数据审计成为审计行业研究与应用的热点,引起国内外学术界和实务界高度重视。中共中央办公厅、国务院办公厅2015年12月印发的《关于实行审计全覆盖的实施意见》,要求构建大数据审计工作模式。审计署办公厅2019年4月印发的《2019年度内部审计工作指导意见》,要求“积极创新内部审计方式方法,加强审计信息化建设,强化大数据审计思维,增强大数据审计能力,综合运用现场审计和非现场审计方式,提升内部审计监督效能”。中国注册会计师协会2021年4月发布的《注册会计师行业信息化建设规划(2021—2025年)》,提出“大型会计师事务所要综合运用大数据、人工智能、云计算和区块链等前沿信息技术,围绕数据采集、底稿编辑、风险评估、审计策略、审计计划、审计抽样、审计测试、审计报告复核等审计环节,打造全流程的智能审计作业平台及辅助工具,实现远程审计、大数据审计和智能审计”。国务院办公厅2021年8月印发的《关于进一步规范财务审计秩序 促进注册会计师行业健康发展的意见》,提出“加强财会监督大数据分析,对财务造假进行精准打击”。财政部2021年12月印发的《会计信息化发展规划(2021—2025年)》指出“鼓励会计师事务所积极探索全流程的智能审计作业平台及辅助工具,逐步实现远程审计、大数据审计和智能审计”。大数据审计应用方面:关于政府审计,世界审计组织(INTOSAI)大数据工作组于2016年12月成立;关于内部审计,国际内部审计师协会2017年发布了《理解与审计大数据》指南[ 1 ];关于社会审计,美国注册会计师协会(AICPA)高度重视大数据审计,分析了大数据环境对审计工作的影响[ 2 ]。大数据审计学术研究方面:Gepp等[ 3 ]研究了大数据在审计研究和实践中的现状与未来机遇;一些文献分析了大数据审计的现状与发展[ 4 ],大数据环境下电子数据审计的机遇、挑战与方法[ 5 ],研究了基于大数据可视化技术的审计线索特征挖掘方法[ 6 ]和基于大数据可视化技术的大数据审计案例[ 7 ]等;还有一些文献针对信息系统审计研究了基于大数据技术的应用控制风险审计[ 8 ]和业务连续性管理风险审计[ 9 ]等问题;章轲等[ 10 ]分析了大数据背景下国家审计的新变化,提出從理论、法规、管理、技术和安全等方面进行创新的路径。
综上所述,随着大数据审计的广泛应用,大数据审计在审计工作中越来越重要。其中,大数据可视化分析技术成为目前开展大数据审计的重要技术。为了更好地开展大数据可视化分析,选择合适的可视化分析软件工具非常重要。目前,常用的大数据可视化分析工具主要包括:(1)商业化软件工具,如Power BI、Tableau、SAS等;(2)开源工具,如R语言、Python等。考虑到工具的易用性和功能,本文探索基于Power BI和R语言组合应用的大数据可视化审计方法。
二、Power BI在大数据审计应用中的可行性分析
Microsoft Power BI是微软公司(Microsoft)为其Office组件提供的一套商业智能工具软件,于2017年正式发布,其功能是在Excel的基础上增加了查询增强版(Power Query)、建模增强版(Power Pivot)、视图增强版(Power View)和地图增强版(Power Map)。Power BI可以对相关数据进行分析,并生成可视化的分析结果。审计人员不需要强大的信息技术背景,只需要掌握Excel这样简单的电子表格工具就能容易地进行数据可视化分析。微软公司提供了完全免费的Power BI Desktop版本,这为审计人员使用该工具开展审计数据可视化分析提供了便利。
根据大数据审计原理和特点,Power BI应用于大数据审计的可行性主要表现如下。
(一)Power BI能方便地实现审计数据采集
采用Power BI进行大数据审计时,需要把相关数据采集到Power BI中。Power BI的数据采集功能很强大,可以采集多种类型的数据,如电子表格数据(Microsoft Excel等)、数据库数据(SQL Server、Oracle、My SQL等)、文本文件数据(CSV、XML等),以及从Web网页上抓取数据,很好地满足了开展大数据审计时数据采集的需求。Power BI可以采集的数据类型如图1。
不难发现,Power BI在数据采集方面突出的优点是数据采集功能强大、操作方便,且在进行数据采集时不需要编写相关程序代码。
(二)Power BI能方便地实现审计数据预处理
Power BI具有操作简单、功能强大的数据预处理功能。审计人员可以在审计采集数据的过程中根据需要同时进行审计数据预处理操作,即选择“转换数据”功能进入Power Query编辑器,对数据进行简单的预处理,如删除或更改数据内容、更改数据类型、新建字段等;审计人员也可以在完成审计数据采集(把需要审计的数据导入到Power BI中)之后,再在Power BI中进行审计数据预处理操作。
(三)Power BI能方便地实现审计数据分析
Power BI具有操作简单、功能强大的数据可视化分析功能,提供了“可视化”“筛选器”等快捷功能。借助这些快捷功能,审计人员可以很方便地对采集来的审计数据进行可视化分析。
三、基于Power BI和R语言组合应用的大数据审计方法优势分析
(一)R语言简介
R语言是诞生于1980年左右的S语言的一个分支。新西兰奥克兰(Auckland)大学的Ross Ihaka和Robert Gentleman开发了R语言,由于Ross Ihaka和Robert Gentleman两人名字的首字母都是R,因此称为R语言。相比其他编程语言来说,其操作难度要低很多。作为开源工具,R语言广泛应用于数据分析与统计等领域。目前流行的R语言软件有R、RStudio等。R语言的主要优点如下。
1.数据采集功能强大
R语言能实现读取各种不同类型的被审计数据,例如Microsoft Excel、SPSS、SAS等,以及從网页上抓取的数据,完全能满足审计人员开展大数据审计工作的需要。
2.数据分析功能强大
R语言包含众多不同功能的函数、程序包,可满足审计人员的需要;作为免费开源工具,用户还能不断创建新的包来更新丰富R语言的使用功能;R语言软件强大的数据可视化功能可以满足审计人员在可视化分析方面的各种需求。以上这些优点为审计人员应用R语言提供了方便。
(二)R语言与Power BI组合应用的优势分析
1.增强Power BI的审计数据采集功能
审计人员在开展大数据审计时,尽管采用Power BI可以有多种方式直接采集所需要分析的审计数据,在Power BI中还可以通过借助R脚本采集所需要分析的审计数据,从而使Power BI的数据采集功能更强大。当需要采用R脚本采集数据时,可在Power BI中通过“获取数据”菜单,选择“其他-R脚本”,在此基础上,输入数据采集所需要的R脚本,Power BI在运行审计数据分析时就可以自动执行该脚本完成采集数据。因此,R语言与Power BI组合应用可以增强Power BI的审计数据采集功能。
2.增强Power BI的审计数据预处理功能
在Power BI中使用R脚本完成数据采集后,审计人员根据审计需要可以在Power BI中编写R脚本对已采集到Power BI中的数据进行转换操作,从而完成所需要的审计数据预处理工作。因此,R语言与Power BI组合应用可以增强Power BI的审计数据预处理功能。
3.增强Power BI的审计数据分析功能
Power BI的数据可视化分析功能与R语言相比,操作更简便。审计人员在进行数据可视化分析时,直接将相关字段添加到相应位置就可以得到对应的可视化分析结果;而审计人员直接采用R语言进行数据可视化分析时,则需要编写相应的可视化分析程序代码。但是,有时对于一些复杂的问题,仅仅使用Power BI难以实现数据可视化分析。因此,R语言与Power BI组合应用可以增强Power BI的审计数据分析功能。
四、基于Power BI和R语言组合应用的大数据审计原理
根据前文分析,如何对Power BI和R语言进行组合使用,发挥各自的优势对审计人员开展大数据审计非常重要。对直接采用Power BI就可以完成的审计数据采集、审计数据预处理和审计数据分析工作,审计人员可以把需要审计的数据直接采集到Power BI中,然后借助其可视化分析功能直接进行分析。对不能直接采用Power BI完成的审计数据分析工作,审计人员可以采用Power BI中的R语言接口,扩展Power BI的数据采集与分析功能,从而增强大数据采集与可视化分析能力。一般来说,采用基于Power BI和R语言组合应用手段进行大数据可视化分析的流程为:借助Power BI中的R语言接口,采用R语言编写数据采集和数据可视化分析程序代码,执行所编写的R语言程序代码,便可采用Power BI和R语言完成审计数据采集与分析,并将分析结果通过Power BI的可视化功能转化为便于审计人员分析观察的图形;在这些分析图形的基础上,审计人员利用自己的相关审计专业知识,通过对采用Power BI分析的可视化结果进行观察和进一步分析,从总体上系统掌握被审计大数据中存在的规律和问题,从而发现可疑的审计线索。另外,审计人员还可以根据需要,通过更改所编写的R语言数据可视化分析程序代码或直接在Power BI中设置可视化显示参数(如采用筛选器功能),改变输出的可视化分析结果,帮助审计人员从不同的视角分析被审计大数据,从而全面、系统地发现可疑的审计线索;审计人员在基于Power BI和R语言组合应用手段进行大数据可视化分析发现的审计线索的基础上,进行延伸取证,最终获得相关审计证据。
相比直接应用R语言进行大数据可视化分析,采用Power BI及其快捷功能,可以减少R语言的复杂代码编写工作。概括来说,基于Power BI和R语言组合应用的大数据可视化审计方法原理如图2。
五、基于Power BI和R语言组合应用的大数据可视化审计方法案例
(一)案例背景简介
以某证券公司经济责任审计为例,该公司股票交易数据中是否存在内幕交易的违规现象是经济责任审计中的一项重要审计内容。假设现已获得的、经过脱密处理的相关股票交易数据[ 7 ]示例如图3。
(二)简单问题的可视化分析
根据审计经验,对股票交易数据中是否存在内幕交易的违规现象,一般具有以下几个特征:客户购买股票的类型比较单一;客户的某种购买股票获利大;客户购入的某种购买股票在短时间内卖出。审计人员可以根据以往经验,分析该股票交易数据中是否存在具有以上特征的数据,从而发现相关内幕交易线索,获得审计证据。对一些简单问题的可视化分析,可以直接采用Power BI应用柱状图、散点图、条形图、折线图、直方图等方法进行数据可视化分析,审计人员不需要编写任何代码就可以轻松完成。以条形图为例,条形图是数据可视化分析中常用的方法之一。
审计人员通过条形图,可以把被审计数据表中的列或行数据生成条形图,从而可以直观地显示被审计数据中各项目之间的比较情况。条形图的主要特点是方便审计人员查看各个项目数据的大小,审计人员很容易比较各项目数据之间的差别。根据以上分析,在本案例中,为了查找购买股票类型比较单一的客户,审计人员可以采用条形图分析该股票交易数据。基于以上分析,直接采用Power BI进行分析的结果示例如图4。
图4中的Y轴表示被审计股票交易数据中客户所购买的股票类型总数,X轴表示被审计股票交易数据中的客户编号。由图4可以很容易地看出客户编号为C024、C038、C046、C064的条形高度较短,这意味着其代表的客户购买股票的类型比较单一,符合股票内幕交易违规的特征之一,这类客户比较可疑,是审计人员关注的重点。
(三)复杂问题的可视化分析
对较复杂问题的可视化分析,有时仅采用Power BI无法实现,这种情况下,审计人员可以采用Power BI和R语言组合应用,通过R语言编写相应的功能代码,从而增加Power BI的数据采集和数据可视化分析功能。在本例中,通过简单的图形虽然可以帮助审计人员分析客户购买股票的类型是否比较单一,但不能整体了解客户购买股票的获利情况,仅靠这一个特征,仍不能很好地发现审计线索。为了更精准地发现审计线索,审计人员可以对这些数据做更多维度的分析。以被审计股票交易数据的气泡图分析为例,气泡图分析结果除了可以表示X、Y轴坐标之间数据的变化关系之外,还可以通过气泡图中气泡图的大小直观地表现出其所代表的数据值大小。通过气泡图,审计人员可以整体了解客户购买股票的获利情况。因此,审计人员可以采用气泡图分析方法对股票交易数据进行分析。但仅仅采用Power BI不容易实现气泡图分析,R语言可以扩展Power BI的可视化分析功能。
综上分析,审计人员可以采用Power BI和R语言组合应用实现对客户购买股票及获利金额大小情况的气泡图分析,其结果如图5。
在图5中,X轴表示被分析股票交易数据中的客户编号字段,Y轴表示被分析股票交易数据的客户所购买股票的代码字段。
通过图5的分析结果,审计人员可以很容易地发现购买股票的类型比较单一,同时客户购买的股票获利较大。但大数据环境下,当被分析数据较多时,分析结果可能不清晰。为了更清晰地察看相关分析结果数据,在图5分析结果的基础上,审计人员可以采用Power BI的筛选器功能,方便地选择部分分析结果做进一步详细分析。例如,通过采用Power BI的筛选器功能,对分析结果仅选择客户编号为C024和C064的客户,如图6所示。
由图6可以更清晰、容易地看出编号为C024和C064的客户对应的气泡数量较少且气泡较大,这意味着其代表的客户购买股票的类型比较单一,且客户购买的股票获利金额较大(如标的为B1318的股票),符合股票内幕交易违规的两个特征,这类客户更可疑,是审计人员关注的重点。
以上应用不难发现:采用Power BI的筛选器功能做进一步分析时,审计人员可以避免使用R语言编写复杂的程序代码,从而方便了审计人员的应用。
同理,采用Power BI和R语言组合应用,审计人员可以容易地进行被审计股票交易数据的热力图可视化分析,其结果如图7。在以上组合应用的基础上,审计人员可以采用Power BI的筛选器功能,方便地选择部分分析结果做进一步详细分析。
六、总结
本文根据目前国内外开展大数据审计的实际需要,探索了基于Power BI和R语言组合应用的大数据可视化审计方法,并结合案例分析了该方法的应用。通过本文的研究,不难发现:采用Power BI和R语言组合应用,可以充分发挥二者的优势,规避其不足。例如,对简单问题的数据可视化分析,审计人员直接采用Power BI完成,无需编写相关程序代码;对复杂问题的数据可视化分析,可以借助R语言通过编写简单的代码完成数据可视化分析。基于Power BI和R语言组合应用的大数据审计可视化分析方法,审计人员无需系统地掌握R语言的详细功能和复杂的编程操作,方便了一般审计人员的使用。
【主要参考文献】
[1] GTAG.Understanding and auditing big data [EB/OL].http://www.theiia.org,2017.
[2] AICPA.Reimagining auditing in a wired world[EB/OL].http://www.aicpa.org,2014.
[3] GEPP A,LINNENLUECKE M K,O'NEILL T,et al.Big data techniques in auditing research and practice:current trends and future opportunities[J].Journal of Accounting Literature,2018,40(1):102-115.
[4] 陳伟,居江宁.大数据审计:现状与发展[J].中国注册会计师,2017(12):77-81.
[5] 陈伟,SMIELIAUSKAS W.大数据环境下的电子数据审计:机遇、挑战与方法[J].计算机科学,2016(1):8-13.
[6] 陈伟,居江宁.基于大数据可视化技术的审计线索特征挖掘方法研究[J].审计研究,2018(1):16-21.
[7] 陈伟.基于可视化分析技术的大数据审计案例研究[J].中国注册会计师,2019(6):61-64.
[8] 陈伟,詹明惠.基于大数据可视化技术的信息系统AC审计[J].会计之友,2021(1):120-125.
[9] 陈伟.基于大数据技术的BCM审计方法研究[J].会计之友,2019(11):113-116.
[10] 章轲,张冬霁,梁轩瑞,等.大数据审计中要做到的“三个把握”[J].审计研究,2018(5):30-34.