审计全覆盖驱动下大数据审计平台构建研究
2021-06-01刘国城马欣萌徐志
刘国城 马欣萌 徐志
【摘 要】 大数据技术的发展改变了传统审计模式,拓展了审计的范围和领域,为国家大数据审计工作注入了活力。审计全覆盖赋予了国家审计新的使命,也對大数据审计平台的建设提出了新的挑战。在审计全覆盖总体目标驱动下,大数据审计平台的建设与创新工作尤为重要。文章结合云计算相关技术,运用较为成熟的Hadoop系统,尝试建立审计全覆盖驱动下的大数据审计平台,并从大数据审计平台构建的需求、理念和策略三个方面进行分析,将大数据审计平台分为数据中心、采集、预处理、分析和可视化五个系统,以此探索有效的审计新路径、新方法,以期为审计全覆盖提供技术基础,为未来大数据审计工作的开展提供理论支持。
【关键词】 审计全覆盖; 国家审计; 大数据审计; 审计平台建设
【中图分类号】 F239.44 【文献标识码】 A 【文章编号】 1004-5937(2021)11-0125-08
2014年国务院印发《关于加强审计工作的意见》,2015年中共中央办公厅、国务院办公厅印发《关于完善审计制度若干重大问题的框架意见》和《关于实行审计全覆盖的实施意见》(以下简称《意见》),这些文件确定了审计全覆盖的总体目标。党的十八届四中全会提出:“完善审计制度,保障依法独立行使审计监督权,对公共资金、国有资产、国有资源和领导干部履行经济责任情况实行审计全覆盖。”当前,以大数据为重点的“金审三期”工程顺利开展,审计大数据信息化的建设为实施审计全覆盖提供了重要的数据资源与处理工具。运用大数据技术推动审计技术的革新和审计管理平台的优化,是实现审计全覆盖、实现国家治理现代化与信息化的重要途径。
一、理论梳理与回顾
(一)大数据审计在我国的应用与发展
新时代,大数据审计技术方法不断更新和改进,在我国的应用范围也越来越广。邱玉慧等[ 1 ]利用海量微观的社会保险大数据进行审计评价,充分运用可视化技术,初步印证了海量微观的社保大数据在评价养老金调整现状、评估不同待遇调整方案方面的优势。郑志元[ 2 ]从全量审计、持续审计、风险导向、智能审计、人本审计思维分析商业银行内部审计理念的转型。王李[ 3 ]认为商业银行内部审计广泛应用大数据的前提是区分全量与抽样的差别、处理好效率与精确的关系以及注意数据挖掘对象的因果关系。郑伟等[ 4 ]基于大数据环境下的数据式审计模式并从逻辑流程、网络构架和应用架构三个维度设计数据式审计模式与路径。陈伟等[ 5 ]研究了基于Benford定律的大数据审计方法。王会金等[ 6 ]指出随着大数据审计技术创新发展,数据量愈发庞大,大数据安全审计问题的解决更加依托于科学的审计技术方法,通过云提供商和云租户之间的责任划分建立政务云安全审计运行框架,可以为大数据时代政务云安全管理实践提供思路。赵圣伟等[ 7 ]基于金融审计大数据的证券市场交易异常模型,创新了大数据环境下的审计数据分析和应用模式。湖北省审计学会课题组[ 8 ]以湖北省医保审计实践为例,在医保审计中创新应用软硬件技术和大数据挖掘技术,为审计全覆盖提供了技术基础和思路。
(二)审计全覆盖理念对大数据审计的驱动作用
审计全覆盖是新时期我国大数据审计发展的主要方向,是国家审计监督能力提高的关键依据。审计监督经历了财务审计、经济责任审计、绩效审计等阶段,大数据下审计环境的变化与国家治理共同要求审计监督更具全面性。2015年进入包含离任审计在内的全覆盖审计阶段,审计全覆盖理念推动了大数据审计的广泛应用。首先,审计全覆盖背景下,传统审计逐步转变为利用全面样本、更加追求效率、注重相关关系的大数据审计,审计环境发生变化,政府审计模式发生转变(魏祥健,2016)。Danielle等[ 9 ]认为,大数据时代,模式识别、数据挖掘、自然语言处理等技术的应用将提高数据分析的预测能力。Michael Alles等[ 10 ]基于理论证据研究大数据技术纳入财务报表审计的优势与障碍,并确定了可能使审计师受益的大数据具体方面。陈伟等[ 11 ]强调面对复杂的审计大数据,大数据分析技术正处于发展阶段,大数据环境下电子数据审计面临机遇与挑战,审计的思路与理念应紧随时代的发展持续创新。其次,审计环境变化,审计技术进步,为大数据审计带来了应用范围、框架路径、机制方法等方面的创新。戚振东和尹平[ 12 ]从国家治理视角研究了国家审计全覆盖的发展创新问题,分别是以资金权力运行为主线拓展政府审计范围、以协同审计创新国家审计运行机制、以治理目标导向创新国家审计模式、以职能分工授权拓展业务流程来完善国家审计职权等方面。Earley[ 13 ]和朱玲玲[ 14 ]分析大数据、云技术对审计监督全覆盖的影响,指出审计计划、执行等阶段下大数据和云技术给审计监督全覆盖带来机遇和挑战。刘亚男等[ 15 ]从机构设置、人员力量、审计结果、整改落实、联席会议制度执行、领导干部权责、评价指标体系等方面指出了我国高校经济责任审计普遍存在的问题,提出改进对策,以充分发挥审计的免疫系统作用,进一步促进高校强化经济责任审计。陈桂云[ 16 ]从突破组织边界和借助资源共享两个方面对审计全覆盖的实现路径进行探索分析,为加快审计全覆盖的实现提供了有益借鉴。陈骏和时现[ 17 ]提出审计全覆盖驱动下的审计技术方法创新应以目标性、系统性、组织性为核心,探索审计技术方法创新的理论框架。
(三)审计全覆盖驱动下大数据审计平台构建的理论支撑
目前有关大数据审计的研究文献相对偏少,且注重理论研究,研究范围普遍停留在社会科学视角,而结合数据与信息科学的研究较少。我国对大数据审计的研究正处于逐步完善的过程中,未来应更加注重应用与实践研究,从技术方法上积极融入信息学和工程学的相关知识,例如数据挖掘技术、可视化技术、审计取证技术等,不断更新方法,攻克技术难题。《意见》要求“审计机关应当进一步构建国家审计数据系统和数字化审计平台,积极运用大数据技术,加大业务数据与财务数据、单位数据与行业数据以及跨行业、跨领域数据的综合比对和关联分析力度,提高运用信息化技术查核问题、评价判断和宏观分析的能力”。我国大数据审计的实务工作正在建设之中,审计全覆盖将会推进我国大数据审计工作更加有序地开展,并为大数据审计理论的创新发展提供支持。
审计全覆盖驱动下构建大数据审计平台,可以有效提高国家治理能力,顺应我国大数据审计的发展要求。大数据审计平台通常可以细化为采集、预处理、分析、可视化四个子平台[ 18 ]。采集数据时,可以基于孤立点分析方法构建审计抽样模型[ 19 ],利用DBSCAN聚类算法对审计抽样关联规则进行聚类,建立审计样本与目标的关联规则[ 20 ]。预处理数据时,需要衡量电子数据审计取证的模式及适用场景和条件[ 21 ],利用远程数据审计方案以验证存储数据的完整性[ 22 ]。牛艳芳等[ 23 ]阐述了审计大数据网络分析的相关理论和方法,提出审计大数據网络分析平台建设框架,概括“点、线、面、块”的网络分析方法体系。陈伟等[ 24 ]基于大数据可视化技术对审计线索特征进行了挖掘。当前我国审计全覆盖与大数据未完全融合,被审计单位信息化程度、审计人员的差异以及审计数据的复杂性导致基于审计全覆盖的大数据审计平台构建存在一定的难度。为此,本文在审计全覆盖的要求下,结合大数据平台构建思路,分析了审计全覆盖驱动下的大数据审计平台的建设理念和路径。
二、审计全覆盖驱动下大数据审计平台构建的现实需求
(一)要求审计人员拥有大数据思维
从审计意识出发,审计全覆盖要求审计人员具备大数据思维,树立全局观念,实现审计工作的上下联动。传统模式下的审计人员往往缺少大数据关键性技术与思维,大数据审计的高端知识型人才培养存在断层,短时期内难以达到理想的目标与效果,这就要求当代审计人员转变思维。首先,由抽样审计思维向具有完整性的总体审计思维转变。传统的审计模式根据局部抽样总结个体特征,推断全局规律,而大数据环境要求分析与审计对象所有的相关数据,实现总体审计。其次,由追求数据精确度向追求数据及时性和使用效率转变。大数据审计面对的海量数据大多是半结构化与非结构化数据,数据量的规模性扩大要求审计人员必须转变思维,更加注重非结构化数据的利用,学会处理海量数据,追求样本全貌,提高数据利用效率。再次,由事后审计思维向事前、事中审计思维转变。传统的事后审计逐步转变为面向全局的全过程审计,大数据审计更加重视事前审计、事中审计,同时要求审计人员更加注重对数据的实时监控,在项目进展过程中实时从业务活动中抽取和控制审计信息,及时有效地进行风险监控和防范。最后,由因果关系思维向相关关系思维转变。面对海量数据,挖掘审计证据不必过于深究其因果关系,而是对所有的相关数据进行采集、挖掘、分析和整理,找出隐含的关系,从多层次、多领域、多角度的海量数据中提炼问题,揭示共性规律,分析过去、捕获现在、预测未来,满足审计全覆盖的要求。
(二)要求审计人员拥有强大的数据处理能力
从审计技术应用来讲,审计全覆盖要求运用大数据技术提升数据采集、整理和分析能力。面对全覆盖审计数据的海量化与审计对象的复杂化,加之信息化高端人才紧缺[ 25 ],采集提炼、存储整理、分析处理数据的审计任务异常艰巨,因而审计人员需要具备相关的大数据分析处理能力。首先,要具备从宏观角度处理海量数据的能力。在具备基础技术及知识的基础上,利用计算机软件对所有相关数据进行采集和整理,将结构化的数据进行分析,将半结构化、非结构化的跨领域、跨层次、跨行业的数据进行加工和转换,以易于理解的形式加入总体分析框架之中,对海量审计数据和资源实施整体、全面、深入地分析,避免管中窥豹、顾此失彼,为推进审计监督全覆盖提供技术方面的支持。其次,要具备数据采集和挖掘能力。大数据之所以“大”,是因为有广泛的数据。国家审计准则要求政府各个部门的每一笔收支都备案,每一笔资金去向都可供检查,然而一些人员为一己之利,将违法违纪的行为“抹去”,进而使得数据来源受限,审计监督受到制约。因此,审计人员要注重从非结构数据中获取充分和适当的审计证据,挖掘更细微、深入的信息,由“面”到“点”,具备多维度、深层次分析数据的能力,能够发现隐藏在数据细节中更具价值的信息。最后,要具备大数据关联分析的能力。掌握基本的计算机技能与大数据分析工具原理和运行思路是推进大数据时代发展的必要条件。审计人员需要具备专业知识和技能,利用信息技术,综合比对业务数据与财务数据、单位部门之间的数据、行业数据、跨行业和跨领域数据,将最终的审计成果同被审计单位相关联,为今后的审计工作提供经验基础,从而节省人力和时间成本,有效提高审计工作的效率。
(三)要求依托强大的数据库系统和云共享平台
为了更好地顺应大数据时代需求,尽快满足审计全覆盖要求,并综合利用大数据技术优势,应构建国家审计数据信息系统和云共享平台。大数据时代下实施国家审计需要注重数据采集和存储、数据分析、数据可视化等环节,要求加大审计资源统筹整合力度,增强审计监督整体效率和功能。如今全国各地都逐步开展大数据审计建设工作,尝试建设大数据信息系统和云共享平台,但尚存在一系列问题,重点是非结构化数据利用率低、数据库类型单一、数据安全储存技术不完善等,在这样的环境下,海量数据和资源得不到充分的采集和利用。《意见》指出,“建立审计成果和信息共享机制,加强各级审计机关、不同审计项目之间的沟通交流,实现审计成果和信息及时共享”。审计全覆盖要求政府有关部门、金融机构和国有企事业单位开放数据系统查询权限,以适应审计工作的需要,加大数据的集中度,在审计过程中注重潜在数据的获取和分析,对获取的数据和资料严格保密,提升效率的同时注重数据安全性。审计工作要做到统筹计划,在充分了解审计对象的基础上,建立分行业、分领域审计数据库,突出审计重点、统筹规划全局,保证在一定周期内实现审计全覆盖,提升数据的及时性和使用效率,积极探索审计实时监督系统,实施联网审计,为数据库信息系统和云共享平台的逐渐成熟提供理论和技术支持。
三、审计全覆盖驱动下大数据审计平台的构建理念
(一)应用开源Hadoop技术,提高数据处理能力
传统的数据中心存储能力是有限的,且存储处理的数据大多为结构化数据,如Oracle、MySQL等关系型数据库所存放的数据(谢志明等,2016)。现如今,NoSQL技术出现,将来自数字媒体、物联网、互联网等机构的多领域、多层次、多元化数据交织混杂在一起,数据类型不再是单一的结构化数据,更多的是半结构化数据和非结构化数据。传统数据中心无法存储如此庞大的数据量,存储空间不足,不能满足现代审计全覆盖下大数据分析的要求,因而传统的审计数据库和数据分析系统应有所改进,审计人员对大数据处理和分析的工作面临挑战。Hadoop系统是基于Java技术的软件框架,开源的Hadoop数据中心能够很好地解决数据存储和处理难题,核心技术是分布式文件系统HDFS和分布式计算框架MapReduce,它解决了大数据审计工作面临的两大难题:存储和分析。随着大数据应用技术的不断发展,Hadoop系统进一步引入HBase(Hadoop Database)。HBase强化系统存储能力,性能更强、可靠性更高,为提高数据的存储、分析和计算能力提供了更好的技术条件。
Hadoop系统采用分布式文件系统HDFS作为底层架构,将上传的数据进行分布式储存和处理,通过热插拨方式,迅速增加磁盘的空间并进行维护处理,大大降低了管理和维护的消耗及成本(谢志明等,2016)。安全监测平台通过运用组件技术将界面控制、业务逻辑和数据映射分离,迅速应对业务变化的需求,实现系统内部的松耦合。基于Hadoop系统搭建起来的数据中心目的是将多台计算机利用网络连接起来,在统一的管理系统控制下,协调合作完成大型数据处理任务,从单一的服务器实现上千台机器的联系与扩展,每一个体机器都可以提供本地储存和计算[ 8 ]。在文件存储写入时,将文件基本信息放置于主节点,切分成文件块分布存储置于各子节点主机,因此海量审计数据储存于Hadoop数据中心是行之有效的。
(二)重视非结构化数据,提升数据利用价值
大数据环境下大量的非结构化审计数据为处理分析工作增加了难度,研究如何对非结构化数据进行有效利用具有重要的实践意义。在Hadoop系统的不断完善和优化下,其具有存储和计算海量非结构化数据的能力。分布式文件系统HDFS、分布式数据库HBase以及分布式计算框架MapReduce组成的Hadoop生态系统,对非结构化数据进行统一管理,有效实现了数据共享,有利于打破数据孤立的局面。大数据环境下,浏览和筛选等方法无法满足非结构化数据审计的需要,Hadoop系统可以对一些过去无法采集到的数据进行分析,通过大数据分析系统处理之后得到可视化信息,具体如图1所示。
大数据环境下,可利用网络检索相关数据,再接入大数据审计平台,建立分析模型。大数据审计平台为审计大数据的采集、存储、挖掘和管理提供良好的服务,为审计人员提供关联分析和深度挖掘的相关工具和应用界面,最终便于利用相应的数据挖掘算法进行预测性分析。同时,服务平台的可视化系统为提升数据利用价值提供了重要途径。对网上公开数据源采集的相关非结构化数据,在数据预处理基础上可对非结构化数据进行可视化分析,将非结构化数据中的内容和规律化为视觉符号,向审计人员展示,审计人员从中获取信息和重点,发现线索,找出审计证据。构建这种数据平台管理模式降低了审计数据管理风险,通过开展联网动态监测审计并深入挖掘,实现对非结构化数据的最大利用效率。对此,审计人员有责任和义务遵循国家法律法规,积极履行审计监督全覆盖职责,保护国家和人民财产不受侵犯。
(三)加强审计信息共享,强化数据实时分析
为了建立健全大数据审计信息共享机制,使数据不受时间和空间的限制,审计人员可以进行联网审计,通过客户端远程访问被审计单位的数据库。各级审计机关利用互联网及时掌握被审计单位的各项信息,将各自的审计报告和审计资料全部录入平台(靳思昌,2018),简化流程,这样审计人员则无需关注数据储存和采集等问题,而是侧重于审计任务本身。云审计平台可以提供信息审计服务和信息监管服务,提升平台的安全可信性[ 26 ],审计机关在节省现场审计成本的同时可以获取全面的数据和信息;当出现异常指标时再进行现场审计,节省时间成本,实现审计监督的动态化,打破目前各单位、各部门间的信息壁垒,提高审计工作的效率,实现数据共享,实施信息动态管理。云审计平台的出现,搭建了远程与现场审计的网络系统,应用Hadoop的分布式存储系统联结各离散存储单元形成强大的横向和纵向数据网络,如图2所示,为各个政府部门之间和审计机关之间的数据共享奠定了基础,为实施实时审计提供了可能。
构建云审计平台虽然为存储和分析海量审计数据提供了优势与便利,但也存在一些不足。首先,审计数据更加注重时效性,需要及时分析。Hadoop系统相比于Storm流式实时计算系统略显弱势,商业化运用Storm系统如支付宝、淘宝等,实时计算交易量、注册量等信息,分析处理计算功能已经较为成熟,如果国家审计可以借鉴此系统,那么实时监测、审计全覆盖的目标将能尽快实现。其次,大量半结构化、非结构化数据有可能被不法分子盗取,存在安全隐患。我国政务云安全审计正处在探索和发展阶段,其要求完善信息安全学科体系,保证数据内容安全、系统安全,掌握信息管控技术、安全等级及安全测评技术、密码应用技术等,提升云服务的保密性和完整性。实时分析处理功能的提高、信息安全问题的改善,将会对国家审计部门的工作产生质的影响,真正意义上实现“用数据显示真相、用信息反映事实”。
(四)强化部门联合效應,有效实现审计全覆盖
大数据背景之下,审计过程不仅要重视部门内部的审计,而且打造部门之间的联合效应也是实现审计全覆盖目标的重要手段。审计机关需要站在整体全局的角度拥有大数据审计格局,综合考虑部门内部、部门上下级之间、部门与行业之间的配合、联系与协作。审计项目大都涉及多个政府部门,包括财政、税务、公安、人力资源和社会保障等多个单位,仅仅依靠审计机关的单独作业难度较大,审计机关和各个部门之间都要依照审计全覆盖的要求,树立全局意识,形成部门与部门之间的密切配合与高效协作,找出具有规模效应的有价值的审计数据、审计线索、审计证据,共同促进我国大数据审计事业的发展。
伴随信息技术的发展,审计机关要充分认识到部门联合对国家审计全覆盖的重要性。国家审计需要的不仅仅是审计报表等结构化数据的真实可靠性,还更为需要对海量审计数据的现实反映。审计机关应该依靠和利用大数据审计平台,整合各有关部门的数据信息,深入挖掘被审计单位容易隐藏的问题,形成部门之间相互监督、相互作用的机制(见图3),对整体审计工作提出有效的对策建议,发挥政府监管的“免疫系统”功能。审计全覆盖要求审计项目与财政审计、金融审计、企业审计、资源环境审计、涉外审计等相结合,在一定的时间周期内依法对属于审计监督范围的所有管理、分配、使用公共資金、国有资产、国有资源的部门和单位进行审计,优化过程分析,促成审计成果,实现审计全覆盖,发挥审计功能。
四、审计全覆盖驱动下大数据审计平台的构建策略
大数据审计平台的建立是提高审计机关数据分析能力的基础。多数在建的大数据审计平台均属于静态批量模式,其特点是先储存后计算,对数据的准确性和全面性要求较高,以此为代表的有Hadoop系统,经过不断地更新和优化,其三大基础HDFS、MapReduce和HBase已经发展为由60多个相关组件组成的庞大生态系统,包括数据存储、执行引擎、编程和数据访问框架等。本文应用Hadoop系统,将大数据审计平台分为数据中心、采集、预处理、分析和可视化五个系统,以期实现审计全覆盖的总体目标,具体流程如图4所示。
(一)数据中心
随着大数据技术的不断发展,海量数据呈现集中化的趋势。数据类型主要有结构化数据(如被审计单位的财务数据、业务数据等)、半结构化数据和非结构化数据(如经营战略、社会关系、组织结构、经验数据、管理数据、预测数据、Web数据、日志数据,包括所有格式的办公文档、文本、图片、XML、HTML、报表、图像、音频和视频等信息、被审计单位的非货币性数据等)。其中非结构化数据占比巨大,潜藏着庞大的应用价值。这些审计数据并非散乱式获取与机械化堆砌,Hadoop系统下可利用成熟的技术工具将其有机融合、合理存储、有效处理。
数据中心的主要目的是归集各类型相关数据,实现对审计资源的合理配置,对审计信息的充分利用,挖掘审计线索,确定审计重点,查找审计疑点,提高审计工作的效率。审计机关分类建立财政、经济责任、国家资产等数据库,将搜集到的与审计对象相关的全部数据按照类型存入数据系统。建立数据中心有利于获取之前审计的经验和成果,为再次审计奠定基础,节省人力和时间成本,使事前、事中、事后全过程审计的实现不再是空谈,对进一步达成审计监督全覆盖的目标提供基础支撑。
(二)数据采集系统
大数据审计的基础任务是收集足够的与审计项目相关的数据信息。建立专业化的数据采集系统,有利于整体把握审计项目,有效获取数据,最终从海量数据中获取具有潜在价值的规律和事实,完成审计任务。采集系统是数据中心的重要保障,为数据预处理提供了可能。
数据采集系统是指将审计机关和被审计单位的数据库通过专业化工具方法连接起来,进行数据共享。常用的审计数据采集方法主要有直接复制、通过中间文件、通过ODBC接口、远程联网等。Hadoop系统下的采集框架主要有Apache Sqoop实现数据的自动传输,Apache Flume收集可靠的日志数据,Gobblin负责整合数据源,同时Datax负责异构数据的稳定性。除此之外还有大数据采集技术,例如网络爬虫等网络数据采集方法,Hadoop系统的Chukwa等日志数据采集方法。数据存储是数据采集之后存放数据的系统,通过构建Hadoop分布式框架的HDFS和HBase,可以完成即时的操作读写功能,便于审计数据的即时储存和利用。
(三)数据预处理系统
大数据审计预处理系统主要起到了承上启下的作用,系统针对采集之后的海量数据进行预处理,包括对结构化数据去重复值或有误值,对半结构化和非结构化数据通过预处理系统转化为可供理解、易分类、易分析的结构化数据。目前常用的方法主要有数据类型转换、名称转换、横向纵向合并、空值处理等。
大数据审计的预处理系统包括数据清洗、数据挖掘、数据转换三项流程。数据清洗,需要多重清洗方法相结合,以迎合审计大数据的多样化和多元性。通过设置规则,确保数据合法性;通过补全信息,提升数据完整性;通过去重,促进数据的唯一性。数据挖掘,主要是运用先进的软件技术,根据不同的审计目标选择不同的方法,对清理过和筛选出的数据进行分析。数据挖掘可以发现数据之间的异常关系,提取有价值的信息,提供精准的审计证据。数据转换,涵盖数据内容的截取、数据格式的转化、数据的拆分与合并,是将不同格式与语义的源数据转化为被审计用户所理解、与目标数据相一致的数据整合过程。审计人员必须明确转换任务,明晰转换类型与转换格式,进行数据拆分与合并。
(四)数据分析系统
大数据的核心价值在于使用大数据技术深层次挖掘和分析来自政治、经济、财政、环境、金融、企业等各种类型的数据。由于被审计单位舞弊手段的复杂多样及隐蔽性,必须以“金审工程”为依托,通过财务数据同业务数据的关联分析、上下级单位之间的纵向分析、各部门之间的横向分析、单位数据与行业数据的比对分析、跨领域数据的综合分析等,对重大财政资金、重要投资项目进行深入查究,充分利用审计信息数据库系统,发现潜在的规律和可加以利用的信息,找出审计疑点,获取审计线索,搜集审计证据。除此之外,审计人员应对数据时刻保持敏感,探索异常数据快速排查方法,确定审计重点,对带有普遍性、倾向性的问题进行挖掘,发现问题相关关系,实现真正意义上的审计监督全覆盖,提高审计效能。
为满足大数据环境下数据分析的需求,要依靠专业化信息技术的发展与创新。Hadoop系统中MapReduce和Yarn是基于Hadoop平台的并行计算框架,它们对大数据进行标准化分析,利用Mahout和R语言进行深度挖掘及关联分析,实现分析数据共享。借助上述技术的创新应用,有利于审计数据的实时分析。
(五)数据可视化系统
审计过程中,单调乏味的数字、晦涩难懂的结论、海量的数据严重影响着审计工作的效率以及审计人员对审计工作的热情,现代信息技术的不断完善促进了可视化技术的发展,并以此提高了审计工作效率,审计人员只需关注审计任务本身而无需为繁琐的数据烦恼。数据可视化技术有助于审计人员对审计大数据进行直观分析和探索疑点。同时,数据可视化技术借助一系列工具和手段,能够高效地沟通信息,帮助审计人员快速发现问题。另外,数据可视化方便了大数据审计成果的展示,可以提高审计效率,使被审计单位大数据的分析结果更有意义。大数据时代,审计人员要想洞察被审计单位数据存在的问题,就必须不断发展数据可视化技术。
当前,已有众多方法可供审计主体运用,这些方法支持可视化建模分析,同时为可视化结果呈现提供便利。可视化结果呈现主要是将繁琐复杂的审计数据通过信息技术手段表达出来,展示成网络图、维恩图等,为审计结果使用者做出审计判断提供便利。审计人员可以根据审计目标和评估指标,对可视化结果进行综合判断,以便更为深入地论证审计结论。
五、结语
当前,大数据应用已经渗透到政治、经济、社会等各个层次和各个领域,以强大的冲击力深刻地影响和改变着人们的工作、生活和思维方式。审计全覆盖与大数据平台的建设相互作用、相辅相成,共同推动我国大数据审计的发展。在国家审计全覆盖总目标的驱动下,为顺应时代发展的潮流,应建立和优化大数据审计平台,完善数据中心、采集、预处理、分析、可视化五个系统,实现各系统相互配合、相互支持和无缝连接,同时建立国家级大数据审计平台,最大程度共享数据,实现审计全覆盖目标,有力推进国家审计的常态化、流程化与智能化。
【参考文献】
[1] 邱玉慧,吕天阳,杨蕴毅.基于大数据的企业基本养老保险待遇调整绩效审计分析:以X省为例[J].审计研究,2014(3):106-112.
[2] 郑志元.大数据下的银行审计思维[J].中国金融,2016(14):52-53.
[3] 王李.大数据关注点在商业银行内部审计中的应用:以M银行为例[J].会计之友,2016(16):110-112.
[4] 郑伟,张立民,杨莉.试析大数据环境下的数据式审计模式[J].审计研究,2016(4):20-27.
[5] 陈伟,吴正,刘海.基于Benford定律的大数据审计方法研究与实现[J].中国注册会计师,2017(9):80-84.
[6] 王会金,刘国城.大数据时代政务云安全风险估计及其审计运行研究[J].审计与经济研究,2018,33(5):1-11.
[7] 赵圣伟,吴雨横.基于金融审计大数据的证券市场异常交易模型探讨[J].审计研究,2018(5):17-21.
[8] 湖北省审计学会课题组.大数据技术在审计全覆盖中的应用研究:以湖北省医保审计实践为例[J].审计研究,2018(1):11-15.
[9] LOMBARDI D,BLOCH R,VASARHELYI M A. The current state and future of the audit profession[J].Current Issues in Auditing,2015,9(1):10-16.
[10] ALLES M,GRAY G.Incorporating big data in audits:identifying inhibitors and a research agenda to address those inhibitors[J]. International Journal of Accounting Information Systems,2016,22(7):44-59.
[11] 陈伟,SMIELIAUSKAS WALLY.大数据环境下的电子数据审计:机遇、挑战与方法[J].计算机科学,2016,43(1):8-13,34.
[12] 戚振东,尹平.国家治理视角下的审计全覆盖:一个理论框架[J].学海,2015(6):107-112.
[13] EARLEY C E. Data analytics in auditing:opportunities and challenges[J].Business Horizons,2015(5):493-500.
[14] 朱玲玲.大数据、云技术对审计监督全覆盖的影响研究[J].中国注册会计师,2016(6):85-88.
[15] 刘亚男,张文承,郝素彬.审计全覆盖下高校经济责任审计问题及对策[J].会计之友,2017(12):124-128.
[16] 陈桂云.审计全覆盖面临的“壁垒”及其实现路径[J].会计之友,2018(9):90-93.
[17] 陳骏,时现.审计全覆盖驱动下的审计技术方法创新研究[J].审计研究,2018(5):22-29.
[18] 刘国城,王会金.大数据审计平台构建研究[J].审计研究,2017(6):36-41.
[19] 孙玥璠,宋迪.大数据环境下基于孤立点分析的审计抽样方法[J].财务与会计,2015(14):71-73.
[20] 程平,陈珊.大数据时代基于DBSCAN聚类方法的审计抽样[J].中国注册会计师,2016(4):76-79.
[21] 程铖,李睿.电子数据审计取证模式研究[J].审计研究,2016(5):8-13.
[22] SOOKHAK M,GANIA A,KHAN M K,et al.Dynamic remote data auditing for securing big data storage in cloud computing[J]. Information Sciences,2017,380(2):101-116.
[23] 牛艳芳,薛岩,邓雪梅,等.审计大数据关联的网络分析平台构建及应用研究[J].审计研究,2018(5):35-42.
[24] 陈伟,居江宁.基于大数据可视化技术的审计线索特征挖掘方法研究[J].审计研究,2018(1):16-21.
[25] 刘国常,胡枫.大数据助推政府审计全覆盖路径研究[J].会计之友,2018(18):98-101.
[26] 秦荣生.大数据、云计算技术对审计的影响研究[J].审计研究,2014(6):23-28.