大数据环境下的政府审计实施框架
2019-10-08贾凯
贾凯
大数据、云计算概念和关系
(一)大数据的概念。大数据,亦可称海量资料,是指现在市场上的主流软件工具都无法在一定的时间内完成分析、处理,并将其转化成为有用信息的海量数据。而大数据技术既是指快速高效的从各种复杂繁多的类型数据中获取有价值信息的能力。大数据具有四个特点:一是数据体量级别跃升,从TB到PB,不单是采集量大,其存储和计算量也非常巨大。二是速度快、时效性高,这是大数据与传统数据挖掘技术的最主要区别,例如用户在搜索引擎上可以检索到刚刚发生的新闻。三是数据类型多样,从海量的结构化数据,以及位置信息、图片、视频、音频等等各种各样类型的半结构化和非结构化数据中,通过分析计算,找到数据价值,是大数据所要解决的问题。四是价值密度低,商业价值高,随着信息技术的快速发展,各行各业中互联网、物联网的应用无处不在,产生的数据量在几何倍数的增加,单一数据的呈现并不能产生价值,二若把相关数据聚集在一起并进行深入挖掘就会产生很高的商业价值。在大数据的思维下,我们不要抽样要全体、不要精确要效率、不要因果要相关。大数据改变了人们收集、处理和使用数据的方式,促使着会计、审计思维方式的转变,而这些改变则推动着财务管理模式的转变,影响着审计技术和手段的发展。
(二)云计算的概念。云计算是虚拟化(Virtualization)、效用计算(Utility Computing)、基础设施即服务(IaaS)、平台即服务(PaaS)、软件即服务(SaaS)等概念混合演进并跃升的结果,是一种新兴的共享基础架构的方法,它最核心的技术就是将大量用网络连接的计算资源统一管理和调度,构成一个计算资源池对用户提供按需服务,提供资源的网络被称为“云”。在云计算的环境下,为了使用户能够快速、便捷、准确、高效的访问“云”中的数据,云计算的服务供应商不仅要能够提供给用户足够大的存储空间,还要能够提供速度快、准确性高的计算能力,将服务器、网络、存储和各种应用软件集中在一个资源共享空间内,使用户能够随时随地通过互联网访问数据,并将用户每一次处理的数据保存在互联网的数据中心,方便用户以后随时调取使用。这种模式使得管理费用大大降低,应用体验感受大幅提升。
(三)大数据和云计算的关系。大数据和云计算可以看作是一个硬币的正反两面。大数据的特点决定了普通的单台计算机无法满足其功能需求对数据进行有效处理,而必须采用分布式计算架构,依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术,对海量数据进行有效挖掘,找到有价值信息。大数据技术的重点在于对海量数据的存储能力,同时提供数据采集、挖掘、分析的技术和方法,它着眼于“数据”,专注点在实际业务中。云计算技术的重点在于对海量数据的计算能力,也就是数据处理能力,它着眼于“计算”。大数据的海量数据存储和云计算的海量数据处理是相辅相成、缺一不可的,二者只有同时作用于数据时才能使相关数据产生价值。
大数据、云计算对政府审计的影响
(一)扩大政府审计范围。现阶段的政府审计工作,由于技术手段和从业人员的专业水平限制,无法对被审单位的所有数据进行梳理和辨别,通常是根据重要性水平,抽样进行审计分析。而在大数据时代,云计算技术的不断发展,使得审计的样本量不断扩大,从传统的抽样审计逐渐过渡到全覆盖审计,因此可以规避掉审计抽样风险。同时,审计范围的扩大,也对数据的存储、分析和挖掘力起到一个推动作用,使得大数据审计的技术能力不断发展。
(二)丰富政府审计数据。传统政府审计的数据主要为财务、业务等企业内部的结构化数据,但对企业的规章制度、会议记录等非结构化的数据应用较少,且人为影响因素较大。在云计算平台下,数据存储空间及处理速度大幅度提升,对结构化和非结构化数据的处理水平也大大提高,因此可用数据越来越多,数据来源更为广泛,快速、便捷、高效的获取非标准化数据和各种类型的外部数据成为可能。
(三)促进政府审计成果应用。当前,拥有固定的格式,且内容相对单一、信息量相对较少的审计报告仍然是审计工作的最主要的成果。随着大数据、云计算技术在审计中广泛应用,审计工作进行过程中产生的各种信息数据也逐渐被重视。通过对这些数据的深入挖掘,并与内控、薪酬等等规章制度,以及外部数据的关联,能够从中找出财务、业务和经营管理等方面存在的问题和发展趋势,总结出内在规律,并将其汇总归纳为宏观性和综合性较强的审计信息,提供给被审计单位的管理层和决策层,从而通过审计促进被审单位完善内部制度、提高管理水平,同时提高审计成果的综合应用效果。此外,大数据、云计算技术还能够将审计过程中发现的问题规则化并固化到系统中,并通过与同行业标杆企业相同问题进行对比,设置预警模型,向被审计单位进行预警。
(四)加速大数据审计师培养。现阶段的政府审计工作要求审计人员掌握相应的会计、审计知识,具备过硬的专业素质和职业道德,同时拥有一定的审计经验。但是,在大数据、云计算时代,数据的真实性是一切的基石,倘若数据不真实,那么无论怎么计算都不能得到有价值的结果,因此,对数据真实性的验证就成了重中之重。在这样的前提下,就产生了数据审计师这一职业。数据审计师除了能熟练掌握审计相关知识以外,还应该是数学、统计学、以及计算机科学等领域的专家,应该具备大数据分析和预测的评估能力,同时也要与审计人员一同恪守职业道德。
大数据政府审计实施框架
大数据环境下政府审计的主要任务是通过构建一个支撑平台,实现对审计数据的分析和处理,将审计系统和数据挖掘技术结合起来,找到结合的突破口。运用大数据技术对被审计单位运行过程中产生的大量业务数据与财务数据,以及与被审单位相关的外部数据进行深入的分析,形成疑点数据,取得审计线索。基于以上理解,本文根據审计项目实施流程,构建了一个大数据时代审计实施框架,见下图:
大数据环境下的政府审计是按照统一的行业审计模型,通过云平台数据中心来实现数据采集、数据转换、模型和方法制作,并利用数据之间的相关关系得出相应的审计线索。审计部门可以从云平台数据中心,调出被审计单位的数据,并通过云平台审计系统进行数据的分析和处理。
(一)数据采集。大数据审计实施的基础是数据采集,以审计目标为出发点,在被审计单位内部的企业资源计划系统(ERP)及业务管理系统(EIS)中,采集与审计目标相关的各种类型数据,同时通过网络将被审计单位内部各个系统与审计系统直接链接起来,审计人员就可以通过审计系统直接访问被审计单位的内部各系统,进而修复、筛选出真实、可靠、相关的审计数据,形成数据层。
(二)数据清洗。首先对收集来的源数据进行抽取、转换、清洗、集成,加载,再通过ODS、DM、OLAP等数据分析与数据挖掘技术对清洗过的数据进行有针对性加工,提炼出有价值合乎审计目标的数据。
(三)数据存储。清洗过的数据采用分布式存储的方式存储在数据中心。
(四)数据分析。通过逻辑数据模型对清洗过的数据进行重构,形成多个数据仓库,并在数据仓库中进行存储和管理,形成审计数据库。审计数据库使用多维数据模型进行数据建模,在基于云计算平台的审计数据挖掘中,数据库的访问信息目录由元数据提供,这个目录可以精准的定位源数据和数据库中的内容,也可以对数据仓库服务器中的数据进行存储和更新。
云平台中的模型方法将输入的原始数据过分析计算转化为审计需要的信息,以发现审计线索或支持审计取证。从云平台获取处理过的审计数据,根据正确的设定值计算,判断审计业务的性质。在对其进行确认验证后,得出具体审计结果。
(作者单位:陕西省审计厅)