大数据审计平台构建研究
2019-03-08蔡乙萍舒若敏
蔡乙萍 舒若敏
摘 要:大数据审计是现代审计发展的必由之路,是国家治理体系和治理能力现代化的重要保证。目前,中国迫切需要一系列比较成熟的方法来构建大数据审计平台,以满足大数据时代智能审计的需要。大数据审计平台的构建涉及审计理论、大数据科学、计算机科学等学科,具有各种适用技术和复杂的构建机制。本文将大数据审计平台分为收集、预处理、分析和可视化四个子平台。在方法支持、过程建模和运行机制的基础上,对各子平台进行了专题研究,旨在为大数据审计的实践提供建设性思路。
关键词:大数据审计 平台构建 数据挖掘 过程建模
大数据审计是以大数据为背景的专业审计主体,根据具体规范,审计科学和大数据科学程序的使用和方法:通过大数据收集,开展独立监督活动,验证重大财务事项,业务管理活动和被审计单位相关资料的可靠性。近年来,中国政府高度重视大数据审计的建设。 目前,中国迫切需要一系列丰富的大数据审计理论来指导实践,从而大大提高审计主体利用信息方法挖掘问题的能力,从宏观上进行评估,判断和分析。 为此,本文在审计大数据采集,预处理,分析,可视化等模块的基础上,深入探讨了大数据审计平台的构建机制。
一、大数据审计平台建设的理论分析
大数据审计平台的构建遵循系统理论,结构理论,协同理论和控制理论的思想。大数据的关键技术涵盖了收集,预处理,存储和管理,分析和挖掘,演示和应用五个技术方面。大数据审计平台涵盖多个子平台,按照具体逻辑进行集成。为大数据处理技术全面整合到大数据审计平台建设,以平台为视角展示大数据审计。在整个设计过程中,本文特别以分类为理论基础的五大技术将分裂为大数据审计集,预处理,分析和可视化是一个研究的平台,其中,内置的存储技术建立子平臺时,必须发现具体审计的内在本质和逻辑规则基于细节深入系统地处理大数据对象,熟悉其任务需求。只有这样才能完成相关子平台的过程分解和功能分解,“主题技术数据库”下的子科学建立平台,有效选择各子平台的“过程建模小组”,在战略层面上有效提升大数据审计整体平台建设的质量和水平。基于跨学科理论的视角相互融合并通过四个平台的分解,加强大数据分析的应用,尝试在实际需求下应用于平台的相应技术,全力以“应用技术组”为轴,比较分析不同的建模技术,有效地促进了审计实践的大数据路由,抽象和智能化。
二、审计大数据采集平台的建立和运行
在大数据时代,审计数据收集渠道得到了广泛的扩展,主要涵盖了互联网平台下的媒体信息,门户网站和搜索报价。引擎和社交网络数据;正在审查的单位的货币数据,以及一系列非货币数据,如业务战略,技术研发,社会关系,治理能力和组织环境;经验数据,业务数据,管理 审计实体内的数据和预测数据;其他渠道,如日志数据,传感器数据,经济数据,行业数据,政策数据等。审计大数据不是上述渠道的分散收购和机械化,而是 在特定逻辑框架下整合指导本地化和有机集成。
三、审计大数据预处理平台的建立和运行
审计大数据预处理平台由数据存储,提取,清理,转换和加载等模块组成。近年来,大数据存储基础审计采用传统的存储模式,审计主体应熟悉各种分布式存储技术。其核心是网络存储技术,灵活高效的元数据管理,系统开发,应用和负载存储优化,优化,存储层数据动态调度和优化,数据灾难以及存储属性等优化技术。审计主体需要选择适用的数据存储子系统基于大数据结构的特点。对于结构化数据,采用分布式数据库存储。对于简单的半结构化数据,采用分布式键值存储。对于复杂的半结构化数据,采用分布式表存储。对于视频,图片和其他非结构化数据,分布式文件存储被采纳。
审计大数据提取包括全量提取和增量提取。 全量提取是复制和迁移源数据库中的所有数据并增加提取是基于前者从源表中提取新添加,删除和修改的数据。 具体方法包括时间戳,触发器,日志比较和全表比较。审计主体应建立适合他们的大数据提取方案。 例如,web标签提取算法可用于结构化数据,基于本体的web标签提取算法可用于半结构化数据,而基于规则的数据提取算法可用于非结构化数据。
四、建立审计大数据分析平台
审计大数据分析平台的构建必须依赖于过程建模,建模的动态因素包括:(1)分布式并行处理。审计主体在分布式并行处理系统的帮助下,海量目标数据可以分成块,并由多台计算机协同处理。基于时间和空间的并行计算,可以同时执行多条指令,从而及时扩展问题解决规模,解决复杂的审计计算问题。(2)引擎组件。审计主体可以使用云引擎来执行应用程序设计各种功能,或使用相同的“云”来执行不同要求的审计分析。工作流程是开发适用的过程逻辑,确保审计分析的灵活性,可维护性和稳定性。审计主体需要通过基于流向管理,流程节点管理和流程样本管理的芯片处理器来增强审计分析引擎,以促进审计分析的同步实施和效率优化。(3)方法库。(4)相关软件工具。审计大数据分析平台需要整合现有的成熟分析软件,如SPSS,SAS,R语言等。
五、审计大数据可视化平台的建立和运行
审计大数据可视化基于计算机辅助设计,图像处理,信号处理,图形,计算机视觉和其他学科。利用计算机图形和图像处理等相关技术,将审计大数据信息的内部结构转换为图形或图像进行显示,实现交互处理。
参考文献
[1] 吕劲松,王志成等.2017.大数据环境下商业银行审计非结构化数据研究[J].软科学(1):141-144.
[2] 秦荣生.2014.大数据、云计算技术对审计的影响研究[J].审计研究(6):23-28.
[3] 王崇业.2017.基于大数据的传统财务报表持续审计模型重构[J].财会通讯(7):111-113.
[4] 魏建祥.2016.大数据环境下政府审计模式转变[J].财会月刊(22):64-67.
[5] 张元鸣,陈苗等.2016.非结构化表格文档数据抽取与组织模型研究[J].浙江工业大学学报(5):487-494.
[6] 郑伟,张立民,杨莉.2016.试析大数据环境下的大数据审计模式[J].审计研究(4):20-27.