APP下载

基于大数据的审计数据统计分析策略

2019-05-15李永娣

社会科学家 2019年2期
关键词:分析信息

李永娣

(河南省统计局科研所,河南 郑州 450008)

大数据在云计算的基础上,借助信息存储、信息分享与数据挖掘,把海量、高速、多元和多变的终端数据存储在云端,在对其进行分析计算之后能够寻求到解决问题的有效途径。为了让经济社会的发展与大数据产业进程保持一致,国家制定并出台了诸多与之相关的发展战略与发展规划[1]。尤其对审计行业来说,由于大数据、云计算、物联网、4G 通信等新技术、新产业和新应用的持续涌现,该行业的信息系统变得越来越复杂,数据量不断增加。此时,纸质账册形式的审计已无法满足现实需要,借助大数据技术开展审计工作已经势在必行。期间,电子财务数据与业务数据是十分重要的两类数据,而一旦审计对象的信息化程度较高,就会由于数据统计分析难度较高而让审计工作面临诸多困难。

一、大数据及对数据统计工作的新要求

一段时间以来,大数据和云计算、物联网、移动互联网等技术一道,共同对全球经济社会生活带来了巨大冲击[2]。在审计数据统计领域,大数据在为其提供了诸多新技术与新方法外,还对审计组织、审计人员提出了全新的要求——不但要把握大数据技术的内容和特征,让审计技术与审计方法得到进一步发展,还要借此提高审计数据分析的水平与效率,最大限度拓展审计数据统计分析的应用范围。

1.大数据的涵义解析

从2009年开始,“大数据”的概念逐渐开始在经济领域传播,而其真正变得火爆,是在2012年美国时任总统奥巴马宣布了“大数据研究与开发计划”之后。一般认为,这一事件是“大数据”时代真正开始的关键标志,也认为人类社会开始进入到了大数据场域之中。“大数据”也被称为巨量资料,指的是所关联的数据量规模极大,甚至难以借助当前的主流软件工具加以度量,而一旦通过有效的工作在特点时间内对其进行收集、分析和处理以及转化,就以得到帮助决策者决策的有价值的信息。在我国,互联网数据中心对“大数据”下了如下定义,即为了更加经济、更加有效地在高频率、巨容量、异结构的数据体系内获取价值,继而设计出来的全新的架构与技术,然后借此描述与定义信息时代出现的海量数据。一般来说,大数据具有以下几个显著特征:第一,数据类型多,不但包括图片、地理位置信息和视频、网络日志等,还包括音频、动画等多种形式;第二,大数据的价值密度较低,但其商业价值却处于高位。如果对其进行深度开发,一定能够从中获得有价值的信息。也就是说,对大数据来说,任何单一的数据价值都较低,甚至可以忽略不计,可是一旦把大量数据聚集在一处,就能够产生极高的商业价值;第三,数据体量无法估计,甚至可以从TB 级别跃升至PB 级别或者更高,如果对大数据的统计分析处理速度较快,就能改变传统数据采集、处理与应用模式,也会因此而改变人们的思维范式。

2.大数据对数据统计工作的新要求

大数据的本子是促使人们在搜集、处理与使用数据的过程中进行思维转换,而这会对数据统计工作产生全新的影响,也会对相关工作提出新的要求:(1)在大数据背景下,人们很难发现事物之间的直接性的因果关系,需要深入认识并借助事物的相关关系才能发现问题的真相。而自古以来,寻找事物之间的因果关系已经成为人类发展进程中形成的不可更改的习惯。而到了大数据时代,人们可以把主要精力置于事物之间因果关系之外,对于因果关系的分析可以借助大数据技术进行。将其置于数据统计分析之中,更是能够发现事物之间的相关关系。即借助某类事物之间的相关关系,能够获取事物的现在信息并预测未来,这对相关工作的开展是大有裨益的;(2)在大数据背景下,即便不通过抽样分析,也能够获得并处理事物整体的所有数据。而实际上,自十九世纪之后,在处理较大样本量的过程中,人们习惯借助抽样的形式对总体进行分析。可需要注意的是,抽样技术的出现是条件受限的结果,即在数据缺乏与获得数据受到约束时,不得不采用的一类方法。而在今天,包括大数据技术在内的科学技术条件已经获得了极大发展,借此可以对海量数据进行加工和分析。比如,可以借助大数据分析替换掉抽样分析,让数据统计分析工作突破抽样调查与实证数据的局限,在大量收集过去难以收集到的数据之后,进行大数据分析,继而获得更多有价值的信息;(3)在大数据背景下,统计分析工作可以不必追求数据的精准度,而是追求其效率问题。这是因为,如果测量事物的能力受到约束,人们关注的问题就是获取最精确的结果。也就是说,在大数据场域中,追求精确度变得不必要也不可行,在很多领域也不再受欢迎。在实际操作中,借助大数据分析技术,可以更为深刻的掌握事物的未来发展趋势,提升数据的及时性与使用绩效,让统计人员能够更加全面的认识事物的真相。

二、大数据背景下审计数据统计分析的机遇与挑战

在大数据环境下,审计数据的规模更大、复杂度更高、数量更多,对其进行分析需要更有效的手段[3]。基于此,大数据时代的到来势必会为审计数据统计工作带来审计实践、审计思维的变革,也会引发审计数据分析的深刻思考。当然,需要注意的是,审计机关除了要具备对大数据进行采集与存储的能力,还要面对诸多挑战,以便对审计数据进行高效分析与挖掘,借此发现更为直接的审计线索,寻求审计对策。

表1 河南省审计系统对大数据的依赖度(%)

图1 河南省审计系统对大数据依赖折线图

1.问卷调查分析

2018年3-5月,对河南省郑州市、洛阳市等多地审计系统应用大数据(主要是对大数据的依赖程度)的现状进行了调研。制定了《河南省审计系统大数据使用情况》的调查问卷。共针对审计系统领导、一线员工发放问卷360 份,各审计机关平均发放问卷20 份,共收回有效问卷342 份。经检验,问卷信度和效度均达到要求,有关结果如表1所示。

调查结果表明,河南省审计系统对大数据的总体态度以积极为主,高度依赖和一般依赖分别占到了26.8%和45.6%,但也有27.6%的审计系统领导和一线员工对大数据持“不依赖”的态度。这说明审计系统对于大数据的应用既有机遇也存在明显的挑战。但乐观的是,从不同审计机关的数据看,无论对大数据“高度依赖”、“一般依赖”还是“不依赖”,它们所持的态度大体相同(图1),这说明河南省审计系统对于大数据的应用正在推广和普及,其积极效果在不同地区都有所显现。

2.大数据背景下审计数据统计分析的机遇

通过前文的分析可知,与传统数据仓库应用相较,大数据分析具备数据量大、查询分析复杂等显著特征,它注重把数据与业务流程、决策过程结合在一起,在进行实时分析之后能够对业务产生更高价值。结合表1和图1可知,在大数据背景下,审计数据统计分析工作会面临以下机遇:(1)借助大数据技术对审计数据进行分析将能够提升决策的科学性与准确性,促进预测预警与应急响应机制建设,更为有效的规范审计机构的经济活动。审计人员能够借助对历年海量数据的统计和分析,挖掘出审计对象经济活动的特征和规律,对相关违规违纪行为予以总结和归纳,这对审计机关的建章立制来说是大有帮助的,能够为其提供更多有价值的参考信息;(2)借助大数据能够更加科学的评估审计任务的执行效果,借此帮助审计机关不断发现问题、分析问题和整改落实。更为重要的是,在审计数据统计分析工作不断深化的过程中,审计分析会超越原有的数据分析模式,即在对纯数据予以分析挖掘的基础上,能够完成对财务账表、财务报告的深度挖掘,极大提升审计数据统计分析的效率和效果;(3)让大数据参与到审计实践之中,能够极大增强审计数据分析的认同感。在我国,审计部门是一类综合性的经济监督部门,要始终根据数据说话。比如,在审计报告中,不论是综合评价抑或是揭示问题,都要以数据做支撑。在大数据体系内,海量数据会以离散的形态存储在不同信息系统内。借助大数据分析技术可以充分借助数据仓库、联机分析以及数据可视化等,对相关数据予以关联分析与挖掘分析,借此科学评估资源的使用情况与法规的实施效果,这对得出更加客观的审计结论是大有帮助的;(4)大数据以及得到了审计机构和审计对象的一致认同,这将在很大程度上提升审计实践效果,让审计统计数据分析的基础数据获取更为便利。近年来,我国审计机构不断破除内部协同思想理念上的障碍,及时纳入大数据思维,通过跨越系统、跨越平台和跨越数据流结构的形式,让审计数据实现了纵向、横向流通。这样一来,审计部门可以突破传统“点对点”和审计对象联网模式,只要在内部局域网设定了许可权限,就能够直接查询并借助数据信息,这不但极大节省了审计成本,还借助大数据技术提升了统计数据处理和分析响应的时间,让审计效率得到了显著提高。

3.大数据背景下审计数据统计分析的挑战

结合表1和图1可知,大数据在带给审计信息化诸多机遇的同时,也使之面临着前所未有的挑战,主要体现在以下几个方面:(1)审计机关是我国经济社会安全运行的免疫系统,其工作职责当中除了要对已经出现的问题予以查处、修补外,还应对潜在风险予以及时揭示,最大限度的抵御风险。当然,更为重要的是,在大数据时代,审计人员需要对该新事物进行全面而深入的分析,以便在更高层面和更全范围、更广视角上为审计机关提供系统性、综合性和前瞻性的审计建议;(2)在大数据时代,为了实现审计资源的统一规划与综合使用,需要以数据编码与信息标准统一、彼此之间兼容互联为基础开展工作[4]。可是,因为相关制度依据的缺乏,部门之间的横向协同难度较大,在传统审计模式下形成的“信息孤岛”无法为审计机关提供更多有价值的审计数据,使得持续性的审计变得十分困难;(3)面对体量巨大、种类繁杂的大数据信息源,审计机关在开展审计工作时,一方面要具备对海量数据进行搜集、分析与存储的能力,还应以较快的速度对其进行分析与挖掘。但是,这一工作的开展需要审计人员从传统社会的“经验依赖”转化成大数据时代的“数据依赖”,而这对审计人员及其数据处理能力来说是较大的考验;(4)在大数据时代,审计业务流程主要以数据信息形式出现,资金流向一般都体现为数据信息流之间的交换,这就使得违规违纪行为更为隐蔽也更加多样,任何数据变动都会带来经济损失。此时,之前的审计范式已经无法满足需要,借助抽样分析和单一的财务账目分析也无法发现那些重要但微小的数据异常,单纯这一工作,就对审计机关和审计人员提出了全新的、严格的要求。

三、大数据背景下审计数据统计分析的现实路径

按照经验,审计技术与审计方法的发展都和科学技术的进步保持一致性。在大数据时代,审计技术与审计方法需要在原始查账基础上由低级到高级转变、由不完备转到更加完备的阶段[5]。按照这一思路,当前乃至以后,基于大数据的审计数据统计分析工作除了要构建审计数据统计分析安全系统、深入挖掘审计统计数据信息外,还应充分融入统计学的思想与方法、基于云计算平台开展审计数据统计分析,以便在审计抽样技术、审计报告模式和审计证据搜集等方面做出更多成绩。

1.构建审计数据统计分析安全系统

在我国,需要在掌握大量关系经济社会发展的数据之后才能开展工作,此类宝贵的数据资源如果出现了丢失或者产生了不必要的损失,就会对我国的经济安全带来难以挽回的负面影响,其后果不可估量。因此,为了保证审计数据资源的安全,需要以大数据为背景,全面了解审计对象信息系统的管理体系、组织结构、规划设计和管理水平等属性。其中,要对审计信息系统的数据资源进行重点调研,特别要清楚掌握审计数据库中的项目、数量、功能等信息,并对统计分析软件的版本、管理维护机构和访问模式等进行分析,以此得到数据存储与备份的关键信息。同时,还应关注审计统计数据和信息安全系统的建设问题,在不断创新大数据审计技术研发的过程中,实现对敏感审计数据的监管工作,搭建起完善的审计数据安全体系。

2.深入挖掘审计统计数据信息

已有的经验表明,在大数据背景下,优化审计数据的掘取、存储和处理以及应用水平,对提升审计效率、提高分析结果的精度具有十分积极的现实意义。一段时间以来,我国审计工作应用更多地为查询型分析与验证型分析,这种做法难以满足深刻揭示经济活动本质规律的现实诉求。因此,有必要引入大数据中的数据挖掘技术,即借助数据仓库与数据挖掘工具对审计统计数据进行分析。期间,可以将回归分析、聚类分析、关联分析等方法和模型应用其中,然后借助数据挖掘技术,对上述数据进行分类、存储和快速调用。这样一来,不但完成了对审计数据资源的分析和整合,还通过数据存储平台的搭建,让数据整理与研判机制更加完善,在实现重点数据库兼容互联的同时,让审计数据分析结果更加精确。

3.充分融入统计学的思想与方法

基于大数据的审计数据分析应该借助统计学的思想与方法,让数理统计技术应用其中,处理和解决审计数据分析问题。其具体做法是:(1)对审计数据中的离散点加以分析,发现其中的偏差,并将其视为审计工作的重点分析。接下来,要借助横向和纵向逻辑分析与研究,对数据的特点、规律以及不对称信息等进行分析,借此发现审计工作的新的突破口。比如,在纳税征管予以核查的过程中,应该分析该地区经济产业结构的分布情况以及增减变动情况,借助大数据技术对纳税贡献予以系统把握,这样就可以得到更有价值的信息;(2)借助大数据技术对审计统计数据进行对比分析(尤其是异常数据)。比如,在对现金流趋势进行分析的过程中,就可以借助定基法或者环比法等统计方法对变化规律进行观察,以发现其中的异常变动情况。

4.基于云计算平台开展审计数据统计分析

通过大数据对审计统计数据进行分析时,需要构建与之相适应的云计算平台,以此满足审计人员对数据分析的诉求。当然,在数据审计的过程中,应合理借助云计算技术,使之能够最大限度地避免审计人员的重复工作,降低其工作量。同时,要把审计信息录入至云计算平台当中,借助平台系统软件对审计数据进行统计、分类、分析与计算,以此得到海量数据中隐含的有价值的信息。此外,可以通过云计算的介入,让审计数据实现跨空间运算,规避传统审计数据分析方法的风险,解决软件不兼容和格式不统一的瓶颈。如此一来,就可以最大限度地提升审计工作的网络化水平与信息化程度。

四、结 语

作为一类企事业单位监督和管理的重要机制,审计对于经济社会的发展和进步具有异常关键的现实意义。而在大数据环境下,越来越多的审计对象会在生产、经营和管理活动当中形成多种多样的数据信息,借助大数据技术对审计数据进行分析和研判不但可以完成对数据信息的加工和整理,还能获得传统方法无法获得的有价值的信息。因此,在将来,基于大数据的审计数据统计分析工作需要不断提升其灵活性,在开展全面统计分析的同时,审计机构和审计人员要合理应用大数据分析模式和统计方法,成为审计数据分析最为重要的发展趋势。

猜你喜欢

分析信息
隐蔽失效适航要求符合性验证分析
电力系统不平衡分析
订阅信息
电力系统及其自动化发展趋势分析
展会信息
中西医结合治疗抑郁症100例分析
在线教育与MOOC的比较分析
信息
健康信息
健康信息(九则)