APP下载

大数据环境下的审计取证初探

2018-01-09王君王建辉

审计与理财 2017年12期
关键词:充分性结构化证据

■黄 王君 王建辉

大数据环境下的审计取证初探

■黄 王君 王建辉

大数据具有海量(Volume)、多样(Variety)、高频(Velocity)和商业价值大(Value)的特点。利用大数据技术进行数据分析、开展审计工作能够有效提升审计的效率和保障审计的质量。审计取证是在审计目标的指引下不断获取审计证据的过程,不断发展的大数据技术推动了大数据审计的实践,也促使着审计取证思维和取证方式的转变。就目前而言,审计人员如何运用更为经济的方式,在新的审计环境下充分挖掘审计取证的价值和防范审计取证风险,进而保障审计质量,是大数据审计发展中值得思考的重要命题。

一、大数据时代的审计取证环境

大数据的产生得益于云计算、数据挖掘等信息技术的发展,数据的采集、储存、交叉和分析能力不断提升。数据信息呈现了爆炸式的增长,使得审计取证环境由“小数据”向“大数据”转变,也改变了审计证据的衡量方式。

(一)大数据对审计取证的影响

大数据之于小数据,其实界限十分模糊,前者海量、多样及商业价值高的特点,小数据同样也具备,真正使得两者不同的是大数据的高频(Velocity)和详尽(exhaustivity)。高频性是指数据生成和处理速度突飞猛进,这是大数据时代的一个突出特点,而详尽性是指数据的采集量巨大,往往接近于总体。正是这两种差异,使得大数据下的审计取证环境在数据采集、取证范围、审计手段和审计证据上与小数据下的取证环境区别开来。

在大数据时代,几乎所有的事物都能得以数据化,企业的业务数据也不例外。这些数据不仅仅产生于企业内部,也可能由企业外部的信息网络和数据库进行侧面的电子记录,通常不为个别的企业所影响和控制,具有较强的可信度及可获得性,是大数据环境下审计取证的重要数据来源。事实上,大数据使得审计取证过程中的数据采集更为便捷与可靠,因为即使相关业务信息未被企业内部记录、丢失或保护,审计人员依然可以从外部数据库中获取大量侧面的信息碎片,进行交叉比对、融合和分析,进而还原整个业务的画面。

与此同时,大数据时代企业的所有信息都变得更为丰富,它们不仅仅是规则的结构化数据,也可以是无固定范式的非结构化数据,如音频、文档、图片等,这客观上要求审计取证工作扩大数据搜集范围。审计取证的范围从单一的凭证、账簿、报表等财务信息拓展到多样化的非财务信息,极大地丰富了审计证据,为审计人员进行全面综合的审计分析、提升审计效率提供了充分的数据保障。

大数据同样影响着审计取证的手段,使之实现了实时、精准与客观。一来,大数据下企业的业务数据是动态的,使得审计人员能够在云会计平台上实时处理具体的业务数据,而不必在分析业务结束之后去统计整理的信息;二来,由于大数据详尽性的特征,审计人员可以运用大数据技术对接近于总体的业务数据进行审计,相比于小数据时代的抽样审计而言,审计效率和质量都将大大提升;三来,大数据审计下数据分析系统的运用,使得审计取证的自动化成为可能。由于任何主观随意因素的出现都有可能影响大数据审计系统的自动化运作,因此审计人员的主观判断在大数据环境下很有可能让位于自动化的信息化分析系统,而这种审计过程中主观因素的弱化在一定程度上保证了审计取证方式的客观。

(二)大数据下审计证据的特征

审计证据是审计取证的“成果”,它具有充分性和适当性两大衡量标准,如图1所示,充分性是对审计证据“量”的要求,而适当性是对审计证据“质”的要求,只有同时保证审计证据的充分性和适当性,才算充分挖掘了审计取证的价值,才能支持得出的审计结论。随着大数据审计的推进,审计证据的这两大衡量标准进行了相应的变化,而把握它的动态变化,也是了解大数据下审计取证环境转变、促进审计取证工作充分合理发展必不可少的部分。

图1 审计证据衡量标准

1.充分性。

充分性是对审计证据数量的要求,从大数据下的审计取证环境看,取证的范围更广,不仅包括结构化的数据,还包括大量非结构化的数据,并且非结构化数据随着电子记录的深入而愈发重要,构成了大数据审计的主要组成部分。大数据下,审计证据充分性的特征也主要体现在非结构化数据的利用上。

审计取证的非结构化数据主要是非财务数据,包括内部和外部两个部分。内部非财务数据包括客户、销售、供应商、采购、人力资源等各类系统的信息,它们与企业内部的财务系统相结合,能够帮助审计人员从整体上把握企业的基本情况,了解业务开展的各个流程。外部非财务信息指的是诸如宏观政策、行业动态、邮件通讯、新闻报道等从外部网络和数据库中采集的信息,它们作为传统审计证据的补充而存在,能够更好地提升审计证据的充分性。在大数据环境下,数据采集和存储的成本降低,审计取证的效率由于信息技术的利用而提升,内外部非财务信息的利用更为经济有效,必然使得审计证据越加丰富、更易获得。

2.适当性。

适当性是对审计证据质量的要求,它包括可靠和相关两个方面,只有保证审计证据的适当性,审计证据的数量才是有效的,二者才能更好地支持审计结论。

可靠性是指审计证据必须是真实可信的,它包括可验证性、客观性和真实完整性三个方面,这也是大数据对审计证据影响最深的几个方面。首先,可靠性要求审计证据具备可验证性,即审计证据可以由其他证据从侧面验证,大数据环境下,审计取证渠道越来越丰富,审计人员不仅仅关注企业内部信息,同样关注外部信息,不仅利用财务信息,也越来越重视非财务信息,多元化的数据交汇融合,能够进行相互印证,使得审计证据的可验证性提升;其次,可靠性要求审计证据具备客观性,传统审计由于技术和资源的限制,一般通过函证、检查、询问等方式获取审计证据,审计人员的主观意识很容易影响证据的客观性,而在大数据下,审计分析系统的自动化数据采集与分析大大减少了人为因素的干扰,多样化的外部数据来源也使得审计的独立性得到提升,这都使得审计证据的客观程度大为提高;最后,可靠性还要求审计证据具备真实完整性,由于审计取证的大数据并非是经过精挑细选、层层分筛的数据,虽然它们具备客观性,但数据持续不断的增长和“鱼龙混杂”的现状也可能导致数据不准确甚至数据造假的发生,这将影响审计证据的真实完整性,这也是大数据审计下难以消除的一个弊端。但由于大数据在充分、可验证及客观性上对审计证据的提升,在一定程度上也抵消了审计取证数据真实完整性不够精准的缺陷。

相关性是指审计证据和审计目标、具体项目之间具有实质性的联系,它主要体现在审计证据的及时性和确认能力两方面。大数据很好地契合了审计证据的相关性,一方面,大数据实时、持续的特征使得业务信息能够得到快速采集和及时应用,另一方面,大数据分析系统通过相关模型让审计数据进行交叉比对、相互印证,拓宽了审计确认的渠道,使得审计证据的确认价值更高。

可以看出,大数据时代,随着海量信息和大数据技术的不断发展与创新,审计取证在渠道上有所增长、范围上有所拓宽,审计取证环境的独立性和客观性也有所提升,所获取审计证据的充分性已然不是问题,值得审计人员关注的是如何保障所采集数据的真实完整性,充分挖掘审计取证的价值。

二、大数据下审计取证思维的重塑

面对新的审计取证环境,要充分挖掘审计取证的价值,得出高质量的审计成果,转变审计取证思维将是关键的一步。在大数据环境下,审计取证思维将发生三大转变,分别是从抽样思维转变为整体思维,从追求精确转变为容纳混杂,从因果思维转变为相关思维。

1.整体思维。

由于企业规模等客观因素及审计资源的限制,传统审计通常采用随机抽样的方式进行审计,用样本数据推断整体情况,并据此得出审计结论。在大数据时代到来之前,抽样审计的确是审计人员进行审计的理性选择。但是随着大数据的推进,企业转变了财务管理模式,构建起财务共享服务平台,使得企业内部各业务环节的数据聚集在同一个数据库当中,通过大数据技术,能够很容易地以一种较为经济的方式实现大量数据的实时采集、清洗、存储和分析。因此,在大数据时代,审计取证的数量越来越接近于总体,审计取证思维也得以从过去的抽样审计向详细审计迈进。整体思维即“样本即总体”的一种思维,审计人员在该思维的指引下,开放式地接纳与审计业务相关的所有信息,从不同的数据渠道进行审计取证的数据采集工作,从而形成对审计对象更为系统和全面的认识。

整体思维是其他取证思维的前提,只有审计人员秉持审计取证的整体思维,才能从根本上保障取证数据的完整,为获取更为充分、可靠的审计证据打下基础。

2.容错思维。

审计取证环境的转变使得审计证据的衡量方式也有所改变。大数据时代信息呈现指数式的增长,更新的频率越发频繁,动态的数据和多样化的渠道使得取证环境更为复杂。传统的审计取证追求所搜集信息的精确性,在抽样审计的基础上还要对抽样审计结果进行不断地验证,反复地确认,从而耗费了巨大的资源。在大数据环境下,审计取证面向总体,面对所搜集的混乱、随意甚至可能虚假错误的数据,大数据审计的数据清洗、存储和分析工作变得越来越沉重,追求传统审计中精确信息的方式显然是不够理性的,要充分挖掘审计取证的价值,需要从过去追求精确数据的思维中跳出,向接纳混乱数据的容错思维转变。

容错思维是建立在整体思维之上的,它要求将审计抽样排除的混乱数据纳入总体进行分析。大数据时代,非结构化数据可信度更高、可获得性更强,真正有价值的信息其实都蕴含在一些稍显混乱复杂的非结构化数据当中,在进行审计取证工作时,也难免会囊括各种杂乱、无序、主观、无效的信息,利用大数据进行审计线索整理时可能出现错误,但包容一定程度的错误并不会影响大数据审计中以总体为审计对象、以非结构化数据为数据主要组成部分的取证工作,对审计结果也产生不了重大影响,反而有可能提升审计人员的洞察力。

3.相关思维。

由于海量数据的存在和聚合,数据间相互联系,传统审计取证中探寻数据间一对一因果关系的一贯方式将变得十分困难。审计工作所分析的审计数据之间的关系将逐渐从因果关系转变为相关关系,审计人员能够将大数据审计模型固化在数据分析系统当中,并在此基础上,对审计疑点进行预测、汇总和处理,从而得出审计结论,本质上这属于一种对相关关系的探寻。因而,审计取证思维在大数据环境下应当从因果思维向相关思维进行转变。

相关思维是建立在整体思维与容错思维之上的,属于审计取证的核心思维。相比于传统审计中因果关系的证明,相关思维更注重于碎片化信息的整体重现,它耗时更短、成本更低,并且还有利于审计人员对审计对象的整体把握。虽然相关思维指导下的审计取证精确度不一定高,但它克服了因果关系证明中预设条件的弊端,最大限度地弱化了审计人员主观因素的影响,一切用数据说话,为审计取证提供了视野更为广阔、更为丰富的审计线索。

三、大数据下的审计取证风险

大数据时代为审计提供了广阔的数据来源和先进的技术手段,也改变着审计取证的思维,人们对信息的认知程度随着大数据的发展不断提升。在对大数据认识越来越深入的同时,审计取证的相应风险也随之出现。

1.信息风险。

审计取证的信息风险是伴随着信息化而来的,大数据在给审计取证提供海量、多样的动态数据的同时,也带来了信息质量和信息安全方面的风险。一方面,取证所搜集的数据较为广泛,几乎所有与审计业务相关的信息都纳入了取证的范围,这难免造成审计数据的相对混乱和无序,即使是在进行了数据清洗之后,也仍旧可能存在一些低质量的信息,虽然取证的容错思维促使审计人员容纳一定数量的低质量信息,但若是质量过低,必将影响后续的审计分析,因此容错思维不能成为放松对信息质量把控的挡箭牌,审计人员应该结合对审计环境和目标的要求,实时关注审计取证的信息质量风险。另一方面,审计人员利用大数据技术对海量数据进行搜集、融合和交叉分析,这些数据中除了企业提供的信息,也必然包含了许多从企业内外部获取的相关个体私密的信息,如果未能遵循审计的独立性和保持相应的职业谨慎,极有可能引发审计取证的信息安全风险。

2.技术风险。

大数据时代,利用大数据技术进行审计取证是归纳审计线索、搜集审计证据的一大突出手段,这必然引发审计取证的技术风险。事实上,在大数据下这种风险是贯彻整个审计过程始终的,由于非结构化信息的存在,在如何进行对它的精确和自动化处理、结合审计环境和信息背景方面,现有的数据处理技术已经出现了明显的不适应。同时,由于大数据环境下不可消除的低质量信息的存在,审计取证所运用的信息技术也难免会对相应的低质量数据进行分析。所以,技术风险随着信息质量风险的存在而客观存在着。

3.认知风险。

大数据时代的到来对审计人员的技能和知识水平提出了要求,但由于涉及面广、技术能力要求高,大数据超越了审计人员现有的认知水平,对审计取证工作带来了认知风险。审计人员不仅要有丰富的业务知识,还需要掌握较高的信息技术知识,有一定数学和统计学的基础,熟练掌握计算机审计的工作流程,否则便无法顺利完成审计取证工作。同时,大数据带来的另一种认知风险是在一切信息都转化为数据之后人性部分的缺失,当业务转化为数据时,有关人性的部分却很难量化,如经办人内心的想法、行为背后的潜意识等等。在这种情况下,审计取证工作趋于标准化,得出的审计结论难免机械化,但审计恰恰是一种交互的工作,必须将数据与人性、环境等相结合,才能把握事物的本质,重现事件的因果。

[1]刘星,牛艳芳,唐志豪.关于推进大数据审计工作的几点思考[J].审计研究,2016,(5):3-7.

[2]阳杰,孟里应.大数据时代的审计证据与审计取证研究[J].财会月刊,2017,(1):115-124.

[3]Kitchin R.,Mc Ardle G..WhatMakes Big Data?Exploring the OntologicalCharacteristics of26 Datas?ets[J].Big Data&Society,2016,(1).

南昌工学院)

猜你喜欢

充分性结构化证据
改进的非结构化对等网络动态搜索算法
深度学习的单元结构化教学实践与思考
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
再谈高三化学讲评课的实践与探索
审计证据质量评价标准研究
构建充分性语文课堂涵泳初中生核心素养
手上的证据
家庭暴力证据搜集指南
手上的证据