严控大数据审计中数据分析风险的建议
2019-02-19鄂立恒武汉市蔡甸区审计局
◆舒 畅 鄂立恒/ 武汉市蔡甸区审计局
近年来,我国在审计全覆盖方面加大工作力度,大数据审计应运而生。作为电子信息产业与审计工作深度融合的产物,大数据审计对提升审计效率卓有成效。但是,随着大数据审计应用深入推广,大数据固有的缺陷带来的种种问题日渐凸显。尤其在数据分析阶段,大数据分析“广撒网”的模式和审计工作“精准打击”要求之间的矛盾颇为明显。
一、大数据审计中数据分析风险产生的原因
一方面,大数据具有高噪点、低密度的特点。高噪点,是指在大数据环境下,数据来源的广度和数据内容的复杂程度急剧上升,混淆在有用信息中的无关信息也日益增多,同时计算机语言上也存在多源异构、语法不连贯等问题。低密度,是指在内容更加丰富的同时,大数据中的无关和无用信息也在增长,隐藏和未知的信息较多,有效信息的“提纯”难度不断增加。这些特点导致大数据审计过程中容易出现精度不足、大数据审计结果与实际不符等问题。
另一方面,审计数据分析条件和方法落后。审计数据分析条件的落后体现在硬件系统上的落后,主要是计算机硬件的更新换代跟不上大数据处理的要求。审计数据分析方法的落后体现在审计软件程序的落后,主要是计算机语言更新换代过慢和软件算法、语法缺乏创新的问题。这些问题造成审计工作在大数据环境下容易进入没方向、低效率的怪圈,进而产生一系列数据分析风险。
二、严控大数据审计中数据分析风险的建议
(一)提升大数据非现场集中分析精准度
非现场集中分析,就是对集中收集到的大数据进行二次筛选和加工,以甄别出隐藏信息、无用信息和有用信息。在这一环节,传统的分析方法可以处理信息量较小的审计数据,但是对于体量庞大的审计大数据则无从下手。结合目前审计大数据情况,可以进一步提升的相关分析方法有以下几种。
1.常用的SQL 数据查询方法。SQL数据查询方法是在对审计焦点进行先行人工分析的前提下,编写相应SQL 语句,继而在数据软件中运行这些语句,进行相对较为精准的关联度匹配,从而筛查出对审计有帮助的数据。由此可知,SQL 数据查询方法的运行效率和标准语句的编写关系重大。
SQL 数据查询方法在审计中的运用相对较早,已经积累了一定的编写经验,但仍必须结合新情况、新特点,使审计焦点的人工分析适应大数据环境。这就要求分析部门关注多层次、多部门之前的数据联系,改变以往单一层次分析的习惯,运用综合分析方法分析不同来源的数据,更多地发现财务数据和业务数据之间的联系。
2.大数据可视化技术。将抽象的数据具象化,通过大数据可视化软件对集成后的数据进行建模分析,从而实现大数据可视化,也是提升审计效率、准确利用数据的重要方法。借助可视化技术,审计人员能够在数据分析过程中及时发现数据内容和审计内容之间的关系,降低大数据噪点的影响,提升信息密度,迅速发现审计线索和方向。大数据可视化技术在实现过程中要注意以下两点。
首先,精准预先处理。在进行可视化建模之前,审计人员必须对已经集成的数据进行预处理,其目的主要是利用审计人员的专业知识对既有数据进行初步分类,保证和提升可视化效果。
其次,准确进行分析。在完成数据可视化之后,审计人员应当对数据进行准确分析,这种分析建立在两个基础之上:一是对审计相关知识的熟练掌握和精准运用;二是对可视化系统原理的熟悉和把握。在此基础上,可视化技术简洁的表达结果才能发挥用武之地。依照现有大数据可视化技术,在及时调整可视化软件参数的条件下,数据可视化效果能够多视角、多角度地进行数据分析,输出不同类型的数据图像,满足不同类型审计的需要,这一切都在与专业知识的对接中实现价值。
3.其他大数据分析方法。SQL数据查询方法和可视化技术只是较为常用和必要性较高的两种方法。随着审计工作环境的复杂变化,越来越多先进的数据分析方法将被采纳和使用,在此简要分析另外两种能够弥补现有数据分析方法不足的算法。
一是社交网络分析技术。社交网络分析,是指基于信息学、数学、社会学、管理学、心理学等多学科的融合理论和方法,为理解人类各种社交关系的形成、行为特点分析以及信息传播规律提供的一种可计算的分析方法。这种方法的优势在于兼顾了传统审计忽略的非官方数据,而这些非官方数据在实践中往往能够更为精准地还原审计项目原貌,能够从更为细腻的视角为审计人员提供意想不到的证据。
二是图形数据库技术。图形数据库是基于数学中图论的概念和算法而实现的高效处理复杂关系网络的新型数据库系统。图形数据库往往仅由节点和关系两个元素组成,简洁明了。元素的简洁并不意味内容的单薄,在现实算法中,图形数据库的节点往往附加以标签,同时节点和关系在书写过程中都可以被附以属性。这样的设计删繁就简,在处理复杂数据的过程中具有先天优势,尤其在审计大数据日益立体化的今天,社交数据和征信数据等均被纳入审计数据范围,图形数据库的算法更应得到重视。
(二)发展和完善远程数据查询分析系统
有了远程数据查询分析系统,审计人员不再因远离数据中心而丧失对数据的分析、核查机会,在合理的风险防控机制下,这一系统能够提升审计工作效率和精度。防控远程数据分析风险要关注以下几个问题。
第一,严格限定远程查询条件,非必要不查询。不可否认的是,无论如何施加保密措施,远程数据查询终归会形成数据风险,或是在传输环节,或是在分析环节,因此,严格限制数据远程查询条件是有必要的。在严格依据审计项目需求给予查询权限的同时,还要加强数据使用和分析人员的安全保密教育,同时严格监控数据使用和分析过程,及时销毁终端数据和平台备份数据。
第二,实现数据分级,把握最小授权原则。最小授权原则是指减少接触数据的人数,最大程度降低数据风险。要想达到这一目标,就必须对数据进行分级管理,依照数据的保密程度给予最小范围的人员查询权限,同时在权限账户的管理过程中,强化对账户适用范围、目的、IP 地址等问题的监管。
第三,严格审批流程,人机双重把关确保安全。数据查询密码应当多重加密,有条件的地区可以在远程数据查询系统中植入指纹识别和虹膜识别系统,或者采取电子密码器等安保手段,实现机器核查方面的严格把关,不给风险留空间。另外,在人工安保环节,既要及时核查数据查询使用情况,又要及时跟踪数据查询的人员、地点、任务等关键信息,并留存授权资料以供检查使用。
(三)在制度建设和人员培训方面下功夫
严控大数据审计中的数据分析风险,除了要在技术上不断突破,还需要加强以下两个方面工作。
一要加强制度建设。严控审计数据分析风险,在技术上实现突破的同时,更要注重联网审计相关的制度建设,建立与联网审计和大数据发展形势相适应的制度体系,形成科学有效的权力制约机制。现行法律法规中对应用大数据技术进行审计工作没有出台相关细则,有关部门应当抓紧研究出台联网实时审计安全保障措施,部署安全方案,解决好大数据在审计监督领域的法律依据问题,发挥大数据在推动审计全覆盖工作中的积极作用。
二要加强人员培训。各级审计机关要加大审计人员的数据应用技术培训,同时还可以到联网审计前沿单位学习大数据审计工作思路和技巧,通过借鉴和学习,加快研发大数据审计模型,建立常态化的审计模型研发、验证、更新工作机制,提高大数据实时监控的智能化、自动化水平。