大数据技术赋能政府审计全覆盖:动因、困境与进路
2023-05-19陈凤霞姜宾
陈凤霞 姜宾
【摘要】实施政府审计全覆盖是充分发挥国家审计在服务国家治理现代化中作用的重要方略。应用大数据技术赋能政府审计全覆盖是防范社会治理中苗头性、 局部性问题转化和演变为风险的重要“法宝”、 突破审计全覆盖技术瓶颈的有效途径以及保持审计长效威慑力与强化审计问责的实践要求。现阶段, 大数据技术赋能政府审计全覆盖仍面临着现有管理体制机制滞后、 多维审计信息获取存在壁垒、 大数据应用的信任风险和大数据应用的系统化能力羸弱等问题。未来应加强管理体制机制的顶层设计、 打破多维审计信息获取壁垒、 保障审计数据可信度和提升大数据在审计全覆盖中应用的系统化能力。
【关键词】大数据技术;政府审计;信任风险;审计监督
【中图分类号】 F239.3 【文献标识码】A 【文章编号】1004-0994(2023)07-0108-5
一、 引言
2014年10月, 中国共产党第十八届中央委员会第四次全体会议通过了《中共中央关于全面推进依法治国若干重大问题的决定》(简称《决定》)。《决定》指出, 要通过审计监督强化对行政权力的制约, 对公共资金、 国有资产、 国有资源和领导干部履行经济责任情况实行审计全覆盖。《决定》从全面推进依法治国的战略高度阐明了审计全覆盖在深入推进依法行政、 建设法治政府中所扮演的重要角色。随后, 国务院先后印发《国务院关于加强审计工作的意见》和《促进大数据发展行动纲要》, 提出了“探索在审计实践中运用大数据技术的途径, 加大数据综合利用力度, 提高运用信息化技术查核问题、 评价判断、 宏观分析的能力”和“建立‘用数据说话、 用数据决策、 用数据管理、 用数据创新的管理机制”。2021年6月, 中央审计委员会、 审计署根据国家“十四五”规划纲要, 结合审计工作实际, 制定了《“十四五”国家审计工作发展规划》(简称《规划》)。《规划》提出, 要通过提升信息化支撑业务能力和数据管理水平以及加强数据资源分析利用来提高审计全覆盖的质量和效率。这也确立了在“十四五”期间构建审计全覆盖工作格局的基本遵循。
实施政府审计全覆盖是充分发挥国家审计在服务国家治理现代化中作用的重要方略(李明辉, 2020)。在党中央、 国务院的决策部署之下, 伴随着审计管理体制改革创新进程的加快, 审计全覆盖得到了稳步推进并取得了长足发展。然而, 在出现的新挑战、 新使命面前, 审计全覆盖仍存在政策执行效果不佳、 运行机制有短板等问题。进入中国特色社会主义新时代, 特别是进入各领域高质量发展的新发展格局阶段, 基于提升国家审计信息化、 智能化、 精准化的发展定位, 开展吸纳大数据技术的国家审计全覆盖政策精准实施研究, 促进大数据赋能的国家审计全覆盖实施手段创新, 不仅是提升国家审计全覆盖履行监督职能的需要, 更是助推新时代审计事业高质量发展的需要。
二、 大数据赋能审计全覆盖的动因分析
工欲善其事, 必先利其器。一个允洽的“器”对“事”的达成往往能起到事半功倍的效果。大数据自1980年被首次提出以来便引起商界、 学术界乃至政府机构的高度关注。时至今日, 其已成为可以与物质资产和人力资本相提并论的重要基础性资源。全球知名管理咨询公司麦肯锡曾发布过一篇题为Big Data: The Next Frontier For Innovation, Competition, and Productivity的研究报告。报告指出, 公共部门能以大数据技术为支撑实现政务透明化和分析决策自动化的跨越式进步。大数据赋能审计全覆盖以Big Table、 云计算、 数据挖掘、 自然语言处理、 神经网络、 数据仓库和可视化技术等关键技术为支撑, 基于审计机关开展审计活动的对象构建大数据技术应用的架构体系, 开展审计全覆盖全盘式、 长效式、 精准式实施, 并开展审计的跟踪督促检查, 推动审计全覆盖目标的实现。
(一)是防范苗头性、 局部性问题转化和演变为风险的重要“法宝”
习近平总书记指出“审计不仅要查病, 更要治已病、 防未病”。即审计全覆盖应坚持对症用药和防微杜渐并重的方针, 并将该方针贯彻到审计全覆盖的全部活动之中。祸患常积于忽微, 大的祸患往往是由一些微小的失误积累而成的。当前, 我国正处于各类矛盾粘连累加、 急流暗礁丛生的复杂变局之中, 以审计全覆盖来防范苗头性、 局部性问题转化和演变为风险不仅是从容应对“乌卡”时代各种不确定性和挑战的关键之举, 更是打好防范重大风险攻坚战, 实现国家治理现代化和高質量发展的重要举措。在传统的国家审计实践中, 由于缺乏大数据技术的支持, 审计人员在设计审计程序时往往会考虑审计证据的易获得性和审计成本的经济性。一方面, 基于统计抽样收集的审计资料在很大程度上会存在漏洞, 在这种情形下统计数据只能够记录和评价那些能够观测和量化的部分而无法发现苗头性、 局部性问题。另一方面, 传统的审计分析方法无法实现对审计对象产生过程、 细节以及深层机理的全盘式或有的放矢式的剖析。然而, 大数据可通过应用数据挖掘、 云计算、 自然语言处理、 人工智能和可视化技术等数据处理技术, 对来源于审计项目的文本、 视频与图像、 AI记录的肢体语言等大数据信息进行可视化分析(陈伟和居江宁, 2018), 找出潜在的风险泄露点并通过大数据预测、 优化功能将苗头性、 局部性问题加以确定, 借此将趋势性、 全局性问题消弭于萌芽状态。
(二)是突破审计全覆盖技术瓶颈的有效途径
《规划》中指出: “着力构建全面覆盖的审计工作格局, 要求党中央重大政策措施部署到哪里、 国家利益延伸到哪里、 公共资金运用到哪里、 公权力行使到哪里, 审计监督就跟进到哪里”。审计监督的广度和深度的增加伴随的是审计工作量的快速增长。按照帕累托效率(Aron Raymond,2017)的解释, 涉及经济活动的任何措施都应当使“得者的所得多于失者的所失”。因而, 一个需要消耗大量资源且徒然增加审计成本仍无法保证效果的执行手段是背离政策设计初衷的。一个高效率、 高质量的审计辅助方法也就成了审计全覆盖执行的技术瓶颈。区别于传统的审计取证和管理方法, 大数据赋能下的审计全覆盖可以利用多样的信息技术来简化审计资料收集和整合的整体流程, 进而实现审计全覆盖执行过程的高效率和审计成果的高质量。具体来说: 通过数据挖掘技术, 对特定事项的真实性、 有效性进行分析, 找出离群结果, 查找隐藏在海量数据中违规操作的蛛丝马迹; 可以使用自然语言处理将纷繁杂乱的文本信息等非结构化数据连同结构化数据进行分析和处理并找出关键信息(Qiu Xipeng等,2020); 利用以图论为主要技术应用的社会网络分析技术将审计视角由“点”扩展至“网络”以精准定位审计疑点; 借助区块链技术的去中心化、 不可篡改性和追溯性等特性, 促进审计平台信息共享, 确保审计信息真实可靠(蒋尧明等,2021)。
(三)是保持审计长效威慑力与强化审计问责的实践要求
刑罚的威慑力并不是或者说并不是全部来自于刑罚的严酷性, 而是刑罚的必定性。审计监督威慑力中的必定性意味着要提升审计人员发现揭露被审计单位在国家政策落实、 财政预算执行和财政收支真实合法性、 自然资源环境保护、 民生资金与项目和经济责任履行等领域违法违纪行为的概率。要全方位提升审计监督的长效威慑力, 要大幅度提升审计揭示违规违纪的可能性, 就要在强化审计问责的过程中, 不断通过加强审计技术方法创新以增强审计查核能力、 执法能力。大数据技术对于审计监督长效威慑力形成的促进作用通过两方面表现。一方面, 大数据技术可通过对数据信息(结构性信息和非结构性信息)的搜集挖掘、 清洗、 集合存储、 可视化分析, 帮助审计人员从枯燥的数字和分析过程中解放出来, 提升审计人员洞悉被审计单位数据背后的内在联系、 规律和走向趋势的能力, 借此找出潜藏的更深层次的审计风险点, 提升审计监督威慑力。另一方面, 大数据对审计全覆盖长效威慑力的影响是通过跟踪追溯性功能实现的。基于大数据技术的审计全覆盖可以更有效地对特定事项开展“365天不间断”审计, 突破传统方式下时空条件对审计活动的限制, 重构历史数据与当前数据的维度联系。此外, 大数据技术将以动态性、 实时性的联动方式推动审计查出问题长效整改机制, 做实审计监督的后半篇文章。
三、 大数据赋能审计全覆盖的探索与现实困境
(一)大数据赋能审计全覆盖的探索
为贯彻上级机关关于“提升信息化支撑能力, 提高数据管理水平”的指示精神, 各地开展了大数据赋能审计全覆盖的创新实践。山东省的大数据协同化创新、 湖北医保审计的数据挖掘创新和粤港澳大湾区大数据审计队伍建设创新均取得了不俗的成果, 这些有益探索为未来的大数据赋能审计全覆盖的推进提供了宝贵经验。
1. 山东省大数据审计使用质效和协同化创新。2017年11月, 山东省审计厅印发了《关于加快推进智慧审计建设的意见》(简称《意见》)。《意见》提出, 要以大数据技术应用为核心, 构建大数据审计模式, 以“智慧审计”建设推进审计全覆盖。此后, 山东省以紧贴审计工作需要为关注点, 着重解决大数据技术与审计工作配适度的问题, 创造性地将外部技术力量作为审计工作的强有力辅助手段。特别是在解决大数据技术与审计工作配适度方面, 山東省建立了围绕大数据“怎么存、 怎么管、 怎么用”的创新路径。一是以省级“云计算”平台为依托, 搭建覆盖全省审计部门的数据中心, 解决大数据存储的技术问题。二是研发构建省域内审计大数据管理的全平台, 平台集数据远程报送、 智能入库、 规范整理、 授权使用和综合查询等五大功能于一体。在数据平台的支持下, 审计人员可以及时地掌握汇总后的各类综合信息, 精确检索所需信息, 提升大数据管理质效和协同化水平。三是综合各类技术方法, 提升大数据资源利用效率, 如使用“审计百度”检索技术快速抓取数据索引库内的高相关词条, 同时将检索结果按照相关因子进行排序, 这极大地提升了审计人员对大数据的使用感观和使用主动性。
2. 湖北医保审计中大数据跨行业关联和聚类的数据挖掘创新。湖北省在审计全覆盖实践中, 积极探索大数据技术在医保审计中的应用, 并在跨行业关联和聚类的数据挖掘方面取得了较大的创新成果, 这为大数据技术在其他部门领域的应用提供了较为清晰的思路。一是应用Hadoop集群技术搭建大数据应用的基础设施框架层, 同时依靠分布式文件系统HDFS提高数据容错率, 完成安全模式下数据系统内持续化程序组成, 并利用集成化使用Hive数据仓库处理工具和达梦数据库缩短数据延迟加载收集实践。二是依据医保审计的特点, 搜集涉及医保、 新农合、 公积金、 税务、 工商、 殡葬、 伤残低保和婚姻子女等来自多部门多领域的信息, 通过后续关联对比, 精准定位审计中的疑点位置, 大幅提升审计质量和效率。
3. 粤港澳大湾区大数据审计队伍建设创新。为解决大数据审计队伍在应用能力不足、 人才结构分布不均、 人才地域差异较大和领军人才缺乏等方面存在的发展难题, 广东省审计厅确立了环境、 平台、 培训和布局等方面的高质量发展路径。一是健全相关人才激励机制, 以科学的奖惩制度来调动人才的积极性, 实施大数据审计的人才团队型管理, 着力构建由领军人才、 骨干人才和一般人员组成的“橄榄型”团队结构。二是依托“数字政府”和“金审三期”平台建设对审计队伍开展大数据审计业务培训, 借此提高大数据审计队伍的实战能力。三是开展粤港澳三地大数据审计资源共享, 探索粤港澳三地在大湾区建设中项目审计的合作模式, 助推大湾区建设高质量发展。
(二)大数据赋能审计全覆盖的现实困境
大数据技术应用于审计全覆盖是推进国家治理现代化的重要战略, 然而我国对于大数据技术应用于审计全覆盖还有很长一段路要走, 仍面临着管理体制机制滞后、 多维信息获取存在壁垒、 大数据应用存在信任风险和大数据应用的系统化能力羸弱等制约因素。
1. 面向大数据应用的管理体制机制存在一定的滞后性。一个完备的制度体制和成熟的制度运行机制是大数据赋能审计全覆盖真正奏效的重要保障。大数据作为一种方兴未艾的新兴事物, 不可避免地会存在各种各样不完善的地方, 而大数据赋能下审计全覆盖更是牵扯面广、 处理关系复杂的一项系统性工程, 对相应的配套制度设计也有着特殊考量。目前, 我国虽对大数据技术应用给予了高度关注, 但对审计过程中存在的数据客观性、 程序正当性等现实问题在制度体制机制层面进行说明限定还有待完善, 而这也在一定程度上制约了大数据赋能审计全覆盖。一是尚未出台大数据赋能审计全覆盖的专门性的法规制度和面向实操的应用指南。以专门性的法规制度规范审计人员行为, 是维护国家法律体系统一状态的法治精神的应有之义。而以专业化的应用指南对大数据赋能审计全覆盖的步骤程序、 组成口径等细节问题形成固定规制将为实践工作的展开提供一条明确的路径。二是审计人员缺乏大数据思维, 导致针对大数据技术应用的制度设计无法真正物尽其用。广大审计工作一线人员应当养成“用数据说话”的思维, 突破原有的审计证据的搜集范围, 凝聚“一切皆可为数据(维克托·迈尔-舍尔维恩等,2013), 数据皆可为证据”的数据共识, 增强大数据对审计工作的预测性意识。
2. 多维审计信息获取存在壁垒。审计大数据信息获取是大数据赋能审计全覆盖的首要环节, 是推动大数据应用制度持续运行、 有效提升审计质量的关键内容。然而, 目前我国审计机关与其他机关间的信息数据沟通效率、 频率不高和审计多维信息固有特性制约着大数据信息的整合优化。具体来讲, 一方面, 审计全覆盖中使用的大数据信息来源是广泛多元的。而这些信息由所属部门管理, 加之受到部门中心主义的影响, 难以为审计人员所用。这类信息沟通障碍或者说信息资源壁垒还存在于上下层级的审计机关和针对境外投资等的审计活动(郑国洪等,2021)。另一方面, 大数据信息的形式繁多, 诸如文本、 视频图像、 音频等形式的海量数据格式上的差异造成的口径不一也给多维度审计信息的获取造成窒塞。诚然, 在审计过程中可以借助信息处理工具对其进行清洗、 重述, 但如何将多种信息进行相互鉴证, 使其相互之间发生吸附、 碰撞和合并将是审计实务中需要考虑的问题。
3. 大数据应用存在信任风险。信任是一個伦理学上的概念, 是指主体对他人言行或生活于其中的社会制度可信性的期待和信念。信任与信用互为表里, 构成现代社会正常秩序下的基本伦理守则。信任风险的存续将以监督成本、 证明成本为介质增加社会中协作、 交易的运作成本。大数据赋能审计全覆盖中的信任表现具有一定的特殊性。大数据审计全覆盖面对的信任内容是技术、 程序算法和智能机器等非人格化客体信任与规则、 契约与权威的制度信任以及社群人际信任的叠加。大数据自诞生始就天然带有多源、 低价值密度和操作技能要求特殊的特性。具体表现在: 一是大数据的低价值密度意味着审计人员在执行审计全覆盖政策时, 要对大数据进行多轮程序算法计算和智能机器的重复反馈处理。此种情境下, 难控的数据系统差错将与信任直接挂钩。二是大数据的多源性使得从收集、 处理到分析、 销毁必然要经历多种公共部门和人员, 这也就增大了出现“暗箱”操作的可能性。另外, 在地方审计机关进行大数据技术应用往往会采取向社会机构购买服务的做法(浙江省注册会计师协会课题组,2021), 信任风险也会存在于此类实务操作中。
4. 大数据应用的系统化能力羸弱。目前, 我国各级审计机关开始逐步有意识地在执行审计全覆盖的过程中引入大数据技术, 并积累了一定经验。但囿于人才、 技术和设施等基础资源供给不足, 大数据赋能审计全覆盖的系统化能力发展进程仍显迂缓。一是缺少一支“高精尖”的审计团队。伴随着审计全覆盖的日渐展开, 对于拥有大数据和审计等综合知识背景的复合型审计团队的需求大大增加。与之对应的却是相关人才培养进程的相对滞后。在一个团队建设需要超长培养期的状况下, 此类供求失衡的处境还将在未来一段时间内长期存续(唐大鹏等,2020)。二是技术和硬件建设还存在短板。现阶段, 大数据在审计全覆盖中的运用多停留在浅层逻辑, 而未将大数据作为审计全覆盖的基础性工程给予高度关注。三是多种要素的磨合, 形成系统化能力还有很长的一段路要走。大数据赋能审计全覆盖的过程不仅仅是各类要素简单叠加的过程, 而是通过诸种要素的磨合、 熔炼, 才能培养默契度进而形成有机结合的整体, 从而达到协调化配合实现效用倍增。
四、 大数据赋能审计全覆盖的前路展望
大数据技术作为一项具有深刻变革影响的信息技术, 对促进审计全覆盖高质量实施具有深远影响。研究大数据未来应用中的前路展望将为促进大数据技术发挥充分效能和推动形成审计全覆盖发展新局面进而实现国家治理现代化目标提供行动助力。
(一)加强大数据赋能审计全覆盖的制度建设
为了避免政策执行中出现混乱不明、 疲软乏力的状况, 相关部门要做好顶层设计, 对政策执行工作进行系统性、 统筹性、 全局性的指导; 同时, 应注意顶层设计与基层探索的互动结合, 以系统性思考路径消除创新发展产生的更替冲突, 有条不紊地推进大数据赋能审计全覆盖的进程。一是加快大数据赋能的制度型发展。从制度层面上阐发大数据赋能审计全覆盖的核心理念、 流程环节、 领导组织、 应用对象以及职业要求规范等内容。制订并发布大数据技术的应用指南和优秀案例介绍, 以此介绍大数据赋能过程的计划制订、 组织实施、 效果评估、 报告范式、 考察反馈以及事项指标等内容。二是优化组织架构, 划分管理职责。现阶段, 面对基层人员业务素质和实践经验相对欠缺且提升时间所需较长的现实情况, 应考虑将大数据技术应用中的分析职责和执行职责分离。将大数据应用中专业性、 集中式的数据分析、 对象监控、 角色预判等关键环节向总署、 省厅层级倾斜, 而后再将具体任务下派至各主管审计机关。其目的在于在提高审计全覆盖工作的规范性、 针对性的同时, 能减少基层能力欠缺对大数据技术效能发挥的影响。三是将维护好数据安全贯穿大数据赋能审计全覆盖的全过程。以制度和技术创新为突破点, 通过确立大数据使用的安全规范标准来防范审计过程中涉及的尤其是关系国家安全的数据被篡改和泄露风险。不断完善大数据安全技术, 围绕数据漂白、 数据库防火墙、 同态加密等密码学技术开展技术创新(陈玲,2022), 提升保密能力。
(二)打破多维审计信息获取壁垒
以多维度、 多视角的审计信息构成大数据的基础来源是实现审计全覆盖稳步向好的前提性条件。共享机制可以提升审计访问数据的开放程度, 借此破除数据获取的部门隔膜; 通过大数据分析技术的创新变革, 则可以建立新数据分析体系, 进而打破多维审计信息的获取壁垒。一是建立行之有效的信息数据共享机制。审计机关应建立囊括多部门、 多地域、 多年度的信息数据流通平台和统一的身份认证门户, 夯实数据资源基础。利用大数据技术精准分析审计工作对数据开放的范围需求, 编录数据共享总纲清单和亚纲细则以对接数据共享需求。各部门还应成立专职协调机构用于传递数据信息的即时需求、 攻击讯息和差错、 异议的修订动态。二是以人的智能与决策解决大数据处理方法中的高阶复杂问题, 以人为介质传递数据信息与机器间的“波动”, 借此实现多维信息的互动。发展并涵盖数据接入、 流式处理、 图计算、 训推一体的新一代全栈式的大数据系统软件, 重构从预处理、 表征学习、 语义分析与知识图谱推理、 决策研判到可视化的全技术链大数据分析处理流程, 建立以审计全覆盖任务为导向的具备场景感知、 任务感知的大数据计算环境。
(三)保障审计数据可信度
审计数据的可信度是大数据应用质量控制的生命线, 是大数据赋能审计全覆盖的基础性意义。信任是一种极易破碎的稀缺资源, 打造极富可信度的数据素材需要长效的、 审慎的规范化控制和典式的判断裁定作为保障手段。一是创新组织管理。应推动组织管理的流程再造创新, 维护防止权责失衡泛化与保持组织弹性空间的动态平衡, 并在此基础上探索“零信任”基础上的任意交互行为的安全设计的组织管理路径。数字智能时代下, 愈发模糊且渐趋开放的组织和系统边界使得以划定部门边限、 剥离组织层级为概念的传统安全措施(如设立本地防火墙、 设置访问控制等手段)变得不合时宜。数字时代下的数据信任应以设立最小权限访问、 数据泄露假设等原则为依据, 对审计组织管理中的历次随意发出的数据访问均进行识别验证。“零信任”式的数据管理创新能够在大数据环境下发现并阻断审计系统内存在风险的数据访问, 保障审计数据的可信度。二是做好大数据赋能过程中的信任风险识别和应对。建立风险管理云计算平台, 向审计系统内的审计数据用户提供安全服务。通过云计算监控平台了解审计数据采集、 储存、 结果分析和销毁过程中的风险态势, 并向数据安全风险点提供必要的安全处理方案。三是依靠技术秩序重设信任机制。区块链技术吸纳的分布式节点、 共识算力、 灵活编程等功能使其天然具备去中心化、 不可篡改、 可追溯等特点。审计机关可以尝试建立区域范围内的区块链系统, 将审计数据通过区块链系统进行存储、 传递和使用, 以此来保证审计数据的完整性和真实性。
(四)提升大数据赋能审计全覆盖的系统化能力
系统化能力的缺位致使大数据赋能审计全覆盖丧失了非稳态结构中学习和应变的能力, 容易造成诸要素结构和功能内耗, 无法协调一致形成外向合力。要建构系统化能力就要摆脱排列组合的零散状态, 针对系统化能力的短板精准发力。一是注意相关人才的培养和引进工作, 建立一支“高精尖”的审计队伍。定期开展审计人员大数据应用能力培训, 对审计人员的大数据技术应用能力进行考核与激励。在实践中培养审计人员的大数据思维, 并逐步实现对复合型人才的培养。在开展人才培养的同时, 还应注意大数据相关人才的外部引进。持续优化和拓宽人才引进渠道, 开展面向目标人才的政策宣讲或现场招聘, 并在重要城市设立人才引进工作站。而对于那些紧缺岗位, 可以实施弹性人才引进政策, 以兼职、 研究合作项目或人才共享等方式吸引高层次人才为审计工作服务。二是加快大数据赋能审计全覆盖的基础性工程建设。以应用平台、 安全系统和标准规范为主要内容的基础性工程建设, 是为未来大数据审计进一步发展积蓄后劲的重要助推。特别地, 在大数据赋能的应用平台建设中, 要格外注意平台建设中可扩展性的保留。同时, 在相关建设中还应做好基础性工程建设的期间规划(秦荣生,2014), 这主要是为了解决建设盲区问题和重复建设问题以避免资源的空耗浪费。
【 主 要 參 考 文 献 】
陈伟,居江宁.基于大数据可视化技术的审计线索特征挖掘方法研究[ J].审计研究,2018(1):16 ~ 21.
秦荣生.大数据、云计算技术对审计的影响研究[ J].审计研究,2014(6):23 ~ 28.
Qiu Xipeng,Sun Tianxiang, et al.. Pre-trained models for natural language processing: A survey[ J].Science China(Technological Sciences),2020(10):1872 ~ 1897.
【基金项目】黑龙江省社会科学基金项目“公共政策执行视角下黑龙江省政策措施落实审计质量研究”(项目编号:17JYE398)
【作者单位】东北农业大学经济管理学院, 哈尔滨 150036