财政预算绩效评价大数据应用的实践探索
——以新疆维吾尔自治区为例
2022-02-06赵恺
●赵 恺
一、引言
全面实施预算绩效管理是党中央的重大决策部署。 中共中央、 国务院《关于全面实施预算绩效管理的意见》明确指出, 全面实施预算绩效管理是推进国家治理体系和治理能力现代化的内在要求,是深化财税体制改革、建立现代财政制度的重要内容。 为贯彻落实中央决策部署, 新疆维吾尔自治区财政厅紧紧围绕加快构建“全方位、全过程、全覆盖”预算绩效管理体系目标任务, 将绩效作为自治区财政管理的“底线”之一,全面促进预算管理与绩效管理深度融合, 着力推动各部门单位以预算绩效管理为抓手, 不断提高财政资金配置效率和使用效益。
信息化是完善预算绩效闭环管理工作机制、 推进管理水平提质增效的重要内容。 新疆维吾尔自治区财政厅在全区各级财政部门全面实施预算绩效管理信息化的基础上, 一方面依托金财工程网络,建立“自治区—地(州、市)—县(市、区)”纵向的绩效管理数据通道, 打通上下级财政预算绩效信息管理瓶颈, 初步构筑出全区规模的预算绩效管理数据仓库, 将财政部门对预算绩效的监管延伸至基层单位和资金使用末端;另一方面,集中精力深入开展预算绩效管理理论体系研究,结合财政预算管理需求, 借助高等院校、第三方机构的研究和技术力量,在预算绩效评价大数据应用方面进行了有益的探索。
二、新疆预算绩效管理数据形态分析
大数据有“4V”特征,即数据量大(Volume)、数据种类繁多(Variety)、处理速度快 (Velocity) 和价值密度低(Value)。 应用大数据技术就是要通过对数据量大、来源分散、格式多样的数据进行采集、存储和关联分析,从中挖掘新知识、创造新价值、培育新能力。从现实和发展角度看, 大数据不仅是一场技术革命,还是一场管理革命。 原中国行政体制改革研究会副会长周文彰认为,大数据将通过全息数据呈现,使政府从“主观主义”“经验主义”的模糊治理方式,迈向“实事求是”“数据驱动” 的精确治理方式。 在大数据条件下,“人在干、云在算、天在看”,数据驱动的“精确治理体系”“智慧决策体系”“阳光权力平台”都将逐步成为现实。
以大数据视角分析和审视新疆预算绩效管理信息,符合开展大数据应用的基本需求。 一是预算绩效信息量大、覆盖面全。 贯彻落实中央全面实施预算绩效管理决策部署,新疆已完成将“所有部门单位、所有财政资金”全部纳入预算绩效管理的工作目标,自治区本级、14 个地(州、市)、96 个县(市、区)、1.3 万家部门单位每年约6.7 万个项目支出全部实现全过程预算绩效管理, 年新生产数据量近80 个GB。 二是预算绩效管理数据类型呈现多样化。按照财政部、新疆预算绩效管理制度办法规定,新疆各级财政部门收集并审核的材料包括事前绩效评估报告、绩效目标表、绩效监控表、绩效评价单位自评表、绩效评价部门评价报告、第三方机构绩效评价报告和各阶段佐证材料等。数据种类包括已纳入数据库管理的结构化数据以及诸多WORD、EXCLE、图片、PDF 文档等非结构化数据。三是预算绩效信息处理速度符合财政资金管理特点。相比网上购物、娱乐、短视频等在线商业应用,显然预算绩效管理信息产生、处理的效率比较低;但从财政预算管理的周期看,预算绩效信息的处理速度是完全能够满足政府财政资金管理的需要。四是单个项目预算绩效评价的价值已基本挖掘出来。 一方面,新疆各级财政部门在编制2021 年度部门预算时,落实绩效评价结果与预算安排挂钩机制,大力削减低效无效资金, 依据评价结果调减了2100 多个项目预算资金近30 亿元, 发挥出了预算绩效对提高财政资金使用效益的积极作用。 另一方面,项目作为财政资金管理的最小单位之一,往往受地域、时间、环境等诸多外部条件影响较大,单一项目(包括采取抽样方法选取少量项目)的绩效评价结论很难总结或提炼出标准和规律,对政府的宏观经济决策辅助功效不大,同时也限制了预算绩效在更高层面对优化财政资金分配格局作用的发挥。
因此,从新疆预算绩效管理提质增效的实际需求考虑, 在继续深入做好项目预算绩效精细化管理、全力保障预算绩效管理基础数据真实准确的同时,也迫切需要进行一场大数据管理革命,从全局、宏观的高度审视和调整预算绩效管理,力争把绩效结果根植于最广泛的数据基础上,探索建立“用数据说话、用数据决策、用数据管理、用数据创新”的绩效新模式, 最大限度地为财政预算管理提供科学、可靠的依据。
三、新疆开展预算绩效大数据应用的目标
通过大数据关联分析,展示出的结果往往是不可预知的。 这种不可预知性通常反映出事务内部非逻辑性的必然联系, 是数据挖掘价值最大的部分。但获得有效成果的前提条件包括:原始数据采集是否真实,数据清洗方式是否准确,以及预设的数据模型或研究框架是否科学、合理、中性等。
为贯彻落实中央关于全面实施预算绩效管理的指导思想,新疆维吾尔自治区财政厅将开展预算绩效大数据应用的初期目标任务设定为:按照业界大数据应用标准,组建专业团队,对全区直达资金(包括中央、自治区)项目预算绩效管理数据进行分析建模,用实践手段去验证涉及预算绩效大数据应用各关键环节的可行性,并总结出有效推进工作的方法。
(一)研究预期应用模型的可行性
初步预设的预算绩效管理大数据应用模型有四种,包括:一是统计分析模型。 建立新疆分地域、分时间、分行业的财政项目支出投入—产出—绩效的动态模型, 综合反映同类资金在不同区域的效果。 二是支出标准模型。 对历史的项目绩效信息特征化,按一定算法将单个项目投入、产出、效益等关键信息降维成点,再将相同投入方向的所有项目点在数轴上做正态分布,从统计学角度为研究财政项目支出标准体系提供依据。 三是辅助决策模型。 将历史数据封装成“黑盒”,量化新增项目事前绩效评估情况后,输入“黑盒”进行讨论,输出对项目“支持”“部分支持”“不支持”的概率分析。 四是审计推送模型。 通过分析历史数据,自动建立行业标杆,按流水作业方式,对当年部门单位填报的项目预算绩效情况进行审计, 发现问题再推送到人工复审,降低财政部门全覆盖审核工作强度,提高工作效率。
(二)摸索数据清洗和标记的方法
数据清洗是在收集多个维度、来源和结构的数据后,对数据进行抽取、转化和集成加载的过程,目的是对全部数据进行归并整理,以及更正、修复一些错误数据来消除噪声。 新疆预算绩效大数据清洗,计划通过实践,对比分析各类大数据清洗方法的优劣,包括统计学方法、基于聚类的方法、基于距离的方法、基于分类的方法和基于关联规则的方法等,最终遴选并确定符合新疆绩效管理最佳的数据清洗方法或组合方式。
数据标记是基于预期的应用模型,利用经验为元数据增加统一的、 有使用价值的外部属性的过程,来弥补数据收集阶段的缺陷。 新疆预算绩效大数据的标记工作, 计划第一阶段使用人工方式,采取“边标记、边建模、再标记”的方法,循环往复推进标记工作。 其目的是利用相对有限、可控的数据规模,来验证在完成预期应用模式下最经济的标记数量, 进而为后期改进和完善数据收集机制提供依据。
(三)实践预算绩效大数据的技术路线
新疆预算绩效大数据的总体架构为 “一个机制、两套体系、三个平台”。 “一个机制”指预算绩效大数据管理工作机制,包括数据共享开放、业务协同、大数据科学决策、精准监管等应用机制。 “两套体系”包括组织保障和标准规范体系、统一运维和信息安全体系,为大数据系统提供稳定运行与安全可靠等技术保障。 “三个平台”分为基础设施平台、数据资源平台和业务应用平台,其中:基础设施平台是集约化建设的IT 基础设施层, 为大数据处理和应用提供统一基础支撑服务;数据资源平台为大数据应用提供统一数据采集、分析和处理等支撑服务;业务应用平台为大数据在各领域的应用提供综合服务。
基于大数据实施方法,研究确定新疆预算绩效大数据的技术架构:一是分布式系统架构,满足各类型数据的存储、 大规模数据计算和数据分析;二是J2EE 框架,遵循J2EE 标准及规格,规范应用系统的开发与部署,进而体现其良好的兼容性、可移植性、安全与再用价值;三是大数据BI 技术,提供完整的解决方案,将现有的绩效数据进行有效的整合,准确地提供报表并提出审计、支出标准、辅助决策依据。
四、实施第一阶段大数据分析研究的情况
按照新疆预算绩效大数据的总体架构,以自治区2019、2020 年度直达资金全过程预算绩效管理为数据基础,通过对数据采集、清洗、存储、处理与分析等,实践探索预算绩效大数据的技术路线。
(一)数据采集(ETL)
数据来源于自治区各地、 县上报的EXCLE、WORD、PDF、图片等非结构化数据。
1、数据抽取(Extract)
(1)建立分级文件夹并压缩。 一级目录为业务过程文件夹 (1—项目绩效表、2—一次监控表、3—二次监控表、4—自评表、5—财政审核评价表),二级为区划码+地(州、市)名称文件夹,三级为区划码+县(市、区)名称文件夹。
(2)数据包临存入库。 按照提取算法读取压缩包数据批量识别,同时自动归类项目基础信息和绩效指标、监控信息、自评价、部门评价信息。 ETL 自动推送存疑常数据,由人工甄别处理。 提取甄别完毕后归档入临时项目库。
2、数据清洗转换(Cleaning、Transform)
(1)标记关联关系。 一是按照区划、部门、单位名称、项目名称,按照规则自动标记关联关系;二是依据项目信息自动标记目标、监控、自评价等隶属关联关系,确保项目、目标、监控、评价隶属关联准确性。ETL 自动推送不能建立关联关系过程数据供人工标记。
(2)不一致数据转换。隶属关联标记完成后,不一致信息由ETL 自动转换为一致,如单位名称、项目名称等信息。ETL 自动推送不能自动转换的数据供人工转换。
(3)错误数据纠正。联动推送项目监控、自评价数据执行率、 定量指标完成率等计算错误的数据,按照算法计算推送至人工核准。 复审通过数据,自动从临时库转入正式库。
3、结构化数据抽取。基于新疆预算绩效管理信息系统上下级互联互通的完成,自治区本级、地、县数据采集将采用接口方式通过预算绩效上下级互联互通系统直接获取。
4、增量数据更新。 一是采用时间戳方式,通过比较系统时间与抽取源表的时间戳字段的值来决定抽取哪些数据。二是全表对比在不一致时采取全增方式,解决绩效目标调整的业务问题。
(二)数据标记
1、自动标记方法。 一是专项类型,如直达资金、产业扶持已明确的专项类型等。二是项目功能分类,通过功能科目一级自动标记为项目大类,如201—一般公共服务支出,细化标记至二级。 三是项目支出分类,如301—工资福利支出,细化标记至二级。
2、手工标记方法。一是标记项目分类,标记大类对个人补助类、专项业务费类、专项支出类,同时细化并标记专项支出类。二是标记其他属性,如乡村振兴、文化润疆、十大产业等。
(三)建立应用模型
1、项目信息模型。 项目是绩效目标、监控、评价的载体,一个综合、直观、易操作的横向可汇聚,纵向可级联的项目展示模型尤为重要。 一是确定项目元素。 包括:地域、时间、部门单位名称、项目名称、专项类型、支出功能分类、支出经济分类、预算数(财政资金、其他资金)、其他属性、评价得分等。二是分析级联关系。包括:地域维度(自治区、地、县)、项目维度(绩效目标、监控、自评价、部门评价)、时间维度等。 三是布局展示及钻取。 按照地域、时间,以部门单位和项目为单位罗列展示项目信息,按照级联关系钻取,以项目信息钻取按照原始报送格式展示齐目标、监控、评价信息。
2、统计分析模型。建立漏斗分析模型、分布分析模型、属性分析模型等,通过分地域、分时间、分行业的财政项目支出中的投入、产出、效益的动态模型,采用均值、方差、偏度等统计方法解读分析同类资金在不同地区的实施效果。
3、自动审计模型。 包括指标体系、监控、单位评价审计模型。 通过历史数据透过分地域分行业绩效审计体系模型,按流水作业方式,对当年部门单位填报绩效数据进行审计, 发现问题再推送到人工复审,降低财政部门全覆盖审核工作强度,提高工作效率。
4、支出标准模型。对历史项目信息特征化:一是信息降维, 按照单个项目支出标准=预算执行数/实际产出数来计算,将项目数据降维成点。 二是数据投影,将同类项目的支出标准在数轴上做正态分布, 从统计学角度研究财政项目支出标准。
5、辅助决策模型。 将新增项目预算绩效指标与历史项目实际完成指标封装成决策池, 从支出标准、 效益两个维度进行计算, 对偏差值进行统计,以一定的支持率划分区间,按等级确定支持程度。
五、预算绩效大数据应用实践中发现的问题及解决思路
目前, 新疆财政预算绩效大数据第一阶段实践工作已基本完成。总结工作开展过程,主要发现有两个方面的问题: 一方面在预算绩效管理业务上,存在项目分类没有统一标准、同类项目绩效指标设置不规范、绩效评价方式和尺度不一等问题,会干扰大数据分析结果;另一方面在技术准备上,低估了数据抽取及清洗阶段的工作量, 对项目属性把握能力不足、标记属性精准度有待提高,选用的建模工具对复杂算法支持度不够等。
以问题为导向, 下一阶段新疆预算绩效评价大数据建设的工作思路为: 一是在标准化上下功夫,加快自治区分行业、分领域共性项目核心指标体系建设,把控好项目分类和核心指标,确保入数据仓库项目可比可测;二是在规范化上下功夫, 全面实施自治区预算绩效上下级互通工程,从基层单位、从信息源头规范入库数据,降低非结构化数据量, 减轻数据抽取和清洗的工作量;三是在科学化上下功夫,组成专家小组重新评估数据建模分析工具,提高数据分析效率和对复杂算法的支持,确保能够及时积极应对财政管理各类需求。