政府统计数据治理背景下的智慧统计体系建设思考
2023-12-08裴来辉
裴来辉 刘 畅
(深圳市维度数据科技股份有限公司,广东 深圳 518000)
一、引言
数字经济时代,数据与资本、劳动力、土地、技术共同构成新的生产要素,带来了生产方式变革,创造了新的业态。2022 年12 月2 日,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》出台,初步搭建起我国数据基础制度的“四梁八柱”,促进数据要素价值加快释放。而政府统计数据作为数据要素中不可忽视的重要组成部分,在加快培育数据要素市场中有着重要的示范作用。在此背景下,推动政府统计数据治理,构建现代化智慧统计体系,成为各级政府规划中数字政府建设的重要内容,在国家治理体系和治理能力现代化中处于牵一发而动全身的重要地位。
二、政府统计数据治理需要考虑专业特性
(一)政府统计数据的内涵
依据联合国统计署《政府统计基本原则》的描述,政府统计为“政府、经济部门和公众提供有关经济、人口、社会和环境状况的数据”,公正不偏地编纂“有实际用途的官方统计结果并加以公布”。政府统计数据是政府为了履行职能,通过统计机构和相关部门根据科学的统计方法制度依法组织实施统计活动,获得的与经济社会相关的数量化信息。它是重要的决策依据,有着“晴雨表”“风向标”“测量仪”“指示器”的作用,是公共资产也是公共资源,是政府治理的工具,也是政府治理的对象,是最重要的公共产品之一。
(二)政府统计数据的特性
虽然政府统计数据与其他企业数据、大数据均是以数据搜集、整理、分析、应用为生产流程,但是由于核心目标的差异导致政府统计数据区别于其他大数据关注对象,其具有清晰的业务特性,主要表现在三个方面。
1.有明确的业务场景。政府数据均是根据政府职能确定的相关业务范围进行采集,政府统计数据区别于其他部门数据,有明确的统计方法制度、精准的指标定义、法定的分类标准以及有规律的采集频次,有非常强的业务特性。比如规模以上工业产值根据规模以上工业统计方法制度调查得到,对调查频次、调查对象范围、产值定义均有清晰的规范,脱离方法制度理解“规模以上”“工业”“产值”的概念就可能出现口径不一的问题。
2.包含大量的分析数据。政府统计数据不仅包含第一手数据,更包含大量经过处理、加工、汇聚而形成的数据、信息、知识、智慧。以规模以上工业增加值增速为例,它是对规模以上工业企业上报的产值结合行业增加值率进行加工,在计算增速时既需要考虑价格因素的可比性,还需要考虑产业活动单位的地域情况,最终还会参考规模以上工业企业的能耗税收及实际经营情况等,是典型的分析数据。
3.数据维度立体性强。政府统计数据是典型的面板数据,包含较长的时间维度和较多的横截面维度,比如数据的主体、区域等。以数据主体为例,每一条政府统计数据关联的用户信息都很重要,且与业务制定和设定的数据采集规则密切相关,每个企业和项目主体都可能对数据进行一定程度加工,同时数据收集者也是数据构建的参与者。这些维度构成立体的政府统计数据面板。
(三)政府统计数据治理的目的
《DAMA 数据管理知识体系指南》中指出数据治理是对数据资产管理行使权力和控制的活动集合,是一项系统性工程,包含角色与职责、流程与规则、质量和数量,核心是数据流动。政府统计数据治理则是对政府统计数据资源充分挖掘、盘活,根本目的是提升政府统计数据的价值。
(四)政府统计数据治理的关键环节
目前国内对政府数据治理流程的研究结论主要是从顶层设计建立起统筹协调的机构,到摸清各部门数据家底、建立统一数据资源平台实现数据融合,再到建立内部需求对接机制实现共享、建立对外开放模型实现开放,最后实现市场化的利用,数据安全贯穿始终。随着政府数据化转型的加快,这一整套流程在各地都有不同程度的实践和落地,《中国政府开放数据利用研究报告(2022)》提到全国333 个地级行政区中建成公共数据开放平台的地区已达58%,虽然还未完全成熟,各地建设效果也存在差异,但都是很有意义的尝试。这部分尝试大多借鉴参考了国际国内先进企业通用的数据治理经验,偏重技术,当政府统计数据归集其中时会发现有许多无法兼容的问题,其根本原因在于忽略了政府统计数据的专业特性。
政府数据的治理对专业性提出了更高的要求,需要考虑四大关键环节。
1.数据集成管理充分考虑流程再造。20 世纪80年代西方国家将企业管理中的“流程再造”理论引入到了公共管理领域,有美国学者创造性地提出了将广泛应用于商业领域的流程再造理论引入政府治理领域中的观点,主要包含环节流程再造、组织结构重组与信息资源整合等环节,在政府数据治理中主要需要考虑环节流程再造和信息资源整合。政府统计数据来源大致可以归纳为三大类,第一类是来源于业务系统,主要是国家联网直报平台的数据;第二类是来源于部门统计数据,有相对固定的采集频次和报送方式;第三类可以统一归纳为外源数据,包括上级部门反馈的各类加工汇总数据、协调的部门数据、不定期实地调查的企业信息以及部分互联网数据等,渠道多样,对接方式和频次不固定,数据格式没有统一标准,还存在一些非结构化数据。政府统计数据集成管理需要通盘考虑数据流转,按照不同地区政府数据流转的要求和业务流程,借助数据归集类平台支撑,进行贴近工作场景的数据采集流程简化和重组,同时明确数据采集主体和修改权限,构建有序、合理、持久运转的数据采集规范。
2.数据清洗充分考虑妥善处理数据缺失问题。政府统计数据采集在很多情况下会出现数据值缺失,例如新入库企业没有上年同期数值,这是符合统计方法制度的正常上报情况,在对这种不完整数据清洗时需要分辨正常数据缺失状况,根据不同的业务场景和需求选择适当的处理办法。
3.数据规范管理充分考虑符合业务的标准化处理。目前数据治理技术中通用的数据规范办法主要是规则处理引擎和标准代码库映射,一般遵循行业或者国家标准。但是在政府统计数据规范化管理的过程中会发现其业务特性太强,直接影响应用中数据的通用性、共享性、可移植性及数据分析的简便可靠性。这就需要按照统计业务规范去建立标准代码库,导致政府统计数据治理产生较高的业务门槛。需要在专业人员的参与下建立统计元数据管理规范和标准,建立标准统一、动态管理的统计数据资源目录,也就是“一数一源一标准”,实现各类统计指标的唯一识别和统计数据精准入库。
4.政府统计数据的流转需要充分兼顾数据共享和数据安全。数据只有流通到最需要的地方,实现多元优质数据根据业务需求在特定场景汇聚融合才能释放更大的价值。政府统计数据分析中越来越多地考虑引用外部数据,同时越来越多的机构、部门和公众对于政府统计数据的需求日益凸显,安全获取、解析和交换数据需要考虑政府统计数据的特殊性。《中华人民共和国统计法》第三章第六条规定“统计调查中获得的能够识别或者推断单个统计调查对象身份的资料,任何单位和个人不得对外提供、泄露,不得用于统计以外的目的。”针对政府统计数据的特殊性更要强调数据安全有序、合法合规流通,比如考虑隐私计算“原始数据不出域”“数据可用不可见”的流通范式、利用区块链技术增强数据保密能力等。
三、现代化智慧统计体系的内涵
党的十九届五中全会作出推进统计现代化改革的重大部署,《“十四五”时期统计现代化改革规划》明确规划了完善统计标准和指标体系、健全统计调查制度体系、优化统计数据采集体系、完善国民经济核算体系、健全统计监测服务体系、健全统计法治监督体系、深化统计体制改革和对外开放、推进统计信息化建设、健全统计工作保障机制等9 个方面内容,其核心是要求现代化的统计体系必须面向需求、面向治理、面向应用,是从实际出发、符合社会经济发展要求、与国家治理体系和治理能力现代化相适应的,在当前数字经济时代背景下集中体现在“智慧”一词。
图1 智慧相关词源
“智慧”一词有典型的中国传统文化底蕴。在中国古代,智慧不仅指聪明才智,还代表了把握真理的能力。习近平总书记指出:“运用大数据、云计算、区块链、人工智能等前沿技术推动城市管理手段、管理模式、管理理念创新,从数字化到智能化再到智慧化,让城市更聪明一些、更智慧一些,是推动城市治理体系和治理能力现代化的必由之路,前景广阔。”可以看到在城市治理过程中,数字化到智能化再到智慧化是一个层层推进和提升的过程。
现代化的智慧统计体系是借助互联网的全感知、全连接、全场景、全智能的特性和新型技术设备,结合区块链、云计算、大数据、人工智能、数字孪生、ChatGPT等技术优势,催生新的统计思想、理论和方法,更大程度激发数据整理、统计分析、监测、质量控制、风险防范等不同场景下的统计服务能力,以实现科学决策、智能管理、个性化精准服务的统计体系。
四、 政府统计数据治理在构建现代化智慧统计体系中的应用
政府统计数据治理的落脚点是服务于构建现代化智慧统计体系,让“以数据治理”成为可能,在技术潜力不断释放的智慧城市、智慧统计信息化平台建设中衍生出许多具体的应用场景。
1.多元数据库。创建多通路数据集成入口,对统计部门工作中使用的各类数据进行统一归集处理,对统计数据进行回溯和管理。在存储方面,探索与互联网特征相适应、与信息安全要求相匹配的数据存储方案,稳步推动分布式数据库应用,实现数据高效存储和弹性扩展;同时预留对外共享的服务接口,探索进行数据加密处理后的数据共享、交换、流通。
2.智能名录库。在目前统计系统的基本单位名录库建设基础上,与市场监管、税务、能耗、金融、征信、电信、互联网等业务数据紧密结合,进一步提高统计标准和统计数据质量,实现名录库信息的及时更新、实时更新,描绘更加立体、生动、准确的企业画像,根据指标对比和条件设置对名录库进行智能分类,动态更新储备库、“准四上库”、风险提示库等,并不断扩大基本单位名录库的应用范畴。
3.模型算法库。通过建模方法进行估算和推断,寻找数据特征、相关关系和变化规律,在此基础上进行汇总和推断;通过数据挖掘和机器学习等技术,沉淀统计工作中涉及的模型算法工具,支撑数据加工、数据分析和深度挖掘。在目前实践中比较典型的模型算法有主要宏观经济指标预测模型、企业达规预测模型、园区活跃度监测模型、企业动迁预测模型等。
4.统计产品生产平台。通过报表自动引擎和智能机器人(RPA 技术)实现统计年鉴、统计月报、领导干部手册、主要经济指标简析等统计产品自动生成。探索实现数据智能化分析,从宏观、中观、微观各层面论证分析结论。
5.数据质量提升平台。通过设定不同数据审核规则,对多元数据进行比对,通过数理统计分析开展数据质量可靠性评估,应用算法模型对数据进行预审,提升数据质量。
6.经济预测预警平台。运用经济数据推算预测模型,结合主要经济指标的核算办法,从行业、产业、企业生产经营及就业、物价、居民收入、结构调整、质量效益、区域对比等方面深入分析经济运行态势,在宏观层面数据下追踪微观主体运行状态,预测未来重点指标数据走向,按照历史数据进行宏观、中观、微观三级数据的预测分析,寻找影响经济发展的正向因素,识别负向因素,通过落地到企业层面来实现经济数据调度,生成智能化调度清单,辅助领导和部门对经济工作进行指挥调度。
7.经济数据可视化空间化。结合GIS 和数字孪生技术,动态可视化呈现各项经济指标的历史趋势、内部结构、关联信息和在地图上的具体点位,直观感知、生动演绎经济数据反映的具体内涵、空间区位、发展态势,满足演示、汇报、会议等多种形式,促进信息的深度洞察和深层挖掘。
8.办公移动化。打造手机端智慧应用,建立移动驾驶舱,支持随时查数找数,实现数据生产进度监测、数据审核过程跟踪、统计产品及时查看、主要经济指标实时更新等功能。
五、构建现代化智慧统计体系的举措
针对数字政府建设、统计数字化和智慧统计建设的发展趋势,结合不同区域对智慧统计建设的实践经验,对智慧统计建设提供几点建议。
1.建设统一的统计数据资源管理中心。建立统计元数据管理规范和标准,对统计部门工作中使用的各类数据进行统一归集处理,实现不同类型统计和经济数据的快速接入,经数据集成、抽取、转换、加载、融合后形成归集库、基础库和主题库,实现统计数据回溯和管理,构建宏观、中观、微观的统计数据库,为智慧统计应用提供统一的数据支撑。
2.建设统一的内部工作门户和外部服务门户。建设智慧统计内部工作门户,基于不同用户的使用特点,为各级统计工作人员、统计机构、政府部门、相关单位等政务公共网用户提供智慧统计服务平台使用入口,按角色权限提供统计生产、管理和服务等各种功能,为用户提供更好的统计服务门户和平台。
3.建设统一的智慧统计业务应用体系。根据实际需要进行应用完善和升级。建设统计生产应用体系,包括统计制度设计子系统、统计数据采集子系统、统计数据评估子系统、统计数据加工子系统、统计产品发布子系统等;建设统计管理体系,包括基本单位名录管理应用、统计队伍管理应用、统计执法管理应用、统计工作督导管理子系统、数据质量评估应用等;建设统计服务平台,包括智慧统计一张图应用、宏观经济分析预警预测应用、经济数据共享应用等。◆