技术、行动与策略:大数据背景下纪检监察统计变革与创新
2016-03-09刘金程呼莎莎
刘金程,呼莎莎
(中国矿业大学(北京) 文法学院,北京 100083)
技术、行动与策略:大数据背景下纪检监察统计变革与创新
刘金程,呼莎莎
(中国矿业大学(北京) 文法学院,北京100083)
纪检监察统计是推进反腐倡廉建设的工作基础。大数据技术的迅猛发展,使数据的生产、采集、处理、应用和发布方式从本质上发生了巨大的变革。大数据技术也给纪检监察统计带来了前所未有的机遇,有助于丰富数据来源,保证数据质量,为纪检监察统计提供新的分析思路,并且提升其服务能力。但与此同时,纪检监察统计在大数据背景下也面临着职能、方法、体系、人员技术等困境。要发挥大数据的巨大应用价值,就应该紧随时代潮流,积极转变纪检监察统计职能,改善技术方法,增加信息化投入,完善指标体系,推动纪检监察统计的进一步发展。
大数据;纪检监察;统计分析
大数据正在把我们带入一个全新的变革时代。移动互联网、智能终端、新型传感器的普及应用深刻改变了人们的生活方式,重塑人与人之间的社会关系,也对公共事务治理提出了一系列新的挑战。执政党和政府需要积极应对、冷静分析,推动统计生产力的发展和统计生产方式的变革。党风廉政建设与反腐败工作是推进执政党建设和政治生态重构的系统工程,基于大数据的统计与开发将会为精准的形势判断、科学的决策制定、持续的理论研究提供扎实的基础。纪检监察统计如何充分把握变革机遇,主动迎接大数据时代挑战,既是一个政策议题,也是一个理论问题。
一、大数据的统计价值
大数据是一组因技术更新而导致的行动策略、思维方式以及意识形态的变化,这些变化构成了当下时代最显著的符号特征。
大数据首先是海量数据的产生、存储、交换和利用。据统计,从2013年到2020年,人类数据规模将增长10倍。大数据从提出到迅速转化为实践,给各个行业领域带来了颠覆式的变革和创新。麦肯锡认为,大数据是指大小超出了常规数据库工作获取、存储、管理和分析能力的数据集合。维基百科的定义是:巨量资料或称大数据,指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理并整理成为帮助企业经营决策更积极目的的资讯。从数据和技术的角度出发,大数据的特点可以归纳为六个方面:(1)数据体量巨大;(2)数据类型多样;(3)应用价值巨大;(4)处理速度快;(5)数据传送方式灵活;(6)数据真实准确性高。然而,大数据的内涵及其影响远不止于“数据大”,“量变积累导致质变”再一次在大数据时代得以验证,“大数据标志着人类在寻求量化和认识世界的道路上前进了一大步”[1]23。
大数据改变了人们的行为方式,也改变了我们认识世界的方式。它赋予这个社会一种新型的能力:“以一种前所未有的方式,通过对海量数据进行分析,获得有巨大价值的服务,或深刻洞见。”[1]4更多的数据为预测和判断提供了更多可能:人们可以无需沉迷于微观认识的精确度,而是用更广阔的视角来审视宏观世界,对更宏大的未来做出深刻洞察;人们也不必基于样本数据专注于解释因果关系层面的“为什么”,而是可以更快速、更全面地了解复杂事物的全貌“是什么”,只要确认了相关关系,就可以快速反应。至于“为什么”的问题,可以留待控制局面之后从容解释。
从这个意义上讲,“大数据是一种以数据处理为核心的方法论,它的应用必将会对政府统计部门传统的统计工作方法、流程、理念、价值等产生巨大的冲击,同时也对现今政府统计体系模式、组织机构和数据价值的认识形成挑战”[2]。从横向层面来看,大数据技术将对统计数据的采集、处理、存储、分析、发布等多个环节产生影响;从纵向层面来看,大数据技术将极大地促进统计机构整体结构的优化和标准化统计的实现。在大数据背景下,政府统计呈现出数据需求多样、数据源头扩大、数据生产多元、数据应用微观等新的特点。
二、大数据对纪检监察统计的思维革新
纪检监察相关数据,特别是关于腐败行为的数据,是纪检监察统计工作的基础。反腐败的重要前提在于准确判断总体形势,清晰认知腐败的表象与本质,而所有这些,都有赖于客观、全面、准确的数据。大数据时代背景下,党风廉政建设与反腐败工作必将借助更先进的技术手段来认识腐败的规模、分布、表征以及演化规律,同时还需要决策者转变观念,应对时代的变迁。
(一)大数据拓展了纪检监察统计范围,丰富了数据来源
我国政府统计的数据来源从主体上来分主要有公民、公共组织和非公共组织,三类主体各自产生数据,又会在互动中交叉产生数据,并且主要是结构化数据。目前纪检监察统计数据主要来源于被动接收,包括公众信访、下级部门报送、本部门业务产生,自身主动收集的数据较少或基本没有,数据统计范围狭小,来源渠道单一。大数据时代,公民是大数据制造的最重要来源之一,随着公民主体意识和政治参与度的提高,对于“腐败”的认知和反腐败的热情都达到了前所未有的高度,而大数据技术的发展则为民意的表达提供了良好的平台,人们通过微信、微博、论坛等途径充分发出了自己的声音,同时也制造出了前所未有的关于“腐败”的结构化与非结构化的海量数据。大数据技术可以依据各级纪检监察部门的特点,明确所采集数据信息的界定范围,为不同的纪检监察部门形成持久稳定的数据采集范围,同时实现高效、标准的采集方式。
(二)大数据为纪检监察统计数据质量提供了保证
腐败行为相关数据的收集是开展纪检监察统计的前提和基础,而对数据的处理是纪检监察统计的关键。目前纪检监察统计中的案件管理系统实现了网上直报,一定程度上提高了数据传递的效率,但是信息技术的应用程度还不够。其他纪检监察统计工作涉及的业务部门还没有纳入网上直报系统。这就导致存在多种统计标准、统计指标,各部门之间协作程度低,给数据信息的协调管理带来了难度。通常纪检监察统计部门主要以“立案数量”“结案数量”“信访举报量”“党纪政纪受处分人数”等指标进行统计,更多地关注结果,却无法反映腐败发生、演化的动态过程。同时,在已有数据的层层上报以及人工手动录入过程中也难免出现统计误差,影响了统计的真实性与时效性。大数据技术的应用能有效完善现行的网上直报处理平台,实现业务整合和深度挖掘,并且大数据具有数量巨大、来源广泛、处理速度快等特点,人为干扰程度较低。可以多源头、多维度对同一对象进行验证,剥离一定假数据;也可以多角度、全面地为传统的纪检监察统计指标提供补充和验证,能够在很大程度上强化纪检监察机关对统计质量的控制,提高统计数据的真实性、准确性、完整性与及时性。
(三)大数据为纪检监察统计提供了新的分析思路
第一,走向实时统计。传统的统计分析以人的主观能动性为基础,多为事后统计,纪检监察统计目前主要根据查办案件的情况来摸清腐败发生人群、领域及其发生的规律,均是腐败发生后的统计数据。但腐败有较长时间的潜伏期,对于潜伏期的腐败情形,纪检监察统计则无能为力,因此也无法完全实现有针对性的预防。而在大数据时代,恰恰可以通过对大量非结构性数据的分析实现由阶段性统计到实时统计,实现对腐败全过程的监控,提高数据的适用性和有效性。
第二,不再追求精确性。维克多·迈尔—舍恩伯格曾经说过:“统计学的一个目的就是用尽可能少的数据证实尽可能重大的发现。”[1]29传统的纪检监察统计依赖量小而精确的数据来实现对整体趋势的预测,完成“定性—定量—再定性”的过程。在大数据时代,只有极少的一部分数据是结构化数据,大部分的非结构化数据无法适用于传统统计。可能一条微博、一段视频就蕴含着一条腐败线索,如果一味追求以往的精确数据就会错过重要信息,大数据强调的规模的完整性和混杂性,有利于更进一步接近事实真相。在大数据时代,我们所要做的就是直接从“定量”的海量数据中找出那些真正的、重要的数量特征和数量关系,得出可以作为判断或决策依据的结论,因此统计分析的过程可以简化为“定量—定性”,从而大大提高得到新的定性结论的可能性。[3]
第三,相关分析更为重要。传统的纪检监察统计在数据来源、数据规模和计算能力有限等条件的限制下,往往无法全面捕捉现象与现象之间的相关关系。基于样本数据的估计,更多偏重于微观的因果关系,而忽视甚至放弃了“总体”。腐败恰恰是一种系统性的社会痼疾,如果不能从总体视角认识腐败,则必将导致腐败控制和腐败预防陷入被动。按照纪检监察实践的传统策略,人们只能凭借有限的数据构建简单的证据链条,而大量与腐败相关的因素未能进入分析员和决策者的视野。如果没有系统思维策略,以碎片化的具体措施应对统合性的社会问题,势必导致“头痛医头、脚痛医脚”的困局。
大数据时代将彻底改变这种情况。但在大数据时代,数据量巨大,计算能力显著提高,新的分析工具和分析方法层出不穷,寻找事物之间的相关关系变得更为容易,见微知著,更容易通过网络关注热点、消息传播路径等丰富的信息构建多元化的相关关系体系,还原现象与其相关要素之间的关联,在更宏大的视野下审视腐败现象,从而为预测、预防、控制腐败赢得主动和先机。
(四)大数据“倒逼”纪检监察统计提升服务能力
由于工作性质的原因,从改革开放之初至2000年,纪检监察统计数据在公开的报道中几乎找不到。近几年,随着纪检监察工作透明度的提高,相关数据的发布也更加公开化了,但是离全部公开化还有很长的距离[4]。公众对政府的信任从政府数据透明开始,在大数据、云计算等现代信息技术的冲击下,存在于政府和公众之间的信息差正在逐步缩小,政府数据开放在开放内容及开放方式上均得到大幅革新,政府的服务意识、服务能力也随之增强。大数据超越了传统的数据分析方法,一定程度上促使政府统计分析和服务更趋精细化。大数据的发展也培育了公众多元化的需求,未来政府可以根据公众的偏好,对不同人群提供针对性服务。我国国家统计局建立了国家数据网,定期发布各类统计数据,还通过“统计开放日”“数据中国”客户端、手机“搜数”等一系列创新工具提供数据服务。[5]85纪检监察统计作为官方统计的一部分,在大数据时代下应加快数据公开进程,提升服务能力,获得公众支持与信任。党的十八大以来,纪检监察数据更新、发布、开发和利用都有很明显的改进,在很大程度上为整个纪检监察工作提供了助力。
三、大数据背景下纪检监察统计的现实困境
从数据结构到技术条件再到管理制度,纪检监察领域的统计工作基础都比较薄弱。大数据背景下纪检监察统计要抓住机遇实现跨越式发展,必须克服以下现实困难。
(一)职能困境:大数据对纪检监察统计部门统计职能的冲击
作为公共管理主体,执政党和政府对公共信息和社会数据具有天然的“垄断”优势,这在任何国家都一样。鉴于打击腐败相关数据可能威胁执政党的形象、冲击社会秩序,纪检监察和司法部门对相关信息与数据的使用一直保持高度的谨慎。大数据时代的到来,使官方统计作为公共统计信息主渠道的地位受到了挑战。大数据的应用已经从商业领域向公共服务领域转化和渗透。在大数据背景下,越来越多的行业拥有官方统计系统以外的海量数据,越来越多的企业和社会调查机构具备开发、挖掘和利用大数据资源的能力。政府统计部门不再是数据的主要提供者,也不再是数据的唯一发布者,逐渐由“生产—管理”型机构向“管理—生产”型机构转变,其权威性将受到极大挑战。随着全球“开放政府数据”的呼声日益高涨,大数据还将成为启动透明政府的利器。届时,包括纪检监察统计部门在内的官方统计只有打破信息技术、条块分割的体制限制,打破“信息孤岛”和数据壁垒,实现数据之间的互通共享,完善信息发布,强化统计服务,才能最大程度享受大数据带来的便利。
(二)方法困境:大数据改变了传统的纪检监察统计调查分析方法
传统的纪检监察统计遵循自上而下实证研究范式,即先从已有的理论或社会经验出发,根据理论设定统计指标,再去利用统计数据进行实证分析。而大数据采用的是自下而上的数据挖掘方式,以数据为先导,不需要预先设定具体的研究目的或方法,也无需人为选择关联关系和假设前提,而是从大量实际产生数据中通过数据挖掘技术找到数据之间的关系并建立模型,进而形成新的认知和新理论。这种研究方式已广泛地应用于当前的数据处理过程中,颠覆了传统的统计研究范式。
目前纪检监察统计分析主要针对结构化数据展开,处理方法相对单一,通过最基本的运算得出一般性的趋势和规律,缺乏对数据的深度分析,尤其是对主要指标的深度解读。大数据背景下的统计分析不仅仅是对数据进行简单的汇总、罗列和比较,尤其是面对大量的非结构化数据,需要更专业的数据挖掘与处理技术,对数据的来源、科学性、逻辑性等方面进行判断,最后进行加工整理。如果将大数据的数据挖掘技术和分析方法应用于传统的纪检监察统计中,将大大提升纪检监察数据服务于决策、服务于社会的能力。
(三)指标困境:大数据对纪检监察统计指标体系的冲击
纪检监察统计指标体系是反映纪检监察工作总体特征的数量概念或具体数值,是由一系列相互联系、相互依存、相互独立的统计指标所组成的一个整体。目前纪检监察指标体系本身就存在体系不统一、分类不规范、分析功能薄弱等问题,缺乏深度探寻腐败规律的作用,而且调查发布频率低,不能有效满足实际工作的需求。在大数据时代,一些掌握大量数据资源的公司,如阿里巴巴、百度等能够依托大数据的挖掘技术发布时效性更高、可信度更强、指标反映更具体的相关分析。目前我国已经能够通过构建经济预测的先行指标,利用大数据来预测经济走势。国家工商行政管理总局依托工商企业全量登记数据,借助大数据分析技术,构建了企业发展工商指数,该指数与GDP、公共财政收入等经济指标具有显著正相关性,能提前1~2个季度预判宏观经济走势。[5]200未来随着大数据应用范围的日益广泛,数据挖掘技术的日臻成熟,会有更多来自于民间非官方机构的统计指标应运而生,传统纪检监察统计指标的实用性、价值性、科学性将面临更大挑战。只有积极采用新技术、结合用户需求,积极改进统计指标,才能推动纪检监察统计工作的进一步发展。
(四)保障困境:大数据对纪检监察统计保障条件提出更高要求
在大数据背景下,纪检监察统计系统需要完备的信息共享机制、专业化的人才队伍、可靠的数据安全保护作为保障机制。然而这些条件在现实中还很不完善。
首先,统计需要有大量的数据源,更需要有各种数据之间的开放和联通。与纪检监察密切相关的数据库包括金融、财政、政务、舆情等,但是这些数据分别归属于中央、地方党政等不同部门。因此在大数据时代数据如何整合、如何共享,部门之间如何协同等都是从中央到地方需要解决的问题。其次,数据专家是制约纪检监察大数据运用的关键。美国数据分析家Bill Franks曾说道:“成功分析的关键不是工具和技术本身,使用这些工具和技术的人才是取得成功的核心要素。”[6]我国现阶段纪检监察机关应用大数据的技术还比较薄弱,数据的收集存储、挖掘分析等都不成熟。专业化的人才队伍建设将是纪检监察统计系统工程中的重要环节。再次,信息技术的典型特征在于它是一把“双刃剑”,大数据技术在成为纪检监察反腐利器的同时也会带来个人信息安全问题。如果安防技术存在漏洞,数据库一旦被攻陷,将会使得公职人员及其他相关社会成员的个人隐私受到严重侵犯。与此同时,公众在各种网络举报平台、政府信息公开平台上发布的反腐言论也都有可能泄露个人信息,威胁个人安全。因此,对整个政府统计来说,应用大数据要从网络安全、数据安全、灾难备份和安全管理等各个角度考虑,部署方案,保障数据安全。[7]
四、纪检监察统计的发展路径:面向大数据
尽管面临诸多困难与挑战,但是大数据时代已经来临,纪检监察统计工作只能适应时代潮流,主动应对。
(一)推动职能转变,提升纪检监察统计服务能力
纪检监察统计的最终目的是服务于全社会,而长久以来纪检监察统计更多的是为党政领导的决策服务,随着公众参与意识的增强,政府简政放权步伐的加快,纪检监察统计的工作重心应该及时由为决策者服务转向同时更多地为社会大众服务。首先,统计分析报告是公众了解纪检监察工作的主要渠道,在大数据时代,应该加大纪检监察统计分析报告向公众开放的力度,帮助社会公众正确理解统计数据内涵。其次,纪检监察部门要不断开拓创新工作载体和应用,利用信息技术增加纪检监察统计与社会公众的接触点,让社会公众更多地了解政纪检监察统计工作的同时,扩大纪检监察统计的影响力。再次,纪检监察统计还要有针对性地服务社会公众,利用大数据精细化的分析,满足不同群体多元化的需求。
(二)完善技术方法,增强纪检监察数据统计核心能力
“大数据”时代采用的是自下而上的方式,是从大量实际产生的数据中通过数据挖掘技术找到数据之间的关系并建立模型,这种以数据为先导的方式颠覆了传统的统计研究范式。纪检监察统计首先要加强数据整合的能力,不仅仅是政府统计内部数据的整合,更重要的是与其他来源渠道的数据以及各种非结构化数据的整合,进行更为高效的数据挖掘。其次,要变被动为主动,树立“全过程分析”的意识,利用大数据的特性,在日常工作中侧重培养对统计分析的前瞻性、时效性和准确性能力的掌握,做到事前抓指标、事中抓监测、事后抓分析。再次,要大力培养新型复合型数据人才。对于纪检监察统计而言,要把更多的统计人员从统计专家向统计数据专家、统计分析专家的方向转变。积极学习发达国家以及代表性互联网企业在大数据处理和应用方面的经验,改变现有统计人员的知识结构,更广泛、更快速地应用先进技术与方法。
(三)增加信息化投入,构建政府统计大数据共享平台
目前我国参与反腐、防腐的党的各级各类组织、政府、司法机构、公众及其他社会组织之间的数据彼此孤立,严重制约了纪检监察部门全面开展工作,也违背了大数据下数据开放的原则要求。建立数据联通、数据共享机制和共享平台是解决数据困境、开展纪检监察统计工作的重要举措。这就要求政府在大数据战略指导下设立大数据应用顶层平台,建立跨地区、跨领域、跨部门的大数据分享平台。不但要在纵向上把中央、省级、市级、县级乃至乡镇级的政府信息资源联通起来,也要把横向上的政府行政、司法、工业、农业、税务、城建、金融等系统联通起来。实现从公共组织到非公共组织、从中央党政部门到地方各级党政部门、从行政到司法的立体多维数据联网。通过系统强大的汇总功能,对各个部门的相关数据进行综合的筛选和定性,便于查阅和使用,还要保证数据的持续开发利用,实现历史数据与新数据的有效对接。
(四)统一编码标准,完善统计指标体系
随着信息技术的发展以及工作的需求,纪检监察系统各业务部门为了提高工作效率,按照各自的职责和管理需求编制或开发了各自的电子信息系统或指标体系。这些管理信息系统的编码缺乏统一标准,指标体系零散交叉现象严重,给纪检监察统计工作带来了新的困难。统一的编码标准是将不同系统的数据进行对接,并且应用于统计生产的必备条件。另外,统计指标体系也应统一规范,并且具有针对性和扩展性,能够随实际工作的需求做出适时调整。因此,在大数据技术条件下,应通过对纪检监察统计业务的整合以及数据环境体系的完善,最终实现建立面向统计数据信息的统一元数据库,包括对数据的指标、目录、报表等元素进行规范,把好数据进出关卡,保证对数据描述、理解、存取的一致性,同时,通过元数据库持续记录并检测系统内部数据一致性要求的执行情况,防止发生数据属性相互冲突的现象,为数据的进一步管理与分析奠定基础。
总之,大数据背景下的纪检监察统计工作是一项全新的事业,挑战前所未有,机遇前所未有。大数据是技术的进步,更是思维的变革,也是这个时代最典型的符号。设计全新的纪检监察统计体制框架与工作机制,需要采纳与应用最前沿的技术,更需要转变认识世界的角度。“因为不受限于传统的思维模式和特定领域里隐含的固有偏见,大数据才能为我们提供如此多新的深刻洞见。”[1]94
[1]维克多·迈尔—舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.
[2]李国正. 政府统计在大数据环境下有许多事情要做[J]. 中国统计, 2013(8): 9-10.
[3]李金昌.大数据与统计新思维[J].统计研究,2014(1):10-17.
[4]过勇,宋伟.腐败测量[M].北京:清华大学出版社,2015:139.
[5]大数据领导干部读本[M].北京:人民出版社,2015.
[6]FRANKS B.驾驭大数据[M].黄海,车皓阳,王悦,等,译.北京:人民邮电出版社,2013.
[7]马建堂.大数据在政府统计中的探索与应用[M].北京:中国统计出版社,2013:176.
[责任编辑罗海丰]
Technology, Action and Strategies: Transform and Innovation of Statistics of Discipline Inspection and Supervision under the Background of Big Data
LIU Jincheng, HU Shasha
(School of Law and Huminities, China University of Mining & Technology, Beijing 100083, China)
The work of anticorruption should be promoted on the basis of statistics of discipline inspection. The rapid development of big data technology has not only caused profound and essential changes in the production, collection, processing, application and release of the data, but also brought unprecedented opportunities to statistics of discipline inspection, which is helpful to rich sources of data, ensures the quality of data, offers a new analysis for the discipline inspection statistical thinking pattern and improves its service ability. At the same time, under the background of big data technology, discipline inspection statistics is also faced with many challenges like functions, methods, system, personnel, technology problems. To maximize the application value of big data and thus promote the further development of the discipline inspection statistics, it is advisable to follow the trend and make corresponding reforms and adjustments, such as to change the discipline inspection statistical functions positively, improve the technology and methods, increase the information technology investment and perfect the index system.
big data; discipline inspection; statistical analysis
2016- 06- 25
北京市纪检监察学会年度重大项目(BJJW2015Z001、BJJW2015Z003)
刘金程,中国矿业大学(北京)副教授,从事廉政风险防控、廉洁治理与发展研究。
D630.9
A
1671-394X(2016)09- 0012- 05