精准扶贫大数据开放共享的应用价值研究
2020-06-11王晴
王 晴
(南开大学商学院,天津300071)
一、研究背景及问题的提出
脱贫攻坚,贵在精准,难在精准。经过多年的实践探索,我国精准扶贫工作已取得阶段性成效。随着脱贫攻坚实践工作的不断深入以及多渠道政策措施的持续推进,一定程度上消解了传统扶贫工作中的部分突出问题,然而,精准扶贫对于扶贫数据化、信息采集与沟通机制、数据支撑效率等方面提出了更高的要求,这在客观上要求对现有精准扶贫体制机制进行创新发展。[1]精准扶贫实践工作的现实复杂性已远超理论预期,相关工作已进入攻坚阶段,需要多样化的手段和方法创新来支撑创新发展。
“大数据”已经连续六年写进国务院政府工作报告,上升为国家战略,深化大数据的研究与应用具有重要的现实意义,运用大数据能够提升国家治理水平,建立健全辅助决策和扶贫治理机制,有助于推进转型时期精准扶贫模式和管理创新。在大数据时代,政府部门越来越重视数据价值的重要性和开发利用的紧迫性,相继出台了一系列政策制度,以促进和保障经济社会活动中大数据的开放共享,如《促进大数据行动发展纲要》(国发〔2015〕50 号)。大数据的价值更多地体现在它的利用层面上,能否将精准扶贫实践中产生的大数据进行有效的开放共享,是决定能否真正意义上发挥其价值的关键环节。鉴于此,大数据思维就成为助力精准扶贫可持续发展的重要手段。
在实践方面,全国多地已在推进精准扶贫大数据的开放共享。河北省盐山县利用网络平台,实现了精准扶贫数据在政府部门之间共享共用,具有数据统计分析、动态监测、定位等功能,有助于及时反馈和精准解决问题。[2]贵州扶贫办与科技企业合作,构建数据交换共享平台助力精准扶贫,促使扶贫办与其他机构的数据连通,提供基于大数据技术的全周期解决方案。[3]贵州省大数据局与金融服务企业签署《数据共享合作协议》,信息专用于贫困人口的比对分析工作,激活双方数据的价值,推进精准扶贫。[4]云南省楚雄市制定扶贫基础信息数据共享机制方案,说明其重要意义,厘定部门职责,加强工作衔接。[5]
2015 年,习近平总书记就精准扶贫的数据目标问题作了明确阐释,提出“充分发挥数据精准定位、开放共享的应用价值”的精准扶贫开发理念,[6]成为精准扶贫大数据开放共享价值开发的战略依据和行动指南。共享发展理念折射了鲜明的问题导向意识,凸显了新时代精准扶贫的价值追求,也为精准扶贫的理论研究创新提供了新的切入点。目前,精准扶贫研究成果的数量已呈爆发式增长,很多研究者通过对精准扶贫的主体、方法和路径等焦点问题的回应,进一步诠释了精准扶贫的战略内涵及要义,但从质量上看,相关研究仍处于初步上升阶段,如何践行共享发展理念与精准扶贫的耦合推进,还需要继续跟进。[7]精准扶贫大数据开放共享理念的提出,为展开相应的研究与对话提供了新的路径支持。
二、现状分析与价值逻辑
(一)现状分析
大数据开放共享的前提是海量数据的客观生成和累积,关键在于数据的关联和拥有。我国精准扶贫经过多年的战略实践,围绕“人(扶贫对象、广大参与者)”“物(资产、设备、环境)”“事(生产、生活)”投入了大量资金,构建了几乎涵盖不同类型和地区的精准扶贫社会支持网络,在此过程中产生了大量的有价数据资源,然而并没有形成有效的聚合、共享和开放利用格局,探究其原因有助于构建一个符合实情的应用价值分析框架。
1.技术基础。精准扶贫大数据共享不畅的一个重要原因是缺乏互联互通的技术规范。这是由于政府没有对精准扶贫数据资源进行统一的规划,在制定数据标准方面显得滞后。精准扶贫实践活动产生的多源多样数据很难在实际需求中实现业务互通,一方面是底层数据的设计逻辑混乱,集成效果不佳,甚至无法形成系统性集成;另一方面,数据利用与实际脱节,数据转换和流通的渠道受阻,供需匹配效果不佳。
2.管理机制。大数据本身就是一种战略资产,有些部门甚至将其视为部门内的私有资产,权力本位的思想致使共享机制不畅,往往不愿意主动共享,或者缺乏共享的意识,或者担心由于数据共享带来的负面效果或由此产生的问责。精准扶贫大数据开放共享的推动者是政府部门,虽然近年来成立了诸如大数据管理局等职能机构,但就实际的业务重组和权责归属而言,往往处于被动的局面,在推动精准扶贫大数据共享时经常处于“等”“要”的状态。
3.质量控制。精准扶贫大数据的生命周期包含了从识别、帮扶、管理到考核等多个环节。然而,实际操作的专业人才匮乏,数据应用能力较弱,鲜有规范化的数据管理流程和制度。随着各地区精准扶贫数据管理平台的不断设立,笔者发现各平台的数据质量管理水平差异较大,运行标准和维护规范亦不相同,即使是同一类型的平台,所涵盖的数据内容和形式也不尽相同,这势必会造成精准扶贫大数据开放共享的不通、不畅,从而阻碍了实际效果的发挥。在扶贫实践中,存在着数据监管空白或技术缺陷,甚至为了考评的需要而随意改动数据,特别是过程性数据的质量问题,如数据缺值、重复等,无形中增加了后续工作量和难度。
4.隐私保护。对于精准扶贫大数据而言,隐私保护和安全问题同样值得关注。精准扶贫大数据的隐私保护和安全问题贯穿于其实践活动的全过程,不仅需要加强技术处理,还需要制定相应的保障制度。目前我国尚未制定个人信息保护法律制度。在扶贫领域,长期以来对扶贫对象的隐私保护重视程度不够,扶贫对象的身份证号、家庭地址、通讯方式、子女情况等敏感信息常被无意识泄露。这一现实问题应当引起重视,但目前有关研究和实践不足。
5.数据服务。数据服务是实现精准扶贫大数据价值的手段和过程,但前提是具备相应的制度规范和技术基础。然而,大量的历史遗留数据常处于封存状态,没有被及时处理和利用,给数据创新服务带来了一定程度的困扰,限制了开放范围和程度。早期的扶贫大数据很难满足短期内开放共享的需要,数据开放的接口涉及面较广,需要技术、制度、经济等多要素的介入。
(二)价值逻辑
精准扶贫大数据的产生和发展是由不同类型的主客体所推动的。如前所述,精准扶贫大数据开放共享虽有一定的进步,但仍面临着诸多现实问题和挑战,每一项问题或挑战都不是独立存在的,而是由不同要素衍生的结果。自精准识别环节开始,大数据贯穿于扶贫实践活动的全过程,具有数据生命周期的典型特质。剖析精准扶贫大数据开放共享的价值问题,应当将其置于大数据的价值链中进行分析,以便于更好地揭示和解释其关系结构,为分析其在不同环节的应用价值提供逻辑依据。
首先,参与主体具有互动性。在精准扶贫的过程中,政府部门、社会力量、第三方机构等实践者是相互联系的主体。其中,政府部门发挥着主导作用,不同结构的社会力量是重要的参与者,第三方机构是不应忽视的监督者。政府部门依据大数据技术精准识别的结果将作为其他主体工作的重要参考;社会力量需要科学的决策基础作为支撑,而扶贫大数据就是重要的决策资源;政府部门、社会力量以及其他主体是精准扶贫治理的共同参与者,起到协调、合作和互补的作用;第三方机构也需要客观而精准的大数据作为评估保障。
其次,精准扶贫大数据的价值特征。精准扶贫大数据同样具有规模性、多样性、高速性和价值性等典型特征。精准扶贫是一项宏大的系统性工程,随着要素的投入、运行等实践活动的开展,过程中产生的数据呈指数级增长并不断累积;精准扶贫的数据形式具有鲜明的多样性,特别是非结构化数据大量涌现;精准扶贫海量数据的高速传播、共享对技术提出了更高的要求,例如当5G 技术应用后,将更加体现出高速性;最重要的是,精准扶贫大数据的价值在于开放共享,最终达到提高精准扶贫效率、改善效果的目的。
最后,价值传递呈链式结构。数据价值存续于精准扶贫实践的每个环节,并且具有链式传递功能和特征(见图1)。从数据生命周期的角度来看,精准扶贫大数据的价值传递在于开放共享,它不是一个封闭的生态系统,而是具有创新、协作属性的开放式生态系统。通过整合扶贫、统计、民政、卫计、住建、国土等行业数据,建立统一的动态更新大数据资源库,实现扶贫信息资源的融合共享。决策机制的建立依赖于精准定位和识别,决策后的战略实施和工作推进需要各类型参与主体的监督和维护,并且在运行的过程中形成协调有序、互动互助的精准扶贫大数据治理格局,最后根据评估和考核结果,推进相关工作的健康可持续发展和创新实践。
图1 精准扶贫大数据价值链关系结构
三、应用价值分析
(一)精准识别
精准识别是扶贫工作中基础性、前置性环节。当前一些地方对贫困户及其致贫原因的识别不够准确,存在走访式、慰问式扶贫现象,扶贫的“精准”思维和思路不清晰,有的地方对村情、农情不深入调查,缺乏可靠的数据支持。
一直以来,贫困人口的识别主要采取的是“自下而上”的方式,即由贫困户先申请,然后经民主评议,再由上级部门审核确认。这种方式往往费时费力,遴选的结果亦缺乏定量的数据支撑。大数据技术的应用,将成为贫困人口识别的重要抓手,促使识别方式从“自下而上”向立体、多维的模式转变。可以使用人口大数据提供的多维、动态信息来测量和瞄准贫困,极大地压缩从数据采集到信息确认的周期,而且通过互联互通的大数据共享系统,便于及时更新信息,建卡归档贫困人口数据的定量分析,实现贫困人口数据的动态管理。
解决“扶持谁”的问题是精准扶贫工作的首要任务,[8]由于贫困具有动态性、多维性和复杂性特点,辨识贫困户需要投入较多的资源。利用大数据技术助力贫困人口的精准识别工作,要从宏观和微观两个层面入手。在精准扶贫大数据系统和服务平台的基础上,使分散在跨部门、跨地区的碎片化信息整合起来,利用大数据分析技术,准确界定符合标准的扶贫对象,一方面可以可视化地展示贫困人口的分布特征及变化规律等宏观信息,另一方面还便于充分显示扶贫对象的家庭状况、年龄结构、受教育程度等具体的人口学信息,[9]及时掌握致贫原因及贫困程度,为扶贫工作的精准发力和宏观调控提供依据。
传统的扶贫工作往往存在“信息不对称”问题,容易滋生扶贫中的贪腐行为,大数据技术的引入能够增强信息透明度,能够对可能的贪腐行为起到遏制或有效防范作用。一方面,通过网站、官方APP 等多种渠道受理信访举报,政府部门基于对扶贫大数据的精准研判,便于开展追责问责工作;另一方面,通过不同的数据维度进行对比,可以将扶贫受惠人员信息与工商、税务等部门数据进行连通,为发现精准扶贫中的贪腐线索和证据提供数据支持,而且通过精准扶贫大数据的不断更新,能够起到返贫预警功能。另外,在贫困信息的公示方面,基于大数据技术动态更新的可视化结果,可以通过新媒体平台等方式进行公示,也可与现有的贫困人口信息公开/公告模式相结合,便于社会监督。
(二)智慧决策
随着大数据技术及平台的优化升级以及扶贫治理能力的进一步现代化,基于数据驱动的精准扶贫决策机制逐渐走向智慧化和系统化。大数据驱动的精准扶贫智慧决策机制的构建需要建立在“两大前提”“一个内核”的前提基础上。两大前提条件包括:大数据软硬件设施的优化,并且尽可能实现终端移动化、计算可视化、管理动态化等目标;管理体制机制的创新是不可忽视的重要的软环境,也是促成数据共享利用的关键要素。[10]一个内核指的是精准扶贫大数据的实时动态管理系统平台,这是开展精准决策的技术基础,需要解决好运算能力建设、数据关联、供需匹配、开放与隐私相互协调等核心问题,为精准扶贫的科学决策提供时效性、准确性等方面的信息保障。
大数据驱动的精准扶贫决策体系的构建,将数据生态系统中的“数据”“人”“设施”要素有机地联系起来,形成智慧型决策运行机制。通过该机制的有效运行和维护,扶贫大数据中的有效样本、扶贫对象画像以及其他内外部数据将实现连通,可整体导入决策分析系统,融合多种计算和模拟技术,构建精准扶贫大数据的多重模型,包括共享与隐私对接、供给与需要匹配、内部与外部交互、预警与应急管理等,为精准决策提供针对性的数据链分析与管理支持方案。在决策数据的传递方面,可运用云计算、机器学习、5G等技术,大数据决策结果以可视化方式展示,保障决策知识的精准传递和实时掌控,使精准扶贫决策方案更具前瞻性、智慧化和互动性。
精准扶贫大数据的“充分性”能够弥补传统的样本统计的局限性,起到纠正决策偏差的积极效果,成为更为可靠的统计和决策手段。应当看到,在精准扶贫大数据衍生和累积过程中,数据价值的开发利用依赖于决策主体的主动作为,即需要政府部门(或公共服务机构)有意识地将数据建设和数据化作为某种行动指南,[11]以便于增强扶贫决策效率。
(三)审计监督
随着国家扶贫力度的不断加大,自2016 年以来,中央专项扶贫资金连续四年高速度增长,但是,在该项资金的管理中仍存在这样那样的顽疾。加强精准扶贫资金的投入、使用和管理,切实提高其使用效率,是审计工作的一项艰巨任务。审计监督部门应充分认识到大数据时代的共享价值,在精准扶贫中运用好大数据及其技术与方法。为保证扶贫资金投入的精准度和有效性,以扶贫项目为平台,以扶贫绩效为目标的审计实践已成为精准扶贫工作不可或缺的重要环节。当前,精准扶贫审计中主要存在项目事前审计弱化、事中执行不力、事后评估不健全等问题,究其原因,症结在于缺乏信息共享的精准扶贫大数据平台。[12]
扶贫资金的精准使用和管理涉及面广,管理部门多、使用方向分散、项目内容繁杂,要提高精准扶贫审计效率和质量,有必要借助于大数据技术。基于大数据平台/系统,以共享数据为依托,发挥大数据分析技术在精准扶贫审计领域的“指导”作用,对扶贫项目实施的全过程进行真实性、规范性和精准性的动态监督,助力降低扶贫成本、提高扶贫速度和质量,重点关注扶贫政策跟踪审计,动态跟踪扶贫政策的价值转化效能,实现精准扶贫审计过程的全覆盖。得益于大数据审计方面的创新机制,审计发现的问题将更加精准,通过关联分析精准扶贫各类数据,能够在精准扶贫工作中发挥跟踪监督的作用。开放共享大数据的应用,在很大程度上创新审计方法和方式,降低繁重的扶贫审计工作量,显著提升审计效率。
当然,脱贫减贫的真实有效性远比数字形式更重要,要发挥第三方机构的监督和查验作用,嵌入精准扶贫的全过程,利用大数据客观地评估精准扶贫“成绩单”的真实性,更要坚决防止任何形式主义和虚假脱贫。可见,应当将精准扶贫“回头看”工作重视起来,随着精准扶贫大数据开放共享平台的建立,借助于大数据技术保障其真实性和科学性。“回头看”工作应是精准扶贫摸底排查的有效方法,为保障这项工作的顺利开展,有必要将卡、册、薄、档、卷等原始档案进行电子化,形成档案大数据。借力大数据强化精准监督,对已纳入贫困户的不精准疑难问题进行系统性整理,开出疑难点问题清单,对有疑点的贫困户重新填写、上传《扶贫大数据入户登记表》等,并在系统内进行共享,进一步核对、查实有关疑难点,做到“真扶贫”“扶真贫”。
(四)协同治理
从精准扶贫大数据实践和研究现状来看,主要采用的是基于抽样调查或第三方数据的统计分析、模拟仿真、平台数据的挖掘分析等常用数据处理方法,加之管理体制(垂直的科层制结构)的现实特点,往往存在跨系统之间信息难以共享,甚至出现了“数据孤岛”现象,严重阻碍了精准扶贫大数据的开发利用,难以形成协同治理成效。[13]为促进精准扶贫参与主体及相关要素之间的互动、协调以及常态化演进,理应消解横向信息封闭的系统弊病,在相对独立的IT 基础设施和管理信息系统(MIS)上建立跨系统开放共享机制,使得精准扶贫大数据的再利用朝着模块化、集成化、智慧化方向发展,具备跨系统检索、交互、共享的互联互通功能。
作为政府大数据资源体系的重要构成,精准扶贫大数据具有重要的数据治理应用价值。在治理主体方面,应对海量的扶贫数据进行整合规划,做好数据利用的顶层设计,依托现有资源和平台,创新管理机制,与政府外部数据进行合作,构建精准扶贫信息网络系统和信息服务平台。在主体协作方面,打破各层级政府间、各部门间存在的数据壁垒,建立统一开放平台,为政府、社会机构、企业等参与主体之间建立数据交易市场平台,[14]推动精准扶贫大数据的资源整合和社会化再利用。
“重投入、轻治理”是传统扶贫工作的弱点。在大数据时代的信息化助推之下,依托于针对性的精准扶贫大数据管理方案,有利于提升精准扶贫数据管理效率。借助于大数据技术与支持机构,建立精准扶贫大数据管理系统,可由大数据管理平台和移动终端两个体系组成。一方面,移动终端可以为直接受益的贫困户提供信息化窗口,以便于其及时了解扶贫政策和动态,增强自主脱贫意识,也能够提升扶贫主体的工作效率,提供案例分享、信息查询、新闻公告等核心功能;另一方面,通过大数据管理平台,既可以及时地更新和维护扶贫数据,也可以对扶贫痕迹进行验证和管理,为精准扶贫考核提供依据,也可以利用利益累积的大数据进行可视化展示,更全面客观地揭示精准扶贫工作动态。
(五)效果评估
“入之愈深,其进愈难”。随着脱贫攻坚工作的不断推进和深入,实施精准扶贫战略需要创新治理手段和模式,建立健全精准扶贫成效评估机制是基本的治理手段,也是不可或缺的考核方式。精准扶贫大数据的经济价值对促进实践创新与可持续发展具有现实作用,利用大数据进行扶贫现状的精准分析、解读和评价,可以帮助帮扶主体更好地锁定贫困户需求,从而推动脱贫减贫的业态优化和模式创新,提高参与主体的工作效率,改善扶贫工作的现实环境;能够在一定程度上拓展农村贫困人口的就业市场,增进贫困户与扶贫主体之间的互动互信关系,改善贫困地区人口精准扶贫的质量。
大数据是实施精准扶贫成效第三方评估的科学支撑。当前,我国精准扶贫第三方评估存在着诸多方面的挑战:不仅要突出显性指标的重要性,还要关注潜在贫困人口的动态演变,这必然会增加第三方评估的数据量和统计分析难度。[15]虽然已有众多的扶贫台账或已建成数据库,但由于开放共享不充分,很难发挥既有数据资源的原始价值。运用大数据助力精准扶贫的第三方评估,大数据分析结果可作为精准扶贫成效评估和考核的重要依据。[16]通过大数据分析技术,将针对性的实时结果进行有序量化,包括贫困人口结构、致贫原因、扶贫方式、参与主体等动态指标值的统计分析,以及对第三方评估机构推送的即时数据进行整合评价,尽可能地采用基于大数据平台/系统等WEB端的多源数据,减少人工干预,也能够有效减少重复劳动和人力成本。
在大数据生态系统中,精准扶贫效果评估应是一个完整、规范的体系,除考虑构建科学合理的评价指标外,丰富和优化评估组织结构也是重要的战略目标。[17]该目标的实现不仅需要引入第三方评估机构,还需要更多的主体/客体参与其中,构建由政府部门、第三方机构、社会力量/公益组织、扶贫对象等多方主体共同参与的评估机制,打破扶贫信息、数据和知识的单一性垄断,促使评价数据的来源多元化、立体化和全面化,形成数据共建共享的良性互动机制,从而保证精准扶贫效果评价的有效性和可靠性,这也是脱贫攻坚考核机制走向成熟的重要标志之一。
四、讨论与结论
大数据助力脱贫攻坚可以提升扶贫的精准性和有效性,但在实践中也存在现实的制约因素,分布在理念、技术/手段、平台、管理机制等诸多方面。其中,核心的制约要素是针对海量数据开放共享与增值利用的标准化问题,主要体现为平台构建差异较大、数据化过程缺乏标准支持、技术规范有待增强、业务模块融合不充分。[18]因此,为促进精准扶贫大数据的开放共享,深度挖掘和利用其资源价值,应尽快出台精准扶贫数据操作规范,构建基于统一管理原则的全国性扶贫大数据云平台/操作系统,有机整合分散于各参与主体/客体之间的扶贫数据,打通互联互通机制,做好人员、资源、信息流的配置和管控。
建立扶贫大数据开放共享机制,是推进精准扶贫的前提性、基础性工作,有利于增强精准扶贫工作的有效性和针对性,促进扶贫数据在不同主体间的合理流动和开发利用。为保障和提升数据的预测力和解释力,应将问卷/实地调查获得的“小数据”与基于技术集成的“大数据”资源融合,形成相互印证和补充的数据管理制度,为进一步深化精准扶贫的体制机制创新提供决策支持。在实践方式上,综合运用云计算、数理统计/建模、计算机仿真、科学计量等方法并加以集成创新,“让数据说话”,有效地揭示扶贫数据的内在规律和实践指导意义。
数据共享才能体现精准扶贫大数据的社会价值,在数据利用中需要处理好数据伦理问题:数据公开与共享被标榜为大数据时代的价值风尚,而数据权益保障和保护又面临着诸多挑战。随着数据流的交互性优化、社会有机体的进化以及数据资源配置科学化,由共享导致的新的社会关系与传统伦理之间的紧张关系也将得到改善,[11]使得精准扶贫过程中的大数据共享成为一种客观必然性,有益于社会福祉的数据价值利用,也将使得扶贫的精准定位和精准发展走向成功。
五、未来展望
当前我国精准扶贫大数据开放共享的主体有政府、企业、社会组织与公众等,他们通过以大数据技术为支撑的具体形式,在以各类平台等为载体的共享中不断加强精准扶贫大数据的增值利用,从而实现预期的经济价值、社会价值和政治价值,而外部的环境条件也在开放共享大数据的应用过程中对相关主体、方式和效果起着潜在的影响作用。以上研究发现,虽然我国部分地区已经在精准扶贫实践中采用了大数据技术,并且实现了一定范围和程度上的开放共享,大数据开放共享对于精准扶贫实践创新的重要作用已经凸显,但目前仍属于一个相对较新的研究领域,相关文献还比较欠缺,一些研究仅是从设想或某一视角进行浅析,缺乏深入的探究与验证。
总的来说,后续研究还应从两个方面加强分析:应用价值的定量分析和开放共享的协整分析。实现应用价值是精准扶贫大数据开放共享的直接目标,当前在应用价值的研究中,主题比较分散,更缺乏量化方法或实证调查的检验,一些可能的价值表征只是研究者根据大数据共享实践的简单总结,合理评估水平较低。未来研究可从定量的视角,让“数据说话”,客观地检验和评价精准扶贫大数据开放共享的经济效果、社会效果和政治效果。在协整分析方面,首先对有关主体的共享动机和需求进行调查,建立主体类型与应用方式之间的联系,提高应用的针对性和有效性;其次要利用建模和实证检验方法探究应用方式和主体类型之间的联系;最后还需要关注外部条件、现实环境对精准扶贫大数据开放共享的影响因素,因为诸如政策、技术、观念等都是影响实际应用效果的潜在因素,探索其中的最有利因素,挖掘精准扶贫大数据开放共享的深度应用价值。