大数据驱动下精准扶贫运行机制创新研究
2019-09-10徐孝勇曾恒源
徐孝勇 曾恒源
摘要:为融合大数据技术推动精准扶贫机制创新,本文对大数据技术特征和精准扶贫逻辑特征的关联性进行了分析。结论表明,融合大数据技术于精准扶贫机制之中能够减少信息不对称,提升扶贫绩效,而当前的精准扶贫机制对大数据技术的整合运用不足。通过构建数据对比、供需匹配、产业规划三类大数据与精准扶贫的联动机制,能够有效降低精准扶贫过程中的信息不对称,实现精准扶贫机制创新。本文的研究揭示了我国扶贫模式创新和发展的新方向,能为我国精准扶贫机制创新提供理论参考。
关键词:精准扶贫;大数据;关联性;融合创新
一、引言
自2013年习近平首次提出“精准扶贫”以来,我国的扶贫攻坚事业以该思想为指导取得了一系列新进展。随着2020年消灭绝对贫困的时限临近,扶贫战略推进愈发艰难,扶贫的边际效益逐渐递减,既有扶贫机制暴露出许多问题。其中,供需脱节、道德风险与扶贫碎片化成为扶贫过程中的三大难题,而该三大难题的主要诱因是信息不对称。要摆脱边际效益递减、边际成本上升等困境如期实现全面脱贫,必须实现扶贫机制创新,而如何利用现代信息技术、大数据技术的优势进行精准扶贫机制创新、减少扶贫过程中信息的不对称性成为当前我国扶贫领域一个热门的话题。本文的主要贡献在于回答了精准扶贫与大数据是否存在关联性以及構建了一个精准扶贫大数据管理平台以实现二者融合创新。
二、文献综述
通过对已有文献的梳理,发现当前学界主要研究了精准扶贫运行过程中存在的以下三个问题:一是现有扶贫机制存在缺陷。殷浩栋等(2017)从扶贫对象精准识别、扶贫绩效考核等角度总结出我国精准扶贫还存在实施和管理缺陷。王宇等(2016)则从制度、政策及治理体系等视角分析了现阶段我国精准扶贫机制体制存在的问题。二是信息不对称降低扶贫效率。随着国家信息化的逐步推进,越来越多的学者开始关注信息技术对扶贫机制和体系的影响(黄如花,2016;)。汪磊(2017)认为基层乡村干部与民众存在信息鸿沟,使得无法精准识别贫困人口。陆汉文等(2016)认为信息不对称是基础干部进行利益寻租、偏离扶贫路线的技术条件。综合上述观点,消除信息不对称是实现真正精准扶贫的关键。三是大数据技术不能与精准扶贫机制有效融合。学界目前的研究主要偏向于对大数据思维应用的研究,谢治菊(2017)等人从大数据的视角总结当前我国扶贫工作的困境,提出要运用大数据技术提升资源配置效率。莫光辉(2017)认为精准扶贫需要大数据提供信息支持,二者结合能够创造出更加有效的精准扶贫模式。大数据技术的运用能提高决策的科学性和扶贫过程的透明度,从而能够形成以更加有效的扶贫模式。
综上所述,目前学界基本完成了“问题一原因一对策”扶贫机制研究框架的搭建,但对扶贫机制与大数据技术融合创新的研究十分缺乏,且仅集中于探讨对大数据思维的运用,这些文献对现有扶贫模式的实际指导意义有限。本文的重要意义在于分析了大数据与扶贫之间的关联性,并搭建了基于大数据的精准扶贫实现机制。
三、精准扶贫的内涵及其实施机制
大数据与现有扶贫机制融合创新,首先要把握精准扶贫的内涵,笔者将精准扶贫的内涵定义如下:(1)逻辑精准。减贫脱贫是一个缓慢的过程,需要有逻辑性和过程性;(2)管理精准。由于扶贫涉及多方主体,因此有效的管理必不可少,特别是政府要担负起实现“六个精准”的管理责任;(3)技术精准。精准扶贫需要引入量化分析评估手段,从而检验扶贫政策的有效性、分析扶贫变量之间的相关性,做到“对症下药”。
合理有序地实施精准扶贫方案是贯彻落实精准扶贫战略的关键。截止2017年底,我国尚有超过3000万农村贫困人口,要在不到三年的时间里实现农村贫困人口全面脱贫任务艰巨,已有扶贫机制瓶颈凸显,新型扶贫模式GE待发现。截止2017年初,我国二十多个省出台了“1+N”精准扶贫系列文件,将新阶段扶贫政策嵌入到扶贫机制中。如甘肃省出台的包含《关于扎实推进精准扶贫工作的意见》和17个专项配套方案的“1+17”精准扶贫方案;贵州省出台的扶贫攻坚“1+10”系列文件,旨在扎实推进扶贫攻坚计划,分步完成扶贫攻坚目标。概括而言,当前我国精准扶贫实施机制主要以“1+N”脱贫攻坚工作方案为指导,并根据各省区不同情况作出相应的战略安排。
四、大数据与精准扶贫的关联性分析
大数据技术能否与精准扶贫这一理论相互融合,需要对二者的关联性进行分析,如果二者具有较强的关联性,便能够为利用大数据推动精准扶贫机制创新提供理论依据。首先,从特征维度看,大数据具有数据规模大、流转速度快、数据类型多及价值密度低等特征,其中前三个是大数据的技术特征,第四个是大数据的价值特特征(见图1)。目前,这四项特征是衡量某一领域是否具有大数据特征的重要依据,这也是本文分析大数据与精准扶贫关联性分析的逻辑节点。
(一)扶贫数据规模大
扶贫数据具有相当的规模,至2017年,我国建档立卡的农村贫困人口约5000万,广泛分布于我国592个贫困县;此外,国家划有14个集中连片特困区和数万个贫困村。从具体扶贫数据量来看,贫困户每户需填写贫困登记表超过10张,包括交通支持数据管理系统、异地搬迁数据管理系统等19个部分;从扶贫主体上讲,包括企业、政府、贫困户等不同的群体;从扶贫手段来看,形成了异地搬迁、发展教育、生态补偿等一系列综合扶贫帮扶措施。因此,需要采集的数据不仅复杂多样,而且规模巨大。
(二)扶贫数据类型多
精准扶贫的数据多样不仅表现在数据类型多样,也表现在数据来源多样。从数据类型上看,既包括一般性结构化数据,又包括图片、视频、音频等非结构化数据,如贫困户宅基地图、贫困人口空间分布图等。从来源上看,2014年全国贫困人口数据资料来源于22个省区,且涵盖民政、财政、教育、水利等多部门数据。这些数据不仅来源广,而且是多渠道的,例如统计年鉴中的数据,各行业各地区的统计公报等。
(三)扶贫数据流转快
大数据的流转速度快体现在数据增速和处理速度等多个方面。从生成速度上讲,由于农村贫困人口数量大,区域间流动性强;以农民工为例,2017年跨省外出务工农民约7700万,占全国外出务工农民总数的46%左右。此外,贫困人口的收入途径变化快,不仅随国家政策、季节而变化,而且收入结构多样并变化灵活。从扶贫数据处理速度上讲,官方规定数据采集周期为1年,但由于各地区采集数据的时间不统一、人手有限而数据规模庞大,往往导致最终数据与真实数据有较大出入,增补、复核工作频繁。
(四)扶贫数据价值密度低
由国家政策及地方政府管理体制的约束,我国扶贫数据往往分散储存、彼此独立,限制了精准扶贫大数据的生产和使用。例如在精准识别方面,我国当前以2011年国家确定的2300元(2010年不变价)为标准识别贫困,综合计算农民的收人与支出信息,事实上,收入与支出用传统手段难以准确监测,信息采集难以获得真实数据。这种分散化的数据处理方式成本高、信息失真度大,若不进行进一步的处理,则不具有较高的使用价值。因此,利用大数据技术监测、整合贫困农户数据、实现数据共享是消除信息不对称的重要手段。
五、精准扶贫中大数据应用的关联性检验
甘肃和贵州两省较早引入大数据到精准扶贫中,因此本文在研究中主要以甘肃和贵州两省为例进行探讨。在具体实践中这种关联性是否得以体现,需要对两省对扶贫数据的整个采集及应用过程进行分析,以提炼出大数据与精准扶贫耦合机制的关键变量。
(一)数据采集
目前我国大多数地区的贫困数据采集都主要运用问卷调查和现场走访的方式进行,这些数据大都是结构化的数据,并且由人工录入数据库中。较少部分通过互联网终端进行自动采集,贵州主要采集建档立卡等级划分所需要的数据,这些数据包含7项一级指标,100多项二级指标,这些分级指标包括家庭基本情况、帮扶计划等,因此单个贫困户的数据量很大。2015年,贵州市政府相关扶贫部门将数据采集细分为三步,即信息采集、审核与录入,并规定了各阶段任务的完成时限。由于硬件设施限制,数据采集自动化程度低,达不到大数据的特征要求。因此造成了贫困数据冗余与缺失并存、可靠性差的尴尬局面,无法与扶贫机制有效融合。
(二)数据存储
以贵州为例,贵州省于2014年搭建“云上贵州”云平台,其中,扶贫云通过整合民政、工商、金融、移民等十几个部门的数据,形成贫困大数据云平台。通过对行业扶贫数据库、产业扶贫数据库以及社会帮扶数据库进行数学建模,并对整个扶贫过程中各阶段数据进行加工、整理,完成对扶贫进度的跟踪、扶贫效果的展示、扶贫绩效的评估及扶贫机制的修订与决策。但由于扶贫数据规模弹性小、伸缩性差,与大数据技术无法形成有效衔接,扶贫数据的规模和多样性方面仍显不足。
(三)数据分析
由于贵州省扶贫数据不仅包括属性数据,也包括地理空间信息数据,运用云平台进行可视化分析,再加之卫星系统提供的地理信息技术,能够实现对省内贫困地区、贫困人口、扶贫过程的实时监控;此外,贵州省为检验精准扶贫绩效,构建了相应贫困指标,运用该能够指数对贫困程度进行量化分析,能够对脱贫、反贫户以及精准扶贫过程进行监测;甘肃省综合运用多种大数据技术,对各种类型的数据进行处理、监督和绩效评估,为扶贫机制不断完善提供依据。总体上讲,贵州省对扶贫数据的分析更加偏向于传统统计学分析方法,对新兴的神经网络、随机森林等算法的应用还不成熟,因此无法对扶贫大数据进行深度研究。分析扶贫数据,就是期望能够挖掘出扶贫大数据中复杂变量之间的关系,并通过构建适当的模型与分析框架,发现变量之间的内在联系,从而预测扶贫项目的减贫绩效。但不论是贵州甘肅还是全国,高端数据分析技术还未能全面应用于扶贫大数据的分析中。
综上,甘肃、贵州结合大数据技术于精准扶贫的绩效管理之中是扶贫机制创新的有效探索,且实践中存在不足。目前,大数据技术在精准扶贫中扮演的角色主要是提供精准识别贫困户的手段,扶贫大数据平台也仅仅起到管理信息系统的作用。而目前该平台更加偏向于收集、整理数据,处理数据的技术不够,且无法满足复杂的扶贫机制动态性、多维性要求。因此,还需要在扶贫数据挖掘技术及风险预警机制等方面多做创新。
六、大数据与精准扶贫融合机制创新
(一)建立数据对比机制实现精准识别
当前,贫困群体识别错误在我国扶贫领域时有发生,这影响了扶贫资源的有效配置。我国贫困标准量化指标理论上以年人均纯收入2300元为标准,但由于难以获取准确的贫困人口收入与支出数据,实践中往往以基层党委的民主评定为标准,出现理论脱离实际的现象。扶贫数据的对比耦合需要对扶贫数据进行分类:一是建档立卡贫困数据,该类数据由于是通过问卷、民主评议方式获得,其真实性不能得到有效保证;二是各行政部门、企业行业规定的标准数据。运用大数据技术搭建的云平台,通过身份证号码与建档立卡贫困户唯一编号匹配对比,及时剔除源数据与法定数据不一致的对象。由此,贫困户识别机制由主观性较强的人工识别转向有较高客观性的云数据平台识别。随着搜集整理的贫困户数据维度的丰富,识别精度会越来越高;因此,可通过构建贫困数据精准识别对比耦合机制(见图2),弥补人工处理数据涉及众多部门、进程缓慢、协调难度大等缺点。
(二)供需匹配的精准帮扶机制
提升贫困治理效率要求吸纳更多的扶贫主体,目前我国扶贫主体主要是政府,社会和市场发力不足。企业、社会组织、个人等扶贫主体仍然游离于精准扶贫主力军之外,还有相当大的潜能没有发挥出来。精准扶贫大数据平台能够通过其数据处理结果归类不同的贫困群体,使除政府外的各扶贫主体能够根据自己的优势和特色选择不同的帮扶对象和扶贫机制,能够优势互补、又具有针对性。企业主体可以根据自身人力、技术、营销等相对优势,帮助缺少特色产业的贫困群体发展特色产业、技术培训学校。社会组织能够利用自身的公信力宣传引导、募集资金、道德示范,以树立脱贫攻坚的决心和信心,提高贫困户的积极性。供需匹配的精准帮扶耦合机制(见图3)通过大数据平台发布贫困群体的具体信息,扶贫主客体的供需信息,以提高扶贫主体对扶贫对象的认知度;此外,通过跟踪扶贫成效,将成效显著扶贫案例、扶贫主客体作为典型示范,调动其他扶贫主客体的积极性;最后,精准扶贫大数据平台能够提供沟通渠道以实现主客体、中介的多向互动,这更好的解决了信息不对称问题。
(三)产业扶贫大数据融合机制
产业扶贫以市场为导向,以产业发展为杠杆,是涉及资源禀赋、基础设施、等要素的系统工程。现实中产业扶贫的成功率不高,主要是因为市场认知度不够、资源禀赋调动不合理、未充分认识市场风险以及扶贫数据缺乏及真实度不高等原因。此外,由于区域之间的扶贫信息交流不畅,扶贫数据的共享度不高,制约了部门、区域、产业间的协调互通,从而无法实现扶贫机制的科学决策。运用大数据技术,搭建气象、土地、生物等自然资源、环境数据、农业生产数据、市场供求信息等为一体的扶贫数据综合管理云平台。基于此平台,能够获得全面而真实的扶贫信息,从而为优化扶贫机制提供指导,产业扶贫的合理化能够提升扶贫绩效。此外,要格外注意农产品市场风险,建立风险分析和预警机制,这也是扶贫大数据技术的重要职能之一。产业扶贫耦合机制构建如图4。
七、精准扶贫大数据平台的构建
精准扶贫对象众多而且分散,扶贫主体类型各异,精准扶贫过程是包含识别、帮扶、管理、考核等多个步骤的系统工程,因此扶贫数据规模巨大且类型繁多。因此,本文构建的精准扶贫大数据平台特征如下:
(一)数据采集自动化
自动化的数据采集能够缩短数据采集时间,提高数据整合速度,这也是大数据巨量性和高速性的基本要求。因此,可以将低保、异地搬迁扶贫贷款、残疾人生活补助等资金信息进行整合,并开发精准扶贫应用软件,借助手机、电脑等移动设备,可随时随地将扶贫数据收集整理到该应用中。此外,打造贫困地区电商平台,建立农产品供销渠道,不仅有利于促进农民增收,而且能够及时掌握农民的收支数据。
(二)扶贫数据共享
利用大数据云平台整合全国的扶贫大数据,使不同扶贫部门、不同区域层级各类扶贫数据实现互联互通实时共享,能够更加全面而准确的管理精准扶贫过程和考核扶贫绩效。
(三)市场风险预警
扶贫大数据平台能够实现信息跨区域实时共享,通过风险分析技术和理论能够将市场供需数据的处理结果转化为较为可靠的市场风险诊断结果,实现提前预警。比如,进行数据挖掘以识别扶贫大数据中的关键指标,运用主成分分析、关联性分析等方法实现对农产品、劳动力及其他生产要素的市场风险实现动态监测与评估,并及时将风险信息以及专家组讨论形成的风险应对措施推送给贫困户,最大限度的降低风险损失。
因此,精准扶贫大数据平台拓扑结构可设计如图5,从图中能够看出,扶贫数据来源于贫困户、政府、企业及社会组织,这些数据的融合是构建大数据平台的前提;借助手机、电脑等设备及地理信息定位系统能够及时采集贫困户日常数据,使数据集有一个不断增加、不断更新的过程,能够保证数据的时效性、动态性,政府各部门拥有标准对比数据,是静态、存量的数据,建档立卡贫困户的现场采集数据源与之对比能够实现精准识别;从功能来看,该平台能够实现数据采集、整理、分析、服务等功能,能较好的实现扶贫进程的动态监测,对扶贫资金、扶贫项目、扶贫产业以及扶貧绩效有全面的跟踪把握。
八、结论
当前我国扶贫攻坚进入关键时期,传统的扶贫模式已经不能满足当前扶贫阶段的需要,融合大数据技术于精准扶贫中符合扶贫机制创新的演化趋势,且能够有效减少扶贫过程中的信息不对称。本文通过对精准扶贫与大数据技术之间的关联性研究,运用大数据技术构建贫困户精准识别机制、扶贫资源的供需匹配机制及扶贫产业有效选择机制等三大奉禺合机制,以期促进精准扶贫机制创新,但除技术运用外,还需要正确扶贫制度、政策的支持。此外,由于我国扶贫领域目前仍存在较为严重的贪污腐败现象,这也是阻碍精准扶贫绩效提升的重要因素,那么,如何建立相应的大数据分析框架、遏制扶贫腐败问题的发生是又一值得深入研究的命题。
参考文献:
[1]殷浩栋,汪三贵,郭子豪.精准扶贫与基层治理理性——对于A省D县扶贫项目库建设的解构[J].社会学研究,2017,32(06):70-93,243-244.
[2]王宇,李博,左停.精准扶贫的理论导向与实践逻辑——基于精细社会理论的视角[J].贵州社会科学,2016(05):156-161.
[3]黄如花,王春迎.我国政府数据开放平台现状调查与分析[J].情报理论与实践,2016,39(7):50-55.
[4]汪磊,许鹿,汪霞.大数据驱动下精准扶贫运行机制的耦合性分析及其机制创新——基于贵州、甘肃的案例[J].公共管理学报,2017,14(3):135-143,159-160.
[5]陆汉文,李文君.信息不对称条件下贫困户识别偏离的过程与逻辑——以豫西一个建档立卡贫困村为例[J].中国农村经济,2016,(7):15-22.
[6]谢治菊.块数据在农村精准扶贫中的应用及反思——兼与“条时代”大数据应用相比较[J].南京农业大学学报(社会科学版钿,2017,17(5):32-38,151.
[7]莫光辉,张玉雪.大数据背景下的精准扶贫模式创新路径——精准扶贫绩效提升机制系列研究之十[J].理论与改革,2017,(1):119-124.