利用大数据多维度甄选相对贫困人口
2021-04-08陈稳
陈稳
[摘 要]中共十九届四中全会特别强调:“坚决打赢脱贫攻坚战,巩固脱贫攻坚成果,建立解决相对贫困的长效机制。”体现了党中央对扶贫工作的未雨绸缪,为此对相对贫困的区分标准和区分方法也要及时地跟进。标准应该是多维度综合平衡,方法应该依据大数据的积累和分析,两方面结合起来才能建立一个区分相对贫困的科学方法,进而甄选真正的相对贫困人口进行精准帮扶。
[关键词]大数据;甄选;相对贫困
中国共产党第十九届中央委员会第四次全体会议审议通过的《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》中的第八节“坚持和完善统筹城乡的民生保障制度,满足人民日益增长的美好生活需要”的第三自然段 “完善覆盖全民的社会保障体系”[1]的最后特别强调:“坚决打赢脱贫攻坚战,巩固脱贫攻坚成果,建立解决相对贫困的长效机制。”[2]这是为2020年精准扶贫工作取得胜利后做的下一步谋划,体现了党中央的高瞻远瞩,为将来的精准扶贫工作指明了方向和前进的道路。2015年6月习总书记在贵州调研时强调要科学谋划好“十三五”时期扶贫开发工作,确保全国所有的贫困人口到2020年都能顺利脱贫,并提出扶贫开发“贵在精准,重在精准,成败之举在于精准”,并明确地阐述了 “六个精准”的内涵,在此之后精准扶贫工作越做越扎实,脱贫成效越来越明显,贫困人口从2015年的5 575万减少到2019年的1 660万。照此工作进度绝对贫困问题在我国可以基本解决,下一步的扶贫工作的重点就是如何解决相对贫困的问题。国际上尤其是发达国家对相对贫困问题研究的起步较早,他们最早从经济学的范畴:“相对贫困是指个人或家庭的整体收入,虽然可以满足其基本的生活需要,但是不足以使其达到社会的平均生活水平,通常只能维持远远低于平均生活水平的状况。”[3]但随着对相对贫困逐渐深入的研究,专家们发现相对贫困不仅仅是经济学范畴的问题,更是一个社会学问题。因为它包含贫困主体与其他社会人群相比較的过程中,所产生的一种被剥夺感的社会心态,所以对相对贫困的研究几乎涉及所有的社会科学领域。
一、相对贫困的多维度标准分析
1971年汤森从社会资源占有的角度对相对贫困理论进行研究,他认为:“个人、家庭、社会组织缺乏获得饮食、住房、娱乐和参与社会活动等方面的资源,使其不足以达到按照社会习俗或所在社会鼓励提倡的平均生活水平,从而被排斥在正常的生活方式和社会活动之外的一种生存状态。由于穷人缺少这些资源,他们所应该拥有的条件和机会就被相对剥夺了,故而处于贫困状态。”[3]
(一)相对贫困产生的原因
从个体的角度探究相对贫困这种社会现象的产生,基本可以把致贫原因分为两大类:一类是先天因素;一类是后天因素。
先天因素是由个人所处的环境(自然环境和社会环境)和遗传因素所组成的自然禀赋两部分组成。它包括地理环境、社会阶层、家庭财富、人脉关系、性别、智商、容貌及体格素质等。这些自身无法掌控的先天因素会造成不同社会个体之间天生的不平等。这些先天的不平等有一部分可以通过自身地勤奋和努力有所改变,化不利因素为有利因素;但还有一部分先天的不平等再努力也不能改变,而且还会随着时间的增长而增大。这种先天的起始不平等又进一步加剧了结果的不平等,结果的不平等自然而然地就会造成社会上相对贫困的现象层出不穷。由相对贫困中的贫困人口其社会地位分化成为底层群体,就很容易引发不同社会阶层成员之间的相互对立和排斥。这些对立和排斥形成了社会的不和谐因素,如果长时间不能够得到化解就会诱发社会动荡和不安,在某些特殊和极端的情况下还可能会造成尖锐的社会矛盾冲突。
后天因素包括个人后天的勤奋与努力和坚韧与自制的程度;宏观社会的政治制度、经济制度、文化、法律制度等成文的规则和一些风俗习惯的约定俗成非成文规则。由此可见一部分后天因素是受主观能动性所控制的,通过个人努力能够极大地提升自己的社会阶层,改善自己的经济条件。另外一部分后天因素所造成的收入差异和贫富差距反映的是社会的善治水平和市场经济的成熟程度。善治的社会治理和成熟的市场机制将鼓励人们“撸起袖子加油干”,以后天勤奋与坚韧弥补先天自身不足因素的影响。反之,制度的缺陷、市场失灵和政策失误会让人民失去奋斗的方向和动力,加剧了社会贫困分化的程度,让相对贫困的人群逐步扩大化。因此只有通过坚持和完善中国特色社会主义制度,推进国家治理体系和治理能力现代化,进而早日建成更加成熟和完善的社会主义市场经济体制和充满活力的市场机制,使人们公平公正的参与到市场竞争中去,通过自己辛勤劳动收获幸福的生活。
对于那些先天能力处于劣势的人,党和政府会采取一系列精准扶贫的措施和兜底的社会保障手段满足其达到“两不愁三保障”的基本生活需求,不至于身陷为吃穿发愁的绝对贫困生活境地。只有针对先天因素和后天因素两手一起抓,才能使我国逐步地建立起来消除相对贫困的长效机制。
(二)相对贫困的维度分析
1.相对贫困的内涵。国内的专家学者对相对贫困的内涵作一定程度的研究,形成了自己的观点和认识。唐钧认为:“绝对贫困、相对贫困和基本贫困是一个互相衔接的独立概念。绝对贫困是内核,向外扩展第一波是基本贫困,第二波是相对贫困。”[4]相对贫困是社会成员之间相互比较得出的结果,这种相比较出来的不同社会成员之间的相对分层贫困就是一种相对剥夺感的社会心态分层。随着不同社会层次的社会成员之间不断扩大的收入差距和身份地位差距会出现贫富分化的马太效应,使得处于比较劣势地位的相对贫困的社会成员数量进一步扩大,造成相对贫困的社会成员的被剥夺感从低层次的社会成员中逐步地向整个社会中不断地扩散和弥漫。同时相对贫困又属于社会道德的范畴,相对贫困的分化程度与社会公平正义呈负相关,相对贫困的分化程度越低社会相对越公平正义。虽然发达国家以相对贫困为主,但其分化程度也高低不同,其本国的基尼系数和恩格尔系数等统计数据就可以反应出这个结果。而我国则是未雨绸缪,提前降低相对贫困的分化程度,确保全国人民同步迈入社会主义现代化强国的行列。
2.相对贫困的测量维度。把握了相对贫困的内涵之后就要对相对贫困进行多维度地测量,进而甄选出相对贫困的人口群体。具体到测量方面的研究,国内外针对测量方法、测量指标和测量指数等作了深入研究,力求从多维度并运用不同的测量方法、测量指标和测量指数对相对贫困进行测量。联合国开发计划署提出了人类贫困指数(HPI),但针对发达国家和发展中国家国情的不同和具体的贫困情况,在运用人类贫困指数(HPI)测量的过程中也应该采用不同的维度指标进行相对贫困的测量。Atkinson在考察了欧洲国家的多维贫困问题之后,依据公理化的标准,提出了“计数法”的多维贫困测度,这种测量方法可以使人们从更多维度去关注相对贫困的问题[5]。随着我国学者对相对贫困理论研究地不断深入和完善,测量维度由过去关注单一的收入、教育、健康等指标,逐步发展为以这三项指标为核心的多维综合指标测量模式。用更加多维的测量来逐步完善相对贫困的区分标准,确保我国相对贫困筛选的更加精准。而后王小林等人让多维度贫困测量的理论在中国从理论走入了实践,他们利用多维度贫困测量方法对2006 年“中国健康与营养调查”数据中的八项指标进行等权重赋值,利用这八项指标深入分析了我国城市和农村多维度贫困情况。他们在实践过程、实践分析和实践结论中给相对贫困人口的筛选提供了一个更加缜密的思路和方法。
二、大数据库的建设
大数据库建设主要包括:国家扶贫系统建立的扶贫数据库、政府相关机构建立的行业数据库和非官方机构建立的数据库。这三类数据库是他们各自依托自己的行业优势日积月累形成的数据库,其数据的可靠性、广泛性、真实性和便利性具有无可比拟的优势。
(一)国家扶贫系统建立的数据库
按照国家扶贫办的统一要求,安徽省在2014年制定并实施了《安徽省扶贫开发建档立卡工作实施方案》。在省扶贫办的统一领导,地方各级扶贫办组织干部群众录入数据,为建立了国家扶贫系统大数据库贡献了安徽的扶贫数据。其他各省也是同步贡献了自己的扶贫数据,因此全国的贫困人口基本信息在这个数据库中都可以查到。随着这些年精准扶贫工作大规模的展开,数据库的数据内容也在不断充实,通过动态调整和动态管理,确保数据的及时更新。数据库的数据对贫困人口精准扶贫的全过程作了详细记录,确保脱贫数据真实可靠,脱贫效果实实在在。这个数据库也是下一步甄选相对贫困人口可以依据的基础数据。
(二)政府部门及相关机构建立的数据库
家庭人口的基本信息在公安部门的户籍网和卫计委的人口信息网这两个数据库中都有详细的记录。在这两个数据库中可以查到每一个公民的户籍基本信息,姓名、性别、年龄和彼此的血缘亲属关系。这些基本信息可以简单地勾勒出一个人基本情况,这就为下一步相对贫困人口的甄选工作打下了最坚实的基础,让后续环节可以建立在绝对真实的人口信息之上。
家庭整体的收入或者个人的自己收入是甄选相对贫困人口最基本的一个维度。基于传统模式设计出来的各种统计方法和统计内容所计算出来的收入值,无论是精确性还是真实性都不如通过金融系统的数据库,查看其一定时期(以一个自然年度为限)的资金流水和长期存款数额,这两组数据绝对客观真实可靠,同时最能反映其经济收入状况。
大型农机械、工程机械、大客车、大货车和小型轿车等交通工具是社会占有的一个重要内容,也是家庭或个人的重大财产。这些物品在投入使用前都要依法把相关信息登记到公安交通和农机等相应的管理部门之中,由此就建立了相应的大数据库。利用这些部门的数据库就能快速地筛查出该物品的所有人和实际的使用情况。这些数据可以作为排除相对贫困人口的一个依据。
房管部门的数据库记录有每一个购房者的购房信息和持有的房产信息。而且房产信息的内容还比较丰富,仅仅需要输入一个身份证号码就可以得到详细的信息。但农村的房产信息虽然没有登记,但测量起来也非常简单,数据收集也非常便利,很容易就建立一个简易的数据库。人社部门的劳动人事数据库中与相对贫困相关的数据主要包括两类内容:一是公民的就业情况,确认每一个就业人的职业信息和五险一金的缴费情况,据此可以得出其工资的大概收入水平;二是公民养老金的发放情况和发放的数额,据此可以确认每一个达到退休年龄的人每月养老金的领取情况。税务部门的数据库中与相对贫困相关数据就是公民的纳税信息,包括纳税的时间、税种、金额和频率。利用这些数据可以分析该纳税人的财务状况或者其生产经营状况,分析结果就可以作为甄别相对贫困人口的一个重要依据。我国的教育分为基础教育类和非基础教育类两类,所以教育数据库也相应地分为这两类。而这两类信息都可以通过教育系统的大数据库进行信息查询。通过对基础教育类数据库的分析可以了解义务教育阶段的就学情况,重点排查有无因贫辍学的情况发生。非基础教育类可以了解分析学历教育的具体情况,以及学历教育的费用支出。因病致贫和因病返贫是当今社会致贫的一个最重要因素,这部分人也是相对贫困大概率群体。可治疗疾病到底花费了多少金额,不能靠病人随口一说。卫生系统的数据库主要记录病人就医病种、就医时间、就医次数和医疗花费。医疗费用应该依据卫生部门数据库的数据为准,只有这个数据才是最可靠的,也只能依据这个数据来确定医疗支出的花费。农业系统的数据库记录着农村土地承包和流转的基本情况。土地作为最基础的农业生产的资料,可以依据土地面积估算出农作物产量进而评估出农作物的产值。农村家庭承包的土地数量是一定的,其农业的产业收入也是相对比较稳定。国家在2016年开展了土地确权颁证工作,其测量手段依靠高科技GPS定位测量,各个农户土地承包面积测量得非常精确,因此其产量和产值也得到了进一步精确。民政部门的数据库记录着五保、低保、残疾等其他社会福利资金的发放数据。这些转移性支付资金的发放定人、定户、定时、定量,發放的方式为银行直接打卡到人到户。这些数据详实可靠,可以全程跟踪和逆向倒查,同时这些资金的发放还定期在一定范围公示,接受群众的监督。
(三)非政府机构建立的数据库
交通系统的数据库记录着每一个出行人的出行信息。现在的交通工具,无论铁路、公路还是水运都是采取计算机售票,记录着出行人出行的出发时间、出发地点和目的地。这样就可以大概分析一下出行人外出是出差、打工、就学还是就医了。电讯部门的数据库记录着每一个使用人的通讯数据。通过登记的通讯终端信息、通讯的费用和终端的漫游情况,可以了解使用人的通讯消费情况和网络使用偏好。同时通过对通讯数据的分析还可以了解使用人的社交情况,社交面的宽窄也是甄别其是否相对贫困的一个维度。电力系统的数据库记录着每一个用户一定时期的电费信息。一个家庭的月用电度数可以从侧面反映这个家庭生产生活情况,重点可以反应其家庭电器的情况。因此其用电数量的多少可以作为区分相对贫困的一个重要参考。支付宝和微信的数据库记录着每一个使用者的每一笔财务记录。这些数据反映了使用者消费情况和财务进出情况,尤其是消费记录更是反映一个人是否实现财务自由的一个重要指标。淘宝和京东等购物网站记录着每一个消费者的每一次购物信息。这些购物信息既能够反映消费者的购物需求,更能反映消费者购物的层次。购物层次反映的是消费层次,而消费层次是区分相对贫困的一个重要维度。
三、相对贫困甄选的逻辑架构
基于对相对贫困的多维度分析,我们可以得出利用大数据库能够对相对贫困进行更加精确的多维度分析,进而根据分析结果来甄选出相对贫困的人口、家庭、族群和地区进行精准帮扶。
(一)相对贫困大数据库的分类
依据上述三类大数据库的建立可以收集海量的数据,而且这些数据的最大优势在于是可以明确数值的数据,非常方便进一步建立模型和进行数值分析。
第一,对各个数据库中的数据按照一定标准进行分类,然后对每一个类数据单独提取出来进行数据分析,找到这类数据的众数、中数、平均数等数值。根据这些数据分析出不同层次人群的分界点,据此分界点绘制出人口分布比例图。至此该单项数据分析结果就可以让相对贫困人口的甄别区分度处于科学合理的区间和比例。另一类为否,即达到这一类相关数据的一定阈值就可以判断为否,当符合这一类否达到一定比例就可以判断这一群体为相对贫困人口或非相对贫困人口。如人社部门的劳动人事数据库显示一个城镇家庭或个体既没有就业信息也没有养老金领取信息,就基本可以作为判断该家庭或个体为相对贫困人口的一项指标;如民政部门的数据库记录着五保、低保、残疾等社会福利发放的数据。而该数据库从未记录过的家庭或个体,基本可以作为判断该家庭或个体为非相对贫困人口的一项指标。
第二,对分析好的数据进行简化建模,按照是与否的逻辑关系,达到相关数据的一定阈值就可以判断为是,当符合这一类是达到一定比例就可以判断这一群体为相对贫困人口或非相对贫困人口。如支付宝的数据库,我们可以根据国家统计局公布的城市和农村人均年服装消费额为阈值,凡是年服装消费额达到或者超过这个阈值就基本可以作为判断非相对贫困人口一项指标。如电力系统的数据库,我们可以根据国家统计局公布的城市和农村人均年电力消费度数为阈值,凡是年用电度数低于这个阈值的20%,就基本可以作为判断相对贫困人口一项指标。
(二)相对贫困大数据库权重分析
国家扶贫系统建立的数据库、政府部门及相关机构建立的数据库和非政府机构建立的数据库的三大类数据库,下面有具体分为16个子类。这16个子类的数据库内容应该是非常丰富和真实的。尤其是政府部门及相关机构建立的数据库和非政府机构建立的数据库,是他们各自工作过程中日积月累所形成的,掺假造假的可能性微乎其微。
这16类子数据库其内容各自不同,对甄别和甄选相对贫困人口的作用不尽相同,因此他们所占权重就自然不同了。有些数据在“是”的逻辑架构中可能占主要地位,相对来说自然而然的权重就要增加。如公安交通部门的信息数据库和农机管理机关的数据库中拥有大型农机械、工程机械、大客车、大货车和小型轿车等交通工具的所有人,在其认定为非相对贫困人口中所占權重就很大,在其认定为相对贫困人口中所占权重就很小。
同理有些数据在“否”的逻辑架构中可能占主要地位,相对来说自然而然的权重就要增加。如金融系统的数据库可以查看一个家庭和个人在一定时期的资金流水和存款数额,如果在该数据的记录中从未出现的家庭或者个人,在其认定为相对贫困人口中所占权重就很大,在其认定为非相对贫困人口中所占权重就很小。而这些数据库的具体权重还需要进一步的研究和探讨,确定一个科学的比例,尽量让权重能够体现他们自身在甄选中的重要性和实际价值。
对于绝对贫困人口可以划定一个经济收入的贫困线进行一刀裁的方式进行甄选,而相对贫困人口是一个相对复杂的群体,其甄选的方法应该是建立在大数据基础之上的多维度甄选,才能确保甄选过程的科学性和甄选结果的真实性。甄选的维度既要包括传统的收入、教育、健康等基础维度,还要考虑依托大数据提供的其他维度进行综合考量。只有这样才能甄选更为让人信服的相对贫困人口,减少社会矛盾冲突,同时还可以采取有针对性的精准扶贫措施,让相对贫困人口过上更加体面和幸福地生活,为建立解决相对贫困的长效机制打下一个坚实的基础。
[参 考 文 献]
[1] 中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定[EB/OL].(2019-11-06)[2020-12-19].http://www.xinhuanet.com/mrdx/2019-11/06/c_138532143.htm.
[2] 习近平.确保农村贫困人口到2020年如期脱贫[EB/OL]. (2015-06-19)[2020-12-19].http://news.xinhuanet.com/politics/2015-06-19/c_1115674737.htm.
[3] 同春芬,张浩.关于相对贫困的研究综述[J]. 绥化学院学报,2015,35(8):87-97.
[4] 唐钧.中国城市居民贫困线研究[M].上海:上海科学出版社,1994:63-68.
[5] Atkinson A B.Multidimensional Deprivation: Contrasting Social Welfare and Counting Approaches [J]. The Journal of Economic In equality,2003(1).
〔责任编辑:刘 阳〕