APP下载

基于大数据画像的精准扶贫服务研究

2019-02-07程冬玲聂燕敏韩素芬

无线互联科技 2019年22期

程冬玲 聂燕敏 韩素芬

摘   要:《促进大数据发展行动纲要》是巩固当前脱贫攻坚站的重要指导纲要,脱贫大数据的建立是进一步提升脱贫成效的基础和前提,但依靠传统的问卷调研和深度访谈等形式获得的数据可靠性略低,可能会导致基于调研数据的分析结果失真。因此,文章通过对贫困人口的行为痕迹数据进行搜集、整理、分析,形成贫困对象大数据画像,为提升脱贫成效提供数据支撑。

关键词:大数据;精准扶贫;用户画像

随着信息化水平的提高和大数据技术的发展,大数据在精准扶贫领域的作用越来越凸显,通过数据分析可有效辨别是否贫困以及贫困原因,从而进行精准扶贫,巩固和提升扶贫成果。传统数据收集是通过问卷调查和走访等形式完成的,在调查和走访贫困人口过程中,走访对象因自身利益可能会表述不真实的数据,导致基础数据失真,進而影响后续数据分析的准确性。另外,走访和问卷调查方式需要大量的人力,工作量大、任务繁重且易出错,所形成的数据不足以构成事实上的大数据,导致数据分析结果不完备[1]。

当前,数字化已经深入到每个人的社会生活中,任何社会行为都会产生数字痕迹。因此,可利用网络技术获取贫困人口的实时行为大数据,建立高效、准确、丰富的大数据样本,进而抽象出贫困对象的特征标签。用标签描绘出贫困对象的精准“用户画像”,对比调研数据,更加准确地筛选出有效数据,进而进行较完整的数据分析,为精准扶贫、巩固提升扶贫效果建立基础[2]。

1    “用户画像”源数据采集

数据采集是大数据用户画像建立的第一步,数据质量直接决定用户画像的精准度。传统的问卷调查、走访等数据收集方式虽存在弊端,但在数据收集过程中,收集人员可直接与贫困对象面对面的接触,建立数据之外的信息,因此,这种方式是不可取代的。通过传统方式也可获得原始数据,这些数据构成静态的数据信息,如姓名、年龄、住址等。在建立用户画像过程中,需对数据进一步处理,生成用户标签,如高龄、无固定居所等,描绘贫困对象的固有属性。“用户画像”建立示意如图1所示。

只建立“用户画像”的固有属性是不完备的,还需通过动态数据的采集形成用户的动态属性,如收入变化、住院情况等。动态数据采集可通过网络技术和系统接口调用等方式实现,如建立与医保系统的数据接口,获取对象的住院信息,了解其实际医疗的支出情况;与租房或售房系统进行对接,掌握对象的房屋信息;有条件的情况下,与金融消费系统对接,了解收入和支出的情况[3]。

2    “用户画像”标签生成

通过源数据采集获得的数据并不能直接进行分析处理,存在一些冗余度较高、包含大量非结构化或半结构化数据、不同系统获取的数据不一致等问题,进一步进行去冗降噪、结构转化、数据比对、数据清洗后方可使用。处理后的数据相对准确,大部分贫困信息系统、数据库等开发到此阶段就基本结束,但实际上这些数据还不能为扶贫人员提供贫困对象更富有语义的信息。所以,需在数据之上进行挖掘,生成用户标签,为建立贫困对象精准的“用户画像”做准备[4]。

建立用户标签就是从用户数据信息中,抽取出高度精炼、能准确概括用户某种明显特征或属性的标签,标签可更便捷的被计算机识别、处理,是“用户画像”最直接的构成要素。用户标签需具备两要素:一是语义化,工作人员能快速理解每个标签含义;二是简洁凝练,每个标签只能表达一种含义,不能有歧义,这样建立的“用户画像”才能精准。

标签的建立需大量扶贫工作人员的参与,初始建立的标签通过工作人员交流沟通,在咨询相关专家后人工生成。随着数据量的增加,标签的样本库会越来越丰富,通过对数据聚类分析可实现标签自动生成。初始自动生成的标签可能存在误差,可不断抽取高频标签,对标签样本进行纠错调整,使标签生成算法越来越准确。

3    基于“用户画像”精准扶贫作用

基于大数据建立的扶贫对象“用户画像”为工作人员提供了更加精炼、具有丰富语义的贫困人口信息,可在掌握贫困对象静态信息的基础上,了解对象动态信息的变化,达到精准扶贫、对口帮扶、巩固扶贫、提质增速的良好扶贫效果,具体如下:

(1)识别虚假信息,掌握贫困动态。通过调查走访等形式采集的数据因个人利益原因,导致数据不准确,甚至可能出现弄虚作假的情况。在建立贫困人口大数据“用户画像”的过程中,不仅对静态数据进行整理、分析,还需采集其他系统中相关人员的动态数据进行比对、分析,让虚假数据无处遁形,避免国家不必要的损失。对已建卡的贫困人口,通过动态数据的分析,实时掌握贫困动态;对已脱贫的用户,要及时停止相关补贴,把扶贫款用到更需要的人手里。另外,通过与其他系统对接,把因病致贫、因教育致贫等新增贫困对象及时纳入到贫困大数据系统中,实现早期干预、精准扶贫,避免其陷入长期贫困。

(2)区分贫困类型,实现精准扶贫。建立贫困人口大数据“用户画像”的最大优势是实现了贫困对象的精准信息化的描述。传统关系型数据库建立的贫困人口信息系统所采用的贫困分类方式比较粗糙,只能提供基本的用户信息,大量实际情况的信息一般由工作人员自己掌握,无法实现大数据的分析处理,也不利于工作交接。而建立了贫困对象“用户画像”后,计算机处理的信息维度更广、分类更细且富有语义,可充分发挥大数据在数据分析上的优势,为扶贫人员提供更加精准的帮扶信息和帮扶建议,实现基于“用户画像”因人而异的精准扶贫。另外,建立全省或全国的贫困大数据“用户画像”,使工作人员能通过“用户画像”快速掌握贫困人口情况,有效提高扶贫工作效率。

(3)巩固脱贫成效,提升扶贫质量。巩固脱贫成效是脱贫攻坚战的重要内容,对已实现脱贫对象、已建立的大数据标签进行调整,对应的“用户画像”由算法调整后重新生成,相关政策也应有一定的延续性。在大数据系统内建立长期的动态跟踪机制,防止其再次返贫,保障脱贫工作的稳定性。

在提高脱贫工作稳定性的基础上应进一步提高脱贫质量,脱贫不仅是经济上的脱贫,更是观念、思想的脱贫,让脱贫对象能更有尊严、更幸福的生活才是根本目标。通过基于“用户画像”建立的贫困对象大数据分析,在服务精准经济扶贫的同时,服务教育扶贫、思想扶贫,向贫困人口推荐有意义的方针政策,宣传教育意义,让贫困人口脱贫后真正的拥有幸福感、获得感。

4    结语

本文提出一种建立贫困人口大数据“用户画像”的方法,数据源获取的方式在原有传统数据收集的静态数据之外,提出通过网络技术、系统对接等方法获取贫困人口的动态数据,对数据源进行预处理的基础上生成用户标签,进而实现对贫困对象“用户画像”的描绘。

“用户画像”的建立可帮助扶贫工作人员去伪存真,实时掌握贫困动态信息,建立更加细致的贫困人员分类情况,进行精准扶贫,巩固扶贫成果,为进一步提升扶贫成效完成国家扶贫攻坚工作提供数据支撑。

[参考文献]

[1]莫光辉,张玉雪.大数据背景下的精准扶贫模式创新路径—精准扶贫绩效提升机制系列研究之十[J].理论与改革,2017(1):119-124.

[2]吕元媛,蒋春花.大数据支持下的精准扶贫路径选择与模式创新[J].经济研究导刊,2017(29):32-33.

[3]刘海鸥,刘旭,姚苏梅,等.基于大数据深度画像的个性化学习精准服务研究[J].图书馆学研究,2019(15):68-74.

[4]葛晓鸣.基于“用户画像”模型构建的精准营销策略[J].辽东学院学报(社会科学版),2019(4):50-57.