空间数据驱动下的画像分析技术在精准扶贫决策中的应用
2020-06-10严瑞
严瑞
(江苏省测绘地理信息局信息中心 江苏省南京市 210013)
党的十八大以来,党中央、国务院对扶贫开发工作高度重视,将新时期扶贫开发工作定位为“精准扶贫”。在扶贫工作进入决胜阶段的大背景下,面对海量的扶贫大数据,急需创新扶贫工作思路与方法,加强对数据的采集和整合,从繁杂的统计数据中发现更具价值的信息指导扶贫工作。
空间数据在表达上具有直观、多尺度等特点,采用GIS(地理信息系统)空间分析技术,围绕地理国情专项监测成果,充分挖掘道路通达、河流分布、耕地占比等重要空间特征信息,结合扶贫业务数据,构建包含地理影响因子的综合评价模型,将可以更准确的识别区域性贫困特征,为推出定制性政策提供决策辅助,协助地方扶贫主管部门更有针对性地建设帮扶项目。
1 基于地理信息的贫困特征综合评价模型
建立合理的指标体系,是识别贫困特征的基础。本研究依据数据的可获得性以及扶贫开发需要实现的战略目标,构建基于地理信息的扶贫影响因子指标体系。
1.1 数据来源
传统上,贫困特征识别的主要数据来源包括扶贫建档立卡数据、民政统计数据等。本研究在此数据基础上,充分考虑地理空间特征对贫困现状的影响,添加了空间数据作为数据源,用于地理位置空间参考及空间分析。空间数据按照不同用途又分为基础地理信息数据以及扶贫地理信息数据,基础地理信息数据主要包括DLG(数字线划图)、DOM(数字正射影像)、DEM(数字高程模型)和省级基础地理实体数据;扶贫地理信息数据主要指低收入户、扶贫项目等信息的空间分布。
1.2 基于地理信息的扶贫影响因子指标体系
基于地理信息的扶贫影响因子指标体系有效融合地理空间特征与经济社会影响特征,由村经济发展指标,低收入户情况指标,地理影响因子指标及动态相关性指标等四个维度的指标构成,每个维度指标下细分为二级指标,村经济发展指标可以较为客观而清晰的反映村总体贫困现状;低收入户情况指标、地理影响因子指标反映交通、土地利用等宏观扶贫开发进展对扶贫的影响;关系属性指标反映了各个经济薄弱村之间的相似程度。
如图1所示,扶贫影响因子指标体系中,高中教育程度农户数量、人口密度、60岁以上农户数量、从业农户数量、帮扶产业数量、因病致贫占比、人均收入、有无教育贷款等指标可由建档立卡数据、民政统计数据等直接计算得到。
图1:扶贫影响因子指标体系
图2:多层次扶贫画像特征关联
交通通达度是指区域内交通路网的便捷程度,通过交通可达时间测算,数据来源为地理国情监测成果中的国省道路网、铁路网、乡村道路等交通专题数据。项目采用GIS栅格分析和网络分析技术,运用不同尺度的区域时间可达性指标,在此基础上建立区域交通通达度计算模型,表达式为:
其中,i为栅格成本图中的任意格网, Ai为i格网的可达性,Tij为i点到j点通过最短路径所花费的最小时间。
耕地破碎度,表示区域内耕地面积和完整性,可由单位面积内可耕地类面积密度测算,数据来源为地理国情监测成果中地类图斑成果。
1.3 贫困特征综合评价模型
参照扶贫影响因子指标体系,可通过计算得到各指标的单项数值,由于指标性质不一,通常具有不同的量纲和数量级,为了消除不同量纲影响,需对各个指标进行标准化处理:
式中,X为区域内指标实际值;X’为区域内指标标准化后的值;Xmax为指标最大值,Xmin为指标最小值。
将各项指标标准化后,可得到贫困特征综合评价模型:
其中{K1,K2,….Kn}表示每一单项指标均值, {K’1,K’2…K’n}表示区域内各项指标的实际值,V由区域内各项指标的实际值与平均值的差值组成,通过差值的高低,可反映各项指标的影响强弱程度。
2 基于贫困特征综合评价模型的画像分析技术
画像分析作为大数据的根基,完美地抽象出一个对象的信息全貌,为进一步精准、快速地分析该对象的重要特征,提供了足够的数据基础,奠定了大数据时代的基石。本研究基于包含地理因子的贫困特征综合评价模型,建立某个经济薄弱村的个体画像及群体画像。
2.1 个体扶贫画像
个体扶贫画像表示经济薄弱村个体各项指标特征,从中可反映出立产业项目投资、交通建设、教育医疗等民生服务间的关联,制定针对性政策。如图2所示。
2.2 群体扶贫画像
通过多层次扶贫画像的定义,可对扶贫工作中具有相同、相似特征的经济薄弱村进行聚类分析,归类标签,形成具有共同特征的经济薄弱村的具象化描述,例如可自定义交通通达度指标、人口密度指标等,形成交通发达村群体、劳动力充足村群体等经济薄弱村群体特征画像,为扶贫精准施策找到符合需求的经济薄弱村。
2.3 基于画像特征的相似度分析
经济薄弱村特征识别模型从社会经济、自然资源条件、交通条件等多方面对经济薄弱村进行了量化,因此通过选择薄弱村历史数据作为样本,将其他经济薄弱村与其进行对比,可根据相似度判断预测其未来的脱贫趋势。对于每一个待预测的薄弱村,我们首先利用经济薄弱村特征识别模型作为它的表示,然后计算模型各指标相似度,采用Top-k分析方法,选取出相似度最高的K个样本经济薄弱村模型,并求取其脱贫概率平均值,得到待预测经济薄弱村的脱贫趋势预测值。
3 贫困村画像应用分析
本研究基于画像分析技术,以江苏省涟水县为例,对经济薄弱村扶贫画像进行了应用。如图3所示,为当地的某一个经济薄弱村扶贫画像,从中可以看出,其交通条件较为落后,同时产业项目建设也较为薄弱,因此通过加大道路建设投入,提高与周边地区的人力、物资交流,可实现对该村的有效帮扶。
图3:经济薄弱村个体扶贫画像
图4:经济薄弱村相似度画像
图4则是采用画像分析技术,通过画像特征相似度对比找到的与目标对象类似的经济薄弱村结果。从图中可以看出,这两个村均为年龄结构偏重于老年人,产业项目收入少的村庄,并且在交通、耕地等方面存在一定的劣势,通过相似度分析,可以对薄弱环节类似的贫困村采用类似的扶贫措施。
4 结语
本研究充分发挥地理信息技术特点,有效融合地理空间特征与经济社会影响特征,建立了贫困特征综合判别模型,采用画像技术实现了空间数据驱动下的经济薄弱村精准识别和筛选,有效提升了扶贫决策科学化水平,为空间数据在精准扶贫工作中的深层次应用和推广提供了创新的思路。