犹豫模糊决策算法定量精准识别扶贫对象
2019-09-26王丽芳
□付 明 王丽芳
一、引言
在中央扶贫开发工作会议上,习近平总书记强调,中国扶贫攻坚工作须“实施精准扶贫方略,找到‘贫根’,对症下药,靶向治疗”。
精准识别扶贫对象作为扶贫工作的起始环节和重要基础近几年受到了国内外学者的广泛关注。杨国涛等[1](2010)利用西海固入户调查数据建模得出的实证研究显示,在外部环境恒定不变的条件下,家庭具体特征对农户贫困与否在统计学意义上有显著性影响,并指出如果要进一步提高扶贫效果,必须精准识别贫困对象。如何寻找贫困对象典型量化特征,李昊源等[2](2015)利用甘肃地区的调研数据建立logistic贫困对象识别模型,指出子女上学人数和家庭成员健康状况等对家庭贫困与否在统计学意义上具有显著影响;另外住房质量、人均用电量等与家庭贫困程度明显存在负相关特征。郑万军等[3](2016)从另一个角度分析精准扶贫,他认为精准扶贫的核心要义在于精准,而精准的关键在于瞄准相应的脱贫主体,近几年农村人口的空心化既弱化了脱贫的生产建设主体,也侵蚀了脱贫的组织基础。
那么多年来广泛实施的低保政策是否能够有效做到精准扶贫呢,Golan等[4](2017)从扶贫政策上进行研究,他利用常规的收入标准及倾向值匹配得分法分析农户数据,研究农村低保政策的减贫效果和瞄准有效性,结果表明,农村低保政策的反贫困效果有限,并存在较大的瞄准偏误,无法做到精准扶贫。自有计划、有组织开展反贫困以来,如何精准识别扶贫对象已经成为一个世界性难题。
二、算法理论
决策者对衡量贫困程度多个指标进行评估时经常会犹豫不决,往往对于指标的估值不能提供一个确切值,而是在几个可能的取值间犹豫不决[5],该难题也是解决精准识别扶贫对象的关键问题之一,而犹豫模糊集能够很好地解决该问题,它能将该指标多个可能值全部记录下来。犹豫模糊集的思想是当人们在确定一个元素属于某个集合的隶属度时常常感觉很困难,因为他往往在多个可能的取值之间徘徊,这时便把这些值都列出来作为隶属度。由此可见,犹豫模糊集能够更加细致合理地描述事物的不确定性。自从西班牙学者Torra[6]于2010年拓展模糊集并提出犹豫模糊集的概念以来,犹豫模糊集在众多决策领域得到了广泛应用。
目前,采用犹豫模糊集及其信息融合算法定量精准识别扶贫对象的研究成果较少。本文试图将犹豫模糊集及其理论应用在扶贫对象精准识别问题中,给出基于犹豫模糊集的扶贫对象精准识别算法,并通过模拟仿真对理论和算法进行验证。
(一)犹豫模糊集。犹豫模糊集的概念与定义。对于包含多个确定元素的固定集合X,犹豫模糊集是指从X的每个元素映射到[0,1]子集的函数,X中的每个元素对应一个[0,1]子集,犹豫模糊集是多个[0,1]子集的集合。为了便于理解,Xia和Xu[7]于2011年首次给出了犹豫模糊集的数学表达式,如公式(1)所示,其中,hA(x)为[0,1]中一个或者多个可能数值的集合,表示元素关于集合的一些可能的隶属程度。
A={
(1)
h(x)被称为犹豫模糊数,它构成了犹豫模糊集的基本组成部分,X中的每个元素对应一个犹豫模糊数,犹豫模糊集包含一个或者多个犹豫模糊数。针对扶贫对象精准识别问题,待测农户的每个指标分别对应一个犹豫模糊数,该犹豫模糊数包含数据采集人员对该待测农户的某个指标评测的多个可能值,一个待测农户的所有指标评测值对应一个犹豫模糊集。
犹豫模糊数的大小及其比较方法。对于犹豫模糊数,通过公式(2)进行计算可以得到其得分函数s(h),其方差函数v(h)可以由公式(3)进行计算,其中lh为犹豫模糊数h中所包含元素的个数。
(2)
(3)
假设h1和h2分别为两个犹豫模糊数,h1和h2的大小可以通过得分函数s(h)和方差函数v(h)进行比较。
(1)如果s(h1)>s(h2),则h1>h2;
(2)如果s(h1)
(3)如果s(h1)=s(h2),这种情况下将引入方差函数来进行比较:
①如果v(h1)>v(h2),则h1
②如果v(h1) ③如果v(h1)=v(h2),则h1=h2。 (二)犹豫模糊集信息融合算法。犹豫模糊集信息融合算法能将多维复杂模糊决策信息融合为少量单一的总体值,决策者可以根据这些合成的总体值对备选方案进行决策或者排序,从而作出在多约束条件下的最优决策。由此可见,信息融合算法在针对复杂模糊信息的决策过程中发挥着关键的作用。本文对衡量贫困程度的各项指标数据进行信息融合,得到各待测样本贫困程度值,根据该值对贫困程度进行排序。目前关于犹豫模糊集的信息融合算法已取得了一些进展,Xia和Xu针对不同情况提出了不同的犹豫模糊集成算法,本文采用犹豫模糊加权算术平均(hesitant fuzzy weighted averaging,HFWA)算法和拟犹豫模糊混合加权算术平均(quasi hesitant fuzzy hybrid weighted averaging,QHFHWA)算法[8]。 假设犹豫模糊集中包含n个犹豫模糊数,记为hi(i=1,2,…,n)。犹豫模糊加权算术平均(HFWA)算法是一个Θn→Θ的映射,其具体计算公式如公式(4)所示: (4) (5) 若g(r)=r,则QHFHWA算子退化为犹豫模糊混合加权算术平均(hesitant fuzzy hybrid weighted averaging,HFHWA)算法。 (一)关键指标选取。扶贫对象的精准识别关键在于对待测农户贫困程度的精准测量,而贫困程度则通过多项关键指标体现。大数据背景下,对待测农户能够动态采集的指标比较多,选取合适的衡量指标对于精准识别扶贫对象十分关键。通过前期研究,本文采用以下几项关键指标对贫困程度进行定量测算,并列出每项指标的子属性,对于该指标的估值主要从其下多个子属性进行考虑,指标的细化有利于深入了解待测农户目前及有限未来的家庭经济状况,做出较为合理的判断。第一,家庭人均纯收入(C1)指标,由三个子属性构成,即人均务农纯收入(S11)、人均打工纯收入(S12)和人均养殖业纯收入(S13);第二,子女数量(C2)指标,由四个子属性构成,即义务教育前子女人数(S21)、义务教育阶段子女人数(S22)、大学到博士阶段子女人数(S23)和已经参加工作或务农子女人数(S24);第三,疾病状况(C3)指标,由两个子属性构成,即家庭成员患慢性病及程度(S31)和家庭成员患重大疾病及程度(S32);第四,住房条件(C4)指标,由两个子属性构成,即住房数量(S41)和住房质量(S42);第五,村民和扶贫干部对其贫困程度评价(C5)指标,由两个子属性构成,即村民对其贫困程度评价(S51)和扶贫干部对其贫困程度评价(S52)。 区别以往主要按照家庭人均纯收入对扶贫对象贫困程度进行衡量,通过前期调研发现,疾病和子女上学是导致贫困的两大主要因素,另外住房条件也是衡量贫困程度的重要指标,而且本文引入贫困程度评价指标,分为村民对其贫困程度评价和扶贫干部对其贫困程度评价两个子属性,多角度和多层次对待测农户贫困程度进行衡量。 (二)数据采集与标准化处理。在决策领域,为了得到合理的决策结果,往往邀请多个专家组成决策团队对一组方案分别提出偏好信息。基于此,为了得到真实可靠的待测农户贫困程度值,本文采用多个数据采集员分别对每一待测农户多项指标进行评测,在对待测农户的某些指标进行估值时,数据采集员往往并不能够明确地提供一个值,而是在几个可能的取值间犹豫不决,例如:数据采集员对某一待测农户的村民和扶贫干部对其贫困程度评价指标进行评测时,对于取值0.86,0.90和0.93犹豫不决,传统算法往往选取这些值中的某一个值,这既具有随意性,也不符合数据采集员的本意,与以往使用精确值不同,本文算法采用犹豫模糊数对该指标进行记录,该指标值可以表示为犹豫模糊数{0.86,0.90,0.93},采用犹豫模糊数对指标进行记录,保证了采集得到的第一手数据的真实性和完整性。作为一个犹豫模糊集基本单元的犹豫模糊数{0.86,0.90,0.93}比精确的实数0.86(或0.90或0.93)、区间数[0.86,0.93]或直觉模糊数(0.86,0.1)能够更加全面地刻画问题[9],这是因为方案满足属性的程度不是0.86,0.90和0.93的凸组合或0.86与0.93之间的区间,而是三个可能的值:0.83,0.90和0.93[10]。 (6) 一是效益型指标:偏好值越大越好;二是成本型指标:偏好值越小越好。效益型和成本型指标的划分没有固定的规则,往往根据目标函数对各指标进行划分[11]。本文研究目标为贫困程度定量测量,家庭人均纯收入和住房条件为成本型指标;而疾病状况和村民和扶贫干部对其贫困程度评价为效益型指标;子女数量指标中大部分子属性为效益型属性,但已经参加工作或务农子女人数为成本型属性,对该指标估值时需要数据采集员进行综合判断。 (四)系统建模与实现。 第三,利用拟犹豫模糊混合加权算术平均(quasi hesitant fuzzy hybrid weighted averaging,QHFHWA)算法对群体决策矩阵H=(hij)m×n进行信息融合,得到各待测农户贫困程度犹豫模糊数。 第四,计算各待测农户贫困程度犹豫模糊数的大小,得到其贫困程度值。根据该值可以对待测农户贫困程度进行排序。如图1所示。 图1 犹豫模糊算法精准识别扶贫对象流程图 精准扶贫是当今社会第一民生工程,且顺应广大人民群众迫切需求,而精准扶贫的首要任务为精准识别扶贫对象。本文提出一种基于犹豫模糊决策理论用于精准识别贫困对象的算法。 以表1中5个家庭为例,定量计算每个家庭贫困程度,并依次排序。在算法实际运算中,由于指标众多,数据量大,其计算量为待测农户数量乘以专家数量乘以指标数量,采用本文提出的算法借助计算机编程技术能够高效率、高质量对待测农户贫困程度进行定量测算。 表1 待测农户指标定性评测表 (一)待测农户指标定性评测表。通过走访调查、查阅数据、实际观察和个人判断确定待测农户家庭情况指标定性评测,如表1所示,为后续的定量评测打下基础。从表1可以看出,直接对待测农户贫困程度进行排序十分困难,且不具有说服力。 (二)贫困程度指标标准化犹豫模糊决策矩阵。在表1的基础上,数据采集员分别对待测农户各项指标进行定量评测,对于某些取值犹豫不决的指标,记录其多种可能取值,再对数据进行标准化处理,采用犹豫模糊数进行表示。如表2所示。 表2 贫困程度指标标准化犹豫模糊决策矩阵 (三)确定权重因子。由于数据采集人员分为权威数据采集人员、经验丰富数据采集人员和普通数据采集人员,其权重向量分别设置为σ={0.45,0.35,0.2},偏好因子设置为ω={0.25,0.25,0.2,0.15,0.15}。经过前期调查,疾病和子女上学是导致贫困的两大主要原因,对其赋予更多的权重,确立五个指标的权重向量为λ={0.15,0.25,0.3,0.15,0.15}。 (四)合成群体决策犹豫模糊矩阵。利用上文公式(4)提出的HFWA集成算法将表2中个体决策矩阵合成为群体决策矩阵,如表3所示,其中设置为,与相同。 表3 群体决策犹豫模糊矩阵 (五)计算待测农户贫困程度犹豫模糊数。利用上文公式(5)提出的QHFHWA集成算法对表3群体决策矩阵进行计算,得到每个待测农户的贫困程度犹豫模糊数。分别用h1、h2、h3、h4、h5表示。在QHFHWA集成算法中令g(γ)=γ。由于篇幅有限,本文只保留了三位有效数值,在算法实际计算过程中采用精确值进行计算。 h1={0.786,0.785,0.787,0.786,0.786,0.785,0.787,0.786,0.794,0.793,0.795,0.794,0.794,0.793,0.796,0.795,0.800,0.799,0.801,0.800,0.800,0.799,0.801,0.800,0.808,0.807,0.809,0.808,0.808,0.807,0.809,0.808,0.787,0.786,0.789,0.788,0.788,0.787,0.789,0.788,0.796,0.795,0.797,0.796,0.796,0.795,0.797,0.796,0.801,0.800,0.803,0.802,0.802,0.801,0.803,0.802,0.809,0.808,0.810,0.810,0.809,0.808,0.811,0.810}。 h2={0.728,0.723,0.732,0.728,0.730,0.726,0.734,0.730,0.732,0.728,0.736,0.732,0.734,0.730,0.739,0.735,0.730,0.725,0.734,0.730,0.732,0.728,0.736,0.732,0.734,0.730,0.739,0.734,0.736,0.732,0.741,0.737}。 h3={0.746,0.751,0.746,0.752,0.746,0.752,0.747,0.752,0.749,0.754,0.749,0.754,0.749,0.754,0.750,0.755,0.747,0.752,0.747,0.753,0.747,0.753,0.748,0.753,0.750,0.755,0.750,0.755,0.750,0.755,0.751,0.756,0.750,0.755,0.750,0.755,0.750,0.755,0.750,0.756,0.752,0.758,0.753,0.758,0.753,0.758,0.753,0.758,0.751,0.756,0.751,0.756,0.751,0.756,0.751,0.757,0.753,0.758,0.754,0.759,0.754,0.759,0.754,0.759}。 h4={0.774,0.777,0.777,0.780,0.775,0.779,0.778,0.781,0.782,0.785,0.785,0.788,0.783,0.787,0.786,0.789,0.783,0.786,0.785,0.789,0.784,0.787,0.787,0.790,0.790,0.794,0.793,0.796,0.792,0.795,0.794,0.798,0.774,0.778,0.777,0.781,0.776,0.779,0.779,0.782,0.783,0.786,0.785,0.789,0.784,0.787,0.787,0.790,0.783,0.787,0.786,0.790,0.785,0.788,0.787,0.791,0.791,0.795,0.794,0.797,0.793,0.796,0.795,0.798}。 h5={0.813,0.815,0.814,0.816,0.814,0.816,0.815,0.816,0.821,0.822,0.822,0.823,0.821,0.823,0.822,0.824,0.820,0.821,0.821,0.822,0.820,0.822,0.821,0.823,0.827,0.828,0.828,0.829,0.827,0.829,0.828,0.830,0.820,0.822,0.821,0.823,0.820,0.822,0.821,0.823,0.827,0.829,0.828,0.830,0.827,0.829,0.828,0.830,0.826,0.828,0.827,0.829,0.826,0.828,0.827,0.829,0.833,0.834,0.834,0.835,0.833,0.835,0.834,0.836}。 (六)计算待测农户贫困程度值。利用公式(2)对贫困程度犹豫模糊数h1、h2、h3、h4、h5进行计算,得到各待测农户贫困程度值,该值为实数。待测农户贫困程度值如表4所示。 表4 待测农户贫困程度值 (七)贫困程度排序。根据步骤(6)的计算结果,可以对待测农户的贫困程度从高到低进行排序,依次为张杰、王红、刘刚、张勇、李强。另外,通过设置贫困程度阀值,可以输出需要寻找的扶贫对象,实现扶贫对象精准识别。图2为待测农户贫困程度对比图。 图2 待测农户贫困程度对比图 本文将扶贫对象精准识别问题看作多专家多属性决策问题展开研究,采用犹豫模糊数保存衡量待测农户贫困程度的各项指标,充分考虑决策者在决策时的不确定性和模糊性。通过各种权重因子的设置,充分发挥权威专家的能力、关键指标的作用和偏好的影响力。采用犹豫模糊集成算法对各指标进行信息融合,算法能够综合、全面和量化考虑待测农户各方面情况,并能够有效控制个别指标误差对贫困程度定量计算产生的影响。最后,结合实际例子,给出了算法计算的详细步骤、中间过程和中间值,通过该算法和计算机编程技术能够高效率对待测农户贫困程度进行定量计算,对贫困程度进行排序,实现扶贫对象精准识别。三、扶贫对象精准识别系统建模
四、算法实现与验证
五、结语