可拓聚类方法在水库移民后期扶持效果评价中的应用
2015-04-18刘婷婷薛晓燕
李 乾,李 彬,刘婷婷,薛晓燕
(1.华北水利水电大学,河南郑州450011;2.中国水电顾问集团元江开发有限公司,云南昆明650051)
可拓聚类方法在水库移民后期扶持效果评价中的应用
李 乾1,李 彬2,刘婷婷1,薛晓燕1
(1.华北水利水电大学,河南郑州450011;2.中国水电顾问集团元江开发有限公司,云南昆明650051)
在分析影响水库移民生产生活水平多种因素的基础上,结合移民实际生活状况,选取敏感性评价指标,应用物元和可拓集合理论建立移民生活水平评价的可拓聚类分析模型,将移民生活水平划分为贫困、温饱、小康、富裕和最富裕5个等级,通过可拓聚类分析得到水库移民生活水平评价结果。河南省某2个县实例分析表明,可拓聚类方法应用于水库移民生活水平评价中是可行的,评价结果是合理的、有效的。
水库移民;生产生活水平;可拓聚类方法;聚类分析;物元模型
0 引 言
在移民后期扶持政策实施监测评估中,监测评估人员通常根据人均纯收入、生活消费支出、家电拥有量等单个量化指标做出评价,但指标的多样性、复杂性会影响评价结果的准确性和合理性。可拓聚类分析是以物元理论和可拓学为基础,以物元变换成定性工具,关联函数定为定量工具,并采取定性和定量相结合的方法进行评估,保证评价结果的准确性和合理性。
本文从后扶政策实施对移民生活水平影响程度的角度,结合监测评估调查问卷设计指标,构建了移民生产生活水平评价的指标体系,并采用可拓聚类分析方法,以物元变换为定性工具,使所调查指标能高效利用,从而确保获得科学、合理的评价结果。
1 可拓聚类分析的物元模型
可拓聚类分析方法首先通过聚类分析约简属性与划分集合P的子集,构造它们的经典域物元与节域物元,同时确定待测物元。选用比重权数方法与主观经验方法确定权重系数,之后再根据关联函数值来确定待测样本隶属哪一个子集,从而可得到聚类分析结果。
1.1 确定经典域和节域
设Ii(i=1,2,…,m)是p的m个子集,Ii⊂P,对于待测地点p∈P,然后判断p属于哪个子集Ii,并计算p属于任一子集Ii的程度。设Ri(i=1,2,…,m)为m个同征物元,便可建立m个同征物元体,组成同征物元阵。令
式中,C1,C2,…,Cn为Ii的n个不同的特征;而Xi1,Xi2,…,Xin分别为Ii关于特征C1,C2,…,Cn的取值范围,即经典域并且有Xij=〈aij,bij〉,(j=1,2,…,n)。为表示特征C1,C2,…,Cn的取值范围,引入节域的概念,即
待测样本形成的物元Rx为
式中,x1,x2,…,xn分别是待测样本的n个因子观测值。
确定关联函数值待测样本各类影响因子与各类关联度Ki(xj)为
(1)
式中,ρ(xj,Xij)=|xj-(aij+bij)/2|-(bij-aij)/2;|Xij|=|aij-bij|;ρ(xj,Xpj)=|xj-(apj+bpj)/2|-(bpj-apj)/2(j=1,2,…,n;i=1,2,…,m)。
把实变函数中的距离概念拓展为距概念,将点与区间的位置关系采用定量的形式以精确刻画。当点在区间内时,经典数学体系认为点与区间的距离为0。而可拓集合利用距的概念,通过用距的取值不同来表示点在区间内的各个位置的不同。在距的基础上建立相应关联函数,将“具有性质I”的事物从定性的描述拓展为 “具有性质的程度”的量化描述。
1.2 权系数的确定
待测样本归属于哪一类,需要根据待测样本影响程度的不同,以权系数表示各类的重要程度,在[0,1]区间内取值。一般情况下,可根据实际采用比重权数、专家评价、层次分析等方法来确定权系数。本文选用比重权数法。
比重权数方法是根据某个指标,以所有被评价对象观测值的比重大小来确定的一种数量权数,采用该指标的比重差异信息不同来衡量其重要性的大小。对每个要进行判别的类来说,待测样本每一个因子的权系数λij都是由其与之相对应的特征经典域的最大值的比值所占这一类中各个因子,与其相对应的特征值经典域的最大值的比值之和的比例来确定。即
(2)
式中, j为因子,j=1,2,…,n;i为类别,i=1,2,…,m。
待测样本p为i类等级的隶属度为
(3)
式中,Ki(p)为待测样本各个指标关于各个等级的关联程度在考虑指标重要程度情况下的组合值。
根据最大关联原则来确定所属类别,若Ki=maxKi(p),i=1,2,…,m,则可判定样本p属于i类。
2 实例分析
目前,全国都在积极开展后期扶持政策实施监测评估工作。结合具体工作实践,本文选取了河南省的2个重点监测评估县进行实例分析,以验证可拓聚类方法在水库移民后期扶持效果评价中的适用性。
2.1 指标选择与等级划分
以河南省2012年2个移民后扶监测评估县为例,根据系统性、科学性、可操作性等原则建立生产生活水平指标体系。结合移民生产生活水平具体情况,将生活水平评估指标从高到低水平依次划分为一级(最富裕)、二级(富裕)、三级(小康)、四级(温饱)、五级(贫困)等5个等级。
结合该县水库移民的实际情况,影响生产生活水平的主要因素有土地资源拥有量、水利配套设施、居住水平、基础设施水平、教育医疗、经济收入水平等。本文选取人均耕地面积C1、耕地产量水平C2、可灌溉比例C3、人均住房面积C4、基础设施水平C5、卫生医疗水平C6、义务教育普及率C7、人均纯收入C8、恩格尔系数C9作为评价指标。具体情况见表1。
表1 水库移民生活水平评价指标及划分标准
表2 待测物元影响因子的取值
选取的指标包括定量和定性指标,定量指标通过实际统计分析得出,如人均纯收入C8根据2012年国家贫困线为2 300元,2012年的河南省农村人口人均纯收入为7 525元,全国农村人口人均纯收入为7 917元建立物元模型。对于定性指标,如基础设施水平,结合调查当地移民对其满意度所占比例分为5个等级:一级为非常满意人数占90%以上,二级为满意人数在70%~90%之间,三级为基本满意人数在50%~70%之间,四级为不满意人数在30%~50%之间,五级为不做评价人数在0%~30%之间。
2.2 可拓物元模型的建立
根据移民生活水平等级划分,建立物元经典域一级R1、二级R2、三级R3、四级R4和五级R5。从表1可以看出,影响等级取值和生活水平的最高级与最低级相对应的为大于或小于某个值,这就给可拓聚类的分析带来了不方便。根据大量实践和文献资料分析,将指标影响等级的最大值与最小值的取值论域来进行处理。待测物元影响因子的取值见表2。则经典物元为
根据关联函数定义,计算待测样本对于5个等级的综合关联度,即隶属度。将各个等级的隶属度进行比较,隶属度最大的等级记为待测点的生产生活水平等级。选择以第1个待测样本数据1为例,运用公式(1)计算待测样本与各类关联度矩阵K
式中,K11=-1.350、K12=-0.9、K13=0.5、K14=-0.329、K15=-0.375、K16=0.2、K17=0.1、K18=-0.473、K19=-0.238;K21=-1.525、K22=-0.85、K23=-0.2、K24=-0.117、K25=-0.2、K26=-0.25、K27=0.25、K28=-0.370、K29=0.09;K31=-2.050、K32=-0.550、K33=-0.1、K34=0.325、K35=0.5、K36=0.25、K37=-0.167、K38=-0.032、K39=-0.030;K41=0、K42=0.45、K43=0.25、K44=-0.216、K45=-0.2、K46=-0.1、K47=-0.5、K48=0.06、K49=-0.273;K51=0.323、K52=-0.500、K53=-0.250、K54=-0.347、K55=-0.429、K56=-0.357、K57=-0.643、K58=-0.340、K59=-0.418。
根据公式(2),计算各类别对应的每个因子的权系数λij(i=1,2,…,5,j=1,2,…,9)
式中,λ11=0.054、λ12=0.072、λ13=0.110、λ14=0.093、λ15=0.110、λ16=0.100、λ17=0.137、λ18=0.087、λ19=0.238;λ21=0.061、λ22=0.073、λ23=0.116、λ24=0.119、λ25=0.116、λ26=0.107、λ27=0.145、λ28=0.092、λ29=0.170;λ31=0.063、λ32=0.081、λ33=0.097、λ34=0.134、λ35=0.130、λ36=0.119、λ37=0.162、λ38=0.095、λ39=0.118;λ41=0.057、λ42=0.093、λ43=0.100、λ44=0.150、λ45=0.133、λ46=0.122、λ47=0.166、λ48=0.107、λ49=0.072;λ51=0.047、λ52=0.082、λ53=0.105、λ54=0.142、λ55=0.139、λ56=0.128、λ57=0.174、λ58=0.144、λ59=0.039。
2.3 计算待测样本对各类的关联度
根据公式(3),计算出待测样本p对各类别i=1,2,…,5之关联度Ki(p):K1(1)=-0.454 6、K2(1)=-0.225 4、K3(1)=-0.079 7、K4(1)=-0.100 5、K5(1)=-0.383 7。根据最大关联原则Ki=maxKi(p)确定所属类别,得出待测点1生产生活水平属于三级(小康)。
同理,可计算出待测点2的关联度Ki(p):K1(2)=-0.418 4、K2(2)=-0.073 9、K3(2)=-0.039 9、K4(2)=-0.230 5、K5(2)=-0.527 0,得出待测点2生产生活水平也属于三级(小康)。
2.4 结果分析
(1)从计算结果可以看出,待测样本1中关联度K3(1)与K4(1),两者绝对值为0.02,表明该监测评估县移民的生产生活刚从温饱到小康,后期扶持效果良好。
(2)比较2个监测评估县的第3级关联度K3(2)=-0.039 9>K3(1)=-0.079 7,说明待测点2的生产生活水平比待测点1要高,与监测评估实际调查情况相符,说明该方法用来评价分析水库移民后扶实施效果是可行的。
3 结 语
水库移民后期扶持监测评估涉及经济、社会、环境等多个方面,本文采用可拓聚类方法对水库移民后期扶持效果评价是可行的。在等级取值与生活水平的最高级和最低级对应的是大于或小于某个数值时,文中采用指标影响等级的最大值和最小值作为取值论域的处理方法,对其实用性尚需进一步研究及改进。
[1]蔡文, 杨春燕, 林伟初. 可拓工程方法[M]. 北京: 科学出版社, 1999.
[2]蔡文. 物元模型及其应用[M]. 北京: 科学技术文献出版社, 1999.
[3]唐志航. 可拓数据挖掘方法及其应用研究[D]. 上海: 东华大学博士学位论文, 2009.
[4]郑茂杰. 煤与瓦斯突出预测及应急响应机制研究[D]. 北京: 中国矿业大学, 2009.
[5]李临杰. 移民生产生活水平监评指标体系构成研究[J]. 人民黄河, 2003, 25(12): 39- 41.
[6]胡宝柱, 宋向阳, 赵静. 水利工程移民后期扶持研究[J]. 海河水利, 2004(5): 7- 10.
(责任编辑 杨 健)
Application of Extension Clustering Method in the Evaluation of Reservoir Resettlement Post Supporting Effect
LI Qian1, LI Bin2, LIU Tingting1, XUE Xiaoyan1
(1. North China University of Water Resources and Electric Power, Zhengzhou 450011, Henan, China;2. HydroChina Yuanjiang Development Co., Ltd., Kunming 650051, Yunnan, China)
Based on the influence factor analyses of resettlement living level and combined with the actual living conditions of resettlement, the sensitive index are chosen to evaluate resettlement productivity and living standard. Then the extension clustering model for evaluating the resettlement productivity and living standard is established with the matter element and extension theory. The resettlement living levels are divided into five grades of poverty, hunger, well-off, wealthy and richest, and a life evaluation result of reservoir resettlement is got by extension clustering analyses. Taking two counties in Henan Province as example, the results show that the application of extension cluster method in reservoir resettlement living level evaluation is feasible and the results are reasonable and effective.
reservoir resettlement; productivity and living standard; extension clustering method; clustering analysis; matter element model
2015- 04- 17
河南省高校科技创新团队支持计划(14IRTSTHN028);河南省基础与前沿技术研究项目(122300410029);河南省教育厅青年骨干教师资助项目(2013GGJS-086)
李乾(1986—),男,河南虞城人,助教,硕士,主要从事工程管理、水库移民等方面的教学和研究工作.
D632.4
A
0559- 9342(2015)08- 0005- 04