APP下载

基于AHP和k-means算法的电力用户信用度评价

2018-10-08,,,

浙江工业大学学报 2018年5期
关键词:权值用电指标体系

,,, ,

(1. 浙江工业大学 计算机科学与技术学院,浙江 杭州 310023;2. 中国移动通信集团浙江有限公司岱山分公司,浙江 岱山 316200; 3. 华立科技股份公司,浙江 杭州 310023)

近年来电力市场蓬勃发展,对电力系统进行全方位的评估也越来越重要.电力用户是电力系统重要的组成部分,很有必要对其进行信用度管理.当用户拖欠的电费超过一定额度,或者用户产生某些违规用电行为时,信用系统需要给出警示,通知电力管理部门对用户采取一定措施,如催缴、罚款和断电等.目前,电费的缴纳情况已纳入个人的诚信记录.有效地进行电力用户信用度管理,可以提高用户的诚信意识,减少欠费和违法用电行为,帮助电力公司减轻运营负担,获得良好的经济效益和社会效益.现在已经有一些评价电力用户信用度的模型.卢雯嘉等[1]提出利用遗传算法和BP神经网络建立电力用户评价模型.该方法充分发挥了遗传算法和神经网络的优势,使构成的模型具有两者的优点.王辉[2]从用户的购电水平、信用状况、潜在价值、用电特性和可持续能力5 个方面构建了电力用户评价指标体系,并使用J2EE开发模式实现了电力用户信用评价及预测系统.杨尚东等[3]利用LVQ神经网络建立了企业用户风险识别系统,以期在电力大客户发生欠费前对其财务状况进行检测,以分析和预测其欠费发生的风险.朱莹[4]按用电类别、电价类别和行业分类等对电力用户进行了分类,并对不同类别的用户建立了相应的评价模型.王绵斌[5]采用层次分析法和理想点法来分析计算用户的信用等级.许盈盈[6]主要考虑了用户的缴费信息及财务信息,利用KMV信用等级评价管理模型.汪莉[7]通过德菲尔法构建了电力客户信用评分指标,并建立了AHP-logistic混合信用评分模型.

现有的研究成果有些使用了主观性评价方法,有些使用了客观性的评价方式.为了充分体现电力用户信用度评价的公正性和客观性,笔者通过分析电力用户的特点,恰当地选取影响用户信用度的相关指标,建立了信用度评价的指标体系.层次分析法(Analytic hierarchy process,AHP)广泛地应用于各类评价系统中[8-10],k-means聚类算法能够有效地进行对象分类[11].笔者首先使用主观性较强的层次分析法进行信用度的计算,之后使用客观性强的k-means算法修正得到的信用度,从而提高了用户信用等级计算的准确性.内容组织结构如下:1) 建立电力用户信用度的评价指标体系;2) 给出信用度评价公式和数据预处理的方法;3) 介绍基于AHP和k-means算法的电力用户信用度评价算法;4) 以居民电力用户为例,给出电力用户信用度评价实例;5) 总结并给出下一步的研究方向.

1 电力用户信用度评价指标体系的建立

影响电力用户信用度的指标很多,前人的研究也

给出了多种指标体系[12-13].结合已有的研究成果和电力用户的特性,笔者提出了一套电力用户信用度评价指标.由于居民用户和企业用户的属性相差较远,因此为居民用户和企业用户分别建立了评价指标体系.

影响居民用户信用度的关键因素有用户缴费情况、用电贡献和违规用电记录等.其中,用户缴费情况对应的指标包括累计欠费金额、累计欠费率和累计欠费次数.累计欠费率定义为累计的欠费额/三年应缴的电费.用电贡献的对应指标有累计用电电量和月平均缴费额.违规用电记录的对应指标有累计窃电次数、累计窃电电量和累计违规用电次数.所有累计值均是三年的累计值.居民用户的具体指标体系结构如图1所示.

图1 居民用户信用度评价指标体系Fig.1 Credit index system for resident power consumers

影响企业用户信用度的关键因素比较复杂.除了上面提到的因素外,还包括企业容量占比、企业注册资金、企业负债率和用电管理等多个因素.图2给出了企业用户的信用度评价指标体系.图2中,企业的类型可以分为非工业电力用户、普通工业电力用户、大工业电力用户、商业电力用户和农业电力用户.

图2 企业用户信用度评价指标体系Fig.2 Credit index system for company power consumers

2 信用度的定义和数据预处理

2.1 用户信用度的定义

从上述的信用度指标可以看出:信用度指标可以分为两类,即信用度贡献指标和信用度损失指标.信用度贡献指标是指能够提高用户信用度的指标,如用户的正常用电量、按时缴费和进行电力设备节能改造等.相应地,信用度损失指标则指会降低用户信用度的指标,如用户违规用电、窃电和欠费等等.

以居民电力用户为例,月平均缴费额和累计用电电量属于信用度的贡献指标,这类值越大,用户信用度越高.而累计欠费金额、累计欠费率、累计欠费次数、累计窃电次数、累计窃电电量和累计违规用电次数这几个指标,反映的是用户不良的用电表现,属于信用度损失指标.

用户信用度可定义为

(1)

其中信用度贡献值计算式为

式中:coni为信用度贡献指标i的值;wi为该指标对应的权值;n为信用度贡献指标的个数.式(1)中信用度损失值计算式为

式中:lossj为信用度损失指标j的值;wj为该指标对应的权值;m为信用度损失指标的个数.从式(1)不难看出:用户信用度的取值范围是[0,1].根据电力用户信任度的相关指标值及其权值,就可以计算出其信用度.

2.2 电力用户信用度指标数据预处理

电力用户信用评价指标体系是一个多指标多层次的综合评价体系.由于各评价指标的性质不同,其单位和量级往往差别很大,绝对值小的指标在评价中的作用有可能被绝对值大的指标所掩盖.因此,必须对原始指标的数值进行相应的预处理,以消除由于量级和单位的差别对评价结果的影响.

假设需要对n个用户进行分析.每个用户有m种评价指标,将第i个用户的第j个指标记为xij(i=1,2,…,n;j=1,2,…,m).那么n个用户的评价指标值可以用矩阵X表示为

采用极值法进行各指标的无量纲化.具体算法分为两步:

1) 求各列指标的极值.第j列的最大值maxXj,最小值minXj的计算式为

maxXj=max{x1j,x2j,…,xnj}

(2)

minXj=min{x1j,x2j,…,xnj}

(3)

式中j=1,2,…,m.

(4)

3 电力用户信用度评价算法描述

3.1 基于AHP的信用度评价

采用层次分析法AHP进行各信用度评价指标的权值计算.AHP是一种定性与定量相结合的、系统化的以及层次化的分析方法[14-16],是进行权值计算时常用的工具.

3.1.1 建立层次结构模型

根据第1节建立的电力用户信用度评价指标体系,居民用户和企业用户的AHP层次结构模型分别如图1,2所示.模型分为三层,最上层为目标层,最下层为方案层,中间是准则层.

3.1.2 构造成对比较矩阵

一般地,对于n个指标A1,A2,…,An进行两两的比较,可以使用成对比较矩阵.成对比较矩阵定义为

表1 AHP评价尺度Table 1 AHP evaluation criteria

3.1.3 一致性检验

为保证系统中使用的成对比较矩阵的有效性,需进行一致性检验.

在成对比较矩阵A中,若aik·akj=aij,则称A为一致阵.若成对比较矩阵是一致阵,取对应于最大特征根n的归一化特征向量w=[w1,w2,…,wn]作为权向量.若成对比较矩阵不是一致阵,则用其最大特征根λ对应的归一化特征向量作为权向量w,且Aw=λw.

需要对成对比较矩阵A进行一致性检验,以确定其可用性,使用的指标是一致性比率.

表2 随机一致性指标RI的数值Table 2 Values of RI

当CR<0.1时,认为A具有可以接受的一致性,其归一化特征向量可以作为权向量.否则要重新构造成对比较矩阵,即对A中各元素的取值加以调整.

3.2 使用k-means算法划分用户等级

层次分析法在权值的确定过程中主观成分相对较重.为了更加客观、准确地评价电力用户的信用度,应结合客观算法对用户信用度进行评价.k-means算法也称为k-均值算法,是一种使用广泛的聚类算法.它属于典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大.该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标,具有较强的客观性[17-18].

k-means算法以k为参数,把需要进行分类的n个对象分为k个簇,簇内对象具有较高的相似度.相似度的计算根据簇内对象的平均值进行[19-20].

假定有n个对象,每个对象有w个属性.k-means算法的描述如下:

输入:簇的数目k和n个对象

输出:k个簇,使误差平方和最小

k-means算法步骤为

1) 任意选择k个对象作为初始的k个簇中心,

2) 计算每个对象与各簇平均值的距离,将对象赋给最近的簇.距离采用欧式距离,定义为

式中:xi,yj为对象i,j;xiu为xi的第u个属性值.

4) 误差平方和准则函数为

5) 若E小于给定的阈值,算法结束;否则返回步骤2).

使用k-means算法对电力用户进行分类,对基于AHP方法得到的用户信用度计算结果进行检验和修正.

3.3 结合AHP和k-means进行用户信用度评价

为了能够更准确地评价用户的信用度,可将AHP方法计算出的信用度值和k-means方法计算的信用度值进行加权平均计算,即

用户i的信用度值=α×AHP法计算出的值+

β×k-means法计算出的值

(5)

式中ɑ+β=1.调节ɑ,β的值就可以调节主客观算法对信用度计算的影响.

4 电力用户信用度评价实例

鉴于居民用户和企业用户的信用度计算方法类似,以居民电力用户为例,进行电力用户信用度的计算.

4.1 数据预处理

选取了10 位电力用户的数据,对他们进行信用评价.用户原始数据如表3所示,预处理后的数据如表4所示.

表3 电力用户信用指标数值Table 3 Original value of the indexes

表4 预处理后的数据Table 4 Preprocessed value of the indexes

4.2 基于AHP的用户信用度评价

4.2.1 权值的计算

各层次的成对比较矩阵需要根据用户资料数据、专家意见和决策分析人员的经验经过反复研究确认.表5~8给出了专家对居民用户信息分析后给出的各评分表,据此可以得到各对应的成对比较矩阵.

表5 准则层打分Table 5 Scores for criterion layer

表6 相对于缴费情况打分Table 6 Scores for the index of payment

表7 相对于用电贡献打分Table 7 Scores for power consumption

表8 相对于违规用电记录打分Table 8 Scores for illegal power usage

表5对应的成对比较矩阵为

经计算CR=0.071 3<0.1,此成对比较矩阵通过一致性验证.

缴费信息对应的成对比较情况见表6,其对应的成对比较矩阵为

经计算CR=0.037 2<0.1,此成对比较矩阵通过一致性验证.

表7对应的成对比较矩阵为

经计算CR=0.000 0<0.1,此成对比较矩阵通过一致性验证.

表8对应的成对比较矩阵为

经计算CR=0.091 9<0.1,此成对比较矩阵通过一致性验证.

利用这些矩阵可以进一步计算出各指标的权值,如表9所示.其中累计欠费金额、月平均缴费额、累计欠费率和累计窃电次数排在权值前4 位,较符合实际.

表9 指标权值Table 9 Weight of indexes

4.2.2 信用度计算

根据表9中各指标的权值和表4给出的预处理数据,使用信用度计算式(1),进行最初的信用度值计算,得到表10中显示的用户初始信用度值.

表10 用户信用度值Table 10 Consumers’ credit values

以用户2为例,无量纲化后,他的信用度贡献指标值分别为月平均缴费额0.62,累计用电电量0.68.他的信用度损失指标值分别为累计欠费金额0.86,累计欠费率0.21,累计欠费次数0.33,累计窃电次数0,累计窃电电量0,累计违规用电次数0.则信用度贡献值为

0.62×0.204 1+0.68×0.068 0=0.172 8

同理,信用度损失值为

0.86×0.385 1+0.21×0.158 4+0.33×0.064 5+

0×0.081 2+0×0.023 1+0×0.015 7=0.385 7

根据式(1),用户2的信用度为

0.172 8÷(0.178 2+0.385 7)=0.31

通常对用户是按照信用度等级进行管理的,因此需要将信用度的数值转化为对应的信用度等级.信用度等级和信用度数值对照表见表11.表12给

出了表10中各个用户的初始信用等级划分.

表11 信用度等级对照Table 11 Credit rank reference

表12 用户信用度等级划分Table 12 Rank of each power consumer

4.3 使用k-means算法进行用户等级划分实例

利用k-means算法对表4中的电力用户数据进行处理.因为用户等级分为5 类,因此随机选取5 个用户数据(例如用户1,2,4,5,8)作为各初始类中心(表13).迭代10 次后算法收敛,得出5 个类中心及每个类所包含的电力用户信息,如表14所示.

根据k-means算法得到的分类结果,结合各指标的权值,再对10 位用户进行信用度计算,得到的用户信用度值,如表15所示.

表13 初始聚类中心Table 13 Initial clustering centers

表14 电力用户分类结果Table 14 Clustering result of power consumers

表15 使用k-means得到的用户信用度值和信用度等级Table 15 Credit values and credit ranks by k-means algorithm

对比表12,15,AHP和k-means计算出的结果基本一致,仅用户4,7的等级分类有一些出入.

4.4 最终用户信用度值的确定

当考虑AHP和k-means算法对最终的用户信用度值计算同等重要时,可取α=β=0.5.则最终的信用度值计算结果和用户信用度等级如表16所示.

表16用户最终信用度值和信用度等级

Table16Finalcreditvaluesandcreditranksforpowerconsumers

户号12345678910信用度值1.000.320.980.770.790.350.260.190.090.18信用等级ADABBDDEEE

由表16可以看到:电力用户1,3信用度等级高,他们的用电习惯良好,是值得信赖的用户;用户4,5是B等级,他们用电习惯良好,有一定的用电贡献;用户2,6,7有一定次数的违规和欠费行为,造成一定的用电损失;而用户8,9,10属于用电情节比较恶劣的,这些用户违规用电次数很多,用电贡献远小于违规行为所造成的损失,需要着重管理.

5 结 论

通过对电力用户特性的分析,分别提出了居民用户和企业用户的信用度评价指标体系.为了能够准确、客观地评价用户的信用度,结合层次分析法和k-means算法构建了电力用户信用度的评价模型.首先通过AHP方法计算电力用户各个评价指标的权值,并给出初始的用户信用度等级.再用k-means方法对AHP方法计算的信用度进行检验和修正.算法的解释和验证以居民用户为例进行.实验结果表明笔者提出的方法有效可行.后续的研究将着重考虑如何在已有的用户信用度计算模型的基础上,完善信用度管理体系,并对不同信用度的用户提供不同类型的服务,以鼓励用户提高自身的信用度水平.

猜你喜欢

权值用电指标体系
一种融合时间权值和用户行为序列的电影推荐模型
2022城市商业魅力指标体系
基于5G MR实现Massive MIMO权值智能寻优的技术方案研究
安全用电知识多
网络空间攻防对联合作战体系支援度评估指标体系构建
对输配电及用电工程的自动化运行的几点思考
用电安全要注意
强规划的最小期望权值求解算法∗
用电监察面临的问题及反窃电对策
程序属性的检测与程序属性的分类