基于自适应竞争的均衡优化电力系统客户分类
2021-03-14郑思达刘岩杨晓坤戚成飞袁培森
郑思达 刘岩 杨晓坤 戚成飞 袁培森
摘要:对电力系统客户的精确分类可为客户提供良好的差异化管理和个性化服务.针对客户分类问题,提 出了一种基于均衡优化与极限学习机的分类方法.该方法中提出了一种自适应竞争机制来平衡均衡优化 的全局探索与局部挖掘能力,从而有效提升了均衡优化搜索最优解的性能.之后,将提出的均衡优化集成 极限学习机对电力系统的客户进行分类.通过真实数据集上的实验表明,在不同的分类指标下,所提出的 均衡优化集成极限学习机都具有良好的预测效果,可为电力系统客户管理与服务提供有效的技术手段. 关键詞:均衡优化;极限学习机;电力系统;客户分类
中图分类号:TP391 文献标志码:A DOI: 10.3969/j.issn.1000-5641.2021.05.013
Adaptive competitive equilibrium optimizer for power
system customer classification
ZHENG Sida1, LIU Yan1, YANG Xiaokun1, QI Chengfei1, YUAN Peisen2
(1. Metrology Center, State Grid Jibei Electric Power Supply Company, Beijing 100045 China;
2. College of Artificial Intelligence, Nanjing Agricultural University, Nanjing 210095, China)
Abstract: Accurate classification of power system customers can enable differentiated management and personalized services for customers. In order to address the challenges associated with accurate customer classification, this paper proposes a classification method based on an equilibrium optimizer and an extreme learning machine. In this method, an adaptive competition mechanism is proposed to balance the global exploration and local mining ability of an equilibrium optimizer, improving the performance of algorithms in finding optimal solutions. Thereafter, the proposed equilibrium optimizer is integrated with an extreme learning machine to classify the customers of a power system. Experiments on real data sets showed that the proposed algorithm integrated with an extreme learning machine offers more accurate performance for different classification indexes; hence, the proposed method can provide an effective technical means for power system customer management and service.
Keywords: equilibrium optimizer; extreme learning machine; power system; customer classification
0引 言
金融科技在促进实体经济发展的同时必然会带来新的技术挑战.现代金融市场以及服务运用大量的云计算、人工智能等信息技术,有效扩展了各类企业的金融服务,改善了其资源配置.与此同时, 金融科技会改变现在企业的传统技术[1].电网公司作为我国能源生产、经济发展的重要基础设施,它通 过智能传感和测量技术以及智能化的决策支持系统,实现电网安全可靠、经济高效、环境友好和使用 安全的目标.智能电表是智能电网数据采集的核心设备,承担着原始电能数据采集、计量和传输的任 务,是实现用电信息采集和集成的基础设施.从金融市场的角度审视,随着“双碳”发展目标的提出, 对电力系统智能化、集约化的发展提出更高的要求[2].对电力系统的客户分类是有效提升电力系统差 异化管理与发展的手段.合理的用户分类一定意义上对用电用户的不同策略制定以及电力分配、规划 等因素具有重大影响.通过对不同类型的客户进行分类以及差异化的数据采集策略制定,来实现用户 数据的按需采集,实现采集任务的按需执行、优先执行,为实现数据统计的按需分类统计等数据应用 需求提供支持,进而提高电力企业的经济效益与价值,这一点同时可为金融市场的其他企业带来技术 手段.
面向电力系统公司客户数据噪声大、密度不均匀等特征,针对其单一的属性来划分客户群体是低 效且无针对性的.机器学习方法是应对电力系统的数据的有效技术手段.针对电力系统数据的异常、 冗余、遗漏等问题,吴蕊等提出了利用冗均值聚类算法进行异常检测;陈聿等[4]从提升客户体验感 的角度出发,提出了手肘法确定聚类数目,之后采用期望最大化聚类算法进行客户偏好分类;Barman 等采用灰狼算法优化支持向量机(Support Vector Machine, SVM)进行特殊事件日的电力系统负荷 预测.此外,反向传播神经网络被有效地用于光伏发电系统与风电系统数据的预测[6-7].
对于电力系统的客户分类问题,采用简单有效的机器学习方法可快速划分客户偏好,根据不同的 数据属性确定客户的特征.极限学习机(Extreme Learning Machine, ELM)是一种单层的前馈神经网 络[8].该神经网络中的输入权重与偏置是随机生成的,在训练过程中不需要人为调整,这种设置方式加 快了网络的学习与计算速度.极限学习机被应用于各类工程应用领域,例如,Chen等采用卷积神经 网络和极限学习机集成的方法对齿轮箱和电机轴承进行故障诊断;Shariati等[10]基于極限学习机对工 程力学中的钢架连接力矩和转角进行估计.此外,极限学习机还被用于在短期风力预测、未知恶意软 件检测等方面[11-13].极限学习机快速有效的训练速度受到工程领域研究者的青睐,如何提高其分类或 回归的精度成为进一步需要研究的问题.Chen等[11]指出,极限学习机的初始权重和偏置会影响其最 终训练的模型,因此,得出了一系列最优的初始网络的权重与偏置是重要的.相比梯度下降法等传统 优化方案,群智能算法被广泛关注且被用于神经网络的训练.粒子群算法是具有代表性的一种群智能 算法.Zeng等[14]提出了粒子群算法优化SVM的方法并用于医疗领域,准确诊断了阿尔茨海默病以及 认知障碍.Xia[15]利用一种果蝇优化算法对反向传播神经网络(Back Propagation, BP)进行优化,提高 了 BP对空气质量检测的准确率.良好的优化算法可以提升目标分类预测的精度.在金融市场应用领 域,Uthayakumar等[16]将蚁群算法运用于金融危机的预测,其效果展示出该算法融合财务决策模型预 测金融危机具有良好的鲁棒性;Gao等[17]将粒子群算法用于区块链金融产品收益率的预测,良好的拟 合效果证明该算法的干预可对金融产品的投资者产生良好的指导作用.
极限学习机的性能很大程度上受到其初始权重与偏置的影响.确定良好的初始权重与偏置可视 为多维非线性的优化问题.群智能算法是一类有效应对复杂优化问题的方法.近年来,许多全局优化能 力较强的群智能算法相继被提出,如樽海鞘群算法(Salp Swarm Algorithm, SSA)1181、灰狼优化(Grey Wolf Optimizer, GWO)[19]、正余弦算法(Sine Cosine Algorithm, SCA)[2°],以及均衡优化(Equilibrium Optimizer, EO)[21]等.均衡优化刚刚被提出不久,由于结构简单而被大量应用于科学研究.
本文的主要工作是针对均衡优化自身结构特点,提出一种自适应竞争学习的均衡优化(Adaptive Competitive Equilibrium Optimizer, ACEO),应用ACEO优化ELM并获取其初始权重与偏置来确定
用于分类的ELM模型.实验采用的是某电力公司的真实数据.对训练样本:首先,对这些数据进行筛 选,将信息不全的样本剔除;之后,以客户不同类型进行分类,并与原始ELM、SVM及4层BP网络 (FL-BP)[21]进行实验对比分析,通过仿真验证ACEO与EO以及其他3种算法优化的ELM在学习权 重与偏置方面对客户分类的影响.仿真实验验证了基于ACEO优化的ELM对电力系统客户分类具有 好的分类效果.
1极限学习机
极限学习机是一种单层前馈神经网络, 其网络模型如图 1 所示. 对于 K 个样本 , 其 中 表示输入的第 个样本, 该样本具有 N 个特征, 矩阵表示形式为 ; 表示的是输出特征. 样本输入矩阵为 , 输出矩阵为 , 其中, T 表示对矩阵的转置. 图 1 中, L 表示设定 ELM 网络隐含层数目; W 表示的是 ELM 选择的输入权重; b 表示隐含层与输出层的连接权重, 是要求解的值; H 是隐含层的输入矩阵; K 和 N 分别表示样本数和输出特征的个数.
假设 ELM 的隐含层激活函数为g(x), 偏置为b= [b1,b2, · · · ,bL], 则隐含层输出矩阵 H 为
H= g(WX+b), (1)
输出样本Y 为
Y =Hβ. (2)
在 ELM 模型中, W 和 b的值一旦确定就不再改变; β是模型中唯一要确定的值, 其计算公式为
β=H?Y , (3)
(3) 其中, H?是矩阵 H 的广义逆阵. 如果 是非奇异矩阵, 则 ; 如果 是非奇异矩阵, 则 . ELM 的权重 只需要计算一次, 则结束训练过程. 对于样本 , 其输入样本特征 Y 为
Y =g(W x+b)β. (4)
(4) 2均衡优化算法
均衡优化算法的思想启发来源于力学中控制体积的质量平衡方程,可用一阶常微分方程表示[22],即
其中,C表示控制体积F内的浓度(在工程力学中,控制体积又称为开口系统,简称为控制体),Vf表 示控制体内的质量变化率,Q表示进出控制体积的体积流量,Ceq表示平衡状态下的浓度,G表示控制 体内的质量生成率.
在此背景下,按照方程抽象出的优化算法的模型,描述为:均衡优化算法和其他群体智能算法一 致,按照种群的形式进行搜索最优解,并在迭代中按照贪心选择保留更新.在该算法中构建由5种个 体组成的均衡池,以提供参考指引其他个体的更新,即
Ceq = {C1, C2, C3, C4, Cave} , (6)
其中,C1、C2、C3、C4表示种群求解目标问题得到的前4个最好的解向量,caVe是这4个向量的算数 平均向量.
则本算法的核心更新公式为
C = Ceq + (C ? Ceq) · F + GλV (1 ? F).(7)
公式(7)中,C表示个体的位置;Ceq则是从均衡池中随机选择的一个学习对象;G称为生成率,是 算法中增加的对精确解的条件;F是随时间变化的参数,即周转率,其计算公式为
F = a1sign(r ? 0.5)(e?λt ? 1),(8)
其中的参数A、r是0?1之间的随机数;ai设定为常数2; i是由目标函数评估迭代控制的递减参数, 其计算公式为
其中,liter表示迭代的临时变量,^Es表示最大迭代次数,叱设定为常数1.用GgcP表示控制生成率的 参数,ri、r2表示0?1之间的随机数,则G、Ggcp计算公式分别为
G = GGCP(Ceq ? λC) · F,(10)
均衡优化的伪代码如算法1所示.
算法1均衡优化算法
输入:最大迭代次数FFes;种群数目#NP;适应度函数 输出:最优解
1:初始化种群
2:设定相关参数值:ai = 2; = 1;
3: While /Iter < FFEs 4: For i = 1: Nnp
5:根据目标问题的适应度函数计算每一个个体i的适应度
6:保存前4个个体的适应度到均衡池
7:依次执行公式(8)、公式(1(1)、公式(10)、公式(7)
8: End for
9: IIter+ +
10:对比个体的适应度,保留更优解 11: End while
12:输出最优解
3提出算法 3.1自适应竞争的均衡优化(ACEO)
均衡优化的核心更新方案是种群中的个体按照公式(8)进行搜索,将搜索到的当前最优解按照迭 代贪心方式保留.对于种群中的每一个个体而言,是在当前全局最优解的指引下学习,在迭代过程中 随机施加扰动.如公式(1(2)所示,算法是以50%的随机概率对全局搜索与局部挖掘进行平衡的,这一 点的随机性限制算法的搜索性能.其次,种群总体的朝向是按照均衡池中选择的个体进行靠拢的,这 样的学习策略具有单一性,容易使得个体陷入局部最优解的区域而无法进一步更新.为了提高算法的 种群多样性,减少种群过早的早熟收敛,以提高算法的收敛精度,设计针对性的学习策略是十分必要 的.提出的自适应竞争的均衡优化是在种群演化过程中施加变异策略来增强算法的全局搜索能力,另 外针对种群的特性将其划分为不同的分组,分组按照不同的领导者进行解更新.
变异是指在算法的演化过程中,按照概率对当前个体所在的位置进行扰动,在个体陷入局部最优 解的条件下,可以有效改善解的质量.因此,当种群的多样性变低或者达到某一个随机概率,则对当前 解施加Levy变异[23]. Levy变异的实施方法为
其中,n是取值为1.5的常数[20]; r表示标准的伽马函数;s是参数,其计算公式为
其中的U和E分别是服从均值为0和1、方差为^和1的高斯随机数的计算公式为
对于满足变异条件的个体G进行Levy变异,按照最优解的位置对其进行变异重置,如果变异后 的解更优则进行替换.执行操作的公式为
Ci = B (1+Levy), (15)
其中B表示的是当前种群所能搜索到的最优解.
除了对个体施加变异操作外,分组学习是具有针对性的策略之一.将原有的均衡池选择机制删除, 按照种群的适应度将个体进行排序;然后将排序完成的个体按顺序分别划入3个分组中.各个分组之 间采用差分学习的策略,策略公式为
其中,q和Q是不同于Q的小组中的个体,r是0?1之间均匀分布的随机数.
不同分组之间进行的差分学习,充分利用了各个个体的信息,保持了种群的多样性.加快种群的 学习速率,向最优个体的学习是必要的.按照随机概率对每个分组之间的个体进行更新,相应公式为
自适应竞争的均衡优化算法见算法2.
算法2自适应竞争的均衡优化算法
输入:最大迭代次数FFes;种群数目馬P;适应度函数 输出:最优解
1:初始化种群
2:设定相关参数值:=2;叱=1 3: While /Iter < fFEs 4: For i=1:NNp
5:根据目标问题的适应度函数计算每一个个体i的适应度 6: End for
7:按照从小到大的顺序对种群个体进行排序
8:依次按顺序进行分组
9:对于每个小组进行个体更新
10: If r <0.5
11:执行公式(16)
12: Else
13:执行公式(17)
14: End if
15: If个体连续多次不更新或者r <0.5 16:执行公式(1(5)
17: End if
18: ^Iter+ +
19:对比个体的适应度,保留更优解 20: End while
21:输出最优解
3.2 ACEO优化极限学习机
利用提出的ACEO优化ELM模型的输入权重与偏置进行电力系统客户分类的工作流程如图2 所示.该问题可视为最小化样本误差的问题.用F表示数据集中的真实样本特征,F表示通过ELM 分类得到的样本特征,则该问题的适应度函数为
即利用ACEO最小化J值得到的^和&為ELM确定的初始输出参数.
分类的步骤为:首先将电力系统客户数据集进行清洗预处理,即保证使用的数据是完整没有缺失的;之后提取数据的有效属性作为输入特征;最后将ACEO最小化适应度函数而得到的权重与偏置输 入ELM模型中,进而得到训练完成的模型.之后选取不同于训练样本的数据进行分类,最终可以得到 测试样本中客户的类别.
4實验仿真
4.1实验说明
为了验证本文提出的算法优化ELM模型对电力系统客户分类的效果,采用电网公司5月份的部 分客户数据为数据集进行测试.由于数据集中可能存在信息不完整的缺失数据,首先对数据进行筛选, 得到了具有完整属性的500条客户信息.实验的训练集设置为该数据集中随机挑选的200条客户信 息,测试集是随机挑选不同于训练集的100条客户信息.该数据集的属性有:用电客户的外部标识、负 荷的重要程度指数、合同约定的本用户的容量、开具发票的类型、合同约定的本用户的容量、台区的 标识、用电客户的用电类别、供电路径上的线路的标识,以及供电路径上的变电站的标识等.因为针 对不同用电客户的差异化采集策略和管理是提升电力系统经济效益的重要手段,因此这里分类的目 标是确定客户具体是高电压用户、低电压非居民用户或者是低压居民用户.
将ACEO优化ELM的结果分别与ELM、SVM以及FL-BP进行精确度对比;将ACEO与其他几 种类型的优化算法进行比较.由于ELM的权重和偏置的随机性,以及采用的优化算法的初始种群是 随机的,为避免随机性的影响,所有实验全部独立运行30次.所有优化算法的最大迭代Pfes取值100, 种群数取值30.
测试性能的指标以精确度 (Accuracy, A) 为主, 其次是查准率 (Precision, P)、 查全率 (Recall,R) 以及 F1 分数 (F1-score, F1). 定义: 真正例 (True Positive, TP) 表示正类判断为正类; 假正例 (FalsePositive, FP) 表示负类判断为正类; 假负例 (False Negative, FN) 表示正类判断为负类; 真负例 (TrueNegative, TN) 表示负类判断为负类. 令 nTP 表示真正例数量, nFP 表示假正例数量, nFN 表示假负例数量, nTN 表示真负例数量, 则 A、R、P、F1 的计算公式分别为
4.2实验结果及分析
对电力系统客户的分类问题是三分类问题:实验中设置高电压用户为类别1;低电压非居民用户 为类别2;低压居民用户为类别3.图3展示了本文提出的ACEO优化ELM的模型ACEO-ELM,以 及ELM、SVM、FL-BP这3个分类器对客户数据分类的效果.图3中的分类结果是独立运行所有分类 器30次,然后按照精确度排序得出的中位数的效果.图3中,方框形状表示原始样本的类别,星形符 号表示分类器得出的类别.可以清楚地观察到,分类的效果与原始样本最为契合的是ACEO-ELM.此 外,表1给出了 4种分类器的不同指标的具体结果.从表1同样可以看到,ACEO-ELM的分类效果是 最好的.
通过对目标函数(公式(18))的优化,ACEO算法和其他对比算法的迭代曲线的对比结果如图4 所示.该曲线取值是这些算法30次独立运行的平均值.为了更清楚地观察曲线,我们对图4中纵轴表示的适应度进行了以10为底的log函数处理.观察图4可知,ACEO在迭代前期得到的误差就消于 SSA与SCA算法.在迭代40代之后目标解超过EO和GWO,在50次迭代之后趋于稳定.这表明本 文提出的ACEO具有全局优化能力,同时具有克服局部最优限制的优势。对比原始版本的EO以及 其他3种算法,表明ACEO确定的ELM初始权值与偏差使得ELM的分类性能更佳.
根据上述描述,图5展示的是ACEO以及其他4种算法优化ELM对电力系统客户进行分类的精 确度.图5中将30次独立运行得到的分类准确度采用箱型图展示.由图5可以观察到5种算法的数据 分布总体都较为离散.其中ACEO-ELM得到准确度的中位数最佳.从数据稳定性角度而言,SCA- ELM表现最佳,但是其总体数据分布的精度较低.ACEO-ELM较SSA-ELM、EO-ELM以及GWO- ELM都展示出了更好的效果.
图5是对5种算法优化ELM准确度的可视化图.表2给出了准确度的具体值,将每种算法在30 次独立运行中的最大值、最小值、均值、标准差给出.标准差可以反映数据离散程度,即算法稳定性. GWO-ELM的最大值、最小值和ACEO-ELM—致,但是稳定性较差,平均性能弱于ACEO-ELM.正 如图5所示,SCA-ELM的标准差最小,但是其得到的分类精度弱于ACEO-ELM.
综上实验结果可知,ACEO优化ELM的误差最小,得到ELM的初始权值以及偏差对ELM的性 能具有重要影响.ACEO-ELM的分类精度优于基本的ELM以及SVM、FL-BP,与其他优化算法对比 也展示了其良好的性能.
5结论
金融科技的发展为现代企业带来新一轮的科学技术变革.本文针对电力公司的客户分类问题,提 出了一种自适应竞争的均衡优化算法与极限学习机的联合模型(ACEO-ELM).为丰富并提升现代化 电力公司的经济效益,对不同的用电客户进行差异化服务与个性化管理,按照不同用电类别对用户进 行分类,其类别为高电压用户、低电压非居民用户以及低压居民用户.通过仿真实验证明,提出的 ACEO-ELM分类精度优于ELM, SVM以及一种4层的反向传播神经网络FL-BP.此外,与其他4种 优化算法对比,也证明了 ACEO-ELM的效果.未来将主要研究减少随机性对ACEO-ELM的影响,使 其对电力系统客户进行分类时的准确度的偏差更小,进而为用电客户的差异化服务与个性化管理提 供更为有效的技术支持.
[参考文献]
[1]吴贺.传统金融机构转型与变革的研宄[J].中国集体经济,2021, 21: 96-97.
[2]WANG P, ZHANG P Y. Classification and management of electricity market customer considering demand response in China [C]//2017 IEEE International Conference on Environment and Electrical Engineering and 2017 IEEE Industrial and Commercial Power Systems Europe (EEEIC/I&CPS Europe). IEEE, 2017: 1-5. DOI: 10.1109/EEEIC.2017.7977664.
[3]吳蕊,张安勤,田秀霞,等.基于改进沁means的电力数据异常检测算法[J].华东师范大学学报(自然科学版),2020(4): 79-87.
[4]陈聿,田博今,彭云竹,等.联合手肘法和期望最大化的高斯混合聚类电力系统客户分群算法[J].计算机应用,2020, 40(1(1): 3217-3223.
[5] BARMAN M, DEV CHOUDHURY N B. A similarity based hybrid GWO-SVM method of power system load forecasting for regional special event days in anomalous load situations in Assam, India [J]. Sustainable Cities and Society, 2020, 61: 102311.
[6] LIU L Y, LIU D R, SUN Q, et al. Forecasting power output of photovoltaic system using a BP network method [J]. Energy Procedia, 2017, 142: 780-786.
[7] WANG Z, WANG B, LIU C, et al. Improved BP neural network algorithm to wind power forecast [J]. The Journal of Engineering, 2017, 13: 940-943.
[8] HUANG G B, ZHU Q Y, SIEW C K. Extreme learning machine: Theory and applications [J]. Neurocomputing, 2006, 70(1/2/(3): 489501.
[9] CHEN Z Y, GRYLLIAS K, LI W H. Mechanical fault diagnosis using convolutional neural networks and extreme learning machine [J]. Mechanical Systems and Signal Processing, 2019, 133: 106272.
[10]SHARIATI M, TRUNG N T, WAKIL K, et al. Estimation of moment and rotation of steel rack connections using extreme learning machine [J]. Steel and Composite Structures, 2019, 31(5): 427-435.
[11]CHEN Y, PI D C. Novel fruit fly algorithm for global optimisation and its application to short-term wind forecasting [J]. Connection Science, 2019, 31(3): 244-266.
[12]JAHROMI A N, HASHEMI S, DEHGHANTANHA A, et al. An improved two-hidden-layer extreme learning machine for malware hunting [J]. Computers & Security, 2020, 89: 101655.
[13]LIU X Y, HUANG H Z, XIANG J W. A personalized diagnosis method to detect faults in gears using numerical simulation and extreme learning machine [J]. Knowledge-Based Systems, 2020, 195: 105653.
[14]ZENG N Y, QIU H, WANG Z D, et al. A new switching-delayed-PSO-based optimized SVM algorithm for diagnosis of Alzheimers disease [J]. Neurocomputing, 2018, 320: 195-202.
[15]XIA X. Study on the application of BP neural network in air quality prediction based on adaptive chaos fruit fly optimization algorithm [J]. MATEC Web of Conferences, 2021, 336: 07002.
[16]UTHAYAKUMAR J, METAWA N, SHANKAR K, et al. Financial crisis prediction model using ant colony optimization [J] . International Journal of Information Management, 2020, 50: 538-556.
[17]GAO W Y, SU C. Analysis of earnings forecast of blockchain financial products based on particle swarm optimization [J]. Journal of Computational and Applied Mathematics, 2020, 372: 112724.
[18]RUAN X M, ZHU Y Y, LI J, et al. Predicting the citation counts of individual papers via a BP neural network [J]. Journal of Informetrics, 2020, 14(3): 101039.
[19]SALGOTRA R, SINGH U, SINGH S, et al. Self-adaptive salp swarm algorithm for engineering optimization problems [J]. Applied Mathematical Modelling, 2021, 89: 188-207.
[20]LONG W, JIAO J J, LIANG X M, et al. An exploration-enhanced grey wolf optimizer to solve high-dimensional numerical optimization [J]. Engineering Applications of Artificial Intelligence, 2018, 68: 63-80.
[21]MIRJALILI S. SCA: A sine cosine algorithm for solving optimization problems [J]. Knowledge-Based Systems, 2016, 96: 120-133.
[22]FARAMARZI A, HEIDARINEJAD M, STEPHENs B, et al. Equilibrium optimizer: A novel optimization algorithm [J]. Knowledge- Based Systems, 2020, 191: 105190.
[23]CHEN Y, PI D C, XU Y. Neighborhood global learning based flower pollination algorithm and its application to unmanned aerial vehicle path planning [J]. Expert Systems with Applications, 2021, 170: 114505.
(責任编辑:李艺)