数据赋能低压配用电系统精益化运行的关键技术与算法
2023-02-27刘晟源章天晗林振智崔雪原李家桥
刘晟源,章天晗,林振智,崔雪原,李家桥,杨 莉
(浙江大学电气工程学院,浙江省杭州市 310027)
0 引言
配用电系统承担着将电能分配给用户以及服务用户消费电能的功能,是连接电网公司与终端用户的纽带[1]。近年来,为提升电网公司的营销运行效益,越来越多的目光已投向如何提升低压配用电系统的精益化管理水平。
近年来,中国在智能配电网和用电系统智能化升级方面取得的成就举世瞩目,以月度为单位的人工抄表已经被以分钟、小时为单位的智能电表自动回传所替代,低压配用电系统的数据规模急剧增长,各种基于数据的低压配用电系统精益化管理方法也不断涌现。数据赋能是指利用数据实现更高水平和更高效率的业务能力[2],数据赋能的配用电系统精益化管理是在原有业务的基础上利用数据助力精益化管理。一方面,要构建、核查、修正低压台区中的各类信息(即用户相位关系识别、户变关系识别、拓扑关系识别),并在此基础上进行线损治理(即三相不平衡治理、异常用电识别、窃电行为检测),以期提高低压配用电系统的可靠性和经济性;另一方面,要根据用户对用能的满意程度来反向促进低压配用电系统精益化运行的进一步提升。
本文根据近几年出现的新问题、新技术及新挑战,重点阐述数据赋能的配电用系统精益化管理的5 个关键技术问题:1)计量采集设备质量评估与计量数据异常监测;2)用户相位关系识别与三相不平衡治理;3)低压台区户变关系和拓扑关系识别;4)用户异常用电和窃电行为检测;5)客户侧用电服务评价。智能低压配用电系统的建设使得电力设备的运行数据和用户用电的计量数据可以被自动和实时地采集和上传,而这些宝贵的数据是解决问题2)至5)的基础。因此,使用高质量的计量采集设备和及时准确地监测计量数据异常(即问题1))是整个低压配用电系统精益化管理研究的基础和支撑。问题2)和3)着眼于电网营销部门所关心的低压配电台区中的相位关系、户变关系以及拓扑关系。其中,用户相位关系识别是户变关系和拓扑关系识别的基础,准确的相位识别结果将大大提升拓扑关系的准确度。因此,问题2)是问题3)的基础,并且问题2)和3)是低压配用电系统精益化管理中不考虑用户不正常用电行为时电网公司需要主动提升的部分。问题4)则着眼于考虑用户侧不正常用电时需要被动提升的情况,即对专变用户和低压用户进行异常用电和窃电行为检测(问题4))。最后,问题5)着眼于用户对用电服务的评价,作为在中国需要承担社会责任的电网企业,这也是低压配用电系统精益化管理的一部分,其可以反馈用户的满意程度,同时有助于电网营销部门发掘精益化管理中的薄弱环节。
1 计量采集设备质量评估与计量数据异常监测
作为低压配用电系统精益化运行与管理的基础设施,大量计量采集设备实时地采集低压配用电系统的运行和维护数据,其质量和可靠性将直接影响低压配用电系统是否能够安全经济运行。计量采集设备的质量评估研究范式如下:首先,提出能够表征计量采集装置质量的若干个指标;然后,选择合适的指标权重综合方法;最后,基于决策理论进行计量采集设备的质量评估,得到如附录A 图A1 所示的计量设备质量排序结果。不同计量采集设备质量评估算法的优劣对比如表1 所示。文献[3]引入全生命周期的概念,对计量采集设备各阶段的质量管理数据打分加权,从而评价设备供应商的优劣。文献[4]则建立了包含负荷采集可用率等5 个描述计量采集设备质量指标在内的评估指标体系。然后,基于CRITIC (criteria importance though intercriteria correlation)综合考虑主客观权重并结合理想点法评估计量采集设备的好坏。类似地,文献[5]提出了6 个反映计量设备运行质量的指标,并最后用熵权法对指标进行综合,从而对计量采集设备进行质量评 估。 文 献[6]则 提 出 了 基 于 改 进K- 近 邻(improvedKnearest neighborhood,iKNN)的离群点识别和异常分数计算方法,然后应用加权融合贝叶斯(weighted fusion Bayesian,WFB)技术,综合上一步的异常分数,其具有较高的设备评价和故障预测性能。
表1 不同计量采集设备质量评估算法对比Table 1 Comparison of evaluation algorithms for different measurement devices
需要指出的是,即使采用高质量的计量采集设备,实际运行中采集到的计量数据依然可能存在各种异常,甚至遭受恶意的数据攻击。因此,对计量数据进行实时监测,及时发现潜在的数据异常和数据攻击也是低压配用电系统精益化运行的基础,其本质是如何从正常的时间连续型数据中进行异常点检测和离群点辨识的问题。不同计量数据异常监测算法的对比如表2 所示。针对国内的电力用户用电信息采集系统,文献[7]考虑高供高计和高供低计的专变用户,将计量装置异常分为表计异常、互感器异常、接线盒异常和终端异常4 类,提出了规律性非连续算法和分类连续差值算法对采集的电流数据进行分析,从而及时检测出处于异常采集状态的计量装置。针对智能配电网和电力信息物理系统(cyber physical system,CPS)中虚假数据注入攻击(false data injection attack,FDIA)问题,国内外均有较为广泛的研究。文献[8]将虚假数据定义为攻击者基于对电网电气和拓扑参数的部分了解,在数据采集和传输接收时,对数据进行可以抵抗不良数据检测的修改,并能影响后续状态估计结果的数据。该文献还根据攻击者对系统参数的掌握程度,将虚假数据分为3 类,并给出了相应的构建方法、对电力系统的影响和防御思路。文献[9]对CPS 下的网络攻击与防御进行了研究综述,归纳整理了CPS 攻击的模型和评估方法。文献[10]则进一步介绍了CPS 攻击检测与保护的技术手段,同时给出了未来研究方向。文献[11]提出了一套适用于相量测量单元(PMU)和数据采集与监控(SCADA)系统混合数据的空间隐蔽型FDIA 在线防御框架。首先,提出了基于相关系数的电网相似度指标和适用于混合量测电网状态的预测方法;然后,提出了适用于SCADA系统数据一致性检测的指标;最后,给出了PMU 和SCADA 系统混合量测中虚假数据的在线剔除与修正方法。文献[12]则基于门控循环单元(GRU)和卷积神经网络(CNN)构建混合神经网络,从而对FDIA 进行快速检测。国外相关研究的对象主要是高级量测体系(advanced measurement infrastructure,AMI)[13],文献[14]提出了一种基于支持向量机(SVM)和时序故障传播图(temporal failure propagation graph,TFPG)的AMI 异常数据和异常状态辨识方法。文献[15]讨论了边缘计算环境下智能量测数据的异常检测,提出了基于决策树和聚类算法的低压设备量测递归误差估计方法。文献[16]研究了恶性数据攻击和协调信息物理攻击,分析了它们之间的异同,最后提出了一种可以同时识别上述两种攻击类型的自适应无参累加(adaptive nonparametric cumulative sum, ANCUSUM)检测器。文献[17]指出之前大多数FDIA检测方法都基于部分计量装置是完全可信的(即不会遭受攻击)这一强假设。因此,为了考虑所有计量装置都有可能遭受攻击的场景,其提出了基于最小代价和混合整数非线性规划的防御策略。
表2 不同计量数据异常监测算法对比Table 2 Comparison of different monitoring algorithms for abnormal measurement data
可以看出,针对计量数据异常监测这一问题,以往研究大多考虑的是配电网层级的SCADA 系统和输电网层级的CPS,其往往具备较为完备和丰富的量测数据。而对于低压配用电系统尤其是用电系统,目前的计量设备主要是用户用电信息采集系统中的智能电表等终端,其采集时间同步性和稳定性都较差,采样频率也较低。然而,目前针对此类问题的研究鲜有报道。因此,在未来,一方面需要针对中国的低压配用电系统的现有状况,考虑计量数据时间不同步等问题,开发有针对性的异常数据监测算法;另一方面需要结合实际,部署一定数量的配电网PMU(D-PMU)[18-19],从 而 为 移 植 以 往 基 于 主 网PMU 的研究成果提供可能。对计量采集设备质量评估而言,应该结合设备的实际运行情况构建更加丰富的质量评估指标体系,从而为电网公司选择高质量、高可靠性的计量采集设备提供依据,为低压配用电系统的精益化管理打好基础。
2 数据赋能的用户相位关系识别与三相不平衡治理
随着近年来大规模的配电网改造,低压配用电系统的结构较以往发生了较大的变化,同时伴随着电网故障和维护修理等工作,电网公司所掌握的低压配用电系统模型与实际情况已有较大差距。例如,用户的相位所属关系往往在多次检修后会与原始的档案记录出现偏差,这将导致电网运行人员无法准确地了解低压配用电系统各相的实际运行状况,阻碍后续三相不平衡治理的进行,从而影响低压配用电系统的经济稳定运行[20]。用户相位关系识别是三相不平衡治理的前提,三相不平衡治理是用户相位关系识别后电网公司的主要应用。用户相位关系识别要确定每个用户所属的相位,其本质上是一个通过量测数据进行无监督聚类或有监督分类的问题,目的是建立起如图1 所示的相位对应关系。三相不平衡治理是在用户相位识别完成后,通过人工切换或者自动切换(需加装如图1 所示的相位切换装置)的方式,减小低压台区的三相不平衡度,其本质上是一个策略生成和数学优化问题。不同相位关系识别与三相不平衡治理算法对比如表3 所示。
图1 用户相位关系识别与三相不平衡治理示意图Fig.1 Schematic diagram for user phase relationship identification and three-phase unbalance regulation
表3 不同相位关系识别与三相不平衡治理算法对比Table 3 Comparison of different phase relationship identification algorithms and different three-phase unbalance regulation algorithms
就用户相位关系识别而言,人工实地排查确认是过去计量采集数据不丰富时的主要手段,费时费力且效率低下。随着近来年智能采集设备的安装,一些数据赋能的识别方法和手段相继出现。文献[21]利用窄带电力载波通信具有跨相耦合的特点,通过载波通信装置分析报文发送端和接收端的时间差以及发送端的已知相位,对接收端的相位进行识别。这一方法操作简单、准确率高,但是其主要问题是该方法的实现依赖于载波通信装置,而目前用户侧的载波通信装置数量十分有限。文献[22]则设计了一种基于模糊微处理器的相位辨识系统,通过时钟频率偏差来识别配电变压器的相位。但是,这一方法也需要额外的硬件配置且只适用于配电网变压器,不能满足确定变压器下级用户相位关系的要求。立足现有的用户用电信息采集系统,也有学者研究了仅依赖于计量采集数据的方法。这类方法的核心思想是将用户相位识别问题转化为聚类中心数为3 的无监督聚类问题。文献[23]首先应用t-分布随机近邻嵌入(t-distributed stochastic neighbor embedding,t-SNE)技术对用户用电信息采集系统采集的电压数据进行数据提取和降维,并将其结果作为利用层次方法的平衡迭代规约和聚类(balanced iterative reducing and clustering using hierarchies,BIRCH)算法的输入,从而将配电网用户分为3 类并确定其所属相位。文献[24]则直接利用适用于聚类数少、类内数量均匀的谱聚类方法进行若干次用户相位关系的识别,然后根据少数服从多数的原则确定每个用户的相位。算例结果表明其可以实现接近100%的准确率。
三相不平衡治理方面,除早期人工转换负荷相位外,学者们提出的治理策略大多基于自动切换装置或基于电力电子逆变补偿装置。文献[25]基于专家系统设计了配电变压器的换相策略,并开发了零线电流减小算法,以支持推理机推导出可用于自动投切装置的三相不平衡治理策略。文献[26]构建了以三相电流不平衡度最小和换相次数最小为目标的多目标三相不平衡治理模型,但其需要通过例如遗传算法的智能优化算法求解,其速度和最优性较差。文献[24]提出的一体化方案中则以三相不平衡度最小为目标函数,考虑电流等式、相位唯一、相位不可调、相位同组不可分、最大相位切换次数等约束,构建了混合整数线性规划(mixed-integer linear programming,MILP)形式的三相不平衡治理模型,其可以快速准确求解。文献[27]在文献[24]的基础上,进一步考虑自动切换装置的最优布点问题,提出了考虑全寿命周期成本和三相不平衡最小化的双层优化模型。文献[28]首先通过高速电力线载波获得准确的相位关系,然后根据历史用户负荷数据给出基于动态规划的用户相位调整(即三相不平衡治理)方案。文献[29]为了降低低压配电线路的三相电压不平衡,提出了一种分布式智能住宅负荷转移方案。安装在配电变压器上的中央控制器通过监测每个住宅的电力消耗,确定相位切换方案。以上策略均是基于自动投切装置,其实现成本较低,不涉及动态补偿过程,切换频率一般为几天或几小时。如果引入类似于输电网[30]的电力电子逆变补偿装置,则可以实现秒级的动态补偿以缓解三相不平衡。文献[31]考虑分布式能源的等效负序虚拟阻抗幅值和相角控制,提出了补偿电网稳态不平衡电压的控制策略。文献[32]在此基础上,以最大化补偿三相系统的负序和零序电流为目标,以三相电压调节和可用无功功率为约束,构建了相应的不平衡补偿模型。但是,这类方法需要配置电力电子逆变补偿装置,一般只能应用于有分布式发电机组的区域。
可以看出,目前用户相位关系识别已经可以基于用户用电信息采集系统的计量数据,通过聚类算法在大多数场景下实现很高的识别准确率。而剩余识别率低的场景也可以通过加装载波通信装置的方法进行一对一的辨识。值得注意的是,如何判断聚类算法在某一给定场景下能否取得较高的准确率是一个值得研究的问题。因为这是一个后验问题,涉及是否需要投入资金和人力对该场景进行单独排查或配置载波通信装置。对于三相不平衡治理而言,目前的模型都处于研究的初级阶段,基于电力电子逆变补偿装置的方法治理效果好,但是其具有应用范围有限、成本高等局限性;而基于自动投切装置的方法效果有限、时效性较差。此外,在未来,考虑经济性的自动投切装置布点问题值得研究关注,合理的布点可以借助少量关键位置的自动投切装置实现较好的三相不平衡治理效果。
3 数据赋能的低压台区户变关系和拓扑关系识别
如第2 章所述,低压配用电系统的检修和改造使得地理信息系统(geographic information system,GIS)中记载的数据与实际情况不完全一致。对于低压配用电系统而言,除了用户相位关系之外,正确的低压台区户变关系和拓扑关系也是精益化管理的重要支撑,其有利于台区实际统计线损的计算[33]和窃电用户的甄别。户变关系指的是每个用户与上级配电变压器的所属关系,低压台区户变关系识别指的是排查每台变压器下是否有档案与实际不符的情况,如图2 所示。图中:紫色和粉红色的用户分别代表档案中记录为变压器1 和2 下的用户,然而实际上有5 户的户变关系需要纠正。拓扑关系则指的是某一变压器下线路和用户的拓扑关系,如图2 所示。拓扑关系识别即确定每组用户在馈线上的前后顺序的相对位置。因此,拓扑关系的准确识别要建立在户变关系识别正确的基础之上。不同低压台区户变关系和拓扑关系识别算法对比如表4 所示。
表4 不同低压台区户变和拓扑关系识别算法对比Table 4 Comparisons of identification algorithms for different user-transformer and topology relationship in low-voltage areas
图2 低压台区户变关系和拓扑关系示意图Fig.2 Schematic diagram for transformer-user and topology relationships in low-voltage areas
户变关系识别只需确定用户与上级配电变压器的所属关系,因此和拓扑识别相比其相对容易,其实质是一个分类或聚类问题。文献[34]提出了一种基于量子遗传和模糊聚类算法的户变关系识别方法,其通过比较电能表和变压器的电压过零偏移,识别户变关系。文献[35]介绍了基于高速电力线载波中识别特征信号的户变关系识别方法。但是,上述两种方法均需要高采样率的计量采集装置以实现对正弦波的采样,而这样的计量采集装置在中国暂时还没有普及。因此,文献[35]针对目前已广泛部署的每天96 点的电能计量装置,进一步提出了基于比较户变电压曲线间离散Frecher 距离的户变关系校验方法,实现了较高的准确率。文献[36]通过用户电压量测数据的相关性分布识别相邻的用户并确定台区所属关系,还根据相关性的高低简单讨论了用户的上下游关系(即拓扑关系)。文献[37]应用电压曲线间的Pearson 相关系数判断GIS 中的户变关系是否正确,并利用K-近邻(KNN)算法确定关系错误用户的实际所属台区。文献[38]通过自适应分段聚合近似方法提取电压计量数据的特征,然后应用可自动确定参数的基于密度的有噪空间聚类(densitybased spatial clustering of application with noise,DBSCAN)算法进行用户户变关系辨识。文献[39]提出导数动态时间弯曲(dynamic time warping,DTW)算法对用户侧和变压器侧的电压数据进行相似度分析,其可以较好地克服实际量测数据的时序不同步性。然后,通过DBSCAN 算法对用户进行聚类从而确定户变关系。文献[40]则采用高斯混合模型(Gaussian mixture model,GMM)对不同用户的电压曲线进行聚类,然后根据其与配电变压器的关联卷积实现户变关系的辨识。文献[41]另辟蹊径,利用同一时刻、同一台区下的用户电流之和应等于其配电变压器总电流这一关系,构建了基于电流偏差最小的线性方程,通过求解该方程即可确定相应的户变关系。
拓扑关系识别方面,国内期刊主要报道了基于配置额外载波通信设备以及半人工排查的方法,而国外期刊则进一步介绍了基于量测数据的自动分析方法。文献[42]基于节点相关性分析和马尔可夫随机场(Markov random field)对低压配用电系统的拓扑进行了建模,采用极大似然法求解模型以得到配用电系统的拓扑关系。文献[43]利用三相电压测量值,结合贪心算法进行配电网相位和拓扑的联合识别。但是,以上两种方法均需要借助配电终端(distribution terminal unit,DTU)、远程终端单元(remote terminal unit,RTU)或配电网PMU,但这些设备至多配置到配电网一级。因此,上述方法只能适用于配电系统的拓扑关系识别而不能应用到台区拓扑的识别。为了解决这一问题,文献[44]基于智能电表的计量数据和能量守恒原理,并通过对时间序列进行主成分分析(principle component analysis,PCA),提取用户所处的位置特征,从而进行拓扑关系的构建。文献[45]基于AMI 量测的电压和功率数据,构建用户到变压器的映射,并基于线路上的电压降关系、用户间的相关系数以及自底而上的聚类方法实现台区拓扑关系的识别。文献[46]通过知识图谱技术对低压配用电网信息系统中的各类数据进行整合,构建台区拓扑关系的知识图谱,从而实现了较好的辨识效果。
目前,低压台区户变关系和拓扑关系识别的可用数据主要是智能电表每隔15 min 一点的计量数据以及配电变压器上的量测数据。对智能电表的96 点数据而言,其时间同步性和数据精度是两大问题。如果不同用户的量测数据不是处于同一时间断面,则基于相关性和能量守恒方法的效果将大打折扣。此外,目前用户侧96 点电压数据精度仅保留到小数点后1 位,这意味着若用户间的电压差小于0.1 V,则其在理论上就很难在拓扑识别中被区分。值得注意的是,用户侧96 点电流数据精度保留到小数点后3 位,因此,理论上基于电流的台区拓扑识别方法可以获得更好的效果,未来值得进一步研究。
4 数据赋能的用户异常用电和窃电行为检测
在低压配用电系统精益化运行管理中,降低台区线损是一项重要任务。如图3 所示,台区线损主要由技术性损失(technical loss,TL)和非技术性损失(non-technical loss,NTL)两部分构成,其中TL主要由输电线电阻的正常耗散引起,而NTL 则主要由用户的异常用电及窃电行为引起。目前,TL 已通过配电网改造等方式主动治理,理论线损只占台区供电功率的2%~4%,而NTL 的存在直接抬高了台区的统计线损,造成电网公司的经济损失。因此,学者对用户异常用电及窃电行为进行了广泛的研究和讨论。其需要解决的关键问题是根据一段时间的连续量测数据判断用户用电是否存在异常,本质上属于有监督的二分类问题。
图3 异常用电和用户窃电行为的主要类型Fig.3 Main types of abnormal electricity consumption and electricity theft behavior
文献[47]对高损台区进行Granger 归因分析,依据窃电量与总用电量一般呈正相关的假设,确定高损台区中最有可能的窃电用户。文献[48]在Granger 归因分析的基础上,提出了基于边缘计算的低压用户窃电检测方法,并利用台区智能终端采集的用户数据进行了验证。文献[49]采用DTW 量度窃电用户之间的相似性,并采用仿射(affinity propagation,AP)聚类法识别出典型窃电用户从而构建窃电样本库,最后与其他用户表计数据进行对比,结合人工经验判定潜在的窃电用户。文献[50]基于相关系数对96 点电流数据进行分析,构建了窃电用户的时空关联矩阵并预估了用户的窃电量。文献[51]根据电力用户消费模型的可预测性,综合运用配电变压器和采集装置的数据进行窃电检测。以上窃电识别方法均是基于较为简单的数据进行相关性分析。文献[52]对异常用电的检测方法进行了全面总结,给出了具有普适性的攻击者(即窃电用户)和检测者的数学模型。此外,该文献将2017 年及之前的检测方法分为了基于系统状态、基于数据驱动、基于博弈论3 类,并分别进行了详细介绍。在近年来机器学习算法快速发展的背景下,文献[53]基于SVM 进行窃电识别,文献[54]则应用贯序极限学习机(ELM),实现了比SVM 更好的效果。文献[55]提出了基于实值深度置信网络的窃电检测方法。文献[56]针对大多数方法重分类器选取而轻用户用电特征提取的问题,提出了基于去相关自编码器的特征提取方法,实现了更好的分类性能。文献[57]针对以往算法未考虑用电周期性的问题,提出了同时基于深度和广度CNN 的窃电模型,以实现更高的精度。
针对正常用户和窃电用户样本数量的不平衡问题,文献[58]进行了初步研究,并提出基于随机降采样 提 升 树(random under-sampling boosting,RUSBoosting)的窃电识别方法及相应的性能评价指标。文献[59]考虑不同类型的窃电,利用最大信息系数(maximum information coefficient,MIC)以及基于密度峰值的快速聚类算法(clustering technique by fast search and find of density peaks,CFSFDP)检测不同形态的窃电。文献[60]考虑窃电用户样本较小的问题,基于三元组孪生网络提出了适用于小样本条件下的窃电检测算法,充分学习同类样本间的相似性和不同类样本间的差异性,从而获得了较准确的窃电检测结果。文献[61]对智能电表记录的功率、报警、电量数据进行综合分析,提出了基于XGBoost 有监督分类算法的窃电检测模型。文献[62-63]则进一步集成了多个分类器,提出了诸如基于孤立森林的窃电检测算法,有效提高了样本不均衡条件下窃电检测的准确率。
文献[64]针对目前窃电检测算法误报率较高的问题,首先对工业用户的典型生产经营状态进行聚类,然后通过判断低电量场景是异常用电还是正常的经营状态变化来进行二次筛查,从而降低误报率。文献[65]综合运用了极限梯度提升、分类提升以及弱梯度提升3 种梯度提升分类器,从而构建以假阳性率(false positive rate,FPR)最小为目标的窃电检测模型。文献[66]对用户侧窃电检测的关键技术进行了全面综述,详细介绍了窃电的原理和常见的窃电方法及对应的窃电检测方法。文献[67]在此基础上继续对数据驱动的窃电检测方法进行了综述和展望,并进一步讨论了低误报率窃电检测的算法设计。值得注意的是,上述窃电识别方法既有在模拟数据集上测试的,也有以实际量测数据集测试的。一般地,在模拟数据集上的测试性能会优于在实际数据集上的测试性能,因为其数据更加规整且不含噪声。关于窃电检测算法更详尽的对比可参考文献[66]。
纵观用户异常用电和窃电行为检测研究,近年来已从人工排查、简单的数据相关性计算转向数据赋能的人工智能算法,取得了喜人的成果。但同时也应注意到,目前基于人工智能的检测方法也面临着客观挑战:
1)正常用户和窃电用户样本数不平衡将在人工智能算法中引入“偏好(bias)”,从而影响识别结果。上述研究中,模拟数据中的窃电用户比例设定在15%左右,而实际数据中的窃电用户比例一般更低。因此,未来需要重点研究降采样或重采样的数据预处理方法,以缓解这一问题。
2)目前的窃电算法大多不能确定窃电量,而实地稽查的成本有时候甚至比追缴电量更高。因此,将经济成本因素考虑在窃电检测中也是未来的研究方向之一。
3)随着分布式能源的大量接入,一些异常用电行为(例如一段时间的低电量或零电量)可能是用户自有的分布式能源造成的,如何区分和剔除这种情况也需要在未来加以研究。
5 数据赋能的客户侧用电服务评价
作为承担社会责任和提供公共服务的电网企业,低压配用电系统的精益化运行中除了要考虑经济性因素外,还要考虑用户侧的用电满意程度。随着过去十几年来电网的快速建设和供电水平的日益提高,以往因客观条件限制导致的限电、非计划停电、安全用电事故明显减少,国内电网公司在客户侧的服务逐渐由过去的粗犷式管理转向精细化管理。为了满足这一点要求,需研究客户侧服务评价方法,将用户对服务的评价科学合理地反馈给电网公司,以提高后者的精益化管理水平。客户侧用电服务评价的本质也是一个评估问题,类似于本文第1 章,其首先要提出例如图4 所示的能合理描述客户用电满意度的多维度指标,然后选择相应的指标综合方法,基于多属性决策理论进行客户侧用电服务的评价。不同客户侧用电服务评价算法对比见表5。
图4 客户侧用电服务评价研究展望Fig.4 Prospect of user-side service evaluation research
表5 不同客户侧用电服务评价算法对比Table 5 Comparison of evaluation algorithms for different user-side services
早在2004 年,就有学者对供电服务质量评价方法进行了初步研究[68]。文献[68]基于电网公司社会服务公告中的承诺内容,构建了包含城市到达事故现场时限等19 个指标在内的供电服务质量评价指标体系,并运用模糊偏序关系和模糊综合评价方法描述人的主观感受并进行服务质量的评价,指标权重的确定采用了专家打分法。文献[69]提出将供电服务质量分为了现场服务、供电质量、营业厅服务、电话服务、服务管理5 个部分,并在每个部分下提出了多个对应的三级指标,从而感知客户服务质量。该文献依然采用了模糊数学理论构造判断矩阵,利用基于三角模糊数的层次分析法(analytic hierarchy process,AHP)确定指标主观权重以进行综合评价。文献[70]则进一步将供电服务质量指标分成了内部评价指标和外部评价指标两大块,分别构建了相应的指标体系,最后设计了相应的服务质量评价系统和功能模块。文献[71]基于物元理论,分析了影响供电服务质量的主要因素,构建了相应的指标体系。文献[72]根据供电质量和服务质量构建评估指标体系,利用理想点法(technique for order preference by similarity to an ideal solution,TOPSIS)和专家打分法进行服务质量评价。文献[73]在供电质量、服务质量的基础上进一步扩展,构建了企业形象、客户期望、价值感知、客户抱怨、客户忠诚等指标以及相应的三级四级指标,运用鱼群优化算法模拟繁琐的专家打分,从而简便科学地对客户满意度进行评估。文献[74]在上述研究的基础上,讨论了新电改前后的供电服务变化,明晰了新电改后用电服务的提供者和对应的评价指标。最后,基于人工神经网络构建下层自适应评价,基于组合权重法确定上层评价体系权重,基于TOPSIS 确定最终的评价结果。文献[75]则利用贝叶斯决策树挖掘用户满意度特征,指导电网供电服务质量的提升。
从上述研究可以看出,目前研究所提出的供电服务质量评价指标及体系都较为抽象,指标的数值往往需要通过问卷调查、访谈来获取,这会导致评价时的样本数量有限、样本分布的均匀性不能得到保证等问题,也可能导致不同区域的供电公司在同业对标中为了提升自身业绩而人为选择样本,造成评价结果不再客观公平。近年来,随着电力客户服务呼叫中心(即95598 热线)和手机客户端的开通和宣传,越来越多的投诉、建议和反馈通过上述渠道进行,而从这些渠道进行的反馈可以作为电子资料被自动和集中地管理,避免了人为因素的干扰。因此,利用95598 热线和手机客户端的通话和聊天记录进行供电服务质量评价在未来将有更广阔的研究前景。但是,也应清醒地认识到对语音和文字记录进行自动的数据分析绝非易事。因此,一方面,电网公司可以在用户进行反馈时设置结构化的事项类别供用户选择,最大限度地在数据采集阶段就能进行数据的初步分类;另一方面,应大力发展基于深度学习的语音识别、文本识别以及语义识别技术,从而助力数据赋能的用户侧用电服务指标提取和综合评价。
6 未来研究展望
前文对数据赋能低压配用电系统精益化运行的关键技术与算法进行了总结并指出了相应的不足。目前,已有的关键技术与算法一方面依赖于计量设备量测的海量数据,另一方面也依赖于日益迭代的大数据分析技术和人工智能算法。在大数据、云计算、物联网、移动互联网、人工智能、区块链(简称“大云物移智链”)快速发展的背景下,数据赋能低压配用电系统计量营销在未来将有以下重点需要解决的问题和研究方向:
1)数据赋能的关键技术与算法依赖于计量设备量测的海量数据,故提升量测数据的多样性和准确性以及量测装置的性能尤为重要。因此,一方面,需研究基于物联网技术的多源数据采集和融合方法,同时研究可指导计量设备采购和安装的综合评估体系;另一方面,需研究基于大数据分析的原始量测数据清洗、修复和重构一体化方法和数据篡改识别方法。
2)数据赋能的关键技术与算法还依赖于大量的算力,故未来可依托云计算平台进行处理,而实时的数据传输与处理又依赖于移动互联网的发展。因此,一方面,需研究基于移动互联网的计量采集设备与云计算平台数据传输关键技术;另一方面,需研究适用于云计算平台的并行数据赋能算法。
3)人工智能算法是本文所述数据赋能配用电系统精益化运行的核心。然而,人工智能算法因其可解释性差、训练数据正负样本不均衡等问题在实际工程中应用较少。因此,一方面,需研究针对配用电系统原理可解释性强的人工智能算法以及前置的样本欠采样/过采样方法;另一方面,需加强实践中真实样本的数据标注,同时研究数字孪生技术进行仿真数据模拟对样本库进行补充。
4)配用电系统的计量数据一方面将用于电网公司的营销计量考核与同业对标,另一方面其往往涉及用户个人隐私。因此,研究行业或私有区块链技术,将计量数据上链,利用区块链的去中心化、安全性和匿名性的特点保证数据的不可篡改和私密性的要求,也是未来数据赋能低压配用电系统计量营销的重要方向之一。
7 结语
本文主要侧重于综述对各类影响配用电系统精益化运行的问题进行识别和矫正的算法,对“优化控制”也有所涉及,例如第2 章中相位识别和三相不平衡治理、第3 章中的户变关系和拓扑关系辨识、第4 章中的窃电监测等。事实上,判断需不需要检修、去哪里检修、检修什么是较困难的,而检修本身是较容易的。例如:1)制定三相不平衡治理的策略是较为困难的,而实施这一策略只需人工切换线路或给装置下达切换命令即可;2)发现台区存在户变关系不正确的问题并找到户变关系不正确的用户是较为困难的,而修复这一关系错误只需要修正档案即可;3)发现台区存在窃电现象并定位疑似窃电用户是较为困难的,而处理窃电用户只需人工上门核查即可。
虽然针对低压配用电系统精益化运行管理的研究目前已有不少数据赋能的场景和成果,本文也给出了相应的研究不足、现有的挑战和未来的展望,但是应当注意到,低压配用电系统精益化运行管理的内容在本文中无法穷尽。例如,在精益化管理时,若能基于数据对不同行业的用户进行识别分类和校验[76],将有利于电网公司采取更精细化的管理手段;在台区拓扑辨识之前,如果能确定中压线变关系[77],将有利于台区下拓扑的准确辨识;如果能基于数据自动对用户用电安全隐患进行监测[78],将有利于电网公司及时检修设备和线路,防患于未然。然而,上述几点内容目前国内外鲜有深入的研究,鲁棒、成熟算法的诞生还需广大学者的进一步努力。
此外,在应用数据对低压配用电系统精益化运行管理进行赋能时,还应明晰当下有什么样的工具可以赋能,有多少资源可供赋能,用什么样的知识去赋能,最终落脚到赋能什么样的具体服务。以上问题还需要进一步地进行系统性研究。
伴随着以5G 为代表的数字化新基建的逐步实施,可以预见未来种类更加多样、信息更加丰富的数据将可以被获取,其将为数据赋能低压配用电系统精益化运行再添新的内涵。
本文在撰写过程中与课题组林之岸、金伟超、连子宽、章博、褚振悦等同学进行了广泛的交流与讨论,他们为本文提供了有益的思考与建议,特此感谢!
附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。