AI技术赋能低压配电运维系统研究
2021-07-22王计斌陈大龙
王计斌 陈大龙
南京华苏科技有限公司
0 引言
低压配电系统作为与电力设备联系最为密切的设备之一,其安全质量日益被人们所关注。为保证电力设备的正常运行和人们日常用电的安全性,必须提高相应的检修技术。
低压配电网与输电网相比存在不少问题:运维人员水平参差不齐,对重要设备运行状态和台区内用户用电情况缺乏主动感知的手段,运维工作停留在计划检修形式;由于缺乏数据收集的手段,无法建立信息化、智能化的运维体系;在配变侧,变压器、开关接点、综合配电柜(JP柜)等缺乏负荷、动环监控方法,存在一定安全隐患,且设备运行寿命难以最优化;在线路侧,低压配电网线路故障难以有效排查和定位,缺乏智能化手段,人工巡检工作量大、效率低,因多为事后响应,导致故障处理及时性效果有限;对于数据的处理缺乏现场一次设备的感知和状态数据收集,因此无法对低压配电线路/设备的状态感知及异常进行精确定位;上层的生产管理系统无法实现运检营销数据的融合贯通,导致无法实现基于多元数据的故障研判、故障定位,在应用层加强大数据分析及应用,从传统“被动抢修”变“主动运维”;目前低压台区拓扑还多以固定登记为主,没有动态识别和分析。此外,配电房的安全管控也是以人工管理为主,并没有引入先进的人工智能(Artificial Intelligence,AI)技术辅助决策和判断。因此,低压配电网运维体系的信息化、智能化改造需要更先进的技术手段来支撑,通过引进AI技术,结合物联网监测、大数据分析、云计算等各种技术,为电力系统运维智能化提供相关技术支撑,实现供电服务能力和供电服务质量的提升。
1 方法论
1.1 基于AMI数据采集的拓扑识别AI算法
高级计量架构(Advanced Metering Infrastructure,AMI)是智能电网的一个重要组成部分,它是集测量、采集、监控、存储、分析、管理为一体的自动化及智能化的完整网络和系统。系统支持国际电工委员会(International Electro technical Commission,IEC)国际标准的通信规约及转发协议,涵盖电网各种计量点及采集终端信息。通过对计量点(单三相智能电表)、智能开关、智能变压器等的数据进行采集及用电监控,实时智能监控电网的电压、电流、电能质量等供电可靠性的重要指标。
采用基于AMI系统采集的数据进行户表关系拓扑识别,并在此基础上开展线损分析及其它需求的管理应用,为整个电网的优化提供数据参考。通过AI算法对低压配电台区侧各电力设备的拓扑关系识别。图1为电力设备级联关系图,拓扑识别AI算法通过设备级联关系实现拓扑识别过程。
图1 电力设备级联关系图
出线柜与下级分支箱的拓扑识别算法如下:
步骤1:出线柜、分支箱、电表箱电流数据合集A,各分支箱采集的电流和的合集B;
步骤2:合集A中删除分支箱电流以及小于合集B中最小值的电流数据形成合集C;
步骤3:合集C中各电流值依次与合集B电流值求差,并取最小的三个差值;
步骤4:依次反复求合集C与合集B最小差值形成方差合集D;
步骤5:按15min采集频率,每天可采集96个点,先求方差合集D中平均值,再求取均方差;
步骤6:根据均方差中最小值确定该分支箱对应的上级出线柜(或分支箱);
步骤7:根据上下级关系,取某一时刻该分支箱进线电流值和对应上级电流值,若上级电流值为某分支箱分项电流值,则判定两个分支箱级联;若上级电流值不属于任一分支箱分项电流值,则判定上级为出线柜。
分支箱与下级电表箱拓扑识别算法如下:
步骤1:合集A中删除所有分支箱对应的上级出线柜(或分支箱)电流值,形成合集E;
步骤2:合集E中任意两个电流轮流求差,E1、E2、EK差值合集数组;
步骤3:按15min采集频率,每天可采集96个点,先求差值合集数组平均值,再求取均方差;根据均方差中最小值确定分支箱出线与电表箱的上下级关系。
1.2 基于XGBoost机器学习算法的单向电表相位识别
如何识别单向电表是从属于总表的哪个相位,这个问题在用户集中的台区尤待解决。通过不断的设计和实验,发现极端梯度提升(eXtreme Gradient Boosting,XGBoost)机器学习算法能够有效解决这一问题。XGBoost是在梯度提升决策树(Gradient Boosting Decision Tree,GBDT)的基础上对boosting方法进行的改进,内部决策树使用的是回归树,特点在于能够自动利用CPU的多线程进行并行计算,同时在算法上加以改进提高精度。
具体实现步骤如下:
(1)定义树的复杂度。首先把树拆分成结构部分q和叶子节点权重部分w,在这里w是一个向量,表示各叶子节点中的输出值。
引入正则化项 来控制数的复杂度,从而实现有效的控制模型的过拟合。
(2)XGBoost中的Boosting Tree模型。与GBDT方法一样,XGBoost的提升模型也是采用残差,不同的是分裂结点选取的时候不一定是最小平方损失,其损失函数如下,较GBDT其根据树模型的复杂度加入了一项正则化项:
(3)对目标函数进行改写。在XGBoost中直接用泰勒展开式将损失函数展开成二项式函数(前提是损失函数一阶、二阶;连续可导),假设我们的叶节点区域为:
则我们的目标函数可以转换成:
(4)树结构的打分函数。上面的Obj值代表当指定一个树结构时,在目标上面最多减少多少,我们可以把它称为结构分数。对于求得Obj分数最小的树结构,我们可以枚举所有的可能性,然后对比结构分数来获得最优的树结构。然而这种方法计算消耗太大,更常用的是贪心法,每次尝试对已经存在的叶节点(最开始的叶节点是根节点)进行分割,然后获得分割后的增益为:
其中,L和R代表左右。
在这里以Gain作为判断是否分割的条件,如果Gain<0,则此叶节点不做分割,然而这样对于每次分割还是需要列出所有的分割方案。而实际中我们先将所有样本按照从小到大排序,然后进行遍历,查看每个节点是否需要分割,这样的分割方式,我们就只要对样本扫描一遍,就可以分割出、,然后根据Gain的分数进行分割。
1.3 图像识别的AI算法
图像识别算法(详见图2算法流程)是对配电房内的图形图像、文字表单等进行识别,核心技术集成了模板匹配、字符位置可感知的文本检测(Character Region Awareness For Text detection,CRAFT)字符检测、表格检测等多种方式,实现对字符的精确定位,Vgg16+BLSTM+CTC模型对字符进行识别,提升配电房运维安全管控措施以及工作效率。
具体实现步骤如图2所示。
图2 图像识别业务流程图
光学字符识别(Optical Character Recognition,OCR)是以图像识别为基础,通过计算机识别图像中的信息来完成辨识任务,一般包含4个部分:
(1)图像预处理。在进行图像信息识别前,首先要对图像进行预处理,过滤噪声和干扰。如果图像信息无法辨识,则需要对图像进行处理,比如增强处理、颜色矫正等。
(2)图像分割。对图像进行分割,定位和分离需要识别的文字和图形。
(3)图像特征提取。从分割出来的文字中提取需要的特征,进行相关的参数计算和测量,并根据测量的结果进行分类。
(4)图像识别。根据提取的特征量进行识别分类,确定对应的文字和图像内容。
图像识别采用卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)网络架构,主要包括三部分:(1)卷积层:从输入图像中提取特征序列;(2)长 短 期 记 忆(Long short-term memory,LSTM)层:预测每一帧的标签分布,从卷积层获取的特征序列的标签(真实值)分布;(3)转译层:将每一帧的预测变为最终的标签序列。
卷积循环神经网络(Convolutional Recurrent Neural Network,CRNN)借助语音识别中解决不定长语音序列的思路。对于序列问题的解决,通常使用循环神经网络(Rerrent Neural Network,RNN),为了消除RNN网络常见的梯度爆炸问题,引出LSTM,这些算法在语音识别领域都已相当成熟,有很好的表现,现在就是设计特征,让图像特征可以有近似于语音的特征表达。
2 实施效果
为验证AI技术应用于低压配电运维的效果,对相位识别、人员着装识别、表单识别进行数据收集和实际测试。验证上述AI算法的准确性和可用性。
2.1 拓扑识别实施效果
为验证本文提出的拓扑识别算法的可行性。以省内某台区为例,安装28台采集终端,将设备通信地址配置到采集终端应用程序(Application,App)内,用于采集终端与管理系统的数据通信。采集终端采集出线柜出线电流、分支箱出线电流和电表箱进线电流等47组电流数据。利用算法模型输出通信地址的级联关系,再结合通信地址对应的电力设备关系表,最终得出电力设备的拓扑关系,下面为输入输出的参数信息。
采集输入:
// 出线柜出线电流集合,通信地址 A相电流 B相电流 C相电流
{ "8197", 3.666, 3.6, 3.6 }, { "8198", 7.665, 7.5, 7.5 },
{ "8199", 11.664, 11.4, 11.4 }, { "8200", 6.066, 6.0, 6.0 },
{ "8201", 15.265, 15.1, 15.1 }, { "8202", 42.843, 42.3, 42.3 }
// 分支箱出线电流集合,通信地址 A相电流 B相电流 C相电流
{ "8203", 1.111, 1.1, 1.1 }, { "8204", 1.222, 1.2, 1.2 }, { "8205", 1.333, 1.3, 1.3 },
{ "8206", 2.444, 2.4, 2.4 }, { "8207", 2.555, 2.5, 2.5 }, { "8208", 2.666, 2.6, 2.6 },
{ "8209", 3.777, 3.7, 3.7 }, { "8210", 3.888, 3.8, 3.8 }, { "8211", 3.999, 3.9, 3.9 },
{ "8212", 1.011, 1.0, 1.0 }, { "8213", 2.022, 2.0, 2.0 }, { "8214", 3.033, 3.0, 3.0 },
{ "8215", 4.044, 4.0, 4.0 }, { "8216", 5.055, 5.0, 5.0 }, { "8217", 6.166, 6.1, 6.1 },
{ "8218", 7.077, 7.0, 7.0 }, { "8219", 8.088, 8.0, 8.0 }, {"8220", 27.678, 27.3, 27.3 },
{ "8221", 9.099, 9.0, 9.0 }, { "8222", 9.123, 9.1, 9.1 }, { "8223", 9.456, 9.2, 9.2 }
// 电表箱进线电流集合,通信地址 A相电流 B相电流 C相电流
{ "0004", 1.111, 1.1, 1.1 }, { "0005", 1.222, 1.2, 1.2 }, { "0006", 1.333, 1.3, 1.3 },
{ "0007", 2.444, 2.4, 2.4 }, { "0008", 2.555, 2.5, 2.5 }, { "0009", 2.666, 2.6, 2.6 },
{ "0010", 3.777, 3.7, 3.7 }, { "0011", 3.888, 3.8, 3.8 }, { "0012", 3.999, 3.9, 3.9 },
{ "0013", 1.011, 1.0, 1.0 }, { "0014", 2.022, 2.0, 2.0 }, { "0015", 3.033, 3.0, 3.0 },
{ "0016", 4.044, 4.0, 4.0 }, { "0017", 5.055, 5.0, 5.0 }, { "0018", 6.166, 6.1, 6.1 },
{ "0019", 7.077, 7.0, 7.0 }, { "0020", 8.088, 8.0, 8.0 }, { "0021", 9.099, 9.0, 9.0 },
{ "0022", 9.123, 9.1, 9.1 }, { "0023", 9.456, 9.2, 9.2 }
输出关系:
出线柜===>>>分支箱
8197 (10.865999) ===>>> 423A (10.865999) ;8198 (22.665001) ===>>> 423B (22.664999)
8199 (34.463997) ===>>> 423C (34.464001) ;8200 (18.066000) ===>>> 423D (18.066002)
8201 (45.465004) ===>>> 423E (45.465000);8202 (127.442993) ===>>> 423F (127.443001)
分支箱 ===>>> 电表箱
8203 (3.311000) ===>>> 0004 (3.311000) ;8204 (3.622000) ===>>> 0005 (3.622000)
8205 (3.933000) ===>>> 0006 (3.933000) ;8206 (7.244000) ===>>> 0007 (7.244000)
8207 (7.555000) ===>>> 0008 (7.555000) ;8208 (7.866000) ===>>> 0009 (7.866000)
8209 (11.177000) ===>>> 0010 (11.177000) ;8210 (11.488000) ===>>> 0011 (11.488000)
8211 (11.799000) ===>>> 0012 (11.799000) ;8212 (3.011000) ===>>> 0013 (3.011000)
8213 (6.022000) ===>>> 0014 (6.022000) ;8214 (9.033000) ===>>> 0015 (9.033000)
8215 (12.044001) ===>>> 0016 (12.044001) ;8216 (15.055000) ===>>> 0017 (15.055000)
8217 (18.365999) ===>>> 0018 (18.365999) ;8218 (21.077000) ===>>> 0019 (21.077000)
8219 (24.088001) ===>>> 0020 (24.088001) ;8221 (27.098999) ===>>> 0021 (27.098999)
8222 (27.323000) ===>>> 0022 (27.323000) ;8223 (27.855999) ===>>> 0023 (27.855999)
选取其中一台出线柜及其下级设备数据,在平台中输出并呈现图3所示的拓扑图关系页面。
图3 出线柜-分支箱-电表箱拓扑图
2.2 相位识别实施效果
收集省内某台区72块电表数据,并且对72块电表进行勘站,获取用电真实信息数据,以验证上述联合算法预测结果的准确性、稳定性。
为了确保数据的完整性,需要对数据进行异常值处理,对用户电表数据进行检验,删除采样点中识别异常的数据和重复的识别数据。首先分别输入台区内1、3、4、5、6、7、8天的关口表和用户电表数据,再分别输出对应1、3、4、5、6、7、8天的相位识别数据。得到如下结论。
1天:识别出67块表,错误识别17块;
3天:识别出68块表,错误识别7块;
4天:识别出69块表,无错误识别;
5天:识别出70块表,无错误识别;
6天:识别出71块表,无错误识别;
7天:识别出71块表,无错误识别;
8天:识别出72块表,无错误识别。
经过训练测试之后,相位识别准确率得到了有效提高。
2.3 人员、安全帽识别实施效果
为验证电力施工人员、安全帽识别的有效性,将安全帽及佩戴安全帽人员图片作为测试集。在训练时为减少运算量,提高检出的速度,将原来VOC训练集进行重新采样。采样中分别对常规的安全帽进行采样,采集彩色图片15000张,再转换成灰度图片15000张。
在大约训练迭代到4000次时,模型已经有一定效果。通过目标分类识别,可进一步降低非人员误报的机率,大约降低10%以上的误报率。最后统计其在数据集上的查准率、查全率以及每秒识别帧数。其中查准率代表预测框中准确的数据比上预测框数据总数,查全率代表找到真实数据框数比上真实数据框总数。
由表1可知工人和安全帽识别精度在92.1%-94.2%,能够很好地满足施工现场识别安全帽佩戴情况,有着很好的识别效果。
表1 测试集实验结果
2.4 手写表格识别
手机摄像头拍摄实验表格后通过OCR算法模型对手写的数据(整数和带小数点数字)进行精准定位和自动识别,识别结果自动存储,对比手工录入测试。
经测试,利用图像识别技术识别表格耗时为9秒,45组数据中识别错误3个,正确率93.3%;而手工录入耗时达3分钟,发生了录入错误。由实验结果可以看出,图像识别录入比手工录入效率提高90%以上,正确率也大幅提高。
3 结束语
运用AI技术对低压配电运维的新赋能,可以实现台区拓扑自动识别,识别率达100%;单相电表的相位自动识别率达100%;工人和安全帽识别精度达到92.1%-94.2%,比传统方式提高6%;AI识别表格速度从人工录入的3分钟提高到9秒,且正确率达到93.3%以上。通过AI技术赋能低压配电运维,可以减少运维成本,提高运维效率,加强运维安全管控。拓扑识别分析技术已经成熟运用,已在多地试点成功,后期必将全面推广。安全管控目标AI视觉识别今后还有很大提升空间,在可识别目标种类及可运用场景方面将逐步深入。