APP下载

基于大数据分析可视化平台关键技术研究及供电服务指挥应用

2022-05-11任政祁建陆晨亮

微型电脑应用 2022年4期
关键词:聚类可视化概率

任政, 祁建, 陆晨亮

(江苏电力信息技术有限公司, 江苏,南京 210029)

0 引言

当前供电服务中心日常工作的关键为配网运行监测、抢修指挥、用户客服问题解答,难以对数据实施综合统计分析,致使多类数据之间不能完成交互共享,各项工作的展开状态十分被动[1-2]。在此背景下,供电企业为供应更优质的供电服务质量,在国网公司号召下设置了独立的集调控监测、配网抢修、调度服务为一体的供电服务指挥中心,尽可能地整合资源,让供电服务指挥变成数据枢纽,令供电服务更为精准化、人性化与便捷化[3]。

为此,相关学者采用余弦相似度权衡簇的凝聚度,运用N-game统计语言模型呈现供电信息间的转移关联,从而判断不同类型的供电信息。也有学者将营配调相互融合的过程当作平台建设基础,利用硬件层、平台支撑软件层、数据储存层、数据处理层及数据可视化展示层搭建供电服务指挥平台。本研究在大数据分析可视化平台关键技术的基础上,创建供电服务指挥平台。

1 基于大数据分析可视化平台的供电信息聚类技术

由于供电服务指挥中包含配网检修、配网检测运行、供电服务集中管控等诸多内容,利用大数据分析可视化平台完成供电信息精准聚类,确保指挥平台运作准确性。聚类分析是大数据分析的关键手段,可明确数据内不同类别和数据内的独有分布特征[4]。本文使用余弦相似度权衡簇的凝聚度,计算过程为

(1)

式中,Ck表示第k个簇,uij是Ck类第i个对象与第j个对象的余弦相似度。基于此,本文相似度定义使用余弦相似度,倘若2个矢量相似度是1,证明2个矢量完全相等,0代表2个矢量没有共同点。将余弦相似度计算式描述成:

(2)

式中,uij是ui与uj的相似度,di是数据簇,|di|代表样本点di处于欧氏空间的长度。

在聚类分析供电信息时,首先采用N-game统计语言模型呈现不同供电信息之间的转移关联[5]。按照最大似然估计,获得供电信息词汇参数为:

(3)

式中,C(w1w2…wi)是样本w1w2…wi-1在训练数据内出现的次数。然后将信息的切分词依次当作候选结果引入相同概率空间,计算联合概率空间最高概率下的切分路径,获取最终的切分结果联合概率分布:

(4)

式中,Pci是供电数据内每个字的信息概率,Pwj是各个词的信息概率,字与词的概率使用最大熵模型进行决策。假如输入结果是k,则融合式(4)得到:

(5)

针对供电大数据文本的分词集合,一般要推算其对于全部可能输出k的条件概率,择取最高概率的过程即为解码。按照式(4)、式(5)对联合空间字词的解码过程为

(6)

字词的联合概率模型能根据前部概率模型共同作用挑选最终的输出结果[6]。将字词联合概率模型表示成:

(7)

如果大数据分析环境内具备一组相似目标集合D及目标内的关键字集合W,且同时存在一组拥有某种特征的集合Z。若目标内的关键字为匀称分布,则供电信息内词语的联合分布概率是:

p(wi,di)=p(di)p(wj|di)=

(8)

其中,p(di)是第j个供电数据目标概率,p(wj|di)是特征语义基础上关键字发生的条件概率,p(zk|dj)是数据目标内具备某种特征的条件概率。

将临界值L的最优解计算公式记作:

(9)

对于抽取后的小数据集,利用式(10)评估其样本大小。

(10)

如果大数据分析过程中拥有数据集X,把数据集X的样本矩阵定义为:

(11)

通过欧式距离的运算,获取其对应矩阵:

(12)

设定Di,j是数据类内Ni全部样本与Nj类内全部样本之间的最小距离,得到:

Di,j=min(di,j)

(13)

使用欧式距离的两点间距离解析式获得:

(14)

(xn,yn)与(xm,ym)依次为2个连通范围m、n边缘点的坐标。若2个坐标间的距离低于设定值时,就把两个范围采取融合,反之搜索下一个坐标。设置g(ci,cj)是全部可能的X聚类对函数,该函数可以明确两个聚类间的相邻性,t是目前聚类的层级等级,将聚类计算过程描写为式(15):

Rt=(Rt-1-{ci,cj})∪{cq}

(15)

利用式(15)获得数据密度中心点,完成高精度供电信息聚类目标,对供电服务指挥的高效运行提供可靠基础。

2 供电服务指挥可视化平台构建

本文将图1中的“一个融合两个转变”当作发展目标,并推进3个建设过程:建设实体化运转的组织机构、建设贴合“五位一体”需求的操作制度,建设功能实用性强的技术支持平台。

图1 营配调融合示意图

可视化智能供电服务指挥平台包含平台硬件层、平台支撑软件层、数据储存层、数据处理层及数据可视化展示层如图2所示。

数据库集成过程详情如图3所示。

数据处理层是对电网生成的大数据实施加工、分析等功能,加工处理、分析和统计运转事件信息。数据可视化展示层内有报表组件、图形组件、服务组件、数据组件等多功能展示模块,为运维检修的辅助决策功能提供技术支撑。

图2 供电服务指挥平台全局结构图

图3 数据集成示意图

在原始数据、生数据、熟数据变换过程中,过滤挖掘脏数据,同时采取数据溯源,有效查询脏数据源头,采取告警与整理,确保数据唯一性、完备性、关联性与合法性等质量需求。数据质量管理包含数据标准化管理、数据辨识校准、数据修正补偿、质量分析等内容,如图4所示。

图4 数据质量管理结构图

供电服务指挥平台遵照配电网全部数据规划分层架构,利用大数据可视化平台,满足配电管理人员与供电服务指挥人员的不同需要,将其划分成5个融合功能,平台功能结构如图5所示。

图5 平台功能结构

3 应用效果与分析

为准确掌握平台运行实际成效,提升供电服务指挥效率与质量,将本文供电服务指挥平台应用于某省电力公司中,自运行以来获得如表1所示的总体运行结果。

表1 使用前后运行统计结果

从表1可知,使用本文平台后,受理故障报修工单数量明显增多,且派单及时率高达99.99%,到达现场及时率为100%,客服中心退单个数为0,停电信息发布不准确、不规范、不完整数量为0。

这是因为本文采用了大数据分析可视化平台中的聚类技术,精准判别海量数据内不同供电派单内容,让供电服务指挥具备更优的操作效率与精确率。

对平台处理配电故障方面进行深入研究。通过用电收集系统监测的配电变压器低压侧电压值、线路供电网络拓扑图等数据,创建基于大数据分析可视化平台下的故障研判规则,规则详情如表2所示。

自运行以来,平台已发掘馈线断线故障1530次,主动推送抢修工单1530件,通过现场核查,精确率是100%。证明所建平台运用“五位一体”协同机制的有效性,充分满足供电服务指挥人员的工作需求。

4 总结

本文构建了基于大数据分析可视化平台下的供电服务指挥平台,该平台在配网故障判断、配电设备监测等方面可有效推进配网智能分析和辅助决策,完成配网故障抢修指挥工作模式向主动化诊断、可视化展示、智能化指挥管理等方向改变,增强用户用电服务质量,明确更多供电信息,为配电网的高效运转提供可靠支持。

表2 断线研判规则表

猜你喜欢

聚类可视化概率
一种傅里叶域海量数据高速谱聚类方法
自然资源可视化决策系统
概率统计中的决策问题
概率统计解答题易错点透视
思维可视化
自然资源可视化决策系统
一种改进K-means聚类的近邻传播最大最小距离算法
概率与统计(1)
概率与统计(2)
AR-Grams:一种应用于网络舆情热点发现的文本聚类方法