面向配网台区的综合评价模型研究与可视化应用
2017-07-31刘飞贲树俊周嘉邓松毛艳芳冯鹏杨佩
刘飞,贲树俊,周嘉,邓松,毛艳芳,冯鹏,杨佩
(1.国网南通供电公司,江苏南通 226000;2.南京邮电大学,江苏南京 210000;3.全球能源互联网研究院,江苏南京 210000)
面向配网台区的综合评价模型研究与可视化应用
刘飞1,贲树俊1,周嘉1,邓松2,毛艳芳1,冯鹏1,杨佩3
(1.国网南通供电公司,江苏南通 226000;2.南京邮电大学,江苏南京 210000;3.全球能源互联网研究院,江苏南京 210000)
随着配电网规模的不断扩大,海量异构数据呈指数级增长,为了提高配电网的运维管理水平,解决配网建设、规划中的诸多问题。文中提出基于大数据、GIS、可视化技术,从配网最小单元台区入手,利用Kmean聚类分析、主客观权重加成、神经网络等方法建立配网台区综合评价模型,并利用可视化技术对评价结合进行多维立体展示,让工作人员快速定位问题,找出问题台区;从而对配网线路、变电站及整个台区的运维状态充分把握,提升问题异动分析的精确度,通过实践所提内容切实可行,能够对台区状态进行立体展示,促进整体配网运维与规划。
配网台区;神经网络;评价模型;大数据;可视化
随着配电自动化、用电信息采集等应用系统的推广,对于有千条馈线的大规模配电网,配电网中会产生指数级增长的海量异构数据[1],来源主要是生产数据和运营管理数据,其中,生产数据主要包括生产、发电量、电压等实时性数据,电网运营管理数据主要包括客户信息、电价水平、管理系统、销售电量、企业ERP等信息数据[2]。利用这些数据,对配网运行管理的水平进行综合评价。
目前对台区的评价多为针对单个指标的评价,比如电压合格率,但对某些特定类型的台区、用户,对电压合格率的敏感度不高,因此单独用电压合格率这个指标来判断该台区的好处有失公允。本文针对负荷特性对台区进行聚类分析,对每一类台区利用方差及专家主观权重加成,形成一系列指标的综合计算,得出结果,并通过神经网络不断训练、优化,完善评价模型。利用大数据强大的数据存储与计算能力,将每一天每一个台区的指标数据、评价数据保存下来[3]。基于GIS,从台区、线路、变电站、供电所等维度,结合时间维度,形成综合全方位立体式的展示。
1 综合评价系统
配网综合评价系统整体架构如图1所示。
图1 系统整体架构图Fig.1 System architecture diagram
如图1中所示,底层数据来源为用电信息采集系统、PMS(production management system,PMS)等。数据经采集系统处理后存入大数据平台,数据处理之前首先进行数据预处理部分,经过数据清洗、异常数据处理、数据归一化、状态估计及指标计算操作之后进行数据建模。主要的数据建模方向有台区指标权重动态生成模型和配电网台区指标评价模型;数据建模的过程中会对评价模型根据实时分析结果进行动态修正;数据分析模块,指标动态分析、运维管理分析、故障分析等多维度分析;可视化模块结合基于GIS的可视化手段,将指标、建模过程、评价过程、评价结果在地图上充分展现,刻画出精确形象的配网运行状态图。
1.2 数据抽取与预处理
采用数据存在于海量实时库中,以测点形式存放。分2步实现从海量实时库到Hadoop的抽取与预处理。1)利用Java程序实现对海量平台增量数据采集的功能,在本功能中,海量平台需要提供查询数据的接口,此接口应包含时间范围、表名、查询条件等参数,通过配置相应的参数来调用海量平台接口,以获取相应的数据。由于采用调用远程接口的方式来获取海量平台上的数据,所以会存在网络异常的情况,针对这种情况,利用记录时间标签的方法来解决,在执行获取数据的方法之前,先判断网络连接是否正常,如果不正常会记录相应的日志,并记录相应的时间标签,等网络环境正常时,根据记录的日期标签,重新执行程序,并重新获取此日期对应的数据。2)在将海量平台中的增量数据获取之后,那么就需要将数据导入到大数据平台。但在做这个操作之前,先校验一下获取的数据,是否正常,比如判断一下数据是否存在空值、负值的情况,这些异常数据将会被舍弃。导入时同样利用时间标签的方式解决网络异常的情况。
1.3 聚类分析
综合评价的第一步,先进行聚类分析。我们以配电网的最小单元台区为抓手,结合变电站、线路等指标,建立弹性的多层次的模型。为了更好地进行配电网台区评价建模,需要在现有配电网台区数据基础上配合人工判读构建配电网电台区自豪表的样本数据库。系统管辖范围内配电网台区数量众多,直接从配电网台区中选择一定数量的台区进行人工判读。构建配电网台区指标评价样本会导致样本数据的不均衡,无法真实反映所在配电网台区的运行情况,本系统中采用数据挖掘技术对现有的配电网台区进行聚类,根据聚类结果区分不同类别的台区;从每一类中选择若干条数据构成待建模的配电网指标评价样本数据表。
从底层用电信息采集系统,采集到的数据源中对数据进行预处理,然后做聚类操作。从数据库中提取的有功功率数据是来自所有配网台区的;不同台区之间功率值数据差异很大,直接聚类会导致数据量级的差异掩盖实际用电特征的差异,一般在聚类操作之前会采用公式1.1将原功率数据进行归一化处理[4]。具体的预处理过程如下:1)填充NA值、清除噪音数据,处理后数据如表1所示。
表1 预处理功率数据Tab.1 Pre-processing power data
2)功率数据归一化
其中:pij为某台区序号在统计时间范围内的功率均值;i代表表中的第i行;j为时间节点;pij即第i行的j时间点上的功率。代表对应id用户的最小功率,代表对应台区序号用户的最大功率。功率数据通过公式计算得到归一化[6]后的数据如下表2所示。
表2 归一化数据示例表Tab.2 Data uniformization example
使用K-means算法,将功率进行聚类[5],根据聚类后类间距离和类内距离的变化,选取最佳聚类个数为4。如图2和图3所示。
图2 类内距离变化图Fig.2 Inner class distance variation
图3 类间距离变化图Fig.3 Distance variation between classes
图2和图3分别表示聚类时的类内距离和类间距离变化图。其中图2表示随着聚类个数的变化,类内距离的变化情况;图3表示随着聚类个数的变化,类间距离的变化情况。综合2图,可以看出,当聚类个数大于4时,类内距离和类间距离变得比较平缓,所以本文选择聚类个数为4。
经聚类分析后,得到图4所示的4个类别的中心点曲线。
如图4聚类中心点图所示,可以将台区分为4类:第一类,在功率曲线方面,该类台区的用电有明显的双峰特征,上午用电属四类台区中用电量最高的一类,且包含的台区个数较少,说明该类台区的用户主要是各类公司、企业等用户;从地理分布来看,该类台区主要集中于各个区县的中心,经过台区配置信息表验证,该类台区的非居民容量最高,供售电量也是四类中最多的,说明上面的推断符合事实。第二类,在功率曲线方面,该类台区在早午时段有个用电小高峰,晚上用电量最高,且该类包含的台区数量最多,推测该类台区的用电对象为居民;从地理分布来看,该类台区广泛分布于各个区县,说明人口分布东密西疏;从台区的配置信息表验证,该类台区的居民容量最高,而非居民容量最低,充分说明推测和实际数据相近。第三类,在功率曲线方面,整体功率都偏低,且有规律性的波动,判定该类台区的用电量较少,台区的用户属空载;从地理分布来看,该类台区主要集中在某县区,说明海安县的空载用户较多;从台区的配置信息表验证,该类台区供售电量最小,这和推测的结果还是比较一致的。第四类,在功率曲线方面,该类台区有白天用电量较小,而晚间用电量较高,说明该类用户错峰用电,推测该类台区的对象主要是需要夜间错峰作业的工厂;从地理分布分布来看,该类台区在市区和工业发达区分布较多,其他区县分布较为稀疏;经台区的配置信息表验证,该类台区的供售电量偏低,居民容量最低,说明上面的推测可靠。
图4 聚类中心点图Fig.4 Clustering centers
1.4 综合评价
台区评价指标针对供电公司采集到的电压、电流和功率3种数据,经过数据清洗、去除N/A值等操作后提取包括电压合格率、峰谷差率、最小负荷率、负荷率、供电可靠性、三相不平衡率、功率因数、配变最大负载率8项数据指标。数据分析的流程如图5所示。系统测试阶段针对聚类特征为居民类别的50个台区的功率数据进行了分析。
从数据查询结果中提取数据对象,包括电压,电流及功率数据。对各个指标进行计算之后获得指标值。基于方差贡献度的综合评价模型方法,通过式2分别计算每个指标的方差,并通过公式3将其转换为权重。
图5 数据处理流程图Fig.5 Data processing flow
根据计算获得的动态权重,利用基于方差贡献度的方法式(4)来计算配电网台区的综合评价值
对准备好的数据进行数据建模,隐层个数的选择和最佳迭代次数的选择分别如图6图7所示。根据经验,随着隐层神经元[7]个数的变化,当误差第一次出现最小值时,对应的神经元个数即为最佳的隐层神经元个数[8],见图6。同理,为了寻找最佳迭代次数,随着迭代次数的增加,当误差变化逐渐变得平稳时,对应的迭代次数就是最佳迭代次数[9],见图7。
图6 隐层最佳神经单元个数选择Fig.6 Best choice of hidden layer neural unit number
图7 神经网络最佳迭代次数选择Fig.7 Best choice of neural network iterations number
在配网台区指标评价样本数据构建的基础上,针对每一个配电网台区评价特征分别采用神经网络来构建模型[10]。神经网络模型构造如下:
1.5 评价结果
评价结果为一个得分矩阵,如表3所示:
表3 评价结果表Tab.3 Evaluation result
表3中显示实际为运行良好、一般、较差的台区均能够实现正确分类。总体来看,模型的准确率达到:(28+1 493+29)/1 550=100%。
上述分析过程来看,其实模糊综合评价方法和神经网络方法两者的作用相似。采用模糊综合评价方法的原因是苦于现在没有历史的对于台区评价的值,所以借助综合评价的方法,根据历史的相关指标数据先计算台区的评价值[12]。在此基础上,训练神经网络,获取合适的权重值,使其能够对将来的台区做出评价。
考虑到现在采用台区评价的实现方法,无法从业务角度解释,尝试从关联分析的角度来说明各个指标和评价值之间的直接关系,在支撑度为0.1,置信度为0.8的水平下,共发现关联规则326条,具体的关联关系如下:
从图8可以看出,关联规则在左上角比较多,这部分关联规则的特点是支撑度较低而置信度较高,关联关系的两者同时发生的概率较低,但前项发生后后项发生的概率较大,且这部分关联规则的提升度也比较高[14]。充分说明:指标的变化对台区的评价值有明显影响[11]。当限制前项个数为2个时,还剩余关联规则6条,如下图9的规律
图8 关联规则散点图Fig.8 Scatter-plot association rules
图9 关联规则Fig.9 Scatter-plot association
三相不平衡率的减少会导致台区状态的变差,相反,三相不平衡率的增加也会使台区状态变好,说明三相不平衡率和台区的状态有极强的关联关系。从关联规则的图上来看,可以得出负荷率的增加会导致台区的状态恶化。
1.6 系统可视化
将配网指标、评价过程、评价结果进行可视化,结合GIS空间信息与基础数据,突出数据特征。
图10显示了部分典型可视化应用界面,a图为某台区一年的综合评价得分日历图,通过日历图可能清楚地看到评价的好坏及变化趋势;b图显示了台区聚类分析的结果,不同种类的台区按颜色区分,便于分析某一类台区的分布特性;c图为台区的采用数据展示,可以直观地看到电流、电压和功率的情况;d图为按台区分布自动勾勒出的所属变电站供电范围色块图,从更上层的角度去分析配网运行状态。
图10 可视化示例图Fig.10 Visualization example
2 总结
本文介绍了配网台区综合评价系统,特点在于根据负荷特性先将台区进行聚类,对第一类台区,赋予不同的评价指标与权重加成,同时结合大数据存储与计算能力,将明细数据进行保存,便于向上收敛,查看台中区所属线路、变电站等的状况,以做进一步深入分析;向下能探清明细,定位问题。在评价的过程中,可以发现一些规律,比如三相不平衡率、负荷率对台区打分的影响情况[15]。最后,在可视化方面,基于轻量GIS的展示,能够对评价结果一目了然[13]。当然,因为台区数量的庞大,几万个、几十万个点的同时渲染,会对浏览器造成一定压力,性能上会有一些的影响,如何优化展示性能,也是值得研究的内容。
[1]曹军威,孙嘉平.能源互联网与能源系统[M].北京:中国电力出版社,2015.CAO Junwei,SUN Jiaping.Energy internet and energy systems[M].Beijing:China Electric Power Press,2015(in Chinese).
[2] FANG Xi,MISRA Satyajayant,XUE Guoliang,et al.Smart grid,the new and improved power grid:a survey[J].IEEE Communications Surveys and Tutorials(COMST),2012,14(4):944-980.
[3]SONG Yaqi,ZHOU Guoliang,ZHU Yongli.Present status and challenges of big data processing in smart grid[J].Power System Technology,2013,37(4):927-935.
[4]杜强,孙敏.基于改进聚类分析算法的入侵检测系统研究[J].计算机工程与应用,2011(11):106-108,181.DU Qiang,SUN Min.Intrusion detection system based on improved clustering algorithm[J].Computer Engineering and Applications,2011(11):106-108,181(in Chinese).
[5]张少敏,赵硕,王保义.基于云计算和量子粒子群算法的电力负荷曲线聚类算法研究[J].电力系统保护与控制,2014,21:93-98.ZHANG Shaomin,ZHAO Shuo,WANG Baoyi.Research of power load curve clustering algorithm based on cloud computing and quantum particle swarm optimization[J].Power System Protection and Control,2014,21:93-98(in Chinese).
[6]张斌,庄池杰,胡军,等.结合降维技术的电力负荷曲线集成聚类算法 [J].中国电机工程学报,2015(15):3741-3749.ZHANG Bin,ZHUANG Chijie,HU Jun,et al.Ensemble clustering algorithm combined with dimension reduction techniques for power load profiles[J].Proceedings of the CSEE,2015(15):3741-3749(in Chinese).
[7]李智勇,吴晶莹,吴为麟,等.基于自组织映射神经网络的电力用户负荷曲线聚类[J].电力系统自动化,2008,32(15):66-70.LI Zhiyong,WU Jingying,WU Weilin,et al.Power customers load profile clustering using the SOM neural network[J].Automation of Electric Power Systems,2008,32(15):66-70(in Chinese).
[8]杜莉,张建军.神经网络在电力负荷预测中的应用研究[J].计算机仿真,2011(10):297-300.DU Li,ZHANG Jianjun.Research on power load forecasting base on neural network[J].Computer Simulation,2011(10):297-300(in Chinese).
[9]梁海峰,涂光瑜,唐红卫.遗传神经网络在电力系统短期负荷预测中的应用[J].电网技术,2001(1):49-55.LIANG Haifeng,TU Guangyu,TANG Hongwei.Application of genetic algorithm neural network for short term load forecasting of power system[J].Power System Technology,2001(1):49-55(in Chinese).
[10]师彪,李郁侠,于新花,等.基于改进粒子群-径向基神经网络模型的短期电力负荷预测 [J].电网技术,2009,33(7):180-184.SHI Biao,LI Yuxia,YU Xinhua,et al.Short-term load forecasting based on modified particle swarm optimization and radial basis function neural network model[J].Power System Technology,2009,33(7):180-184(in Chinese).
[11]ZHANG Suxiang,LIU Jianming,ZHAO Bingzhen,et al.Cloud computing-based analysis on residential electricity consumption behavior[J].Power System Technology,2013,37(6):1542-1546.
[12]CHICCO G,NAPOLI R,PIGLIONE F.Comparisons among clustering techniques for electricity customer classification[J].IEEE Transactions on Power Systems,2006,21(2):933-940.
[13]王德文,宋亚奇,朱永利.基于云计算的智能电网信息平台[J].电力系统自动化,2010,34(22):7-12.WANG Dewen,SONG Yaqi,ZHU Yongli.Information platform of smart grid based on cloud computing[J].Automation of Electric Power Systems,2010,34(22):7-12(in Chinese).
[14]LIU Youbo,LIU Junyong,ZHAO Yan,et al.Calculation of characteristic attributes of consumer aggregations based on multi-objective clustering[J].Automation of Electric Power Systems,2009,33(19):46-51.
[15]肖峻,崔艳妍,王建民,等.配电网规划的综合评价指标体系与方法[J].电力系统自动化,2008,32(15):36-40.XIAO Jun,CUI Yanyan,WANG Jianmin,et al.A hierarchical performance assessment method on the distribution network planning[J].Automation of Electric Power Systems,2008,32(15):36-40(in Chinese).
(编辑 张晓娟)
Research and Visualization Application of Comprehensive Evaluation Model for Distribution Network Substation Area
LIU Fei1,BEN Shujun1,ZHOU Jia1,DENG Song2,MAO Yanfang1,FENG Peng1,YANG Pei3
(1.StateGridNantongPowerSupplyCompany,Nantong260000,Jiangsu,China;2.NanjingUniversityofPostsandElecommunications,Nanjing 210000,Jiangsu,China;3.Global Energy Interconnection Research Institute,Nanjing 210000,Jiangsu,China)
With constant expansion of distribution network,massheterogeneousdatahasshownanexponentialgrowth.Inorder to improve the distribution network operation management and address problems in the distribution network planning and construction,this paper proposes that a comprehensive evaluation model distribution network platform should be built based on GIS,big data and visualization technology.The work starts with the minimum unit of the distribution network and k-mean cluster analysis,subjective and objective weight addition,neural network and other methods are used.The visualization technology can be used for a multidimensional stereoscopic display of the evaluation result,which enables the staff to quickly locate the problem and identify the fault substation area.The staff can thus be fully informed of the operation and maintenance status of distribution network lines,substations and the whole substa tion area,and analyze unusual actions more accurately.The fea sibility of the proposed model has been proved through practice.
distributionnetworkstationarea;neuralnetwork;evaluationmodel;bigdata;visualization
2015-12-11。
刘 飞(1974—),男,硕士,从事数据挖掘算法和技术研究;
贲树俊(1980—),男,学士,从事配电网规划管理、大数据分析研究;
周 嘉(1982—),男,学士,从事配电网规划管理、电网负荷预测研究;
邓 松(1980—),男,博士,副研究员,主要从事电力CPS安全,分布式数据挖掘等研究;
毛艳芳(1989—),女,硕士,工程师,从事大数据挖掘分析及数据可视化研究;
冯 鹏(1984—),男,学士,工程师,从事电力营销、运营监测管理等研究;
杨 佩(1987—),男,学士,工程师,从事大数据分析及可视化研究。
1674-3814(2017)05-0063-06
TM714
A
国家自然科学基金资助项目(51507084);中国博士后基金资助项目(2016M591890)。
Project supported by the National Natural Science Foundation of China(NO.51507084);China Postdoctoral Fund(NO.2016M591890).