基于K均值聚类算法的电力负荷分类研究
2017-12-19山东省青州一中苏浩尊
山东省青州一中 苏浩尊
基于K均值聚类算法的电力负荷分类研究
山东省青州一中 苏浩尊
本文在阐述负荷分类及典型行业负荷特性的基础上,以变电站综合负荷构成占比为负荷特性分类和综合的基本特征,提出了基于K均值算法的电力负荷分类模型。对湖南省48个变电站进行聚类分析,结果表明模型具有良好的聚类综合能力,具有一定的理论和应用价值。
电力系统;负荷分类;K均值聚类
0 引言
目前,电力系统结构日益复杂、规模日益庞大。需求侧负荷特性的多样化及其管理技术的广泛应用,使得电力负荷分类成为电力系统中基础且重要的工作[1]。作为电力系统规划、错峰管理、分时电价、负荷预测的基础,一种好的负荷分类方法能给电力系统提供准确、合理的依据和指导,对电力系统和电力用户均有益处。同时,随着我国电力系统的改革和市场化的推进,供电公司希望针对客户特点提供个性化的服务,对用户进行精准分类并认识各类负荷的特性变得十分重要。基于以上原因,本文进行电力系统负荷分类的研究和实践探索。
1 电力负荷基础
1.1 电力负荷的分类
(1)按物理性能划分
电力负荷按物理性能划分,可分为有功负荷和无功负荷。有功负荷指的是真实消耗掉的能量;无功负荷指的是在电能的输送、传递或转换的过程中建立磁场而消耗的功率,它并不做功。
(2)按电能的划分
根据电能的生产过程,电力负荷可分为发电负荷、供电负荷、用电负荷。发电负荷指的是发电厂实际发电的出力;供电负荷是指区域内的发电负荷减去厂用电负荷并且加上从区域外输入的负荷,再减去向区域外输出的负荷。用电负荷指的是地区供电负荷减去线路和变压器的损耗后的负荷值。
(3)按供电可靠性划分
供电可靠性能够将电力负荷划分为几个级别:一级负荷、二级负荷、三级负荷等。一级负荷如果中断供电将造成人身伤亡,或造成大型设备不可逆损坏,或对国民经济带来巨大损失。二级负荷如果中断供电将造成较大经济损失、影响重要单位的正常工作或公共场所秩序混乱。三级负荷指除一、二级负荷外的其他负荷,如果中断供电造成影响较小。
(4)按用途分类
按照电能的用途,电力负荷可以分为城市居民负荷、商业负荷、工业负荷、农业负荷、其他负荷等。城市居民负荷指居民的家用生活负荷;商业负荷指用于商业的生产、照明等负荷;工业用电负荷指企业等用于工业生产的负荷;农业负荷指从事农业活动需要的电力负荷。
1.2 电力负荷的特点
电力工业的产品即电能无法长期大量储存,电力的生产和消费必须同时进行。电力负荷主要有以下特点:
(1)电力负荷具有连续性。电力负荷不能突变,无论增长或降低必须渐变,表现为负荷曲线连续变化、没有奇点。
(2)电力负荷具有实时变化性。负荷数据不是恒定不变的,由于各种因素能够对负荷造成影响,所以其随时处在变化之中。
(3)电力负荷具有周期性。电力负荷对于季节、温度、天气是十分敏感的,会根据它们的变化而变化,所以从某种程度上体现出连续的相同的变化,呈现成一种周期性。
2 电力负荷特性
2.1 电力负荷特性指标
(1)负荷率
负荷率指标主要有日负荷率、月负荷率、季负荷率、年负荷率等指标[2]。
日负荷率定义为日平均负荷与日最大负荷之比,能够反映一天中负荷的不均衡性,受到用户的性质、类别、组成和系统内的各类用电占比等因素的影响,较高的负荷率代表电力系统运行的经济性较好。
月负荷率定义为月平均日负荷与月最大负荷日的日平均负荷之比,它与该月内发电厂生产人员是否停工休息、设备检修安排和发电用户数增减等因素有关,同时还反映出因生产作业顺序不协调或停电引起的停产等因素的影响。
季负荷率定义为全年各月最大负荷之和的平均值与年最大负荷之比,该指标反映了负荷的季节性变化,其中包含设备的配置、年度检修还有负荷的年增长率等因素。
年负荷率定义为年平均负荷与年最大负荷之比,反映产业的用电结构的变化。一般来说,年负荷率会随着工业用电比重的增加而增加,随着服务业和居民生活用电比重增加而减小。
(2)峰谷差
峰谷差指的是一段时间内最高负荷与最低负荷之差,一般是指有功值。峰谷差能够反映电网所需的调峰情况,可以用来选择调峰措施、制定调峰计划、为电源规划提供参考等。
(3)年最大利用小时数
年最大负荷利用小时数定义为年用电量与年最大负荷之比,能够反映负荷的时间利用效率。年最大负荷利用小时数与各产业用电负荷占比大小有关。一般情况下,工业用电负荷占比越大的地区,年最大负荷利用小时数越高,能够达到6000~6500小时;而第三产业用电和居民生活用电占比越大的地区,年最大负荷利用小时数越低。
2.2 典型行业负荷特性
电力负荷特性研究时,按照国民经济行业,可将电力负荷进行分为行业用电、居民生活用电两类负荷。行业用电负荷包括第一产业用电负荷、第二产业用电负荷、第三产业用电负荷[3]。
第一产业用电负荷主要指的是从事各种农、林、牧、渔业生产活动所需求的电负荷,它受天气、季节、气温等自然条件的影响非常大,稳定性较差。第二产业用电负荷主要指的是工业用电负荷,包括重工业、轻工业、采掘业等企业生产用电。这部分负荷一般较为恒定,受上述自然条件和季节的影响较小。第三产业用电负荷主要指的是商业活动用电,包括企业里的动力、照明、空调等负荷。这部分负荷会随着当地经济情况缓慢变化,但由于商业活动具有季节性、假日性,商业用电负荷也会随之波动。居民生活用电负荷主要指的是居民的日常家庭用电,它会随着该地区居民的数量变化而变化,并且随着经济发展呈现逐年增长的特性,具有较为明显的季节波动,日负荷特性与居民的生活、工作规律相关。
3 基于K均值聚类算法的电力负荷分类建模
3.1 聚类分析概念
聚类分析是一种将研究对象分为相对同质的组群的统计分析方法,广泛应用于解决多种数据量较大的量化分类问题。根据物以类聚的原理,在相似的基础上对样本进行分类的一种多元化统计分析方法。与普通分类不同的是,聚类分析是将样本归到不同的类的一个过程,要求同一个类中的元素有较大的相似性,而不同类之间的元素有较大的相异性。聚类分析是通过数据建模简化数据的一种方法。
3.2 K均值聚类算法
K-means算法是使用最广泛的一种聚类算法,它的目的是使每个样本与所在类均值的误差平方和JK达到最小。
(1)混合样本数目为n个,迭代次数I =1,选取K个初始的聚合中心,。
(3)计算个新的聚合中心:
4 实例分析
算例实验湖南省48个220kV变电站负荷特性数据。该数据为标准化的湖南省多个用电行业的负荷容量百分比(表1),详细数据参见文献[6]附录。
表1 部分变电站综合负荷特性数据
SPSS是科学界公认的优秀的统计软件[7],具有数据管理、统计绘图、统计报表和统计分析的功能。采用SPSS软件相关分析模块进行数据处理。
表2 聚类结果
聚类数需要提前设定,经过对比,将样本分为5类结果最佳,聚类结果如表2所示。
最终聚类中心计算结果如表3所示,表中数据按列查看,每列数据代表该分类中不同用电行业的负荷容量占总容量的百分比。可以看到,第一类变电站是以重工业负荷为主,约占45%,其次居民生活占21%;第二类变电站以居民生活负荷为主,约占55%;第三类变电站以农业负荷为主,约占41%;第四类变电站以居民生活负荷为主,约占37%,重工业、轻工业、农业所占比重相近,分别约为19%、17%、16%;第五类变电站以重工业负荷为主,约占62%,农业和居民生活分别约占14%和11%。
表3 最终聚类中心
5 总结与展望
本文以变电站综合负荷的用电行业构成比例为特征,提出了基于K均值算法的电力负荷分类模型,研究分析了电力负荷特性。结果表明该方法具有良好的聚类综合能力。成功地解决了负荷建模中变电站特性分类处理的问题,具有一定理论和应用价值。
[1]周开乐,杨善林.基于改进模糊C均值算法的电力负荷特性分类[J].电力系统保护与控制,2012,40(22):58-63.
[2]霍成军.电力系统负荷特性分析研究[D].天津大学,2007.
[3]韩丽娜.杭州地区电力负荷特性的分析及预测[D].浙江大学,2008.
[4]管宇.实用多元统计分析[M].杭州:浙江大学出版社,2011.
[5]周润景,张丽娜.基于MATLAB与fuzzyTECH的模糊与神经网络设计[M].北京:电子工业出版社,2010.
[6]李培强,李欣然,陈辉华,等.基于模糊聚类的电力负荷特性的分类与综合[J].中国电机工程学报,2005,25(24):73-78.
[7]朱红兵,席凯强.SPSS17.0中的正交试验设计与数据分析[J].首都体育学院学报,2013,25(03):283-288.
苏浩尊(2000—),男,山东青州人,现为山东省青州第一中学高二在读学生,研究方向是电力系统及其自动化。