APP下载

基于朴素贝叶斯的电网用户行为分析*

2020-06-04胡昌斌李迎丽万上英张思路

沈阳工业大学学报 2020年3期
关键词:贝叶斯用电聚类

胡昌斌, 张 亚, 李迎丽, 万上英, 张思路

(中国南方电网 云南电网有限责任公司, 昆明 650011)

随着我国经济的快速发展,2018年全社会用电量已达68 449亿千瓦时,同比增长8.5%.而电力需求具有时段和季节紧缺的特点,与电力能源即发即用的特点相矛盾,导致用电低谷时期大量电力资源的浪费[1].目前,各电力公司根据用户需求响应的不同提出了不同的有序用电措施,如基于行政手段的需求响应、基于激励的需求响应和基于价格的需求响应方式[2-3],实施有序的电力资源管理措施是保障供用电平稳和优化电力资源配置的有力手段[4-5].

为了有效掌握和管理用户的实际用电需求,需要充分分析与掌握用户的用电行为,并从用户用电负荷数据中挖掘出其中蕴含的用户用电行为特征.文献[6]在电力营销分析中使用聚类算法将供电企业分为不同的组别,并根据各组别的特点设计了不同的电力营销策略;文献[7]结合决策树模型和时间序列数据来预测电力系统负荷;文献[8]根据用电客户的行为、属性、偏好和需求等因素将客户进行细分,以提供有特色和针对性的服务,实现客户高效、便捷的管理;文献[9]针对用户行为与夏季气温变化的特点,采用二次聚类算法总结气温变化对用电行为的影响;文献[10]结合云计算和K均值聚类方法实现了典型用电行为的分类.上述方法主要研究用户用电行为的影响因素,并未细化到用电行为特征分析与用电行为影响机理中,严重限制了电力公司需求响应和能效评估工作的开展[11-13].

本文使用机器学习方法深入挖掘用户的用电数据,提出了一种基于朴素贝叶斯分析的电网用户行为分析模型.该方法首先构建不同用电模式下用户的用电负荷特性指标,然后,使用朴素贝叶斯分类器提取出影响用户用电行为的主要因素,并使用某纺织企业在2018年48个时间点的负荷数据进行了仿真验证.

1 电网用户用电行为分析

本文采用基于时间维度的数据分析方法,将负荷数据表示为特征向量,并对其进行贝叶斯分类.具体包括:数据预处理、用户用电行为模式分析和用电行为模式的影响因素与影响机理分析3部分.

1.1 指标选择与预处理

电网负荷指标多种多样,根据不同的研究目的选择不同的分析指标,将会对负荷分类结果产生较大影响.目前,电力系统负荷指标体系主要分为曲线型和数值型两种,其建立涉及到日、月、年等时间段,传统描述指标有:描述类、比较类和曲线类这3种.日平均负荷、日最大/最小负荷和日峰谷差绝对值属于描述类指标;日负荷率、日最小负荷率和日峰谷差率为相对量,属于比较类指标;而日负荷曲线为曲线类指标.除了这些传统描述指标,目前也提出了一些新型负荷特性指标:

1) 可中断/可削减的持续时间.设备在响应客户需求过程中,满足基本需求的持续响应时间.

2) 爬坡速率.终端设备在单位时间内可以削减或增加的额外功率.

3) 负荷可调能力.在补偿有限的情况下,对负荷的控制是否能通过电网技术实现.

4) 负荷可调整时段.终端设备能正常开启并响应用户需求的时间段.

本文主要研究用户和企业单位正常生活、生产时的日用电特性,所选用的指标体系需要能较准确地反映企业单位的生产特性、生产班次和用电性质.本文使用用户若干时段的负荷数据作为指标,然而这些数据通常存在诸多噪声和异常值,因此需要首先对其进行预处理.使用数据平滑技术来减少噪声数据,即

(1)

(2)

(3)

式中,ε为常数阈值,取值为1~1.5.对异常数据的修正计算式为

(4)

1.2 基于模糊C均值聚类的用电模式分析

为了区分不同的用电模式,本文先使用最短距离聚类法得到初始聚类中心,然后使用模糊C均值聚类判断用电模式.

在最短距离聚类法中,类间距离的计算表达为

DKL=min(d°i,j∶gi∈GK,gj∈GL)

(5)

式中:DKL为类别GK,GL的类间距离;gi为采集到的用户每天48点负荷数据;d°i,j为元素gi,gj间欧式的距离.

将得到的聚类中心作为模糊C均值聚类第一次迭代的初始值,并确定模糊C均值聚类的隶属度矩阵,即

(6)

(7)

式中:uij为元素i与元素j间的隶属度;m为总的类别数;q为权重系数,且有q∈[1,∞);ei为聚类中心位置.

基于隶属度函数可以确定价值函数为

(8)

基于上述步骤可以将电力用户的用电模式聚类为m类,并在此基础上预测各用户的用电行为.

1.3 用户用电行为模式分析

本部分使用贝叶斯分类器建立起日期、气温等因素与用电行为模式之间的关系,并以此为基础分析,预测出用户的用电行为模式,具体计算流程如图1所示.

图1 用户用电模式分析流程Fig.1 Analysis flow chart of electricity consumption modes of users

具体计算分为3个步骤:

1) 准备阶段.使用相关分析量来检测两输入特征的关联程度,从而删除冗余数据,分析表达式为

(9)

本文将所有观测日的特征量组合成特征元组x={x1,x2,…,xl},并将其分为训练集和测试集.

2) 贝叶斯分类器训练.假设每个类ci(i=1,2,…,m)的先验概率为P(ci),并假设各类别相互独立,即

P(x1|ci)P(x2|ci)…P(xl|cl)

(10)

式中,xk为元组x的第k个特征分量.对于特征量x,需要考虑其为连续值还是离散值.

当特征量x为连续值时,假设其服从高斯分布,即

P(xk|cl)=f(xk,μci,σci)=

(11)

式中:μci为第k个属性分量的均值;σci为第k个属性分量的标准差.

3) 分类器评估.本文考虑到用户用电模式的多样性,使用贝叶斯理论公式计算得到用户各种用电模式,即

P(c1|x)c1(t)+…+P(cm|x)cm(t)

(12)

式中,Ds(t)为用电负荷.

1.4 用电行为模式的影响因素与影响机理

在识别出用户的用电模式后,使用主成分分析法识别出影响用户用电行为模式的影响机理和影响因素,具体步骤为:

1) 设共有n个待分析样本,其在m个观测日的样本矩阵为

(13)

式中,xij为观测日i上的第j个特征的观测值,对特征样本进行归一化变换则有

(14)

2) 求相关矩阵R,矩阵各元素的求解表达式为

(15)

式中,x′jh为观测日i的第h个特征经标准化变换后的观测值.

3) 使用特征方程|λI-R|=0计算矩阵R的特征值,得到特征值λj(j=1,2,…,n),并可以得到每个影响因素的方差贡献率,即

(16)

本文取方差贡献率较大的前10个分量作为主成分,即用户用电行为模式的主要影响因素.

2 仿真测试与分析

本文以某纺织企业的用电数据进行仿真测试,选取该企业在2018年全年每日的48点负荷数据与该地的气候信息构建数据集.仿真平台使用惠普Envy13-d025tu笔记本电脑和MATLAB软件进行数据处理.

本文共采集了6.45 GB用电数据,为加快数据的处理速度,将数据读取出来并分成不同的数据块进行分片式处理.经预处理后,可以得到将近10 MB的用电特征数据.本文将这些数据划分为44 000条训练数据和9 000条测试数据.

本文通过分析电力数据的负荷特性(如日负荷率和日峰谷差率)可知电力负荷的变化具有一定的时段性,而且峰谷存在阈值,结合这些值的变化情况来对用电行为进行聚类.本文将该企业的用电行为进行聚类,其中,峰谷差率主要有6种数值:(0.494 932,0.022 945),(0.399 645,0.027 304),(1,0.205 298),(0.972 414,0.051 151),(1,0.040 948)和(0.979 239,0.961 661),因此本文将用户的用电行为聚为6类,聚类结果如图2所示.从图2中可以看出,各用电模式最高负荷的分布不同,其中模式类别2的最高负荷在5 900~6 100 kW,而模式3的最高负荷不到1 000 kW.

图2 不同用电模式聚类结果比较Fig.2 Comparison of clustering results under different electricity consumption modes

基于上述聚类结果,本文分析了气温对用户用电模式的影响,针对该地区的平均气温情况,将2018年的气温分为8个不重复的区间,根据聚类结果可以得到气温与用电模式及其概率的分布情况,如表1所示.通过分析表1的数据可知,气温变化能明显影响用户的用电模式,如用电模式6只存在于温度区间[7 ℃,12 ℃]和[27 ℃,32 ℃];而用电模式3在[32 ℃,40 ℃]时不存在,而在其他温度范围时则均有使用.

表1 气温与用电模式的关系及其概率Tab.1 Relationship between air temperature and electricity consumption modes and respective probability

本文同时使用贝叶斯分类法和聚类法对用电模式进行负荷预测应用,表2所示为本文预测不同工作日情况下的用电模式概率.从表2结果可以看出,本方法在贝叶斯方法的基础上,结合气候条件和工作日变化,可以估算出用户的用电负荷大小.充分验证了本文方法在分析用户用电模式时的有效性,为电力系统的调控与运行提供了一种合理、有效的手段.

3 结 论

本文提出了一种基于朴素贝叶斯分析的电网用户行为分析方法.该方法使用模糊C均值聚类将电网用户的用电数据聚类为6种不同的用电模式,并使用贝叶斯分类器分析气温对用户用电行为的影响.使用MATLAB软件对某企业48点负荷数据的仿真测试结果表明,本文所提出方法在分析用户用电模式方面效果较理想,为电力系统的调控和运行提供了一种合理、有效的方案.

表2 不同工作日情况下的用电模式概率Tab.2 Probabilities of electricity consumption modes in different working days

猜你喜欢

贝叶斯用电聚类
一种傅里叶域海量数据高速谱聚类方法
基于贝叶斯定理的证据推理研究
基于贝叶斯解释回应被告人讲述的故事
对输配电及用电工程的自动化运行的几点思考
用电安全要注意
面向WSN的聚类头选举与维护协议的研究综述
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
改进K均值聚类算法
基于Spark平台的K-means聚类算法改进及并行化实现