基于主从博弈的激励型智能楼宇负荷调度*
2021-12-23刘江永林佳豪王雅慧刘西蒙宋慧娜
刘江永, 林佳豪, 王雅慧 , 范 律, 刘西蒙, 宋慧娜
(1. 湘潭大学 自动化与电子信息学院 湖南省多能源协同控制技术工程研究中心,湖南 湘潭 411105;2.国网湖南省电力公司永州电力局,湖南 永州 425000;3.湖南大学 电气与信息工程学院,湖南 长沙 410082;4.威胜集团有限公司,湖南 长沙 410205)
0 引言
不可再生的化石燃料消耗量日益增大,随之而来的环境污染也日益严重,影响着人们的生活和世界经济的可持续性,促使国家大力倡导可再生能源融入大电网,逐渐完善智能电网用电结构[1-2].
博弈论属于经济学手段,作为运筹学的重要组成部分,主要用来处理两方或两方以上利益冲突的问题.近年来随着智能电网的飞速发展,需求响应技术的不断提升,博弈论渐渐开始运用在需求响应中处理发电商、售电商和用电用户之间利益权衡的问题,成为一种有效的提供需求响应策略的新方法.文献[3]在用户需求不确定的情况下构建楼宇用电用户与售电之间的Stackelberg博弈模型,增加了需求响应的鲁棒性,双方各自获得相应的收益;文献[4]在考虑了售电商与用户之间需求不确定的情况下提出了一种电力市场模型,系统调度员根据双方之间的实时需求和实时使用定价的周期组合实现了有效电价策略,利用贝叶斯纳什均衡解决方案概念,提出了最优服务行为的启发式特征,以最小化峰值到平均水平或减少需求为目标求解函数;文献[5]利用非合作博弈和非理解斯塔伯格领导原则构建公共能源微电网优化模型,通过生成均衡解来得出主网络的需求响应资源进口数量,通过新西兰小镇验证此模型并实现能源的节省;文献[6]提出需求转移的多周期智能电网需求侧管理问题的博弈论模型,售电商与用户同时参与博弈,使用0-1混合线性规划法解决博弈的纳什均衡,并在分析纳什均衡的结构同时,也保持智能电网基础设施的生存能力和售电商与用户之间效用函数的顺序关系;文献[7]通过构建斯塔伯格构建微电网与用户之间的博弈模型,求两者之间的最优电价策略与用户用电行为.
本文通过平移可转移负荷用电时段来实现智能楼宇负荷用电行为,并加入了价格奖励机制鼓励更多用户参与需求响应.随着电力市场的逐渐开放与售电商市场的改革,用户开始可以自由选择售电商,因此,用户参与电力市场与售电商之间的复杂博弈行为必然会对需求响应造成影响,引入博弈论对售电商与用户用电行为之间的博弈行为建模,通过用户调转可转移负荷用电需求,售电商予以价格奖励来鼓励用户参与需求响应.
1 售电商与用户的主从博弈需求响应模型构建
通过主从博弈将售电商与用户之间的利益与用电关系结合起来,其中用户的最佳均衡用电方案通过构造概率演化博弈来求得,并综合考虑了双方之间的利益冲突关系,构造有效的主从博弈需求响应模型与价格奖励机制鼓励更多的居民参与需求响应.
1.1 转移负荷与价格补偿策略
为了体现需求响应在智能电网需求侧节省电能和缓解电网压力的作用还需考虑激励型需求响应.因此本章面向楼宇用户通过价格补偿机制的方式鼓励用户参与需求响应,用户通过改变可转移负荷的用电时间段来达到转移电网供电压力和节省电费的作用.
本文设定用户是通过概率的形式选择每时段售电商电价,所以设定用户i在t时段选择售电商m时转移可转移负荷的电量αi,n(t)如式(1)所示.
(1)
(2)
(3)
式中,Qi,n(t)为用户i选择售电商n后的总实际电量.由于用户i通过转移一定的可转移负荷用电电量来达到削峰填谷的效果,而导致其他用电时段出现的实际用电电量发生改变,所以这里定义用户i转移至其他用电时段选择售电商s的实际用电电量和售电商卖出的电量分别为式(4)和式(5):
(4)
(5)
式中:Qi,s(t′)为在t′时段用户i选择售电商s的总用电电量;qi(t′)为用户i的用电电量.
用户通过将一天中可转移负荷的用电时间段转移至其他时间段来得到售电商的奖励,其中用户从售电商处得到的补偿遵循文献[8]中的定律:
(6)
(7)
式中:PL,i(t)为售电商i的补偿价格;β和δ为与用电用户类型有关的常系数;qi,n(t)为在t时段用户i选择售电商n后的实际用电需求量.
1.2 效用函数
在本节中效用函数表示用户得到价格补偿后的电费花费和在转移负荷需求后的舒适度.本文包含多类用户和多售电商可供选择,其中智能楼宇小区中用电负荷在本章分为可转移负荷和不可转移负荷两种,通过智能电表来连通用电用户和售电商.
1.2.1 用户效用函数本文中用户参与转移可转移负荷得到的补偿Ri,n(t)和选择售电商后的用电成本Ci,n(t)分别如式(8)和式(9)所示:
(8)
Ci,n(t)=Pn(t)·Qi,n(t),
(9)
式中,Pn(t)为售电商n公布电价.
用电用户效用函数中不得不考虑用户在使用电量时的感受,因为如果用户在一个较差的用电时段使用可转移负荷,用户用电的满意度将受到极大的影响,从而影响用户参与转移负荷的补偿价格行为,为此先给出用户用电满意度表达式为:
(10)
式中:∂i,n(t)为每一个用户i选择售电商n后使用电量所带来的价值;γ为预设定值.
Ui,n(t)=Ci,n(t)-Ri,n(t)-Si,n(t),
(11)
式中,Ui,n(t)为用户总效用函数.
1.2.2 售电商效用函数售电商的效用函数由智能小区中所有用户使用的总电量、支付给用户转移负荷的补偿价格和从发电商购电所带来的购电成本表示,表达式如式(12)所示.
(12)
2 基于主从博弈售电商与用户的需求响应策略与求解
2.1 效用函数
智能小区包含多类用电用户,如居家类,上班类,商业类和空置类,本文在进行需求响应优化时不考虑空置类用户负荷的调度.在售电商与用户的博弈中,售电商希望通过制定合理的电价机制能得到更多的利润,而用户通过售电商公布的电价调整自身的用电习惯来达到有利于自身的最大利益.售电商和用户之间不是单纯的博弈关系,而是基于售电商公布电价后,用户对其做出相应的反应和行动,虽然双方有各自的目的,但是主要关系遵从主从博弈的原理,其中售电商是领导者,用电用户是跟随者,通过主从博弈来表达双方之间的关系并求取满足双方最优的均衡解.
先给出用户相对的最优策略,此策略中,用户根据售电商提前向用户公布的每一用电时段电价,来选择对自身有利的用电策略,从用户的角度,用户希望花费较少的电费达到更高的用电满意度;然后将该最优策略上传到售电商,售电商通过制定合理的下次电价来达到满足自身效益的最优策略,再将此最优策略公布给用户,以此往复求解最优策略,直到求出相对均衡最优解,表达式如式(13)所示:
(13)
2.2 演化博弈均衡策略
本节用电用户的每一用电时段用电电量与转移负荷情况通过演化博弈求出,演化博弈均衡策略通过文献[8]微分方程来求解:
(14)
(15)
(16)
2.3 均衡策略求解
基于售电商与用户构成主从博弈模型,具体求解操作步骤如图1所示.
图1 售电商与用户的主从博弈流程图Fig.1 Flow chart of master-slave game between e-commerce sellers and users
3 MOEA/D算法及其聚合函数
MOEA/D算法求解被分为N个子问题[9],经典的分解方法主要分为3种,本文主要采用切比雪夫的聚合方法.其中在切比雪夫法中,标量优化问题可以表示为:
(17)
图2 切比雪夫原理图Fig.2 Schematic diagram of Chebyshev
如图2所示,A和B点是由权重向量产生的子代点,C和D点是由权重向量产生的子代点,B点的适应度值小于A点的适应度值,所以B点支配A点;C点适应度值小于D点适应度值,因此C点支配D点.由于A与C、D点不属于同一权重向量产生,所以无法判断支配关系.
4 基于主从博弈的智能楼宇负荷优化调度仿真实验
本文算例仿真智能楼宇负荷通过3个售电商、5个用电用户来代表.其中5个用户中,居家类、上班类、商业类比例设为3∶1∶1,本算例中将一天用电时段分为24个时段,以一个小时为用电时段,可控负荷设置中,可转移负荷与其他负荷的比例设为1∶4.
算例仿真参数设置为:售电商计划电量为用户初始用电平均值,售电商购买电价单价为0.3元/千瓦小时,不同用户选择售电商n用电价值∂i,n(t)为[4,10]中的随机数值,用户满意度函数中预设值γ设为0.5[10],政府规定售电商公布价格范围为[0.3,1.2]元,转移可转移负荷中的补偿价格系数β为0.2,δ为0.1[8],判断主从博弈迭代中是否达到均衡时的阀值设为10-3,售电商购买电量为总用户在每个时段下的一半,5个用户初始计划用电电量如图3所示.
图3 三类用户的初始计划用电电量Fig.3 Initial planned power consumption of three types of users
从图3中可以看出3个居家类用户用电电量差距不大,在10时至14时期间和18时至21时期间用电量增多;而上班类用户白天用电量相对较少,商业类用户白天用电量较多.
售电商公布的初始电价通过智能电表传达至家庭能源管理系统( Home Energy Management System,HEMS),然后将信息传送给用户,用户通过自身的效用函数做出有利于自身的用电行为,再将最优用电行为通过智能电表上传至售电商,售电商依据自身效用函数对电价做出相应的改变,最终经过双方博弈达到均衡用户用电行为最优解与售电商最优电价策略,本实验通过三类5个用户,向3个不同的售电商购买电价做出自身最优的用电行为,主从博弈均衡用电行为策略用电量对比见图4、图5和图6.
图4 居家类用户博弈均衡用电电量对比Fig.4 Comparison of game equilibrium power consumption of home users
图5 上班类博弈均衡用电电量对比Fig.5 Comparison of game equilibrium power consumption of office users
图6 商业类博弈均衡用电电量对比Fig.6 Comparison of game equilibrium power consumption of business users
从图4博弈均衡用电电量分析可以得出,居家类用户初始用电量相较于博弈均衡后的用电量要多.博弈均衡得出的用电行为策略增加了早上6时至9时,而降低了中午高峰电价时期的电量.其中总用电电费从17.23元降至14.75元,用电峰谷差从3.535 1 kWh降至3 kWh.
上班类用户用电量在夜间18时回家之后急剧增长,特别是在19时之后随着基础负荷的急剧增长导致用电高峰的转移.在博弈均衡用电行为策略中,提高了上午9时至11时的总体用电,降低了中午高峰电价电量.总用电电费从29.24元降低至27.37元,用电峰谷差从2.787 kWh降至2.333 kWh.
商业类用户在白天上班时期用电较多,其中用电负荷主要包括电动汽车、照明负荷、打印机、电脑和饮水机等.经过博弈均衡后得出的用电策略提高了上午6时至8时的用电电量,降低了9时至11时期间和14时至18时期间的总体用电电量.总用电电费从16.02元降至13.63元,用电峰谷差从2.702 kWh降至2.547 kWh.
主从博弈经过售电商与用户用电的不断竞争博弈,用户通过售电商不断改动的价格与转移负荷的价格补偿策略行为,做出有利于自身用电电费与舒适度的用电行为,在本实验满足小于两次迭代中阀值10-3时得出均衡售电商最优电价策略,如图7所示.在图7中3个售电商通过三类5个用户的用电行为最终形成各自实时电价售电曲线.
图7 3个售电商博弈均衡电价策略Fig.7 Game equilibrium price strategy of three e-commerce sellers
5 结论
本文从激励型需求响应入手对售电商和楼宇居民之间利益冲突问题做了研究,引入主从博弈理论构建售电商与用户之间的主从关系,并构造双方各自的效用函数,通过用户在用电时段转移可转移负荷的行为,售电商予以价格补偿的方式将激励型需求响应引入到智能楼宇负荷优化调度中,再利用MOEA/D算法对初始用户最佳用电行为做出指导,将其通过智能电表上传至售电商,售电商依次构建新的电价策略,依次往复最终形成均衡最优电价策略解和用户用电行为策略解.