APP下载

基于不完全信息的工业园区多主体需求响应博弈策略研究

2024-02-27王惠锋孟祥东李宝聚王大亮陈厚合

电工电能新技术 2024年2期
关键词:申报收益容量

孙 勇, 王惠锋, 孟祥东, 李宝聚, 王大亮, 王 尧, 胡 枭, 陈厚合

(1. 国网吉林省电力有限公司, 吉林 长春 130022; 2. 东北电力大学电气工程学院, 吉林省 吉林市 132012; 3. 国网吉林省电力有限公司电力科学研究院, 吉林 长春 130021; 4. 国网吉林省电力有限公司长春供电公司, 吉林 长春 130021)

1 引言

需求响应(Demand Response, DR)作为智能电网框架下的重要互动资源,对于维护系统稳定性、减少电网公司投资、促进新能源消纳等方面起到积极作用。由于用户侧多能负荷的耦合程度日渐加深,且可调控资源潜力和用户用能偏好都与系统的高效运行息息相关,因此用户参与需求响应收益的准确建模、利益分配机制的选择和博弈过程分析都对于继续推进电力市场化改革以及良性的电力现货市场建设具有重要意义。

受惠于电力市场化进程早、电力金融体系相对完备和市场化自由度较高,国外在需求响应的研究中很早就使用了博弈论作为研究手段,并且展望了不同类型博弈在电力市场中不同领域的应用前景[1-4],国内相关研究也紧随其后。文献[5]结合非合作博弈探讨了需求响应在无功支撑和改善电网性能方面的影响,但对经济方面的考量则较为模糊。文献[6]以经济角度作为主要出发点,通过对售电商需求响应策略和补贴价格的制定,论证了在其模型下参与响应的各方都能够因此获利;在此基础上,文献[7]继续结合经济因素,针对风险厌恶型能源,考虑市场价格不确定性,提出一种双层两阶段模型以探寻电力零售商竞价策略和能源定价问题;文献[8]通过光热聚合商、多能运营商和用户三方的利益均衡,采用主从博弈架构,在有效提升用户侧用能满意度的同时,也在一定幅度上提高了系统的经济效益。文献[9]转而从发电侧角度出发,在模型方面作出改进,选择主从博弈与讨价还价博弈共同组成了双层模型,论证了机制上的部分改动可以进一步使博弈各方的经济效益显著提升,然而一定程度上忽略了用电侧作为需求响应主体的重要地位。文献[10,11]从家庭角度,使用了多周期微分博弈建立模型,采用0-1混合线性规划计算纳什均衡,给出了个人房主与电力供应商之间参与需求响应的博弈策略;文献[12]则完全从用户角度切入,设计了家庭之间的点对点能源交易,结合非合作博弈探讨了该交易下的动态定价策略,不过由于家庭用电只占电力负荷比重中较小的部分,意义上仍较为有限;文献[13,14]虽聚焦于需求侧,提出了多层博弈竞标模型和主从架构下的多微网综合需求响应方法,但具体到策略刻画上较为模糊;文献[15-19]虽主要聚焦于工业用户,采用了主从博弈来描述聚合商与用户之间的博弈关系并探寻了二者在此架构下交互的收益问题,但其中部分背景环境与国内电力市场现状仍客观上存在有一定差异,在参考价值方面具备一定的局限性。

总体而言,现有的研究在用户主动响应决策方面的描述尚不全面。譬如在目标群体选择上,大部分文献仅针对单一用户的响应策略,且忽略了用户在制定其响应策略时的有限理性;在用户用能消费的决策方面,现有研究通常通过考虑用户用能时的购买成本、参与需求响应的收益、补贴、市场消费剩余等因素来量化用户用能消费的估值,建立用户用能决策模型,但对于参与需求响应行为反映在用户自身之影响的刻画仍较为粗糙[20,21]。

本文引入Bayes博弈理论来研究用户参与需求侧响应的博弈行为,在按容量区分不同体量用户的基础上建立双层模型,构建了层间交互关系,设计了聚合商与用户的收益分配机制;最后通过算例分析,得到了在聚合商不同利益分配机制下,用户的合作策略倾向以及聚合商参与需求响应的价格和容量申报策略,分析了园区内需求响应对用户侧资源调控具有重要作用和意义,一定程度上可为工业园区内有意愿参与需求响应的各级各利益主体策略决策的制定提供部分参考和依据。

2 工业园区需求响应主体分析

2.1 需求响应交互结构

需求响应的参与者包括执行者与运营商两部分;执行者为用户侧的各类可控负荷,运营商可按角色分为三个主体:负荷聚合商、电力调度中心与电力交易中心。负荷聚合商负责聚合各类电力用户需求响应资源,参与市场化需求响应,为年用电量5 GW·h以上的用户(批发用户)和5 GW·h以下的用户(零售用户)提供服务;电力调度中心负责组织市场主体注册的安全校核、交易出清、评价考核、建设运维;而电力交易中心负责需求响应市场主体的注册申报、合同管理、信息披露、出具结算等[22]。运营商各主体间交互状况可从信息层和物理层两个层面上进行描述,如图1和图2所示。

图1 工业园区需求响应的信息层交互结构Fig.1 Information layer interaction structure for demand response in industrial parks

图2 工业园区需求响应的物理层交互结构Fig.2 Physical layer interaction structure for demand response in industrial parks

信息层交互是指整个系统内参与需求响应的全部主体,其信息流动的交互状况。如图1所示,园区内存在多个规模不同的负荷聚合商,每个负荷聚合商各自与园区内有意向参与需求响应的用户签订服务合同,在合同有效期内,聚合商代行参与需求响应。需要说明的是,大用户(批发用户)可以绕过负荷聚合商,直接参与负荷响应。

物理层交互则是考虑到了负荷聚合商的特殊属性——无实体。由于聚合商本身不提供任何负荷,只是其所代理的全部用户的负荷集合,因此在物理层面上实际只有一类节点,即电力用户,包括批发用户和零售用户。

综上所述,调度中心和交易中心可视为供电公司在参与需求响应管理过程中在物理层和信息层的两种表现形式;相对而言,前者更关注需求响应过程中的响应执行行为本身,而后者则更侧重于在经济层面对市场内用户的激励及其所产生的正面引导作用。

2.2 需求响应交易机制

本文根据我国现行工业园区中需求响应的商业模式,即交易中心-聚合商-用户三层结构,设定了需求响应采取邀约制,即:在用电高峰时,由于电力供应紧张,交易中心发出邀约在市场中寻求提供更多可用电能,试图弥补用电缺口;而在用电低谷时,由于供电能力盈余,交易中心发出邀约在市场中寻求消耗更多电能,以保证电网的经济运行。设置邀约在响应执行日2天前的上午发布,在需求发布后,各负荷聚合商和批发用户各自决定申报容量和申报价格,在邀约发布后12 h内完成市场申报,随后在市场出清过程中,按申报价格由低到高依次调用,报价相同时按截止时间前、最近一次申报时间的先后顺序依次调用,直至满足响应容量需求。出清容量按照全量中标,次日执行响应;在响应执行后、结果申诉前,还会进行响应评价并作出结算[22],该过程如图3所示。

图3 需求响应邀约机制Fig.3 Demand response invitation mechanism

3 园区需求响应的博弈架构构建

3.1 利益边界与双层模型

图3中,申报和出清两个步骤意味着不同的负荷聚合商之间必然存在利益冲突。且因为用户具有自主选择签约聚合商的权利,故对于聚合商而言应在博弈过程中尽可能多地击败其他聚合商,从而谋求获得更多的用户资源,并通过合理的利益分配机制将签约用户保持在自己名下从而最大化自身利益,这体现了聚合商作为商业机构本征存在的逐利性。聚合商、批发用户和零售用户三类博弈参与者参与需求响应的一般状态模式如图4所示,粗直线表示与交易中心进行需求响应行为时各参与者的利益边界,在博弈过程中会被不断推动,直至博弈达到均衡点时停止。

图4 参与需求响应的一般状态Fig.4 General state of participation in demand response

实际上,图4中的利益边界并非一种具象化的、物理存在的实体边界,而是用以表达需求响应过程中不同参与者收益流动的交互边界。图4中任意两条相邻的利益边界所夹围成的区域都可视为上层博弈中的一个对象整体,且该区域的全部收益来源均由交易中心提供,各扇区圆心角的比值即为园区内对应区域的市场份额之比。

在利益边界的动止问题上,本文拟通过不满意度机制的设置对用户与聚合商的合约关系进行更新,这意味着一旦合约关系发生变化,图4中某些区域原有的合作关系便不再能够维持原状(这表征为区域元素的变动),此即为驱动利益边界推动的原动力;而边界的推动过程本身则在次月的需求响应行为中体现,并且由于次月的合约关系表很大可能仍会发生变化,这意味着在次次月,边界仍会被再次推动;当且仅当达到博弈的均衡点,即所有用户都没有在次月改变运营商的动机(因为任何单方面的改动都无法获得更多收益)时,边界失去驱动力,变动停止。

整体博弈架构如图5所示,由于上层博弈中的所有参与者都直接从交易中心获取收益,而所获收益的总额取决于该次响应的出清价格,出清价格又与各参与者的策略决策(也即响应申报容量和申报价格)二者强相关,故任一参与者在参与响应的过程中,其策略决策都会影响其他参与者的收益,这是一种典型的多方非合作博弈[23]。又因为实际的出清结果中只公开中标容量和中标单价,竞争对手的其他信息对于博弈参与者而言是缺失的,无法对其申报策略产生明确的引导方向,故而该博弈是一种不完全信息博弈。

图5 园区需求响应双层博弈架构Fig.5 Bi-level game structure of demand response in park

而在亚结构视角的博弈下层,由于批发用户本身不具备组织其他用户参与需求响应的能力,零售用户若想要获得需求响应的收益必须与聚合商结盟;又因为聚合商并非园区内的用户,自身无法提供任何其所申报的响应容量,本质上其仅是一个由众多用户组成的联盟代理,以与用户签订合约的方式为联盟提供协议约束力,并对所获得的收益进行再分配,而后下发给其名下用户。这意味着在博弈下层,每一负荷聚合商的名下,都形成了支付可转移的合作博弈,也即在下层形成了多个合作博弈格局[24]。至此,一个由Bayes博弈作为上层、数个合作博弈作为下层的双层博弈模型得以构建。

3.2 模型层间关系与用户不满意度

3.1节提及推动利益边界的原动力是下层博弈中用户合约的改变,而促成该变化的原因涉及模型的层间交互过程以及不满意度机制的设计,其中用户的不满意度直接影响下层所形成的合作联盟。如表1所示,数字1表示对应行的用户与对应列的负荷聚合商缔结了联盟关系,否则使用数字0表示;合作联盟一旦形成,仅在本月全部单次响应完成后、下月需求响应开始前允许变更。

表1 下层合约关系表Tab.1 Lower level contract relationship table

当初始的下层合约关系表给定后,各聚合商的可响应容量上限随即确定。对用户而言,自身的博弈策略表现为合作对象的选择,而用户所提供的可响应容量会直接影响聚合商在上层博弈中的收益。当轮Bayes博弈后所产生的上层收益表见表2,表2中,r为用户的收益,R为聚合商的收益。

表2 上层收益矩阵表Tab.2 Upper level income matrix table

表1中,任意一个用户只能与一个聚合商在本月签订合约,表示与该聚合商名下的全部其他用户组成联盟,然后开始第i次迭代过程。由于在第i次迭代过程中的上层博弈时,申报的响应容量上限受制于第i次的合约关系表,而响应容量上限又会影响聚合商的申报策略,这进一步影响了其收益,改变了上层收益矩阵表中的元素,这就形成了下层博弈对上层博弈的影响。而在当次响应过程结束后,聚合商通过对已获得收益的再分配,来直接影响其联盟内每个用户的收益;若用户对分得的该收益不满意,就会在合约到期时改变其联盟对象,转投其他聚合商寻求合作,就会导致下层合约关系表中的元素的变化,形成了上层博弈对下层博弈的影响。

通过这种相互影响和不断迭代,两层博弈通过该机制建立起了内在关联,如图6所示。最终在经历多个子博弈均衡后,可以达到稳固的联盟关系,在该关系中,任一参与者脱离联盟都无法单方面获得较之前更高的收益,这一状态即为该博弈的一个Nash均衡点。而对任一聚合商而言,此时其即将采用的申报容量和申报价格,即是其全部动作策略的最佳反应,也称最优决策。

图6 层间迭代关系Fig.6 Iterative relationship between layers

由于用户对经负荷聚合商再分配后的、自身分得的利益未必达到预期收益值,因此可能会在次月更换其他合作聚合商以图获取更多收益,具体表现为用户对当前对象不满意度的积累到达一定程度时,对自身在下层合约关系表中相应的元素作出变更,以不满意度函数zk作为用户做出该变更行为的概率。不满意度函数如式(1)所示:

ak<1,bk>0

(1)

式中,ak和bk为不满意度函数参数,用来调节不满意度的影响权重;∑r(i)为用户i在本月内实际获得的全部响应收益;∑Er(i)为用户i在本月内期望获得的响应收益(与某用户自己响应容量绝对值最小的5位其他用户收益的算数平均值);ReLU(·)函数即线性整流函数作为激活函数对非正部分进行归零处理。例如当用户i在本月内实际共获得3万元,ak取0.8、bk取1时,随期望获得收益不同而引起的其不满意度的变化如图7所示。当且仅当博弈达到均衡点处且无外部条件改变时,所有用户都不会在次月主动改变自己的合作策略。

图7 期望收益变化引起的其不满意度的变化Fig.7 Changes in dissatisfaction caused by changes in expected earnings

3.3 用户收益分配机制

由于用户的收益实质上依赖于聚合商所获收益后再分配的过程,因此分配机制直接决定了用户收益和不满意度。本文在下层模型中的支付可转移的合作博弈中,拟设置五种利益分配方式:等分、按容量比例分配、按Shapley值分配、按核仁分配和等MDP(Modified Disruption Propensity, MDP)指标[25]分配五种。

(1)等分:联盟下每位参与者平等分割该联盟的联盟价值。

(2)按容量比例分配:参与者分得的收益与其组成联盟的容量成正比。

(3)按Shapley值分配:通过加权因子的控制,按照参与者的边际贡献进行分配。Shapley值具体计算如式(2)所示,式中变量详释见参考文献[25]:

[v(s)-v(s{i})]

(2)

(4)按核仁分配:通过对核的几何中心的求取,将表征核仁的向量映射回三维坐标。由于核的存在性满足了稳定分配的最低要求,保证了所有参与者在该分配下都不会脱离联盟,选择通过牺牲一定的经济性来确保联盟的稳定。

(5)等MDP指标分配:MDP指标是一种改进的破坏联盟倾向指标,用来表示某参与者拒绝合作所带给其他参与者的人均损失与自身损失之比,其核心思路是考虑让所有参与者的这种破坏联盟的倾向相等,来保证对分配的接受程度一致。具体公式如式(3)所示,式中变量详释见参考文献[25]:

(3)

对于用户收益分配机制的对比和分析将在算例部分进一步阐明。

4 基于日清月结的聚合商收益模型

4.1 聚合商收益函数

聚合商收益RLA采用日清月结的方式,其收益包括三个部分,分别为日前邀约需求响应收益RRI、可中断负荷交易响应收益RIL以及零售分成电费收益RRS,如式(4)所示:

RLA=RRI+RIL+RRS

(4)

其中RRI和RIL作为奖励响应收益,分别来自于两种不同的交易类型,而零售分成电费的收益RRS,则是来自于未参与响应,但享受了响应所带来的便利的各个用户所缴纳电费中的一部分。

如式(5)所示,日前邀约需求响应收益,主要是响应费用RRIDR和考核费用RRIA两部分构成,两项分别主要是围绕有效响应容量和无效响应容量来构建,本节各式中部分参数含义见附表1。

附表1 《广东省市场化需求响应实施细则(试行)》中部分参数设置App.Tab.1 Partial parameter in commercialized demand response implementation rules of Guangdong province (trial)

RRI=RRIDR-RRIA
=∑QECRI+∑[QI·max(M1CRI,P3)]

(5)

总体而言根据有效响应容量获得正的收益,根据无效响应容量获得惩罚,也就是所谓的考核费用。在约束上则要满足日前邀约的可响应容量能力约束,和日前邀约的非虚假申报约束如式(6)所示:

(6)

可中断负荷交易响应收益则是由备用费用RSP和调用费用RTR两部分组成的,如式(7)所示:

(7)

由于在单次响应过程中,如果某聚合商被当次调用,则备用费用部分不会获得收益,这意味着两部分收益不可能同时存在,故而使用调用状态函数u,令u=1表示调用,u=0表示未调用。约束方面则要满足可中断负荷的可响应容量能力约束和可中断负荷的非虚假申报约束,如式(8)所示:

(8)

以上各式中的无效响应容量QI和有效响应容量QE则按照式(9)计算:

(9)

式中,QF为实际响应容量;QBL为结算基线负荷;QR为实测负荷。在之前的实际响应容量求取当中,需要用到结算基线负荷,即未实施需求响应和有序用电时响应资源的用电负荷。进一步可以划分为五种制定类型,主要区别在于负荷样本数不同,其制定标准参考文献[22]中的附录部分。

零售分成电费由全月需求地区电力用户分摊费用与地区电力用户月度实际用电量的比值确定:

(10)

由于度电分摊费用无限增加是不现实的,所以在此基础之上设置度电分摊上限CT。在用户分摊费用RZU>CT时,当月不再组织日前邀约和可中断负荷交易,并且要按照折算系数K去等比例地调整响应收益。K具体值如式(11)所示:

(11)

4.2 博弈的数学表述及均衡存在性证明

对于聚合商之间的非合作关系,该Bayes博弈模型可以使用五元组Γ=〈N,S,Θ,p,u〉描述为:

i∈N+

(12)

在均衡解的存在性证明方面,Nash在Kakutani定理和Berge定理的基础之上给出了混合策略Nash均衡存在性定理,即:对策略式博弈G={N;S1,…,Sn,u1,…,un},若策略集合Si为Euclid空间的非空紧子集,支付函数ui关于策略组合s连续,则该博弈存在混合策略Nash均衡[25]。对于本文的博弈模型,由于策略集合来源于申报价格和申报容量两种不相干动作组成的二维策略空间,且二者在各自维度上均是连续的,故而其组成的二维策略空间也是稠密且连续的,所以策略集合显然为Euclid空间的非空紧子集;对于式(4)的收益函数,由于其三部分RRI、RIL、RRS都是连续的,故而其和也是连续的,满足该定理的全部条件,从而该博弈均衡解的存在性得证。

4.3 均衡求解方法

在均衡解求取方面,本文提出一种改进的虚拟遗憾最小化[26,27]算法,在动作空间内随机一个出来作为行动策略,依靠出清信息与实际收益来确定虚拟遗憾值,通过虚拟遗憾的梯度最速下降方向来对本轮内的、先前生成的策略来进行奖励与惩罚,奖励与惩罚的具体权重按照生成策略与出清信息的欧式空间距离来确定。当最小化平均整体遗憾值趋于0时,其所得的平均策略通过2ε-均衡定理认为近似收敛到纳什均衡策略[28]。该算法流程如图8所示。

图8 改进的虚拟遗憾最小化算法流程图Fig.8 Flow chart of improved counterfactual regret minimization

本文所提算法通过对策略使用遗憾值进行奖励或惩罚来不断自我学习,从而引导策略的生成倾向以较快的速度逼近平均整体遗憾更小的方向,并保证模型收敛性与求解效率。

5 算例仿真

本文算例采取2020和2021年广东省某工业园区邀约响应的实际数据。在收益模型部分,对第3节公式中的全部参数设置见附表1,其中,共统计了28个聚合商在2020和2021两个年度在本园区内共计1 585次需求响应中随机抽取5名聚合商响应的实际收益平均值,并在表3中给出了此5名聚合商若采用本文给出的策略所能取得的预期收益,而后将二者进行了对比。此外,全部28个聚合商的平均每次响应收益增长和平均每次响应收益增幅如图9所示。通过分析可以认为总体而言,多数聚合商如果采用了本文提出的策略,其平均收益对比采用策略前均会有所提升,仅有少数聚合商的收益一定程度上下降。

表3 部分聚合商实际收益与采用本文策略后的预期收益及对比Tab.3 Actual income of some aggregators and expected income after adopting strategies in this paper

图9 全部聚合商的平均每次响应收益增长和平均每次响应收益增幅Fig.9 Average revenue per response growth and average revenue per response growth across all aggregators

在策略曲线的变化趋势方面,以聚合商1为例,其申报策略曲线如图10所示。每个需求场景下,都包含其之前全部场景的历史数据,由图10可知,该聚合商的申报价格策略在第300次邀约响应场景附近开始趋于平稳,在经历了全部1 585次邀约响应的场景后最终在800元/(MW·h)附近小幅度波动;其申报容量策略在第380次邀约响应的场景附近开始趋于平稳,在经历了全部1 585次邀约响应的场景后,最终在3.5 MW·h附近波动但幅度较大,这是由于前文提出的不满意度机制作为一种变更合作关系的概率,会在一定程度上导致申报策略的波动。根据多次学习结果的统计,伴随着训练集数量的提升,其策略波动性会在一定程度上渐趋于平缓。

图10 1 585个需求响应场景下聚合商1申报策略曲线Fig.10 Curve of declaration strategy of aggregator 1 under 1 585 demand response scenarios

对于下层博弈的利益分配机制,为便于对比分析,现进行4处理想化处理:

(1)为排除用户在下层博弈中不完全理性所带来的对结果的不确定性影响,假设用户完全理性,即式(1)中的概率性不满意度zk使用式(13)中的确定性不满意度zk′来进行简化替代,概率性不满意度zk在此仅作为评价指标:

(13)

(2)用户i每月提供的响应容量上限恒定不变,即不随月份发生变化。

(3)聚合商用以分配给用户的总支付,占其全部收益的百分比固定不变,本文按照75%取值。

(4)不满意度冷却:用户不会在离开某聚合商名下后的相邻两个月内再回到该聚合商名下。

在此前提下,为方便对利益分配机制的分析,此处设置一新算例,选用表3中的五名聚合商作为园区内全部的可选聚合商,将每个聚合商都分配一种不同的收益分配机制,即在此场景下,园区内全部137名用户同一时间仅能选择这五名聚合商中的某一个进行合作。为了方便比对,这五类分配机制下的初始合作用户数量应尽可能保持一致,具体见表4。

表4 所选聚合商及其对应的收益分配机制Tab.4 Selected aggregators and their corresponding income distribution mechanism

图11和图12分别展示了五种不同分配方式下用户数量变化趋势和用户平均不满意度变化趋势。现对5种收益分配机制分析如下:

图11 不同分配方式下聚合商名下用户数量变化趋势Fig.11 Change trend of number of users under aggregator name with different allocation methods

图12 不同分配方式下聚合商名下用户平均不满意度变化趋势Fig.12 Change trend of average user dissatisfaction of aggregators with different distribution methods

等分:在该园区用户数量的规模下,由于初始合作的用户体量差异客观存在,而等分的利益分配方式总会妨害部分用户利益,使其不满意度维持较高状态,并且随时间的推移该变化呈升高趋势,引起客户持续流失直至用户数量下降至足够低的水平,此时采用该分配方式的聚合商被迫以极低的响应容量上限参与需求响应,其收益也持续走低。在此情形下,一旦用户所能提供的响应容量上限小于上层博弈中聚合商参与需求响应的响应下限时,该聚合商便不再满足需求响应的基本条件,失去次月参与上层博弈的资格,进而不再能获得任何收益,最终导致采用该分配方式的聚合商退市。

按容量比例分配:相比于等分的分配方式,按容量比例分配会在一定程度上降低用户的总体不满意度,但算例中受制于用户完全理性的理想化条件,用户数量流失速度并未有明显改善。总体而言可以认为在足够长的时间尺度内,机械地按照容量比例的分配方式仍会流失全部用户,直至聚合商退市。从博弈论中核仁这一概念的视角下来看,意味着前两种分配方式下的分配策略必然不在核中,即策略元素不是核范围内的元素。

按Shapley值分配:按Shapley值分配的方式实际上是按照参与者的边际贡献来进行分配的,作为一种平均主义思想的分配方式,对于用户而言相对较为公平。图12中该分配方式下的平均不满意度水平在全部五种方式中处于相对较低水平。总体来看其在用户组成上虽未必稳定,但能够提供的响应容量上限和与之强相关的收益必然相对平稳,可以认为是一种较为公平的分配方式。

按核仁分配:如图12所示,按核仁分配最为明显的特点是用户的平均不满意度能够维持在相对较低的水平,并且有缓慢下降的趋势。然而虽然其用户数量的增长水平较高,但仍以规模较小的小容量用户为主,其总提供容量上限的趋势仍不明朗。这意味着按照核仁分配收益的方式,虽在物理意义上较为明确(最小化最大剩余思想),也相对较为符合多数用户的决策理念,但随着其他分配方式下垄断联盟的形成,其稳定度在长时间尺度下也必然会下降,依然将存在退市风险。然而在理论上,如果在长时间内其他聚合商未能形成体量足够的联盟,该分配方式仍可认为表现优异,并在适宜条件下可以保持规模的缓步增长。

按等MDP指标分配:在该分配方式下,用户平均不满意度水平较高。由于该方式着眼于退出联盟给他人带来的损失与给自身带来损失的比值,意味着对于体量较大的用户通常能获得更低的不满意度,也即自身持有较高容量的用户更倾向于选择在该规则下与聚合商达成合作。实际上在本算例的限制条件下,该分配方式的优越性较难体现,但若用户池中不同用户持有容量的方差较大,且聚合商在上层博弈中的响应容量上限不会被限制在较低的水平时,则若采用该分配方式将会逐渐自发扩大其联盟的规模,并不断挤压其他聚合商的生存空间,如图13所示,在经历足够长的时间后将可能会形成垄断地位。

图13 取消响应容量上限前后使用等MDP指标分配对用户数量的影响Fig.13 Impact on number of users of MDP indicator allocation before and after canceling response capacity ceiling

综上所述,在园区内的聚合商仅有上述5类收益分配方式且满足前述4种理想化条件的场景下,等分和按容量比例分配的收益分配方式均会以不同的速度流失用户,造成联盟崩解导致对应的上位聚合商被迫退市,而其他3种利益分配方式能够在稍长的时间里维持相对稳定的运营状况,且各自有其特点;其中,按核仁分配在用户不满意度方面表现较好,按等MDP指标分配则可以在满足一定条件(较大的用户容量方差、申报响应容量上限足够高)时发挥优势形成垄断地位,而按Shapley值分配能在用户平均不满意度水平维持在较低水平的同时一定程度上缓和用户流失,是一种较为平衡的可选分配方式。

6 结论

本文从不同利益视角下出发,通过提出园区内全部需求响应参与者参与至需求响应过程中的利益关系并构建博弈架构,算例验证了所提方法的可行性与有效性,并得到以下结论:

(1)通过理论分析与推导,证明所提出的Bayes博弈模型存在均衡解,并应用一种改进的虚拟遗憾最小化方法求解,结果表明该算法具有较好的收敛效果,可以在部分信息不公开的情况下对博弈策略的生成进行引导。

(2)算例仿真结果说明本文通过引入博弈架构描述聚合商与用户在参与需求响应过程中的关系,能够提高聚合商的收益,通过收益维持已参与需求响应的用户继续参与需求响应,吸引未参与需求响应的用户参与到需求响应中来,改善用户用电模式,达到削峰填谷的作用。

(3)从聚合商视角下审视收益分配制度,若采用等分和容量比例方式均会在较短时间内发生退市,而随着用户容量方差、申报响应容量上限等外部条件的不同,按Shapley值分配、按核仁分配和等MDP指标分配三种分配方式各有优劣,仍需结合具体环境下的具体条件进一步计算才能保证所选择的收益分配方式可以持续运营。

附录

猜你喜欢

申报收益容量
“少年工程院活动校”暨“航天未来人才培养校”共同申报
螃蟹爬上“网” 收益落进兜
国际收支间接申报问答
怎么设定你的年化收益目标
《申报》与上海民国时期禁戏
2015年理财“6宗最”谁能给你稳稳的收益
2015年上半年我国风电新增并网容量916万千瓦
2015年一季度我国风电新增并网容量470万千瓦
改进等效容量法在含风电配网线损计算中的应用
如何解开设计院BIM应用的收益困惑?