数据驱动的电力市场研究:挑战与展望
2023-02-02郭鸿业郑可迪唐庆虎房曦晨陈启鑫
郭鸿业,郑可迪,唐庆虎,房曦晨,陈启鑫
(1. 电力系统及发电设备控制和仿真国家重点实验室,清华大学,北京市 100084;2. 清华大学电机工程与应用电子技术系,北京市 100084)
0 引言
自2015 年启动新一轮电力体制改革以来,中国的电力市场建设稳步推进,取得了一系列重要成果。2021 年,全国市场交易电量3 778.7 TW·h,占全社会用电量的比重达到45.5%,再创新高。目前,以中国广东、山西等8 个省区为代表的第1 批电力现货市场试点地区,已实现了不间断结算试运行,并计划于2022 年开启正式运行。包括中国江苏省、河南省等在内的第2 批电力现货试点地区也已陆续公布了市场运行细则。
与此同时,电力市场相关领域的研究热点不断凸显,研究热度稳步上升。主要关注点包括价格分析[1]、个体决策[2]、博弈均衡分析[3]、市场机制设计[4]等诸多领域。在建设新型电力系统的愿景下,风电、光伏、电动汽车、储能、产消者等新型主体将成为电力市场的一般化主体。一方面,要求对于现有的电力市场体系、机制、规则进行革新与完善;另一方面,对这些新主体自身的市场化运营与交易也提出了新的挑战[5]。
电力市场领域的研究规则始于20 世纪90 年代,至今已发展了30 余年。传统的研究思路从经济学的角度出发,使用包括微观经济学、计量经济学、博弈理论在内的模型方法对电力市场中的个体行为[6]、市场状态[7]、关键变量[8]进行研究。常用的技术路线是基于完全理性假设对市场主体进行建模[9],将个体最优报价决策过程建模为有约束的优化问题[10],并联立多个市场主体模型分析市场博弈均衡过程[11]。此类方法数学形式清晰、经济意义明确、可解释性强,已成为电力市场研究领域的最为广泛的研究思路,取得了大量理论成果。
然而,传统基于经济学理论模型的方法也存在一定的局限性。例如,这类方法在建模过程中,为了确保研究的理论完备性和数学可解性,经常对市场主体的决策[12]和市场运行本身[13]进行大量简化,对市场主体包括理性程度、信息利用能力、决策偏好在内的个体行为深层逻辑进行理想化假设。因此,基于大量简化与假设的传统模型在研究电力市场的过程中,将不可避免地与实际场景产生偏差,导致传统的电力市场研究思路难以指导电力市场的实际业务场景。
事实上,传统研究方法的局限性与其发展的时代有着密切关系。过去,电力市场数据公开有限,也缺乏相应的数据分析方法,故传统研究方法难以结合实际数据开展研究,更不用说对海量数据的正确、高效利用。近年来,随着电力市场数据的开放和数据驱动研究方法的发展,基于实际市场数据分析市场运行状态、消除信息不对称、描述主体交易行为变得更为可行。而基于数据的电力市场研究也逐步体现出自身的独特价值,其研究成果应用范围广、可用性强,对传统的电力市场研究方法形成了很好的补充。
基于数据的电力市场研究,可以称之为数据驱动的电力市场研究。其为广大市场主体参与实际市场交易提供了新的指导思路,为市场运营商监测市场运行提供了新的观察视角,为市场制度设计者模拟市场提供了新的实用性工具,具有重要的意义。例如,在个体行为分析方面,文献[14]面向海量市场主体的交易数据,提出自适应报价聚类算法,提炼个体报价典型模式,实现对海量主体报价行为特点的高效分析;在市场分析方面,文献[15]面向高维电力市场供给曲线数据,提出高效整合与关键信息提炼的方法,并实现了未来市场竞价态势的准确预测。
为此,本文针对近年来兴起的数据驱动的电力市场研究进行介绍,旨在对数据驱动的电力市场的研究基础、进展、挑战进行系统化的梳理,并探讨未来研究的发展方向与应用潜力。
1 电力市场相关领域研究现状与局限性
自21 世纪初以来,世界范围内开始广泛的电力市场建设,同时涌现了大量针对电力市场开展的研究。根据电力市场中的研究对象进行划分,针对不同对象开展的研究大致可以分为4 类,分别是市场状态参数研究、投标优化决策、市场均衡分析与市场机制设计。
在市场状态参数研究方向,主要开展针对影响电力市场运行的关键状态边界及市场运行结果的研究,前者包括系统、母线、节点负荷[16]、新能源出力、电力合约等,后者包括系统与节点电价[17]、机组出清量及系统潮流[18]等。根据研究结果的不同,可以分为分析类与预测类,其中前者侧重于分析边界量的特点或与其他因素的关系,后者侧重于给出未来时段的预测值。针对这个问题,学界采用了多种技术方法。最初,通常采用基于统计学的方法;之后,逐步使用基于计量经济学的模型,如向量自回归(vector auto-regression,VAR)模型、向量误差修改模型(vector error correction model,VECM)、广义自回归条件异方差(generalized autoregressive conditional heteroskedasticity,GARCH)模型等;目前,随着机器学习与深度学习的发展,相关技术也被逐渐应用于该领域。例如,前几年引入使用的支持向量机(support vector machine,SVM)、随机森林(random forest,RF)等方法,以及近年来逐渐得到应用的卷积神经网络(convolutional neural network,CNN)、长 短 期 记 忆(long short-term memory,LSTM)等模型。
在投标优化决策研究方向,主要开展从市场主体视角对报价决策进行优化以实现个体更高收益的研究。根据研究主体的区别,可以分为以传统类型发电主体为研究目标,包括火电厂、水电站等,或以可再生能源发电主体为研究目标,包括风电、光伏等。近年来,也逐渐出现更新的发电主体概念,如园区[19]、微网[20]、综合能源发电商[21]、新能源汽车[22]、虚拟电厂[23]、分布式可交易能源[24]等。在参与市场的假设上,现有研究主要将市场主体分为价格接受 者(price-taker)[25]和 价 格 影 响 者(pricemaker)[26]2 类,前者一般适用于份额较小且自身报价对市场价格影响较小的主体,后者一般适用于市场份额较大或自身报价对市场价格会产生明显影响的主体。在研究方法方面,大体可分为2 类:一是使用传统的优化模型,建立线性或非线性模型,然后采用多种优化方法进行求解[27];二是使用机器学习理论中的强化学习模型,建立个体决策模型并与市场模型充分互动后,获得最优的报价决策。
在市场均衡分析研究方向,主要开展从市场组织者视角对特定市场环境下多个主体的行为互动及其产生的市场结果的研究。根据研究假设的不同,可将现有研究整体分为非合作博弈和合作博弈2 类,前者常用于研究批发市场多类型、多个体的发电侧主体博弈[28],后者近期亦常用于研究配电网侧或微网内的多个产消结合的主体博弈[29]。根据研究假设的不同,会采用不同的建模方法。例如,在非合作博弈假设中,常采用纳什古诺(Nash Cournot)博弈[30]、贝叶斯纳什均衡[31]、斯塔德伯格(Stackelberg)博弈[32]、主从博弈[33];在合作博弈中,常采用纳什讨价还价(Nash bargaining)博弈[34],并通过夏普利值(Shapley value)[35]或Vickrey-Clarke-Groves(VCG)理论[36]计算参与合作的多个体贡献,并基于此分配收益。
在市场机制设计研究方向,主要开展从市场设计者视角对市场现有机制进行修改或提出新的机制,以更好地实现激励相容的研究。根据研究对象的不同,市场机制设计研究可以分为多种类型,如针对电价机制[37]、出清流程[38]、结算方法[8]进行设计。除此之外,还会对电力市场存在的难点与症结进行针对性的研究,如市场串谋[39]、市场力抑制[40]、发售一体控制[41]等。近年来,随着新能源的快速发展,新型电力系统建设迫在眉睫,包括分布式新能源、储能、虚拟电厂等新要素大量接入电力系统,现有的市场机制将不再适用。为了应对这一挑战,涌现了大量市场机制设计研究,如针对分布式主体[42]、储能[43]等。
事实上,目前电力市场领域的4 个主流研究方向中,除了市场边界预测研究是针对特定数据(如电价、潮流等)开展的研究,其他3 个方向的研究的核心均为市场主体行为。其中,报价优化决策研究是尝试实现个体行为的最优化,市场均衡分析研究是将多个个体建模并分析相互间的互动关系,市场机制设计研究亦需要在给定机制下模拟个体行为以验证所提方法的有效性。
然而,传统的研究方法对市场行为建模通常采用微观经济学的理论模型,为确保研究的理论完备性和数学可解性,对市场主体和市场本身进行了大量理想化的假设和简化。具体而言,对市场主体包括理性程度、信息利用能力、决策偏好在内的个体行为深层逻辑进行理想化的假设,如假设所有主体在决策过程中能够充分利用市场信息,以实现自身利益的最大化为目标,完全理性地进行报价;对电力市场组织规则进行大量简化与理想化假设,如为了实现求解将机组的多段报价简化为一次函数,假设市场公布包括系统拓扑、个体具体投标信息等;对市场所在电力系统的建模进行大量简化,如不考虑网络约束、爬坡约束等。这些大量存在的假设与简化导致传统方法的研究结果与实际情况契合度差[44]。
这种理论假设与实际市场间存在的偏差,大大限制了相关研究在实际电力市场中的应用效果,无法满足实际市场多业务场景的需求。因此,在很多实际市场的运行评估与机制设计流程中,还充斥着以专家经验法为主的决策模式,缺乏为基于实际数据的研究提供理论支撑。
为此,电力市场研究领域逐渐涌现出一批面向市场实际数据开展的研究,其在传统假设的基础上,充分挖掘市场数据中隐藏的信息量,并将其应用于电力市场领域几个方向的研究。
2 实际电力市场的信息发布与数据开放
近年来,许多电力市场的交易数据逐渐公开化,大量的真实运行数据在市场运营商的网站上被定期分类发布,并向全社会开放。这些数据包括市场出清价格、系统供给与需求、公开或匿名化的市场主体投标及出清情况、检修运维情况等。当然,由于市场政策的不同,不同地区的电力市场的数据公开程度有所区别。为此,本章将对各国电力市场数据情况进行介绍。
2.1 电力市场相关数据介绍
本节将从研究者的角度出发,详细介绍目前各主要电力市场的数据公开情况和获取方式。
1)美国PJM 电力市场
美国PJM 电力市场长期以来被认为是规则完备、信息披露充分的典范,其市场数据的格式和含义说明详细完整,数据细粒度较高,具有较高的研究价值。但近年来,PJM 将其数据获取接口整合进了其所开发的Data Miner 2 的应用程序接口(application programming interface,API)中,并限制了非会员的使用。由于PJM 会员资格目前仅限于美国境内少数实体机构,研究人员获取PJM 的数据也不再容易。
具体而言,PJM 的数据获取渠道主要有2 类:
(1)一是数据快照(Data Snapshot)[45]、数据浏览 器(Data Viewer)[46]和 数 据 地 图(Interregional Data Map)[47]等短期(7 日以内)数据查询和可视化工具。这些数据渠道主要可供用户查看市场近期的负荷、电价等指标的时空分布趋势,但不提供历史数据以供数据挖掘。
(2)二是数据挖掘器(Data Miner 2)[48],其提供了种类更为丰富的历史数据获取API,并附带了详细的数据含义和格式介绍。尽管调用API 需要会员权限,但是Data Miner 2 开放提供了一个用于查询和浏览数据的预览窗口,可以查询并导出一日或者数日的数据。
受监管的限制,PJM 在数据的公开上较为谨慎,一些较为机密的数据都没有公开或者延迟公开。不公开的数据主要有:机组输出功率和中断、节点负荷和系统网架空间信息。发电商的个体报价信息则是延迟4 个月公布,并且对其信息进行了匿名化处理。弹性负荷的需求报价信息更是延迟6 个月公布,并且只公布聚合后的总需求曲线。
2)美国CAISO 电力市场
美国CAISO 电力市场的数据公开程度和获取便捷程度也较好,所有人都可以从其数据开放平台(Open Access Same-Time Information System,OASIS)[49]中使用网页检索或者以API 方式下载所有的历史数据。但CAISO 的数据文档并不完善,API 的调用逻辑也较为复杂,给获取数据带来了一定的困难。另外,CAISO 也在其网站中提供了部分数据的可视化展示[50],主要包括负荷、供给、电价和碳排放等曲线数据,也提供便捷的时序检索和导出功能,在一定程度上弥补了其API 使用困难的缺点。CAISO 的数据公开情况与PJM 类似,在此不再赘述。
3)美国MISO 与SPP 电力市场
美国MISO 电力市场的数据公开程度较高,其历史数据均以文件列表的形式罗列在网页中,可供直接下载[51]。具体而言,其数据按照时间分为档案数据和活跃数据,前者为距今2 年以前的数据,并按照月份进行压缩整理,后者为近2 年内较新的数据,且每日更新最新的数据表。美国SPP 电力市场的数据公开方式与MISO 类似,其提供了一个专门的网站(Integrated Marketplace)供用户按时间下载各类数据文件[52]。
MISO 与SPP 的数据获取也较为容易。尽管MISO 没有专门提供API 供用户批量读取数据,但其数据文件的下载地址相对简单、固定。同时,MISO 也提供了相应的参考文档,用于解释其数据格式和含义,帮助用户开发下载工具。
4)欧洲统一电力市场
欧洲现已逐渐形成统一的欧洲电力市场,其大部分电力现货交易发生在欧洲能源交易所(European Power Exchange,EPEX SPOT)[53]。
EPEX SPOT 的公开数据仅有近2 日内的市场价格曲线,其余数据均在其定制的各种数据服务产品中,用户需要付费获取。这些数据服务主要是各类报价和聚合报价数据,按照国家和数据内容分类,按需订阅。
另外,欧洲输电网运营商还提供了一个数据公开平台(ENTSO-E Transparency Platform)[54],用户免费注册后就可以浏览和下载所有历史数据,数据的公开程度和文档详细程度也较高。该平台提供多种数据下载方式,较为便捷的方式主要有2 种:一是在数据浏览界面筛选指定国家/价区和时间,然后直接导出,最多可以同时导出一年的数据;二是通过平台提供的文件传输协议(file transfer protocol,FTP)对数据文件进行复制下载,在批量下载大规模数据时,该方式更为便捷。此外,由于该平台的数据实际上来自各国的输电运营商贡献,早期平台不完善时(2015 年及以前),各价区的数据未完全整合,这部分数据按价区分别单独提供。
ENTSO-E 平台的数据主要是电网层面的边界数据,如负荷、发电、输电等,市场方面仅有平衡市场的部分调频备用报价曲线和聚合曲线,没有报价数据。
5)北欧电力市场NordPool
NordPool 主要运营北欧电力市场,与EPEX SPOT 一样,NordPool 也提供数据服务产品,用户付费订阅后,可以通过API 或者FTP 的方式自动快速获取实时数据或者历史数据。与EPEX SPOT 不同的是,NordPool 的数据展示网站[55]上可以查询历史数据并进行导出,也有时间范围更久一些的数据以文件列表的形式提供下载。
NordPool 的公开数据主要是市场报价和交易数据,如小时级日前/日内市场的聚合能量报价,出清电价和供给/需求曲线,但没有个体报价数据。由于NordPool 仅运营市场部分,其公开数据也不包括区域的总负荷、发电等信息,这与美国的情况有所不同。
6)澳大利亚国家电力市场AEMO
澳大利亚电力市场是目前数据公开最完整、最透明和最及时的电力市场,其数据获取方式也较为便捷。 AEMO 提供了一个专门的数据网站(NEMWEB)[56],网站上包含了所有数据的含义格式说明和下载链接。与MISO 类似,其数据也按照距今时间远近分为当前报告(Current Reports)(近1 个月)、档案报告(Archive Reports)(近1 年)和数据模型档案(Data Model Archive)(1 个月以前)。
在数据开放范围上,AEMO 最鲜明的特点是其开放了未隐名的个体报价和出清数据,且这些数据仅延迟1 日发布。相应地,这些未隐名的个体具有唯一的机组编号(DUID),且可以根据相应的机组注册信息查询其装机参数、燃料类型甚至是空间坐标,便于与各类外源数据进行关联分析,具有较高的研究价值。此外,AEMO 也公开了诸如负荷预测、出清电价等市场边界和结果数据,但AEMO 的出清和结算与美国市场常用的链路管理协议(link manager protocol,LMP)机制不同,其按区域出清,整个市场只有5 个价格区域。
2.2 市场数据公开与可利用情况
本节将对各市场的数据公开和可获取情况,按照数据类型进行分别总结,如表1 所示。
表1 典型电力市场中各类数据的可获取性对比Table 1 Availability comparison of various types of data in typical electricity markets
1)市场边界数据
市场边界数据主要是负荷预测值,是其市场内外各相关方进行相关决策的重要依据。各市场基本上都会及时、完整地公开负荷预测数据,其数据细粒度取决于各市场的出清和结算时间段设置。具体而言,PJM、CAISO、MISO、ENTSO-E、AEMO 都提供小时级的分区负荷预测值,且提供系统针对同一时段的负荷在不同时间做出的预测结果。AEMO还提供了概率负荷预测的区间值。
大部分市场也都根据其量测结果发布了实际负荷值和实际发电量,其时空分辨率与负荷预测值基本一致。部分市场还会提供按照电源类型细分的发电量曲线(generation mix)。
风电、光伏出力也是重要的市场边界数据。PJM、CAISO 均提供短期的全系统风光出力预测值。例如,PJM 会公布未来6 h 的10 min 分辨率短期风电、光伏出力预测值,以及事后统计的风光实际出力。
2)市场行为数据
市场行为数据主要分为个体层面的报价曲线和群体层面的聚合供给/需求曲线。前者因涉及隐私的原因,大部分市场都不公布或者延迟隐名公布;后者聚合自市场中所有个体的行为,对隐私的影响略小,有部分市场仅公布聚合后的报价情况。
具体而言,公开个体报价曲线的市场有PJM、CAISO、MISO、SPP 和AEMO,除AEMO 外其他都经过了隐名和延迟处理。允许虚拟投标的几个美国市场也公开了虚拟报价的报价曲线,但SPP 仅公布报价节点上虚拟报价曲线与其他所有报价聚合后的报价曲线,给分析带来了一定的困难。
聚合供给/需求曲线在一定程度上反映了市场的供需关系,对市场研究也有一定的帮助。除了可以从市场公布的全部报价曲线自行计算外,有的市场还专门公布了聚合后的结果。PJM 公布了负荷需求的聚合曲线,以及虚拟报价的供给/需求聚合曲线,NordPool 也公布了全市场的供给需求聚合曲线。
3)市场结果数据
与市场行为类似,市场结果数据也主要分为个体和群体2 个部分。
个体层面的市场结果主要是发电商的出清/调度出力,或者虚拟投标的收益情况。这部分数据往往涉及隐私,鲜有市场公布。目前,仅有AEMO 延迟一日公开各发电商的实际中标和调度结果,且既有能量市场,又有各辅助服务市场。
群体层面的市场结果主要是节点电价或区域电价。各市场根据其出清规则,均有公布出清电价信息。例如,PJM 公布了所有母线和区域的日前和小时前市场的节点电价,CAISO 还公布了节点电价的不同分量(能量分量、阻塞分量等)的具体值。
4)市场保密数据
综合各国情况,电力设施位置、节点负荷大小、个体出清结果一般是不公开的保密数据,而个体报价数据往往会隐名且延迟公开。AEMO 则公开了所有电力设施的位置,并且未隐名的个体报价数据仅延迟一日公布,市场数据透明度最高。
3 数据驱动的电力市场研究现状
数据驱动研究与传统研究方法的区别主要体现在以下几个方面。在研究基础上,数据驱动的电力市场研究的基础是市场数据而非普适的经济学原理;在研究假设上,数据驱动的电力市场研究通常基于实际市场边界条件,较少像传统电力市场研究中使用较强的假设;在研究对象上,数据驱动的电力市场研究的范围更为广泛,除了类似传统电力市场研究是从已有知识建立模型并进行分析以外,还增加了从实际数据逆向发现知识的研究类型;在技术手段上,数据驱动的电力市场研究的方法通常是建立基于计算智能的模型开展研究,而非传统电力市场研究方法使用基于物理与经济学假设模型开展研究;在解决问题上,数据驱动的电力市场研究方法基于实际数据开展,较传统电力市场研究具有更高的实用性和更广的适用性,能够解决许多电力市场实际生产环境中的痛点问题。
随着电力市场数据的逐渐丰富和数据驱动研究方法的不断发展,近年来,数据驱动的电力市场研究不断涌现,其在电力市场的四大研究领域均取得了一定的研究进展与实际应用。为了让读者能够更好地理解当前数据驱动的电力市场研究进展,本章尝试对电力市场研究现状进行综合介绍。
3.1 数据驱动的市场状态参数研究
数据驱动的市场状态参数研究主要服务于市场组织者或参与者对影响市场运行的关键状态边界的预测和未知市场运行结果的感知。这些状态参数关系到市场组织或电力交易决策的开展,主要可划分为4 个类别,分别为市场负荷预测、出清电价和阻塞预测、系统供需态势预测、电力市场状态感知等。其中,前两者是较为传统的研究方向,在电力系统预测领域中也已经有了较为成熟的研究体系,在本文不再进行介绍;而后两者,即系统供需态势预测与电力市场状态感知,则是由于数据驱动方法的发展而产生的新研究主题,本文在此进行着重介绍。
1)系统竞争态势预测
系统竞争态势是指全市场整体供给和需求的价格敏感状态,较传统的系统供需信息增加了价格信息。通常意义上,竞争态势可以由总供给曲线(aggregated supply curve,ASC)或 剩 余 需 求 曲 线(residual demand curve,RDC)刻画。其中,ASC 为市场所有机组报价曲线的累加,RDC 则为其他主体供给曲线和系统负荷需求曲线之差。以ASC 和RDC 为代表的系统竞争态势信息,通常被用于市场价格影响者的报价决策过程,是最优报价决策中重要的边界条件数据。
与负荷或电价的预测相比,ASC 或RDC 是以曲线或函数进行描述的,其数据本身具有非结构化的特性,为这类研究的主要难点。早期的ASC 与RDC 研究通常基于人造数据。文献[12]提出了一种基于动态贝叶斯网络的RDC 预测模型,但将RDC 简化为线性函数的形式,与实际的RDC 形式差别较大。文献[57]使用基于马尔可夫链蒙特卡洛方法和贝叶斯推断法对ASC 进行预测,其ASC 以分段线性的方式进行建模,相应的参数被认为是系统的隐藏状态,并通过电价和交易电量等可观测参数对其进行估计。文献[58]以二次函数形式对机组供给曲线进行建模,并使用神经网络对二次函数的参数和个体报价行为进行预测,在小规模系统中,通过个体报价曲线的累加实现了ASC 的预测。以上研究虽然有一定的效果,但其使用的人造数据与实际偏差较大,在实际市场中的适用性有限。
近年来,研究者尝试使用电力市场的数据开展ASC 与RDC 的预测研究,并取得了不错的效果。文献[59]使用图像序列的形式保存ASC,并使用LSTM 进行预测。文献[60]提出径向基函数近似的方法来表征ASC,并使用意大利市场的数据进行了实证研究。文献[15]使用高维向量对ASC 进行离散化,随后使用主成分分析(principal component analysis,PCA)实 现ASC 的 降 维 处 理,并 使 用LSTM 对降维后的特征进行预测,在美国MISO 市场的数据上验证了算法的准确性。
2)电力市场状态感知
电力市场状态感知是指市场主体通过可公开获取的数据(如电价数据)感知或者估计电力市场的拓扑等状态数据,有助于市场主体理解节点电价和出清结果的变化规律。
在此领域,目前有许多研究进行了初步的尝试。文献[61]提出一种在线的电网拓扑估计方法,通过稀疏恢复、半正定优化以及交替方向乘子法(alternating direction method of multipliers,ADMM),基于实时LMP 数据可以实现电网拓扑的恢复和线路变化的追踪。文献[62]进一步使用已知的部分拓扑信息和LMP 数据在线剩余拓扑情况,明显提升了准确率。文献[63]使用逆向优化的方法从LMP 数据中恢复了电网输电线路和阻塞状态的参数,并使用MISO 市场的数据进行了实证分析。文献[64]对LMP 的空间分布进行了研究,指出其阻塞分量具有子空间特性,基于该特性对阻塞状态和阻塞参数进行了非监督式估计。文献[65]利用LMP 数据对市场各节点的阻塞特性进行估计,并使用聚类方法筛选出关键阻塞节点,实现了金融输电权的投机交易。
在传统的电力市场最优报价研究中,通常假设决策者已知市场未来竞争态势及电力系统拓扑结构,并在此基础上进行最优报价决策。但在实际电力市场中,由于信息不对称问题的存在,这2 项信息通常并不会直接开放给市场参与主体。因此,传统的最优报价决策研究普遍存在研究数据基础要求过高、实际应用能力差、适用性过低等问题。本节所综述的方法,从2 个维度解决了传统电力市场研究中存在的边界数据假设过强的问题。基于对系统竞争态势预测和电力市场状态感知而开展的电力市场最优报价研究,为最优报价决策方法提供了有效的数据基础。
3.2 数据驱动的投标决策研究
电力市场主体的投标竞价决策问题是电力市场参与者的一类核心问题。近年来,数据驱动方法在此类问题中发挥了重要作用,通过市场数据实现了能量投标和虚拟投标的决策优化。
在能量投标方面,由于主体类型的不同,数据驱动方法侧重的建模对象亦不同。例如,针对负荷聚合商或需求响应主体,有研究使用数据驱动方法实现其灵活性资源的建模,并嵌入自身优化模型中求解[66-67];对更通用类型的主体,则更注重直接通过数据驱动模型给出最优的投标建议,如文献[68-69]。考虑到研究的广泛适用性和参考价值,本节主要对后一类研究进行综述。
目前,投标决策中主流的方法是基于强化学习,也有部分研究使用了神经网络等回归方法直接进行拟合。文献[68]针对可再生能源交易中涉及的2 个主要步骤,即预测(包含出力和电价的多目标预测)和交易优化问题,讨论了单独训练预测模型、联合训练预测模型、直接使用极限学习机(extreme learning machine,ELM)拟合投标量3 种情况下的收益情况。在第3 种基于ELM 的方法中,预测和交易优化被合并为一步,并提升了主体收益。文献[69]提出了基于深度强化学习的策略性报价方法,使用深度确定性策略梯度(deep deterministic policy gradient,DDPG)对主体决策行为进行训练,可以给出连续的投标结果,解决了传统强化学习对决策空间离散化而产生的维数灾难问题。文献[70]使用重复博弈对市场过程进行建模,并基于连续动作强化学 习 自 动 机(continuous action reinforcement learning automata,CARLA)实现了发电商在有限信息环境下的报价,该模型不依赖于任何竞价对手或系统信息即可收敛至解析纳什均衡点。文献[71]进一步使用Dyna 结构改进了CARLA 的训练过程,提升了其在实际报价中的易用性。文献[72]使用优势行动者评论家(advantage actor-critic,A2C)算法实现了电力零售商的策略性报价,并能同时考虑批发侧购电价格和电力用户行为的不确定性。文献[73]提出了基于多智能体Nash-Q 强化学习算法的交易策略,实现了电-气综合能源市场竞价优化。与之前强化学习类决策研究不同,文献[74]是采用监督学习进行数据驱动决策的研究,其建立了基于自动编码器和LSTM 的深度学习模型,通过历史数据和扩充数据对模型进行训练,以在面对不同市场边界条件时得到发电商的最优报价决策。
总而言之,神经网络等方法更适合静态模型的拟合,而大多数强化学习的方法则依赖于主体与市场出清过程的迭代,因此,可以较好地拟合市场出清这一复杂的动态过程。然而,强化学习的收敛性是值得关注的问题,若方法需要数百次迭代才能收敛到最优,则可能无法及时追踪市场的动态变化。
在虚拟投标方面,目前的研究主要针对金融套利者开展,通常假设主体为金融主体而忽略了主体的其他特性,其决策中的主要约束为预算约束。文献[75]提出了基于先验风险最小化的虚拟投标在线学习方法,并使用离散集合动态规划方法降低了算法复杂度,通过美国PJM 和NYISO 的10 年电价数据验证了算法有效性。文献[76]基于美国CAISO市场的虚拟投标实际数据,提出了结合3 类策略优点的综合策略,可以显著提升虚拟投标收益。文献[77]建立了多区域多时段虚拟投标模型,并使用条件风险价值(conditional value-at-risk,CVaR)对投标的风险进行量度,随后使用深度Q 网络算法实现了该复杂问题的求解,基于美国PJM 市场的算例数据表明,该方法可以获得稳定盈利。虚拟投标获利的本质在于日前和实时市场的价差,现有数据驱动方法更注重通过对价差分布的追踪实现获利,鲜有研究实现虚拟投标对价差造成影响的建模。虚拟投标决策空间较大,可以涵盖大部分节点和聚合节点,故该方面的建模将涉及高维数据的处理,是目前研究中的难点。
与传统投标决策研究通常基于传统优化模型不同,数据驱动的投标决策研究通常基于强化学习等机器学习方法。由于普遍采用梯度下降类求解算法,无须再受制于传统优化方法在求解过程中需将模型转化为线性形式所带来的限制,可以在问题建模的过程中对实际的市场环境与电力系统运行过程进行更准确的刻画。这极大地提升了最优报价决策方法研究的有效性与实用性,为相关研究在实际市场业务中的应用提供了更多可能性。
3.3 数据驱动的博弈均衡研究
数据驱动的博弈均衡研究方向主要可细分为2 个类别,分别是市场主体行为建模、市场运行模拟与博弈均衡分析。其中,市场主体行为建模的研究重点在于利用实际数据来提升主体建模的精准度与可信性,实现行为模拟与预测等功能;市场运行模拟与博弈均衡分析的研究重点则转移至市场整体,实现市场的整体态势感知或博弈动态演进分析等功能。
1)市场主体行为建模
本研究方向根据适用范围可以分为2 类:第1 类为个体行为模拟,侧重分析市场个体与外界的行为交互,或外界边界条件的变化对于个体行为的影响;第2 类为个体行为预测,侧重分析个体在确定的市场环境下,未来某时某刻的具体行为状态。
在个体行为模拟方向,机器学习中的强化学习是主要使用的技术手段,通常采用如下研究框架。首先,使用马尔可夫决策过程对个体参与市场交易的过程进行标准化建模;接着,根据待模拟个体的特点定制某个强化学习模型;然后,将个体模型与市场进行互动,实现个体行为的模拟。详细的研究方法可见文献[37],在此不再展开。按照采用的模型不同,可分为基于强化学习的个体行为模拟研究[78]和基于深度强化学习的个体行为模拟研究[79],两者的模型虽然有一定的区别,但其实际建模过程与模拟结果并无太大的区别。按照马尔可夫建模的不同,可以分为离散行为空间的个体行为模拟研究与连续行为空间的个体行为模拟研究。前者中,个体行为通常被分为多个离散的行为模式,个体投标模型基于训练好的策略,在多个离散的行为模式中选择一个,具有代表性的包括Q-learning[80]及其衍生模型,如深度Q 网络(deep Q-network,DQN)等。其缺点在于行为空间有限,模拟模型具有一定的局限性;优点是不同行为模式之间彼此独立,可以采取比较复杂的形式,如阶梯分段容量可变的投标形式。后者中,个体行为通常是连续的,个体投标模型基于训练好的策略确定特定的行为值。其缺点是行为需要由连续变量代表,实际投标行为需要简化成单个或多个连续的变量,存在较大的信息损失;其优点是行为空间无限,对个体决策没有预设行为模式的约束,故模型的灵活性较强。
在个体行为预测方向,相关研究目前仍较少,尚处于起步阶段。其与个体行为模拟的主要区别在于其更关注行为预测的精准性,而个体行为在不同外部环境下的变化与反应并不是研究重点。目前,实现个体行为的预测主要采用机器学习中的监督学习作为技术手段。文献[81]在对发电主体投标行为进行聚类的基础上,引入机器学习的前馈神经网络模型,用于捕捉个体行为与外部影响因素的关系,对大量发电主体的未来投标行为进行了预测。
2)市场运行模拟与博弈均衡分析
对市场整体开展的研究,可以分为市场运行模拟与博弈均衡分析2 类。前者更强调未来市场运行状态模拟与预测的准确性,适用于电力市场运营商感知未来市场态势、避免市场发生大的波动,主要使用监督学习的技术路线;后者更专注于分析在特定的外部边界条件下,某个市场中多个主体之间的交互迭代过程,以及最终形成的市场稳定的均衡结果,主要使用强化学习的技术路线,适用于电力市场机制设计者评估新设计的市场机制等。
在市场博弈均衡方向,目前通常采用的研究方法是建立包含多个数据驱动的个体行为模型的市场模型,在给予一定的外部边界条件后,观察市场内各个成员之间的行为交互过程及均衡结果。例如,文献[82]建立了数据驱动的多代理强化学习(multiagent reinforcement learning,MARL)模型来分析市场均衡。文献[83]基于深度强化学习中的确定性策略梯度(deterministic policy gradient,DPG)模型建立个体行为模型,使用LSTM 模型评估市场未来竞争态势,基于此分析市场博弈过程;进一步,文献[84]利用深度强化学习中的DDPG 模型建立市场个体交易行为模型,并将其组成为市场模型,分析市场博弈演进过程及最终达到的纳什均衡状态。部分研究对市场均衡基于实际数据进行了逆向分析,文献[85]使用英国频率响应市场2005 年至2011 年的数据,分析了该市场从建立之初至达到均衡的电价收敛过程,并使用了虚拟行动模型对竞价对手进行建模、自适应学习方法对负荷进行建模,解释了电力市场的动态均衡过程。
在市场运行模拟方向,当前研究尚处在较为初级的探索阶段。文献[86]对现有的电力市场模拟平台进行综述,发现现有的电力市场模拟平台大多仍基于传统的经济学假设与优化模型,较少使用数据驱动的方法进行研究。目前,有一些研究对数据驱动的市场模拟进行了尝试与探索,但并未形成体系化的研究成果。例如,文献[81]尝试对市场中的海量个体交易行为进行预测,进一步,基于个体交易行为的预测结果,对电力市场进行模拟出清,获得包括节点电价、网络潮流、机组出力等的市场出清结果。
传统的电力市场博弈均衡研究通常基于微观经济学理论,使用特定的博弈理论框架,并对其定制化以与电力市场现实博弈过程相对应。其优点在于理论性与可解释性较强,其缺点在于为了确保研究的理论完备性和数学可解性,需对市场主体和市场本身进行大量理想化的假设和简化。这将导致市场博弈均衡分析结果与实际市场运行结果产生较大偏差,降低相关研究的实际效果。
在数据驱动研究方法引入电力市场博弈均衡研究后,从2 个方面改良了这个问题:其一,在个体行为建模方面,数据驱动方法发现了行为历史数据与个体行为决策之间的映射关系,提高了个体行为建模的准确程度;其二,在博弈均衡分析方面,均衡状态的求解由特定的数学范式推导转向多主体模型间的交互迭代至纳什均衡的过程。因此,传统研究中在市场建模过程中的假设与简化大大减少,博弈均衡模型的建模精度得以提升,相关研究的实用性与准确度也得到了提高。
3.4 数据驱动的市场机制研究
目前,针对数据驱动的市场机制研究,主要分为2 类:一是面向机制设计的基础,即对市场主体的行为进行分析;二是使用数据驱动的手段,对现有市场机制手段进行改进。
1)市场主体行为分析
由于市场主体交易行为的数据具有维度高、数量大、非结构化强的特点,之前对市场主体交易行为的深入研究较少。同时,缺乏市场实际行为分析研究的基础,先前市场机制的设计多基于专家经验,或者是大量的市场实践。直到2016 年,实际交易行为数据开始逐渐进入研究者的视野。文献[87]对CAISO 市场的需求投标数据进行了初步的研究,通过分析一整年美国加州市场的能量需求投标数据,计算了不同类型(自调度投标与经济投标)的比例和时段分布,展示了几个大型售电公司的实际投标曲线。进一步,文献[88]研究了CAISO 市场的供给投标数据,基于某月的实际数据进行了简单的分析,对包括投标可用容量、系统供给曲线分布在内的市场边界进行了描述,并分析了实际市场供给的价格弹性及可再生能源装机容量对其的影响。综上所述,针对电力市场主体行为的初期研究是较为朴素的,主要对市场主体的整体行为数据进行分析,采用的技术手段也是较为传统的统计类方法。
然后,针对主体行为分析的研究逐渐发展,研究方法从统计类方法转变为机器学习方法,分析也逐渐深入且更为多样化。主体行为分析的研究重点也逐渐转向基于实际数据逆向解析市场主体的实际行为特征与内在逻辑,实现知识发现、认知主体的功能。
文献[14]首次针对电力市场中的供给主体个体开展行为分析研究,基于AEMO 市场的实际数据,提出针对投标曲线特点的自适应聚类方法,提炼得到不同燃料类型市场主体的典型供给投标曲线,并归纳发电主体投标普遍具有离散性、多样性、模式性、时变性等特征。进一步,文献[89]对美国CAISO 市场的虚拟投标实际数据进行了实证分析,并提取了3 类主要虚拟投标策略。此外,还有研究尝试使用数据驱动的方法建模用户的需求响应行为。例如,文献[90]基于用户的历史互动数据和市场边界数据,使用LSTM 模型捕捉用户聚合体对复杂响应特征的表征,并将其应用于零售定价设计中。
在正向行为分析的基础上,部分研究还尝试通过逆向分析的方法从市场数据中辨识决定主体行为的关键参数。文献[91]针对市场主体的投标行为数据,使用逆向优化(inverse optimization)方法,辨识得到各个主体投标时的分段成本参数。进一步,文献[19]改进了逆向优化方法,并将其用于辨识各个发电主体投标时参考的供给成本函数。文献[92]将逆向均衡(inverse equilibrium)方法引入个体交易参数辨识中,在有约束和无约束的场景下,对包含多个寡头主体的纳什古诺均衡进行逆向解析,辨识得到寡头主体决策目标函数的参数。但是,以上研究均使用人工生成的数据进行分析,并没有使用真实数据。除了成本之外,文献[93]使用逆向优化方法,对基于双层优化模型报价的水电厂的水库库容水量进行逆向辨识,并通过中国市场的实际数据进行了验证。
2020 年,文献[94]使用AEMO 市场的实际数据开展研究,其将逆向强化学习方法应用于电力市场行为分析领域,从发电主体实际投标行为中辨识其风险偏好。2021 年,文献[95]基于AEMO 市场的实际数据,使用逆向深度强化学习方法,对发电主体的供给投标偏好进行了辨识,将投标偏好用多层前馈神经网络进行量化表征,并通过实际数据进行了测试与验证。2022 年,文献[96]基于AEMO 市场的实际数据,对储能主体参与能量、调频、备用等8 个市场的联合决策过程进行逆向强化学习,辨识得到其参与不同市场的决策偏好。
2)数据驱动的市场机制设计
除了对于单个市场主体行为进行分析辨识之外,还有研究尝试将数据驱动方法应用于市场机制设计中,以解决传统方法难以处理的许多问题。但是,当前领域的研究尚处于萌芽阶段,亟待进一步研究。
目前,已有一些研究尝试将数据驱动方法应用于串谋的识别与抑制中。通过分析多个发电企业之间的相互关联性,实现串谋辨识以预防发电商采用市场力危害市场的行为。文献[97]采用基于变分自编码的高斯混合模型,实现了无监督学习辨识不同主体间较为相似的报价行为,从而对串谋行为进行预警。文献[98]提出了基于排序多元Logit 模型的串谋辨识方法,通过比较高价序列和低价序列的统计差异,来判断卡特尔型机组是否存在串谋行为。
传统的电力市场机制设计研究普遍面临信息不对称的挑战,即对于所设计的市场机制内包含的市场主体行为特性不明确所带来的问题。在过去很长一段时间内,市场机制设计者只能依托传统经济学理论及专家经验法,对市场主体的行为特性与决策目标进行假设,并基于此对市场机制进行设计。这在电力市场相对简单时仍能满足激励相容的要求,但随着可再生能源比例不断提升、新型市场主体不断接入,导致电力市场运行环境愈发复杂,传统的机制设计将难以满足要求。
数据驱动方法的引入,极大地改善了传统电力市场机制设计所面临的问题。数据驱动市场主体行为分析方法的提出,从历史数据中辨识市场主体的行为特性,使机制设计者深入了解主体的行为特性并针对相关行为特点设计对应的激励相容市场机制成为可能。进一步,许多数据驱动的分析方法还可从海量数据中提炼关键信息,用于支持传统的机制设计研究。
4 数据驱动研究面临的关键挑战
由上文综述可见,目前的数据驱动的电力市场研究尚处于发展阶段,还未形成通用的、系统化的研究体系。为此,本章尝试总结数据驱动的电力市场研究所面临的关键挑战。
1)电力市场数据存在较高的分析难度
如前所述,电力市场数据主要分为2 类:一类是状态边界与运行结果数据,以负荷、电价、潮流等数据为代表;另一类是行为数据,以个体投标行为、市场竞争态势(ASC 及RDC)为代表。交易行为数据属于电力市场特有的数据类型,存在较高的处理难度。其复杂性主要体现在非结构化的特点上。在大多数的市场中,个体行为投标通常以“价格-容量对”的形式存储,其长短不一(量价段数量不同)、不具有统一的分辨率(每段容量对应一个价格),难以像负荷、价格那样可直接通过数据驱动的机器学习方法进行研究,使其研究难度大大增加。尽管近年来逐渐有面向市场交易数据的针对性分析方法,但大多数方法只针对特定结构数据或者特定使用环境,尚无普适、高效的电力市场交易数据分析方法体系。
2)市场数据存在缺失与不足的问题
尽管近些年来电力市场的数据逐步开放,但目前的电力市场数据仍存在2 个方面的问题阻碍着相关研究的开展。一方面,电力市场数据的收集具有一定的门槛,在国外电力市场主要体现在市场数据获取的接口与权限等方面,而在国内电力市场则主要体现在市场信息公开平台建设不完善等;另一方面,电力市场可获取的数据质量有限。例如,许多电力市场的数据均存在缺失、遗漏、异常测量值的情况,这给数据驱动的电力市场研究带来了压力。
3)电力市场主体建模准确度仍有不足
尽管通过数据驱动研究方法对电力市场主体行为决策实现了较传统基于优化理论方法更精细的建模,但目前对于个体决策行为的建模多直接使用现成的强化学习框架,模型假设与电力市场环境仍存在偏差,导致市场主体建模不准确。例如,由于个体行为对环境的影响较为有限,电力市场投标与交易过程并非强化学习模型所依赖的标准马尔可夫决策过程,而是在一定程度上有所退化;由于个体投标行为的复杂度较高,需在建模时进行降维简化,目前的离散化简化方法将为强化学习框架在行为空间带来严重的维数爆炸问题,影响实际模拟效果。
4)在信息不对称下结果准确性验证存在困难
除个体行为建模外,通过历史数据辨识影响个体决策的边界数据,即对个体运行成本、风险偏好、理性程度等进行“知识发现”,也是数据驱动的电力市场研究中的重要研究主题。然而,由于电力市场环境通常是信息不对称的,市场管理者与研究者很难获知包括市场主体运行成本在内的决策边界数据,对于边界数据辨识研究的准确性难以直接验证。目前,学界通常采用间接验证的方式,如基于识别的个体决策边界数据,再建模市场主体行为模型,通过比对行为模拟结果与实际结果的相似度,来验证边界数据辨识研究的准确性。虽然这在一定程度上能够实现研究的论证,但其效率低、易引入干扰项,仍需研究更高效、精准的验证方式。
5)数据驱动研究与市场政策变化的适用性问题
数据驱动的电力市场研究通常需要基于大量历史实际数据的训练,并应用于未来电力市场的业务中。但是,此技术流程需满足一项前提,即用于模型训练与实际应用的电力市场机制环境没有发生较大的变化,这就导致数据驱动的电力市场研究在中国电力市场应用存在2 个方面问题。其一,面向“双碳”目标与新型电力系统建设目标,中国新能源比例迅速提高,大量新能源的接入使得电力市场环境快速发生变化,导致许多基于长时间尺度数据训练的数据驱动方法的有效性降低;其二,中国各地的电力市场仍在建设过程中,尤其是各地现货市场的发展存在多个时期,市场机制与政策的变化周期很短,不同政策机制下的市场数据存在诸多差异性,不能直接投入模型训练。因此,如何在数据驱动的电力市场研究中考虑市场机制的变化,并高效、合理地利用各个市场环境下的数据,是目前尚未解决的重要挑战。
5 数据驱动市场研究展望
在中国能源体系推动“双碳”目标的大背景下,面向全国统一电力市场建设的迫切需求,数据驱动的电力市场研究虽存在诸多挑战,但同样面临着大量应用机遇。在此,本章尝试对未来数据驱动的电力市场研究进行展望,梳理值得关注的发展方向。
1)电力市场数据标准化结构与分析方法
如前所述,目前世界各国的电力市场数据缺乏统一的结构标准,不同市场间的数据存在较大的差异性,为数据驱动的电力市场研究增添了难度。随着研究的深入,相信未来将出现2 类基础性的研究工作:一是标准化的电力市场数据结构定义,对包括负荷、电价、投标行为、市场供需等电力市场关键变量进行标准化的定义,以供各方在此基础上开展深入研究;二是面向多市场的数据协同接口工作,基于标准化的电力市场数据结构,编制世界各国电力市场与之对接的数据接口,便于各方研究人员以较低的门槛利用来自世界各国的市场数据。
除此之外,未来也将涌现一批针对电力市场数据结构的分析方法,如针对市场数据的独特数据结构提出数据清洗方法,针对市场数据存在的冗余性提出信息提炼方法,针对市场数据具有的高维性提出适合的高效降维方法等。
2)更精细化的市场行为建模研究与实践
随着电力市场建设的深化和市场范围的扩大,电力市场运营者对于市场参与主体的行为需要有更强的分析能力,包括提前预判市场主体交易行为及其影响、交易中对市场主体行为进行实时监控、事后追溯市场主体投标异常等。为实现相关功能,需要更精细化的市场主体行为建模研究技术。笔者认为该领域的发展将包括以下3 个主题:
(1)市场主体行为的深度分析技术。该研究方向需要解决的问题是如何从海量、高维、冗余的电力市场数据中,提炼出能够高效表征市场主体行为的信息量,并将其准确地展示出来。此类研究可用于市场运营者事中监控主体行为,或事后对主体行为进行异常辨识。
(2)市场主体行为的高效建模技术。该研究方向需要解决复杂的、非结构化的交易行为应该如何高效表示的问题,并将其与个体行为决策模型结合起来。此类研究可用于市场运营者对市场主体建模,并进一步应用于个体行为预测、市场运行模拟、市场均衡分析等研究中。
(3)市场主体行为的精准预测技术。该研究方向需要解决如何准确预测海量市场主体未来复杂行为的问题,其难点在于交易行为的合理标签化、与外部影响因素的相关性、主体内部偏好的量化表征等方面。此类研究可用于市场运营者对市场主体的未来行为进行预判,从而对可能存在的串谋与动用市场力行为进行提前处置。
3)数字孪生的数据驱动市场模拟研究
未来的新型电力系统建设将引入更高比例的新能源,势必为电力市场的运行带来更大的不确定性。在此背景下,对电力市场运行提前预警、实时监测、全时评估的重要性进一步凸显。使用数据驱动的电力市场技术建立市场运行的“数字孪生”模型迫在眉睫。
在未来海量电力市场数据基础上,对电力市场的复杂组成部分,如发电主体、用电主体、联络线、以天气为代表性的外部因素等,进行数据驱动的建模,再将其按照市场规则进行组合,建立电力市场的“数字孪生”模型。通过对模型中的各个组成部分进行预测,将预测结果组合进入市场并模拟出清,即可获得电力市场高精度模拟结果,包括各个市场主体的出力结果、市场价格、网络潮流等。基于此,市场运营者能够实现对电力市场运行的高精度预判与全时监测,从而在市场面临风险时提前采取措施,确保电力市场的安全稳定运行。
4)支撑机制设计的数据驱动市场均衡研究
电力市场的机制设计在投入实际应用前,应经过充分的验证。然而,由于目前的技术限制,很多针对电力市场设计的机制在投入实际应用前,并未经过符合市场实际运行特点的测试,而主要采用基于专家评审的方法进行定性验证。可想而知,此种模式将不可避免地产生机制设计与实际的偏差,从而影响机制设计的有效性。在未来,高比例新能源接入电力系统、海量市场主体参与各层级电力市场,将不可避免地增加市场的不确定性,进一步影响机制设计的实际应用效果。
数据驱动的电力市场博弈均衡研究方法是解决此难题的重要技术路径之一。可基于海量主体的历史行为数据,提炼关键信息形成个体行为模型,将海量个体行为模型内嵌入市场规则量化后的市场环境模型中,分析主体在市场中的交互过程与均衡状态。其区别于传统研究方法的特点在于:市场主体的建模均来自历史数据,由数据进行驱动,因此,能够较为真实地描绘市场主体对于特定市场机制的反应。通过将均衡结果与期望结果进行对比分析,即可判断机制设计的有效性,还可以进行不同市场机制效果的量化评估。
5)支撑中国电力市场建设的数据驱动研究
近年来,中国电力市场建设不断深化,电力现货市场即将进入正式运营阶段。相应的,国家和各个电力市场也逐渐公布了其信息公开政策,如2020 年底,国家能源局发布了《电力现货市场信息披露办法(暂行)》[99],各个市场也逐步发布了其信息披露细则。可以预见在不远的将来,国内各个市场也将在一定程度上披露数据。
尽管中国目前的电力市场数据公开较少,难以支撑数据驱动的电力市场研究,但考虑到世界各地的电力市场存在一定的相似性,研究者可先基于国外成熟市场数据开展研究,获得可行的研究方法。待中国市场数据成熟后,可在第一时间应用于国内电力市场,并对电力市场的运行监测、报价决策、机制设计等实际业务产生技术支撑作用。
在中国电力市场数据开放的大背景下,将涌现出一批针对国内电力市场数据特点的数据驱动研究,对国内电力市场建设产生实际支持。包括但不限于以下研究方向:面向各个电力市场特点(不同的发电燃料组合、用户需求价格敏感度等),提出针对性的市场边界预测方法;考虑中国“计划-市场”双轨制的市场特点,基于海量历史数据,为双轨制发电主体设计最优投标策略;基于中国电力市场实际数据,分析市场主体的投标行为与互动关系,进行数据驱动的市场模拟与均衡分析;针对中国电力市场的特殊市场机制设计,如双轨制、中长期交易偏差考核等,进行数据驱动的市场分析,评估相应机制的效率等。
6)适应新型电力系统的数据驱动市场研究
目前,中国已开始推进新型电力系统的建设,其具有含高比例新能源的特点,导致系统不确定性大大增加,为传统电力市场的运行带来了新的挑战。在此背景下,数据驱动的电力市场研究的重要性进一步凸显,未来将出现一系列的关键应用,主要体现在以下2 个方面:
(1)对已有研究方向的再次深化。例如,针对高比例新能源及大量新型主体接入的特点,设计针对性的市场边界预测方法;进一步,将市场边界预测与个体报价决策相结合,为海量参与市场的新能源主体及新型市场主体提供投标优化决策方法。
(2)针对新型电力系统背景下产生的新市场业态,通过数据驱动的技术手段实现知识发现与定量研究。例如,在新型电力系统中将产生配电网分布式市场,以局部微网的形式包含了分布式新能源、分布式储能、电动汽车等多种主体,各个参与者以生产者、消费者、产消者的混合形式进行交易。通过数据驱动的市场模拟方法,可从历史交易数据中提炼关键信息,建立分布式市场的数字孪生模型,对个体决策、交易行为、市场走势等进行量化分析。
6 结语
在电力市场迅速发展及新型电力系统建设的背景下,本文对数据驱动的电力市场研究进行了综述。首先,本文将传统电力市场研究分为市场状态参数研究、投标优化决策、市场均衡分析与市场机制设计4 个方向,分别对其研究现状及局限性进行了归纳;其次,本文针对世界范围内7 个较为成熟、知名度较高的电力市场的信息发布与数据开放政策进行了归纳,总结了不同市场在边界数据、行为数据及结果数据方面的公开程度,为广大电力市场数据研究者提供了参考;接着,本文对数据驱动的电力市场研究现状分4 个方向进行了总结,分别是数据驱动的市场状态参数研究、数据驱动的投标决策研究、数据驱动的博弈均衡研究及数据驱动的市场机制研究;进一步,本文尝试归纳数据驱动的电力市场研究的关键挑战,包括数据的复杂性、不完整、准确性差、验证难和适用性5 个方面;最后,本文对未来数据驱动的电力市场研究进行了展望。
希望本文能为广大电力市场研究者、从业者、管理者与机制设计者提供新的研究思路与技术方法,推动中国电力市场研究更快发展。