数据与知识联合驱动的人工智能方法在电力调度中的应用综述
2024-01-19黄文琦梁凌宇闫昆鹏孙凌云
李 鹏,黄文琦,王 鑫,梁凌宇,闫昆鹏,孙凌云
(1.南方电网数字电网研究院有限公司,广东省广州市 510663;2.浙江大学南方电网人工智能创新联合研究中心,浙江省杭州市 310058;3.浙江大学计算机科学与技术学院,浙江省杭州市 310058)
0 引言
电力系统不断向前发展更新,特高压交直流互联大电网的全面推进、新设备的接入以及数字电网、智能电网等的发展趋势,加剧了电网的复杂性[1]。尤其是在电力系统双高特性的影响之下,电力系统的不确定性、时变性等问题更加突出,调度任务所依赖的信息量骤增,考量因素愈加多元,计算过程愈加复杂。因此,当前智能电网调度方法所处的信息环境和数据基础发生了巨大变化,所表现出来的不安全、不稳定、不可解释性等缺点愈发明显。
国务院于2017 年7 月8 日印发《新一代人工智能发展规划》[2],明确指出需要研究数据驱动与知识引导结合的新一代人工智能方法,完善知识驱动的人机物三元协同与互操作理论。2020 年,南方电网提出“数字电网”的概念,用数字孪生技术支撑以数据为基础提炼出相关的机理规则和电网知识,将其与电网原生机理融合,以解决数字电网各环节时变性、复杂性、建模困难之间的矛盾[3-4]。由中国工程院批复的《中国人工智能2.0 发展战略研究》[5]指出,人工智能2.0 的显著特征在于将数据驱动和知识驱动相结合,使得数据驱动方法不仅智能,而且可解释[6]。
电力调度中知识驱动方法主要包括系统潮流计算、时域仿真法、系统频率响应(SFR)模型、扩展等面积准则(EEAC)等,常用于电力系统暂态稳定分析[7-8]、电力系统扰动后频率稳定分析与预测[9]、控制优化[10]等领域。知识驱动的认知过程与人的认知过程相似,擅长机理分析和提取隐藏的知识规则,可解释性高,具有全局性,并且不需要依赖数据。但其缺点是针对大规模复杂问题的知识机理认知不够清晰、获取知识代价较高、难以持续学习进化、无法平衡计算精度和计算效率等[11]。
电力调度中数据驱动方法主要包括将统计分析、机器学习等方法应用于电力系统故障诊断、感知预测、稳定分析与控制、电力市场等电力调度场景[12-15]。数据驱动方法不会过度关注研究对象的内部机理,而是以大量的历史数据为基础,进行关联性分析,经过训练得出经验模型。其具有较强的通用性,能够持续进化学习,但过度依赖数据的规模和质量,受限于特定场景的数据,并且可解释性较差。
数据驱动方法和知识驱动方法各具优缺点,在很多方面具有互补性,例如:可解释与否、黑盒模型与规则经验结合、局部特征与全局特征的结合等。将数据驱动与知识驱动的优缺点进行有机融合,有望突破当前人工智能技术在电力调度领域的发展瓶颈[16]。文献[17]首次提出将因果分析手段引入统计分析过程,在完全依赖数学模型的问题中加入了统计分析,以此来提高二者的适用性和计算效率。
1 电力调度概述
电力系统是电能的生产、输送、分配和消费的各环节组成的一个整体,具有如下明显特点:电能不能大量储存,电力系统暂态过程十分短暂,与国民经济及人民日常生活密切相关。因此,要保证电力系统中每个设备、每条线路都安全可靠运行是一项极为艰巨的任务。
电力调度是为了保证电网安全稳定运行,对外可靠供电,各类电力生产工作有序进行而采用的一种有效的管理手段,是电力系统运行的“中枢”。电力调度机构对发电、输电、配电、变电、用电等环节进行统一组织、指挥、指导和协调,其工作主要包括:监视系统运行状态和设备运行参数以及对未来状态的数值预测;合理利用调管区域一次能源,充分发挥系统内发输供电设备能力,使系统在最经济的方式下运行;对电力系统的安全稳定状态进行评估;对可能导致事故的异常情况及时处理,发生事故时快速检测和有效隔离;组织电力市场运营,通过市场竞争来实现资源的最优配置等。
上述电力调度工作内容若按照电力系统运行状态来分,可分为稳态相关和暂态相关。电力系统稳态指运行参数在某一恒定的平均值附近发生微小变化,可包括电力系统状态感知与预测、电力系统优化调度和电力市场交易;电力系统暂态一般是指从一种状态到另一种状态的过渡过程,可包括电力系统安全稳定评估、电力系统运行控制。以上调度工作相互协调,共同保证电力系统的安全可靠经济运行。本文将电力调度场景分5 类讨论。
2 联合驱动方法的特点及现状
2.1 数据驱动与知识驱动的特点分析
数据驱动方法存在严重的“黑盒”问题,无法考虑问题全局特征,严重依赖历史数据等缺点[18],制约了其在实际系统上的应用。例如,在电力系统控制、安全稳定评估等场景中,由于数据驱动方法提供的决策和评估结果等缺少解释性,无法为相关工作人员提供高可靠的意见。从另一个角度看,数据驱动的意义在于当无法准确描述一个事物的发展趋势和规律时,可以通过分析研究对象的历史数据中各变量之间的关系,获取和实际情况近似的模型,进而用于指导实践。
知识驱动方法通常需要借助一系列的物理/数学知识、已有的规则经验和领域知识等,对研究对象中各要素之间的运行规则和原理进行严格的分析,并根据实际场景中的业务和功能需求建立对应的数学模型,来描述研究对象各变量之间的因果关系,帮助研究人员做出更好的决策。此外,由于其深度剖析研究对象的内部机理与运行方式,使其具有更好的可解释性和全局性。以上这些特点为其在电力系统潮流计算、机电暂态仿真等机理知识需求强的场景中赢得优势。但随着电力系统规模增大、元件类型剧增,知识驱动方法面对复杂问题中的强非线性问题时就会显得捉襟见肘,无法平衡模型计算的准确率和效率,知识获取的代价较高,且无法持续自我学习。表1 展示了数据驱动方法与知识驱动方法的主要优缺点。
表1 数据驱动与知识驱动方法的优缺点Table 1 Advantages and disadvantages of data-driven and knowledge-driven methods
图1 展示了数据驱动与知识驱动方法的建模过程,可以看出数据驱动方法以数据作为学习的样本,基于统计学、机器学习理论等构建经验模型,并通过不断学习对模型参数进行优化;而知识驱动方法从电力系统物理机理出发,基于因果推理、调度知识经验等构建适用于某问题的机理模型,并在实际中验证模型的准确性。
图1 数据驱动与知识驱动建模过程Fig.1 Data-driven and knowledge-driven modeling process
2.2 数据与知识联合驱动方法发展状况
2020 年,图灵奖得主Judea Pearl 指出,人类正在经历一场以科学为中心的因果革命,强调了因果科学和人工智能会有紧密的联系。马克斯·普朗克智能系统中心主任Bernhard Schölkopf 在文献[19]中介绍了机器学习、人工智能与因果关系之间的内在联系,并解释了如何把因果关系引入人工智能领域中,受到了广泛关注。2022 年2 月清华大学崔鹏教授与斯坦福大学Susan Athey 在Natural 子刊发表的文章总结了因果推理在机器学习和人工智能领域取得的关注[20],认为应当建立机器学习和因果推理之间的共识。因果关系不同于大多数机器学习模型中的关联关系,在揭示问题的内部机理和发展规律上具有重要作用。因果分析和因果推理属于同一概念,其思想均摒弃了机器学习关联思想中的虚假关联关系,利用因果关系去指导模型的建立和学习,具有清晰的物理知识。除因果关系、因果推理之外,物理约束、物理信息、理论引导、知识嵌入等知识驱动概念与数据驱动相结合的思想也越来越多被提出[21-24]。
在电力系统感知预测领域,文献[25]运用机理模型对气象信息的偏移进行修正,在经验模型中引入了时间模式注意力机制,通过Stacking 集成学习框架把两种模型相结合,进一步提高了分布式光伏短期功率预测的稳定性和准确率。在电网故障诊断领域,文献[26]利用因果关系的思想得到预备候选诊断,并借助贝叶斯理论计算出候选诊断的故障概率,提出了一种电网故障最优诊断的查询方法。在优化调度领域,文献[27-30]提出多种数据与模型混合驱动方法,综合考虑新能源消纳、经济性、安全性等多种目标,给出各类资源调度决策。文献[31]基于具有噪声的基于密度的聚类方法(DBSCAN)和EEAC 实现双机等值,再结合长短期记忆神经网络实现电网动态轨迹趋势预测,帮助电力系统暂态稳定的紧急控制。文献[32]建立了基于数据驱动与因果关系相联合、准定量法与精确定量法相联合的暂态稳定分析(TSA)框架,应用于电力系统暂态稳定算例的筛选。在电力市场领域,文献[33]从博弈论和经济学基本原理出发,建立了机理模型和基于数据驱动的回归模型,应用于双边协商电力市场合约价格的预测。
2.3 数据与知识联合驱动思想来源
目前,针对联合驱动方法的具体实现,现有相关文献并未形成统一的联合标准和建模思想。文献[11]针对数据驱动方法和知识驱动方法各自的优缺点,提出了二者在架构级和算法级上的联合思想,针对其架构和算法中的不同模块,来确定采用知识驱动方法还是数据驱动方法又或者是二者协同驱动的模式。具体到电力系统领域,文献[34]主要针对机器学习算法存在的弊端,结合电力系统领域特征,利用电力系统中的专业知识和经验来指导、优化机器学习模型。提出了一种内嵌知识驱动的机器学习方法——引导学习。文献[35]针对电力系统随机性、时变非线性、不完全可观测性等特征提出了一种多模态自适应的智能学习方法和框架——“电力脑”。该架构的核心特征是利用知识驱动来避免发生反常现象,利用数据驱动来提升模型的性能。文献[36]主要针对单一的数据驱动方法或知识驱动方法在电力系统相关应用中所面临的一些困难,并利用二者优劣势互补的特性,提出了4 种比较典型的联合驱动模型:并联模式、串联模式、引导模式和反馈模式。
数字技术正在逐渐与电力系统结合孕育出更加智能的电力系统[3,37]。数字电网的建设主要包括物理空间和数字空间,而数字孪生技术则是实现电网中物理空间向数字空间的全生命周期映射,是数字世界和物理世界双向互动的核心技术。文献[38-39]将数字孪生技术应用到电力系统中,分别探讨了“电力数字孪生系统”和“能源互联网数字孪生框架”。这些框架都明确指出了需要依赖数据与知识联合建模方法来实现数字孪生体和物理实体之间的同步,表明了联合驱动方法与数字孪生技术之间密切相关。在数字孪生模型构建技术中,文献[4,40-41]对其中蕴含的联合驱动思想进行了相关分析。为了更直观地了解上述研究中联合驱动思想,表2从思想来源背景、动机及思想简述这3 点对相关文献进行了归纳。
表2 联合驱动思想归纳Table 2 Summary of combined-driven thoughts
3 联合驱动方法在电力调度中的重点应用场景
图2 对数据驱动、知识驱动、联合驱动方法、电力调度场景这4 个主要概念进行归类,并总结了联合驱动方法在各场景中应用的相关论文的时间分布。从图2(b)可见,近3 年来联合驱动方法在电力调度场景上的研究整体呈上升趋势。其中,数据驱动和知识驱动均分为具体方法和建模思想;而数据与知识联合驱动方法是建立在两种方法基础之上,经过并联、串联、嵌套等多种联合方式,获得更优的联合方法。
图2 相关概念类目划分和文献统计Fig.2 Category division of related concepts and literature statistics
3.1 电力系统状态感知与预测
电力系统状态感知与预测是指对系统各运行状态的感知与其在运行期间以及未来状态的数值预测。其中,对状态感知涉及正常态与故障态的辨别,也可视为是利用相关电力设备的广泛知识和各种终端设备反馈的信息来定位故障元件的位置并辨别故障类型。传统的电力系统故障诊断方法主要是依据专家系统、反向传播(BP)神经网络(BPNN)、贝叶斯网络、支持向量机、优化技术、粗糙集理论等方法[42]。然而,以往单一方法大多属于传统人工智能方法,在故障诊断场景存在很多局限性,如故障机理复杂难以建模、故障数据复杂庞大难以提取特征等问题,联合驱动方法的出现为电力系统故障诊断开辟了新的思路。
在电力系统故障诊断等应用中,由于缺乏相关的训练数据,会导致数据驱动方法在故障诊断中的应用受到很多限制。文献[43]提出了一种混合诊断系统设计,不仅可以识别和定位已知故障与未知故障,还可以利用单个故障训练数据对多个故障进行分类。除此之外,随着对新数据的收集,数据驱动模型的性能也会不断提高。在预防电力系统故障方面,文献[44]提出了一种混合网络物理数字孪生的方法,该方法利用脉冲神经网络(SNN)接收电压、电流等时序数据来预测发生故障的可能性和位置,作为故障识别工具中的过滤器,减少需要知识驱动工具求解的方程。知识驱动模型则采用瞬态状态估计器(TSE)来揭示系统的动态状态,并最终帮助实时地预测电网中即将到来的故障。文献[45]提出了物理驱动与数据驱动相结合的换流故障预测模型,有效解决了在传统高压直流输电预测中物理模型计算精度低和经验模型依赖高质量数据的问题。为了提高电网在线故障筛选计算的时效性和准确性,文献[46]提出了一种结合EEAC 和支持向量机的在线暂态稳定故障筛选,将基于大数据的关联关系分析和因果关系分析相结合,采用交互式并行计算,得到了较好的效果。文献[47]基于同步向量测量单元(PMU)和刻画扰动传播的机电波理论模型,提出了一种模型-数据联合的电网扰动定位方法,用于抑制电网扰动传播。该方法实现了仅利用部分PMU 信息即可高准确率、快速地定位扰动源。
此外,对系统运行准确高效的感知预测方法能够有效调节电量平衡,促进清洁能源的消纳,对电网调度安全经济运行起着至关重要的作用。由于电力系统运行过程中存在非线性因素较多、对预测结果的准确性和高效性要求较高等特点,目前单一模型所能达到的效果有着较大提升空间。以下主要介绍联合驱动方法在负荷预测、频率态势预测上的应用。
负荷预测是电力系统规划运行的关键,尤其在电力系统调度运行中的机组计划制定中具有十分重要的作用。传统的人工智能方法在进行负荷预测时面临着泛化能力不足、可解释性差等问题,联合方法融合了人工智能方法和传统机理模型分析的优缺点,可以进一步提升预测的准确率。文献[48]针对短期电力负荷预测提出基于花授粉算法(FPA)优化的变分模态分解(VMD)和双向长短时记忆网络的两阶段预测方法。第1 阶段是对原始负荷序列数据进行分解预测,第2 阶段作为第1 阶段预测误差的纠正模型,该方法既可以用于短期负荷预测也可以用于中长期负荷预测。文献[49]建立了一个具有理论指导的高精度深度学习模型,将物理规律、工程控制、专家经验等先验信息融入深度学习模型的训练中,获得了更高的准确性和更强的鲁棒性。
在电力系统频率态势预测方面,研究主要针对传统的以物理模型为基础的系统频率特性分析方法存在的计算效率与精度之间的问题。文献[50]提出了一种物理-数据联合模型的频率态势在线预测方法。通过物理建模的方式来表征影响频率态势变化的主要因素之间的因果关系。对于其余的次要影响因素,通过机器学习算法来描述误差影响间的关联关系。文献[51]采用系统频率响应模型对频率响应动态过程进行预测,并采用粒子群优化模型优化的极限学习机(ELM)对预测结果误差进行校正,在保持较高的计算速度时,可以大大提高计算精度。文献[52]针对含风电的系统,首先改进了SFR 模型以适应含风电机组参与的系统频率调节,其次提出了基于多输出支持向量机回归(SVR)的频率动态响应预测方法,用于提高SFR 模型的计算精度,最终能够实现在少样本情况下获得较高的预测精度。文献[53]对比了数据物理融合方法、单一数据驱动方法、单一知识驱动方法在暂态频率态势预测上的表现,最终数据物理融合方法取得了更优的效果。此外,联合驱动方法在变压器相关问题[54]、调频容量需求[55]等方面的预测也有相关研究。
由上述分析可知,在面对结构复杂和非线性因素增多等问题时,数据与知识联合驱动方法可有效缓解机理模型复杂、难以构建等问题,提升经验模型的学习效果和可信度,有利于在电力系统状态感知与预测时获得更高的准确率和精度。
3.2 电力系统优化调度
目前,电力系统优化调度的方法主要是基于最优化理论的知识驱动方法进行求解:首先通过工程实践提炼出数学模型,然后使用多种数学手段对模型进行简化和处理,最后研究相应的最优化算法对问题进行求解[56]。然而,随着电力系统规模不断扩大、耦合关系不断复杂化,在线求解最优化调度问题的计算成本增大,基于知识驱动的传统调度方法逐渐显露不足[27]。数据驱动技术在电力系统中已有大量研究与应用,但目前基于数据驱动的电力调度研究仍然存在可解释性差、得出的结果可能违反系统的约束条件以及影响电网安全的问题。联合驱动方法有望发挥数据驱动智能算力与模型驱动引导效力,实现新能源高占比场景下的优化调度快速求解。
文献[27]提出了一种数据与模型混合驱动的区域综合能源双层优化调度决策方法。上层使用混合整数线性规划(MILP)求解得到日前调度计划,为日内滚动优化提供参考;下层将卷积神经网络(CNN)与门控循环单元(GRU)相结合进行日内滚动优化决策,使用自适应功率修正模型对其输出进行微调得到精确解。文献[28]利用空间聚类和决策树辨识海量调度运行数据的典型运行场景与重要特征,构建甄别场景类别的多层感知机分类器,在线决策时利用分类器辨识有限运行数据的场景类别,调用模型快速求解实时调度任务,实现高随机场景下的多任务快速迁移学习,保证电力系统优化调度决策的最优性。文献[29]在鲁棒机组组合问题中,考虑风电场出力的动态相关性,基于量测数据挖掘随机变量变化范围,建立风电功率的椭球不确定性集合,降低了鲁棒优化结果的保守性。文献[30]考虑电力用户的有限数据和有限理性,建立了一种模型-数据混合驱动的需求响应建模方法,提出了基于Stackelberg 博弈的配电网优化调度方法,有效降低用户用电成本,促进可再生能源利用。针对配电网受台风影响,难以兼顾恢复力和经济性等问题,文献[57]提出了数据-知识联合驱动的配电网故障概率模型。该模型能够反映台风及其引发的暴雨对配电网元件的影响,综合考虑了恢复力和经济性,有助于提高台风多发区配电网移动储能的调度能力。文献[58]提出了一种混合物理驱动和数据驱动的线性潮流模型,该模型可以保留物理模型中有用的部分,并利用数据驱动来提取一些不明确的线性关系,有助于提高电力系统的优化能力。文献[59]提出一种将人工经验和深度强化学习相结合的断面功率控制方法,提出了发电机提前筛选和功率补偿机制;并在深度强化学习模型训练过程中引入知识经验,加速深度强化学习模型收敛。针对传统设备建模不完备、预测精度低所导致的综合能源系统调度经济成本高、能源利用率低等问题,文献[60]通过建立系统的数字孪生体和物理模型预测机组出力、负荷变化等孪生数据来实现综合能源系统实时优化调度,为后续数字孪生与综合能源系统的结合提供了参考。由上述分析可知,在面对强不确定性和非线性的电力系统优化调度任务时,知识的引入可以有效弥补数据驱动方法因系统状态结构复杂易变所导致的求解精度问题,提高系统优化效果。
3.3 电力系统安全稳定评估
电力系统的稳定包括功角稳定、电压稳定和频率稳定,而对电力系统安全稳定的评估中研究最多的是暂态稳定评估,在线动态安全和电网整体性安全稳定评估也有相关研究。当前相关评估方法主要面临着实时性要求高、容错率低、计算量大等难点,而联合驱动方法自身的特点可有效缓解这些问题所带来的影响,提升电力系统的安全稳定评估效果。
在暂态稳定评估方面,由于操作模式的不断变化,需要重复的样本采集过程,这极大地降低了样本采集效率。文献[61]提出一种实例转移方法,使用先前的样本库来构建新的样本库,减少样本采集耗时,将EEAC 和ELM 引入系统临界切除时间(CCT)计算的纠错部分。所提方法能够快速、准确地实现扰动后暂态稳定性的评估。电力系统规模和传统模型复杂性的增加使得EEAC 和数值积分法等稳定性量化方法的计算量骤增。文献[32,62]将因果驱动和数据驱动相结合,提出了一种“两层筛选”的分类器。并将因果指标作为分类特征引入所提分类器中,提升了算例分类的质量和算例筛选的效率。针对传统的暂态稳定评估方法难以同时满足快速和准确的特点,文献[63]从故障后稳定平衡点的稳定域和边界出发,将故障机理引入深度学习技术中加以约束,来获取系统特征量和暂态稳定性之间更为稳定的映射规则,极大地提高了在线暂态稳定评估的准确性和及时性。文献[64]提出了一种基于最小体积闭包椭球理论和最小二乘投影孪生支持向量机的暂态稳定评估方法,并在评估模型中引入正则化项来改进模型中的限制因素,以此来提高模型的计算效率。文献[65]从时域仿真法的计算过程入手,利用知识驱动优化后的数据驱动模型替代那些影响计算速度的数学方程,构建出了数据与知识混合驱动模型。机理知识的引入以及数学方程的简化在提高计算速度的同时,也获得了更高的准确率。
在电力系统整体安全、稳定运行和评估方面,由于新型能源电力系统运行方式的复杂性和不确定性,致使传统的电网调度运行方式产生了时效性差、缺少灵活性、经济性差等问题。文献[66]建立了电网安全特征选择和知识发现平台,该平台由数据驱动和知识驱动方法混合而成,具有较高的实时性,并在广东电网中得到了实际应用。为了更好地反映不同情况下的发电机运行状态,减少由于发电机导致的电网波动,文献[67]首先基于机理模型搭建虚拟同步发电机的详细仿真系统并作为数据驱动方法的数据来源,使用长短期记忆网络对仿真系统运行特征进行动态建模,所提方法有效提升了电网的整体稳定性。此外,联合驱动方法在电力系统动态安全评估[68]、临界切除时间[69]、谐波稳定性分析[70]等场景也有应用。
3.4 电力系统运行控制
现有电力系统控制的研究大多是采用时域仿真法、启发式算法、EEAC 和以深度学习、深度强化为代表的机器学习算法[71-72]。
当系统不满足静态安全性时,需要采取预防控制。而调整发电机出力是最重要的预防控制措施。依据专家知识和经验进行功率调整需耗费较多时间。文献[73]根据输电网满足P-Q分解法、有功功率和无功功率在一定程度上解耦的特点,设计了集中式训练的合作型双智能体结构,由两个智能体分别承担发电机有功功率调整和电压调整任务,克服人工智能算法在训练过程中对超参数敏感、收敛性差等问题。文献[74]针对暂态稳定和小扰动稳定预防控制,运用非参数回归方法分别构建不同稳定指标与系统运行方式间的数据驱动模型。在稳定约束的解析化表征方法基础上,提出联合主导样本的定义及筛选方法,将多个数据驱动模型解析化表征为相互关联的多条稳定约束,使得预防控制问题建模为能够直接优化求解的混合整数规划问题。文献[31]提出了电网动态轨迹趋势预测方法,首先,采用电压相轨迹和DBSCAN 聚类算法来快速辨别系统的超前机群和滞后机群,并基于EEAC 实现双机等值。然后,通过长短期记忆神经网络来预测等值机动轨迹变化情况。最后,根据能量守恒定律计算出机群回稳的切机控制量,保障暂态功角稳定。面对大规模新能源的接入所导致的系统不稳定,控制成本突增等问题,文献[75]建立了集成风险规避算法的深度神经网络模型,用于缓解深度学习模型所产生的成本失衡问题。
3.5 电力市场交易
电力市场交易研究通常建立经典、简化的经济学模型,具有数学形式清晰、经济意义明确、可解释性强等特点[15]。然而,在模型建立过程中,通常对市场主体的决策和市场运行进行了大量理想化假设与简化,导致基于传统方法的研究结果与实际市场状态存在较大偏差。随着电力市场数据的不断公开与透明化,为在机理模型基础上引入数据驱动模型带来了契机。数据-知识联合驱动方法在市场机制设计、市场个体行为分析、市场均衡分析等方面应用广泛。
在市场定价机制研究方面,文献[76]以系统边际电价、节点边际电价和分区边际电价等3 种定价机制的市场规则机理模型为分析框架,提出基于多智能体强化学习的电力现货市场定价机制,辅助发电商制定最优的报价策略。同时,多智能体强化学习可以模拟真实市场运行情况,得到接近市场稳定运行状态下的市场均衡结果。
在双边协商电力市场价格预测方面,由于当前中国可供利用的双边市场数据类型和数据量较少,合约差异、个体差异等问题的存在,使得传统预测方法较难适用。文献[33]针对这些问题,提出了一种从微观行为到宏观价格预测的思路。基于博弈论和经济学基本原理提出了一种经济学模型,采用数据驱动的回归思想建立了优化模型,用于逆向求解市场主体的价值估计值,最后根据所提经济学模型预测合约成交价。所提方法可以很好地揭示双边市场的经济学规律,可解释能力较强。文献[77]针对该问题,提出了一个通用的框架,即知识增强训练,其主要思想是将领域知识纳入深度学习模型的训练程序中。在该框架内开发了一种新的数据增强技术和一种改进的训练策略。结合这两种方法,可以在保持低样本复杂度的同时实现较高的学习性能。
在市场供需平衡方面,文献[78]考虑了更多的需求侧和供应侧之间的波动性因素,引入了瑞典电力系统、宏观经济表现、人口等因素和资本形成之间的长期和短期因果关系,并提出了基于计量经济学和两阶段注意力机制的机器学习模型,用于预测瑞典电力需求和供应的能力。
由上述分析可知,在传统基于物理与经济学模型为基础的电力市场交易研究的基础上,引入数据-知识联合驱动方法可以减少对实际市场边界条件的假设,更适用于市场主体行为深度分析、高效建模和精准预测,可以有效支撑市场机制设计。联合驱动类方法较传统电力市场研究具有更高的实用性和更广的适用性。
3.6 电力调度各场景特点分析
通过对联合驱动方法在以上电力调度各场景应用现状的分析可以发现,在一些环境与数据基础发生较大变化或需求较苛刻时,单一数据驱动或知识驱动方法的表现存在不足。数据与知识联合驱动方法作为引导当前人工智能发展方向的关键技术,在这些场景中具有广泛的应用空间。表3 对以上电力调度各场景的特点进行了总结,并分析了联合驱动方法在各场景中应用的优势。
表3 电力调度各场景的特点与联合驱动方法的应用Table 3 Characteristics of power dispatching scenarios and application of combined-driven method
4 电力调度中的联合建模方式归纳
经过上述对数据与知识联合驱动方法在电力调度重点应用场景的分析,本章归纳出3 类电力调度中的联合建模方式:数据驱动优化知识驱动、知识驱动辅助数据驱动、数据驱动与知识驱动混合模式。
4.1 数据驱动优化知识驱动
数据驱动优化知识驱动的联合建模方式的典型结构如图3 所示。该结构可以分为两种优化模式:一是数据驱动模型和知识驱动模型一样,在开始的时候就接收少量知识驱动难以处理的相关输入数据,作为知识驱动模型的一部分,以此来简化知识驱动模型的、帮助机理模型构建[44,50];二是通过分析知识驱动模型输出结果是否满足性能指标,如果不能,则通过数据驱动模型来优化知识驱动模型的参数或架构、辅助选取合适的知识驱动模型以及矫正知识驱动模型的输出结果[9,48,51,53-54,69,79-80]。通过这两种模式来使知识驱动模型的性能得到提升。
图3 数据驱动优化知识驱动Fig.3 Data-driven optimizing knowledge-driven
4.1.1 知识模型精确性不足
导致模型精确性不足的主要原因有机理模型参数不匹配和模型简化过大。其中,针对模型参数不匹配这一问题,可以利用数据驱动强大的寻优能力来对机理模型中的参数进行优化,也可对其结构进行改进,以提高机理模型对场景的适应性。例如,文献[79]使用基于数据驱动的非线性特征选择技术来对分布式发电复合负载模型中的参数进行敏感性分析,达到对模型参数识别的目的,提升知识驱动模型对实际场景的适应性。
当知识驱动模型简化过大时,会降低模型的计算精度,可以利用数据驱动方法具有大量数据的特点去拟合误差并矫正机理模型。文献[9]在电网频率动态预测过程中,使用SFR 模型来处理基本的物理因果关系,使用ELM 来拟合和纠正SFR 模型产生的误差,提高了模型在频率安全稳定评估上的精度。类似地,在电力系统临界切除时间估计问题中,文献[69]通过数据驱动方法对知识驱动方法的结果进行快速矫正。文献[53]使用数据驱动方法对物理方法产生的误差规律进行拟合矫正,实现故障后系统频率参数预测精度的提升。
4.1.2 知识模型复杂程度高、难以建模
导致知识模型复杂程度高、难以建模的主要原因有知识获取代价高、强非线性因素难以表征、影响因素及其之间的关系难以确定等。而数据驱动方法可以不断熟悉问题所处环境,发现变量之间的关联关系,帮助知识驱动认清问题内部机理,为其提供新的特征,也可以接收一部分强非线性因素,利用其端到端的特点来帮助建立更好的机理模型。文献[50]将电网频率态势影响因素划分为关键因素和非关键因素,利用数据驱动方法处理这些非关键因素,利用知识驱动方法处理关键因素,既降低了机理模型构建的难度,也提升了模型预测的速度和准确性。文献[80]利用卷积神经网络挖掘数据中的特征,帮助辨明各影响因素之间的关系,指导知识驱动模型的构建。
4.2 知识驱动辅助数据驱动
如图4 所示,知识驱动辅助数据驱动的主要方式是通过知识驱动的手段,如知识发现和推理、机理分析等方式获取研究对象中的机理规则和因果关系等,并引入数据驱动方法中,为其提供一些具有机理知识的特征,让数据驱动模型内部体现出一些领域知识和专家经验,也可以为数据驱动方法提供训练数据。以此来提升数据驱动方法对不同场景的适应性,保证其结果的可靠性。
图4 知识驱动辅助数据驱动Fig.4 Knowledge-driven assisting data-driven
4.2.1 缺乏可解释性
在进行起垄的过程中,农户应该对垄宽进行控制,保持起垄宽度在80cm左右,垄顶宽度在54-56cm,垄高为13cm左右,同时也应保持垄顶的平整。在这样的情况下,小行距控制在35cm左右的情况下,每垄可以播种两行花生,每穴播种单粒种子,并将播种深度控制在5cm上下,穴距控制在12cm左右。通过科学的起垄和密植,每亩地块可以种植花生1.4万穴,更好的提升了土地的利用率。
文献[68]在动态安全稳定评估领域,利用系统的物理知识来学习特征之间的因果关系,然后根据所得的因果关系选择作为数据驱动的输入特征。文献[70]针对并网逆变器多工况阻抗获取的问题,选取L 型和LCL 型的并网逆变器典型拓扑为例,通过小信号白箱机理建模,帮助选取经遗传算法优化的核ELM 网络的输入特征。
4.2.2 鲁棒性和泛化性
文献[81]提出了3 种数据和知识的联合模式,分别为级联、并联和混联,其中级联模式利用领域知识来生成虚拟样本,也可以提供训练样本的空间分布概率特征,以此来减少数据驱动方法对数据样本的过度依赖,同时也提高了模型的泛化能力。文献[82]将知识经验加入强化学习中,以缩小搜索空间,先平衡有功功率再平衡无功功率,使算法搜索具有方向性,构造了一种大电网潮流计算收敛的自动调整方法。文献[83]则是将电力系统的物理知识加入神经网络模型中,对数据驱动模型进行引导和约束,提升了潮流分析的性能和泛化性。文献[84]在文献[34]提出的引导学习框架的基础上更加具体地提出了一种内嵌专业知识与经验的算法——基于引导学习的健康指数算法,并与基准算法进行对比。所提的联合驱动方法输出结果与专家经验产生冲突较少,专业知识和经验的引入提升了算法的鲁棒性和泛化性。文献[85]在提升数据驱动方法鲁棒性方面总结概括了3 种引入因果理论的方法,分别为:反事实数据增强、因果效应校准和不变性学习。
4.3 数据驱动与知识驱动混合模式
与前两种方式不同的是,在混合模式中,不再以数据驱动方法或知识驱动方法其中的一个为基础模型,二者没有明确的主次之分,而是根据研究对象中待解决的问题进行联合,以适应实际的业务需求。数据驱动与知识驱动混合模式的结构如图5 所示。使用混合模式的研究[81],提出了数据-知识融合的学习模式,分为级联、并联和混联。与图5 所不同的是,文献[81]的出发点是基于引导学习的思想,用知识驱动方法来帮助数据驱动方法解决一些问题,去引导和约束数据驱动模型的构建。
图5 数据驱动与知识驱动混合模式Fig.5 Hybrid data-knowledge-driven mode
文献[86]采用内嵌的方式,基于演员-评论家架构提出了知识和数据混合驱动的算法,用于电力系统频率稳定控制。首先,将评论家模块中的系统频率响应模型知识与原始经验样本信息相结合;然后,对演员模块中的深度策略网络的参数进行优化,解决了仅由数据驱动组成的演员网络收敛较慢和参数较难的问题。文献[87]在对用户用电行为分析问题上采用串联的方式,首先通过特征优选策略筛选出最佳特征集,将之作为ELM 的输入特征,实现对用户用电行为分类的工作。文献[52]采用并联的方式,数据驱动方法和知识驱动方法均接收电力系统扰动后的量测数据且分别预测出各自的结果,再利用自适应神经模糊推理系统对两个结果进行综合处理,得到最终系统频率响应的预测结果。文献[50]在降低机理模型建模难度的同时,也体现了并联建模的思想。
5 联合驱动方法在电力调度各场景中面临的挑战
5.1 联合驱动方法准确性和高效性的平衡
联合驱动模型在准确性和高效性之间取平衡时面临很多挑战。例如在数据驱动的经验模型中,缺乏高质量的数据和特征,对场景的适应也存在一些限制,这些因素严重影响了模型计算结果的准确度。而知识驱动的机理模型难以表征强非线性因素,或模型过于复杂计算效率较低。因此,在联合建模的过程中,不能一味地追求更高的准确度而增加了复杂度,最终导致模型计算效率降低。
5.2 联合驱动方法的有效性
联合驱动方法的有效性关乎模型输出结果的可信度,影响联合驱动方法有效性的主要因素有模型的完善度和参数的可信度。而在联合驱动方法的构建过程中,由于电力调度相关建模理论知识的完善度各不相同、问题的高度复杂性等原因,想要构建一个完善的联合驱动模型面临很大的挑战。在联合驱动方法的构建过程中,需要考虑如何充分利用电网领域知识来分析问题的深层机理,更重要的是如何全局性地考虑电力系统问题,使联合驱动模型蕴涵更多维度的情况。结合所研究的电力调度问题建立起一个模型有效性的评估体系,使联合驱动方法有效性的评估更加有效。
5.3 联合驱动方法的可靠性
5.4 联合驱动方法的可解释性
联合驱动方法虽然在理论上可以利用因果思想和机理知识等帮助数据驱动方法提高可解释性。但是在提高可解释性的过程中,也会因为知识融入方式不恰当而导致联合驱动模型的拟合能力和准确度降低。在电力调度相关场景中,尤其是电力运行控制、故障检测等场景中的决策选择需要高度依赖相关机理知识和规则,如何有效地将电力领域知识融入数据驱动中对于提升模型可解释性至关重要。其中的难点是如何处理当神经网络层次较深、结构较复杂时,现有知识和逻辑不能充分融入网络结构的问题。提高可解释性的难点还包括如何根据电力领域知识建立一个从输入特征到输出结果的因果解释,形成一个合理的、有效的可解释性框架。
5.5 联合驱动方法与少样本问题
电力系统大多数应用均对安全性有极高的要求,因其需要保障电力系统安全稳定运行,因此产生的故障数据及其他反常样本较少。造成了样本分布极其不均匀[90],加之电力系统中的部分数据可观测性弱等问题,会严重影响数据驱动模型训练的效果和知识获取难度。因此,在面对电力系统样本基础薄弱、少样本等问题时,需要研究如何借助数据驱动和知识驱动的特点来降低其对模型效果的影响。目前,相关研究有提出采用领域知识生成虚拟样本、仿真样本,利用领域知识减少数据驱动对样本的依赖程度等思想和理论。但大多是针对联合思想优化问题而非具体应用,且在电力调度应用中并未得到有效实践。因此,未来有必要在电力调度领域更深入地探讨这些思想和理论的实践。
6 联合驱动方法的适用场景及展望
6.1 联合驱动方法在电力调度场景中的适用性分析
目前,新一代人工智能方法在电力系统中取得成功应用的场景源于其自身特点可以与电力系统特点紧密契合。但是,随着电力系统的复杂性越来越高,无论是传统的机理模型还是新一代数据驱动方法,在电力调度运行各个场景的适应上都出现了不足。如传统机理模型在感知预测和稳定算例筛选等场景上应用时,难以同时满足快速性和准确性,面对复杂问题时难以建模;在涉及电力系统可靠性评估、优化控制等敏感性问题时,数据驱动方法所表现出来的不可解释、低鲁棒性等问题制约了决策空间。
电力调度的场景各具特点,各类联合驱动方法也存在自身限制,需要结合自身优势于应用场景中才能发挥更好的作用。当研究问题处于以下4 类场景时,联合驱动方法有助于更好地解决问题。
1)研究问题规模较大,非线性因素较多,各影响因素之间的关系不够清晰,导致的机理模型难以构建。
2)研究问题同时对实时性和精确度有较高要求,如在线频率态势预测等,单一模型难以同时满足要求。
3)研究问题中数据基础薄弱、数据类型单一、类不平衡,而数据驱动模型又过度依赖数据。
4)研究问题需要模型所做出的决策具有一定可解释性,而模型又缺乏相关机理知识的指导。
6.2 联合驱动方法在电力调度中的展望
联合驱动方法在电力调度上的应用研究刚刚起步,未来在与电力调度各场景的结合上大有可为。
1)随着各种信息采集技术与深度强化学习等数据驱动技术的成熟,研究者可以获取更为丰富的数据,譬如故障诊断这种元件众多、系统失稳类型的不平衡数据等。联合驱动方法中的数据驱动模型可以更深入地对数据进行处理分析,在调整机理模型参数,帮助认知机理规则时可以发挥更好的作用,促进联合驱动方法在电力调度场景中的落地应用。
2)当前联合驱动方法的应用场景主要是当单一方法不能有效满足需求时,才引入另一种方法进行融合来实现更优的效果。由于其发展仍处于起步阶段,缺乏理论知识的指导,联合模式较少且有待梳理成标准参考体系。未来应结合电力调度的专业知识探索出更多的联合模式,甚至形成一个良好的生态体系,帮助研究人员更容易地针对其研究问题选择一个合适的联合驱动模型。
3)未来联合驱动方法应该更多地关注多能源接入下的新型电力系统,研究如何获取众多新元素的特性、提升对未知机理的认知能力,纳入多能源接入情况,有望提高联合驱动方法在新型能源电力系统上的适应能力。
4)联合驱动方法与数字孪生密切相关,其可以帮助实现数字孪生体和物理实体之间的实时闭环交互、精准双向映射等特性。未来联合驱动方法会成为数字孪生电网核心支撑技术之一。
7 结语
通过将数据驱动和知识驱动两者的优缺点互补,融合形成新形式的联合驱动方法,可以为日渐复杂的电力调度业务提供更好的人工智能支撑技术。本文对联合驱动方法在电力调度中的代表性研究进行了综述,总结了单一模型在电力调度典型场景中存在的问题和联合驱动方法的优势,提炼出了电力调度中的3 种联合建模方式,归类了联合驱动方法面临的一些挑战性问题,对联合驱动方法在电力调度的应用场景做了适用性分析和展望。