面向新能源多业务场景的大数据平台构建关键技术与应用
2022-03-22王阔刘辉
王阔,刘辉
(1.北京大学,北京市 海淀区 100191;2.国网冀北电力有限公司电力科学研究院,北京市 西城区 100045)
0 引言
随着以数字化、网络化、智能化为特征的新一代信息技术日益创新突破,能源革命与数字革命加速融合,电力行业迎来了全面转型升级机遇期。同时,在“双碳”目标的重大战略部署下,中国加快了构建以新能源为主体的新型电力系统的步伐,电力系统“双高”、“双峰”的特征日渐凸显[1-2],新能源大数据呈现海量多源异构、数据孤岛、智能化水平不高的现状[3]。一方面,电源侧、电网侧与监管部门都对新能源运行数据的多业务场景应用提出了更高要求:电网侧面对装机规模及数据量巨大的新能源系统,新能源并网消纳分析和功率预测等技术已成为国家电网公司的重要攻关方向;新能源运营商也迫切需要通过精益化运维手段提升场站的运行性能。另一方面,上述业务需求数据横跨多个部门,分析工具则高度依赖智能化计算[4]。传统的数据管理系统与新能源发展趋势并不匹配,以数字化转型赋能新能源行业高质量发展,加快推动电网向能源互联网升级的呼声日益高涨[5]。
基于大数据技术提升新能源管控的自动化、智能化水平也成为行业研究的热点[6-9],各大新能源厂商陆续开展了新能源数据价值挖掘工作。GE于2012年首先提出工业互联网的概念,通过构建Predix平台架构帮助客户将海量数据转化为准确的决策[10]。远景能源2013年提出智慧风电场管理系统EnOS,基于智能物联网技术和云计算技术,帮助开发商提升发电量、降低运维成本,提高风电场综合效益。此外,金风科技建立了智慧运营系统SOAMTM,联合动力建立了UPWindEYE系统,上海电气建立了“风云集控”系统,华为建立了FusionSolar 智能光伏系统[11],各大厂商对新能源的数字化应用都进行了有益探索。
上述应用场景有所不同,但均未形成跨部门、多业务、智能化的大数据平台,本文在新能源大数据应用面临的技术挑战基础上,从数据融合、智能计算、和应用服务三个层面分别阐述了新能源大数据平台的特点和架构,通过融合电网、新能源场站等各方数据,提出了面向电网公司、新能源运营商等不同业务场景的关键技术,并设计了面向不同应用场景的业务功能,最后通过某区域新能源大数据应用平台的典型应用分析进行了实践验证。
1 新能源大数据应用面临的技术挑战
面对新能源大规模高比例并网、分布式电源和微电网接入等多重挑战,以数字化技术为新能源赋能主要面临以下的技术挑战。
1)新能源海量多源异构数据的价值尚未充分挖掘。新能源系统在运行过程中积累了海量数据,数据分散分布于新能源场站、发电企业、电网所开发的不同系统中,易造成数据孤岛效应。同时,数据存在结构化和非结构化多种形式,呈现“多源异构”的特点。海量数据蕴含着巨大的应用价值,亟需实现数据汇集与集中处理,实现多源异构数据的融汇互联[12]。
2)多元化应用对算法层的智能化、兼容性和交互性提出了更高需求。大数据技术的崛起依赖于高质量数据及高性能算法,而目前新能源数据存在数据质量和一致性较差的问题,导致数据利用率不高,数据价值尚未体现[13]。同时,新能源行业多元的应用中对数据及算法的需求存在交集,而各方的应用壁垒会导致运算效率的下降和运算成本的增加,因此亟需设计一套智能计算层来实现数据价值的高效挖掘。
3)面向各方多业务场景服务的需求日渐迫切。未来,高比例新能源电力系统的发展方向使得电网的运行特性更加多元,新能源电站与电网的交互特性变得更加复杂,对电网安全稳定运行和新能源高效消纳提出更大挑战[14-15]。同时,新能源行业大力推进提质增效,迫切需要第三方提供精益化服务,提升新能源系统的发电潜力,降低全寿命周期成本[16]。
因此,迫切需要以“平台+数据+计算”方式培育能源互联网的新业务、新业态、新模式,探索新能源数字化关键技术的研究及应用,挖掘新能源行业服务需求,助力新型电力系统构建和“双碳”目标实现。
2 新能源大数据平台架构
通用大数据平台的主流架构为异构混搭架构和分布式一体化架构。异构混搭架构功能简单,但存在对业务支撑灵活度低、数据搬迁困难、数据冗余、扩展困难等问题,且并未关注历史积累数据的价值创造和应用。分布式一体化架构可以把分散的资源连接为一个整体,实现资源整合、共享和有机协作,建立统一数据体系和服务体系[17]。
新能源数据呈现数据量大、来源广、数据结构多样的海量多源异构特征,且基于不同的应用场景,需实现数据及算法的实时交互和融合应用[18-19]。因此,新能源大数据平台采用分布式一体化架构,通过云计算虚拟化技术,将物理服务器设备进行抽象管理,实现对硬件资源的动态申请,提升系统的灵活性和稳定性[20]。此外,与传统的分布式一体化架构相比,新能源大数据平台针对新能源场景的特性,采用自适应数据动态分片技术,根据时序数据点编码和关系数据表字段进行智能分片规则推演,将各关联设备的不同任务(时序数据存储、业务数据计算等)动态均衡分发到平台特定节点执行,减少大数据平台各节点之间数据传输带来的性能损耗,可以提高大规模数据处理能力和效率。
平台的物理结构如图1所示,由边缘层、基础设施层(IaaS)、平台层(PaaS)、应用服务层(SaaS)4个层级组成。平台的功能架构主要由数据架构、算法架构和应用架构组成。
图1 新能源大数据应用平台架构Fig.1 Overall architecture of renewable energy big data application platform
2.1 多元数据融合
为实现全产业链的信息互联,充分发挥电网企业数据和技术优势,平台接入了电网公司、新能源场站、第三方厂家等多源数据,数据类型及传输方式如图2所示。为了保证数据的实时传输,平台通过边缘层打通工业网络的数据传输通道,可支持IEC104、MODBUS等多种工业协议的智能解析接口,也可通过ODBC、JDBC、FTP等接口采集数据,突破场站内部不同的信息孤岛,实现数据的共享。
图2 新能源大数据平台数据接入示意图Fig.2 Data access of renewable energy big data application platform
平台接入的海量数据包括电网调控中心的新能源率预测、智能电网调控系统、单机信息等分级运行数据,新能源场站的发电机组、AGC、AVC等秒级运行数据,中国气象局、功率预测厂家等第三方厂家的气象数据及算法模型,能够充分支撑多方对状态监控、发电性能、涉网性能等多角度精细化服务的运算需求,打破行业壁垒。
为实现多源异构数据的有效利用,平台在采集、稽核和管理过程中进行优化处理,通过云化ETL技术实现数据采集接口的标准化设计,包括通信标准化、统一数据上传规则、测点规范命名等,从源头提升数据质量。同时,开发数据稽核功能,通过风电机组运行状态的自动辨识和运行性能的量化评价,提升数据的维度和标准化程度,最终构建了多源异构数据的全生命周期管理体系,通过血缘关系追溯等功能实现端到端透明管控,通过多源数据的集成和融合提升数据利用效率。
2.2 智能化算法架构
大数据应用中各功能的实现得益于多元的智能算法,且基于数据应用的不同环节和目标,算法具有通用性。为了提升运算效率,降低系统冗余,平台针对数据质量提升和多业务场景应用的需求,嵌入了大量数据挖掘及数据融合算法(如图3所示),包括聚类算法、线性回归算法、深度学习算法等,算法种类丰富,能够通过专用或组合的方法实现包括新能源异常数据检测及清洗、关键部件的故障识别、光伏图像识别、功率预测、风电机组控制优化等功能应用,为新能源多业务场景的需求提供解决方案。
图3 平台嵌入的智能算法Fig.3 Intelligent algorithm embedded in the platform
2.3 多业务应用
平台深度整合新能源运营商、电网公司等多方需求,开发了涵盖新能源发电精益化运维、新能源功率预测与资源评估、新能源场站涉网性能跟踪评价与风险预警、新能源消纳分析等功能,结合海量数据、专家知识及智能算法集成了全面而丰富的应用模型,基于模型分析可得到对新能源整体运行态势的实时、连续、宏观精准把握,以及对电网局部状态的多角度、多层次精确感知,开展新能源电站及网源协调问题的分析优化,助力新能源的精益运行和数字化赋能水平提升。
3 新能源大数据平台的多业务应用
3.1 监管侧与电网侧业务:新能源消纳分析技术
新能源消纳影响因素众多,各因素之间又相互影响。为此,平台整合了数据采集与监视控制系统信息、负荷信息、设备故障信息、状态信息以及气象预测等系统数据,通过定义标准库的方法实现语义统一,并基于关联分析算法挖掘并量化各因素之间的关系,对新能源消纳情况进行在线实时评价,有助于为新能源调度运行提供详实的数据支撑。
为实现受阻电量分析功能,平台设计了风电场受阻电量精细化分析算法,通过对区域内新能源消纳信息的监测与统计,既能支撑风电场定位发电量损失薄弱环节,提升风电场的运维管理水平,又能支撑电网调度机构高效监测分析消纳情况,助力提升区域新能源消纳水平。
根据数据平台实时采集的新能源机组遥测数据及上报的状态位等信息,将受阻电量按形成机理分类统计,如图4所示。
图4 新能源消纳受阻电量分类Fig.4 Classification of renewable energy curtailment
单个新能源电站的受阻电量计算公式为
式中:Pj_loss表示第j个新能源电站受阻电量;h=1,2,3,分别对应调峰受阻、断面约束受阻和场外受累受阻三种情况;g=1,2,3,4,分别对应计划停机、故障停机、站内受累和发电性能劣化4种情况;Tj,h和Tj,g表示对应情况累计出现的时间;Pj,h和Pj,g分别表示对应情况下的平均功率损失。
调峰受阻电量和断面约束受阻电量为
式中:Pref_i为场站第i台新能源机组参照样板机得到的理论功率;Preal_i为第i台机组实际发电量,N为新能源机组台数;t为调峰降额发电状态的时间或断面限制降额发电状态的时间,根据机组上报状态位确定。
场外受累停机受阻电量、计划停机受阻电量、故障停机受阻电量和站内受累停机受阻电量为
式中:N为新能源机组停机的台数;t为停机持续时间,具体停机原因可结合数据平台与调度日志确定。
通过大数据平台统计,可以对区域新能源整体实时消纳状态、断面消纳、断面弃电率、通道利用率、受阻电量等进行监视,图5为某地区实时消纳断面图。
图5 实时消纳断面Fig.5 Real time power accommodation
3.2 电网侧业务:新能源涉网性能跟踪评价技术
大数据平台通过融合新能源场站AGC运行数据、AVC运行数据、SVG运行数据、SCADA运行数据等多源秒级数据,采取性能评价、发现问题、定位问题、解决问题的思路,采用分布式时序数据库,支撑大量实时、历史数据的快速读写和查询,可实现新能源场站涉网性能在线、实时、并行分析,包含事前预警、事后分析以及典型涉网缺陷定位功能,为各新能源场站涉网性能指标的跟踪评价业务赋能。
涉网事故分析与预警系统提供新能源场站并网点电压超限预警、脱网预警、脱网原因分析等功能,如图6 (a)所示。涉网性能评价模块提供AGC、AVC、SVG调节性能统计分析和展示,并可以实现 AVC系统阻抗优化功能,根据各场站的并网点电压和无功数据进行分析,计算不同电压、不同功率的系统交流阻抗值,并通过统计学相关概率算法,计算适用各工况的最佳阻抗值,功能模块如图6 (b)所示。
图6 涉网性能跟踪评价模块Fig.6 Performance tracking and evaluation module
利用大数据技术对新能源涉网性能进行跟踪评价,可有效支撑电网调控中心对涉网事件的风险管理、新能源场站涉网性能的优化提升。
3.3 共享应用:资源评估与功率预测技术
随着新能源装机规模不断扩大,功率预测关系着电网的安全稳定运行,是大数据平台的重要组成部分。预测模块通过不同的通信接口协议,直接采集数值天气预报、子站与主站预测数据、历史运行数据等多源系统数据,采用神经网络算法建立自主预测模型,并通过时空模式分析与修正,实现新能源发电功率高精度预测。
该模块集成了多个厂家的功率预测模型,实现多数据源、多模型组合优化,支撑场站功率预测精度提升,面向调控中心、交易中心和风电运营商,提供新能源功率预测优化、极端天气预警、中长期电量预测等业务服务(见图7),并实现风电场短期功率预测结果误差成因量化分析。
图7 功率预测与资源评估功能模块Fig.7 Power prediction and pesource evaluation module
功率预测算法的多数据源、多模型组合优化,以基于人工智能的学习算法为主,融合气象站、调度、场站、负荷等多源数据,利用学习算法建立历史时刻的输入数据(实测风速)与整场输出数据之间的映射关系,基于学习获得的映射关系,以NWP数据为输入,依托大数据平台的高算力、多模型进行实时计算,预测未来时刻的输出功率。极端天气预警模块可以根据气象预测计算因大风、寒潮等天气导致的停机容量,优化子站上报结果,支撑主站实现预测偏差的预警。
图8 多模型组合优化功率预测Fig.8 Multi model combined power prediction
3.4 电源侧业务:新能源场站精益化运维技术
新能源场站具有占地面积广、设备数量多、气象影响大、运维手段单一的特点,由于发展时间较晚,传统的运维手段和新兴的发展势头并不匹配。依托大数据平台,通过智能化信息采集、大数据分析处理、云平台智能决策等技术,融合新能源场站的SCADA运行数据、风机运行数据、风机故障数据、单机信息数据等多源数据,可以形成涵盖实时监测、诊断预警、设备管理、运维评价等功能的精益化运维系统,实现新能源场站的管控精细化和运维高效化。
以风电为例,为提升风电场精益化运维水平,平台开发了风电机组典型发电缺陷辨识算法,实现风电机组发电性能缺陷及影响程度的自动识别,辨识机组发电性能劣化的关键因素,提升机组的发电性能。
数据平台中将影响风电机组发电性能的因素分为以下6个方面:①能量捕获关键部件受损;②传动系统关键部件受损;③机组测量部件存在缺陷或受损;④机组偏航或变桨精度不准;⑤主控系统功率控制算法问题;⑥其他因素。由于篇幅限制,此处以偏航误差评估及优化为例,简要介绍新能源场站精益化运维的技术路线。
偏航误差来源于偏航控制性能误差和偏航静态偏差。偏航静态偏差指偏航误差分布整体偏移,仅通过风向标测量值无法获取机组的偏航静态偏差,会导致机组长时间处于无法准确对风的状态。当风电机组存在偏航误差时,导致的功率损失为
据统计,机组自身最大偏航误差约为15°,功率损失约为9.87%,由于偏航静态偏差的存在,会使最大偏航误差增大到约30°,功率损失高达35%。
根据偏航静态偏差对风电机组发电性能影响规律,同时考虑受偏航扇区的影响特征,建立优化模型。将风向标测量的偏航误差角度α和风速v进行区间化处理。将经过预处理后的数据集按照风速分成5个区间,每个区间的范围如式(5)所示:
式中:v(i)为第i个区间的最小风速;v(i+1)为第i个区间的最大风速;风速区间的步长为0.4 m/s。
为了更加精确地分析子风速区间内功率与偏航误差的关系,进一步把每个子风速区间数据按照偏航误差从-20°到20°划分为20个子区间,如式(6)所示:
式中:α(j)为第j个子区间的偏航误差下限,α(j+1)为第j个子区间的偏航误差上限,每个区间的偏航误差步长为2°。计算每个偏航误差区间内功率的平均值作为衡量每个偏航误差区间对应的功率性能的指标
式中:n为风速区间的数量;Pi,j是每个子区间内所有数据的功率平均值。选出Iindicator最大值对应的区间BSUBBIN,计算该区间偏航误差角α的均值,即为偏航系统静态偏差的估计值
式中:n为该偏航误差区间内风速子区间的数量;αi,j为每个子区间内偏航误差的平均值。
偏航系统静态偏差估计值的完整计算流程如图9所示,可以实现风电场内不同风电机组、不同风速区段偏航控制参数的自适应设置,优化风电机组偏航控制误差,有效提高机组发电性能。
图9 基于风速和偏航误差双重分区的偏航静态偏差计算流程图Fig.9 Flow chart of static deviation calculation based on wind speed and yaw error
4 典型应用案例
4.1 新能源功率预测精度提升
基于新能源大数据平台的功率预测优化模块,依托承德地区某风电场(249.5 MW)2020年6月~10月的气象平台数据(风速、风向、温度等)和场站SCADA系统秒级数据(风速、风向、功率、机组运行状态、桨叶角度、偏航角度和故障信息等),对风电场上报的日前功率预测结果开展优化。
通过智能算法对比寻优,此风电场夏季数据适用的聚类模型为高斯混合模型,计算不同分组个数时的BIC指标对分组有效性进行评价,结果如图10所示,可知最优聚类组数为4组。
图10 高斯混合聚类模型的BIC值Fig.10 BIC value of Gaussian mixture model
将该风电场机组分4个子群,并计算组内平均相关系数,选择平均相关系数最高的机组为特征机组,建立机组群的功率预测子模型。相较于传统模型,分组模型能够更灵活地判断实测功率的频繁变化趋势以及极值点的出现位置,更准确地追踪实时的功率变化。对功率预测优化前后的日前预测准确率进行统计,修正前后逐日功率预测准确率变化如图11所示。
由图11可知,通过功率预测专项优化,6月~10月风电场功率预测准确率得到提升的月度平均天数为16.4天,功率预测精度提升效果显著,可以助力地区电网的功率预测精度提升,支撑电网调度制定更为精细的日前发电计划。
图11 优化前后预测功率准确率对比图(逐日)Fig.11 Comparison of predicted power accuracy before and after optimization (day by day)
对2020年6月~10月风电场功率预测优化前后的月度“两个细则”考核电量进行计算,优化前后月度考核电量的对比结果如表1所示,功率预测精度提升后,风电场6月~10月的月度考核电量平均降低了33.1 MW,显著提升了新能源场站的涉网管理水平。
表1 优化后月度考核电量降低情况统计Table 1 Statistics on the reduction of monthly assessment power after optimization
4.2 新能源场站运行能效提升
基于新能源大数据平台的精益化运维模块,依托张家口地区某风电场(100 MW)2020年全年的测风塔数据(风速、风向等)和场站SCADA系统数据(风速、风向、功率、偏航角度等),对风电场发电量损失开展多维量化分析,结果如图12所示,因风电机组发电性能缺陷导致的损失发电量占总损失发电量的55%,是造成该风电场损失发电量的主要原因。
图12 风电场损失电量分析Fig.12 Analysis of wind farm power loss
当风电机组存在偏航静态偏差,会导致机组无法准确对风,降低机组的风能捕获效率,造成机组发电性能降低。对各台风电机组的偏航静态偏差进行计算,典型机组的计算结果如表2所示。该风电场50台机组的偏航静态偏差大致可以分为4类,#12、#24、#11、#1、#21风电机组偏航静态偏差在7.5°左右(见图13),#33、#4、#48、#43风电机组偏航静态偏差在3.8°左右,#42、#23风电机组偏航静态偏差在-3.8°左右,其余机组偏航静态偏差在0°左右。可见部分风电机组存在较大的偏航静态偏差,这也是导致该风电场机组发电性能缺陷的主要因素。
表2 各机组偏航静态偏差计算结果Table 2 Calculation results of yaw static deviation
图13 12#机组偏航静态偏差Fig.13 Measured yaw error of #12
采用基于风速和偏航误差双重分区的偏航静态偏差计算方法,对偏航静态偏差较大的12#风电机组开展控制策略优化,实现风电机组在不同风速区段偏航控制参数的自适应设置。优化前后的功率特性曲线对比如图14所示,经测算#12风电机组年发电量提升了约2.6%,降低了风电场的发电量损失,提升了风电场的发电量和发电效益,有效减少了碳排放。
图14 #12机组优化前后的功率特性曲线Fig.14 Power characteristic curve of #12 wind turbine before and after optimization
5 结论
本文在分析新能源大数据应用面临的技术挑战基础上,提出了“数据融合层、智能算法层、应用服务层”的多业务场景大数据平台功能架构,针对电网公司和新能源运营商两大服务对象,设计了“新能源消纳分析、新能源场站涉网性能跟踪评价、资源评估与功率预测、新能源场站精益化运维”4方面业务方向,介绍了为实现4方面业务所需的关键技术,基于所述平台架构与关键技术构建了新能源大数据平台并开展典型案例实践。实践表明,所开发的新能源大数据平台可显著提升新能源功率预测精度和新能源场站运行能效,为新能源大数据价值挖掘和实践应用提供了有益探索。