APP下载

基于机器学习的光伏发电功率预测研究

2024-05-22北京市市政工程设计研究总院有限公司陶廷伟

电力设备管理 2024年6期
关键词:注意力向量发电

北京市市政工程设计研究总院有限公司 陶廷伟

1 基于Stacking-支持向量机的光伏发电功率预测

1.1 集成学习理论

集成学习可理解为一种分布式机器学习框架,其主要作用在于整合多个学习器,完成相应学习任务,在实际运用时需预先打造一组基学习器。之后,依托结合策略实现学习器输出结果的融合。通常基学习器大多依靠训练集训练决策树等机器学习算法,相较于传统的单一学习器来说预测性能更加突出。常见的集成学习理论主要包括:boosting。是指对弱学习器性能实现增强的算法,该算法的优势在于基学习器件性能能够相互影响,产生极强的依赖效果,能依照基学习器误差赋予相应权重;bagging 方法。是指借助并行形式完成基学习器的构建,利用引入随机特征选择方式,强化机学习器的多样性,保证模型的泛化功能。

1.2 模型构建

为了更好地实现光伏发电功率的预测,笔者认为需要以上述集成学习理论为依托打造预测模型,借助多种参数反映光伏发电系统的实际工作情况,具体公式为:S(t)={Idc(t),Vdc(t),T(t),Iac(t),Vac(t),P(t),E(t)},其中:Idc(t),Vdc(t),Iac(t),Vac(t)分别表示直流电流、直流电压、交流电流、交流电压,而T(t),P(t)分别表示组件温度和发电功率,至于E(t)则用于表示累计发电量。

在充分考虑光伏发电特性的基础上,将连续时刻下的光伏系统工作状态S(t),S(t-1)作为样本特征,依靠大量数据参数将下一时刻的发电功率P(t+1)设计为目标值,此时训练样本可采用下述公式进行表示:sampie(t)={[t,S(t),S(t-1),P(t+1)]}。至于预测模型则主要表现为:P(t+1)=model(t,S(t),S(t-1))。

对于集成学习来说,主要依靠融合多个学习器来满足预测目标。其应用要点更多地表现为基学习器的构建以及融合,前者大多采用随机子空间法,通过预先从原始训练集中采集样本,抽取样本特征,获取初级训练集,凭借基学习器训练达到基学习器生成的目的。该方法能够从样本扰动等方面推动机学习器多样性的大幅度强化,从而保证模型预测性能,满足实际需求,之后借助选择性集成筛选性能优良的基学习器。

在应用Stacking 支持向量机模型时还要注意,应优先采用K 均值聚类算法进行训练集的聚类分析,并划分为多个子样本集,通过输入筛选获得相应的次级训练集,并将每条样本特征值设计为基学习器的输出值,从而使用次级训练集完成各类别语言学习器的训练。

1.3 数据处理与评价指标

在数据处理方面,主要任务在于解决不同参数单位差异性造成的影响,具体的处理方式如下:(xi-xmin)/(xmax-xmin),式中:分别表示输入数据以及处理后的数据,xmin、xmax分别表示输入的最大值、最小值。至于在模型评价指标的设置上,则依靠百分比误差mape以及均方根误差rmse两种指标来实现模型的性能预测,具体方法为:

式中:xmodel,i,xactual,i分别表示预测值以及实测值,n表示常数,i表示样本集序列。

1.4 算例分析

为进一步验证上述光伏发电功率预测模型的可行性与适用性,本文以自身所在城市的光伏发电站作为研究对象,并采用2019年5~7月以及2020年5~7月的数据进行预测模型的训练,进一步考察该模型在2021年6月不同气象条件下的具体表现。借助实验法,确定K 均值聚类数,并选取基学习器数量的1/3,实现集成处理。根据研究显示,在晴天条件下光伏发电功率不会产生较强波动,Stacking 支持向量机模型所生成的预测曲线基本与实测值保持一致。但在发电站开始发电以及结束发电时会存在较高的预测偏差。而在雨天环境下,光伏发电功率本身会出现多个尖峰,此时会进一步加大预测难度。

根据Stacking 支持向量机模型的预测结果显示,发电功率的变化趋势均被准确掌握。即便在上午、傍晚等波动较为严重的时间,Stacking 支持向量机模型仍能保持极佳的预测效果。而在多云气候条件下,对于光伏发电影响的主要因素表现为光照,在受风力、云层位置的影响下光伏发电功率的波动较为强烈。此时Stacking 支持向量机模型仍能具备极佳的预测精确性,准确判断多云天气的发电功率的变化趋势。具体的预测结果如表1所示。

表1 不同气象条件下预测模型的百分比误差mape 以及均方根误差rmse

根据上述数据可知,Stacking 支持向量机模型的预测性能较为突出,相较于传统的K 均值聚类支持向量机模型来说,能够更好的应对气象环境波动造成的影响,在雨天下更具有预测优势。

2 基于长短期记忆网络与注意力机制的光伏发电功率预测

上述章节中主要探究了在加入光伏系统参数后,实现光伏发电功率预测精确性的增强,验证了Stacking 支持向量机模型的预测效果。但要注意,Stacking 支持向量机模型需要根据季节特性克服恶劣天气造成的影响,因此在实际应用时无形增加了模型训练量,也对工作人员的专业能力提出了更高的要求,且模型使用不够便捷,更多的依靠光伏发电特性的设计样本特征,因此无法进行较长时间范围的预测。

为解决此类问题,本文提出基于长短期记忆网络的光伏发电功率预测模型,其中长短期记忆网络可以理解为一种时间递归神经网络,更适合运用在预测时间序列领域,且在语音识别等方向已取得一定应用成果。通过在此模型上加入注意力机制达到模拟生物视觉注意力的目的,从而自动关注重要参数,帮助预测模型,依托发电功率、时间序列,为下一时刻发电功率进行准确评估[1]。

2.1 预测模型算法

根据实际调查显示,以往采用的神经网络模型各层节点无有效连接,更多的表现为层与层之间的全连接,此类结构经常会出现时序数据预测精确性达不到预期标准的问题。究其原因在于,时序数据与原始数据存在联系,而神经网络则难以有效记忆之前参数。至于循环神经网络,虽然能够在时序数据分析过程中具备良好的适应效果,且隐藏神经元存在连接,可以将之前信息记忆并输出,但在实际应用时则难以有效学习数据内的长期依赖特征,且在训练过程中也经常会出现梯度爆炸的不足之处。为此,我国学者提出了长短期记忆网络,其本质上属于一种时间循环神经网络,可凭借传递算法结合错误修改每次权重。在设置过程中,误差能够随着倒回计算,直至数值被过滤掉,以此使循环神经网络正确处理时序信息[2]。

相较于传统的基于机器学习的光伏发电功率预测,基于长短期记忆网络的光伏发电功率预测模型添加了注意力机制,通过打造生物视觉系统,使人体能够将精力放在相关数据信息上,以此最大程度提高观察效率。注意力机制本质上属于一种模拟大脑注意力的网络架构,能够在特定时刻进行注意力的合理分配,以此减少计算资源占用。将其运用在深度神经网络中,能够更好的筛选输入向量内的相关特征,降低其他特征造成的不良影响,保证模型的泛化性能最大化。

在实际应用过程中,通常将长短期网络记忆的隐藏输出向量作为输入,之后寻找特征向量,分配注意力权重,具体公式表现如下[3]:ei=tanh(Whhi+其中:Wh、bh、ai分别表示权值矩阵、偏置项及权重参数,hi表示特征量,ei表示注意力机制,t为输出向量子集个数。

2.2 预测模型构建

在模型构建方面,需要依照光伏发电站的相关数据参数,充分考虑相关学者的研究结果,将光伏发电功率时间序列作为主要输入,搭配组件温度时间序列,从而实现下一时刻的发电功率预测。对于输入中包含的大量参数信息,需要进行分类型的特征提取。将前者输入长短期记忆网络,凭借注意力机制进行隐藏输出的持续关注,并对隐层输出的各个元素赋予差异性注意力权重。而在后者的处理方面则与前者基本保持一致,之后将注意力权重展开成一维向量,借助全连接层预测发电功率。过程中要注意,模型训练阶段需充分考虑网络前向传播的真实训练输出值,并将其结合实际功率值完成平方损失函数的推演,通过适当优化网络架构降低平方损失值,直至返归一化处理后获得实际预测结果[4]。

2.3 数据处理与评价指标

在数据处理方面基本与Stacking 支持向量机的光伏发电功率预测保持相同,主要目的在于解决不同参数之间单位差异造成的影响,控制好数量级大小。同时还要利用滑窗法获得训练样本,设置样本特征值,从而为下一时刻的实际功率值设计训练目标,并同样采用绝对百分比误差来评价模型的实际预测性能。

2.4 算例分析

为进一步验证上述模型的适用性以及可行性,同样选取笔者所在城市的光伏发电站作为研究对象,收集2019、2020年信息以及2021年1~9月的数据完成模型训练,并将2021年10月至次年9月的信息设为训练集,进一步考察长短期网络记忆模型在不同季节下、不同时间区间内的预测效果,与上述章节中的Stacking 支持向量机光伏发电功率预测模型进行比对。其中基准模型可进一步描述成,采用两个长短期网络记忆层实现发电功率的时间序列特征提取,并将其拉成一维后,与组件温度时间序列合并输出预测结果。根据预测结果显示,基于长短期网络记忆和注意力机制的光伏发电功率预测模型能够在30min 时段做出精准预测,60min 时间段同样具备极佳的预测效果,预测值与实际值误差极小[5]。

3 基于机器学习的光伏发电预测未来发展

在信息化时代背景下大数据技术的应用愈发广泛,该技术的迅速兴起也为大规模数据处理提供助力,通过将其与机器学习深度结合,能够进一步挖掘数据背后的价值意义。大数据技术的应用尚处于摸索阶段,因此本文在进行分析时主要以hadoop大数据处理平台作为研究对象,搭建试验群,以此存储光伏发电数据,实现光伏发电信息的建模预测。hadoop 本质上属于一种分布式大数据处理框架,能够具备负载均衡、任务调度等功能,可直接部署在廉价的集群上实现文件的切分处理,保留多个文件备份,具有极高的容错性。在实际应用时需要结合决策树、梯度提升算法以及随机森林,分别完成回归任务、残差训练以及基学习器集成。

根据实际研究发现,相较于上述两种方法来说,基于大数据技术的光伏发电预测同样能够准确预测光伏发电功率,具有极高的应用潜力。同时,为保证光伏发电预测模型的准确应用,还需要相关技术人员加强对先进技术手段的学习与使用,明确相关算法的优劣,结合实际情况进行科学运用,具备一定的信息化素养,能够有效应对突发状况,降低人为操作干扰,更多的依靠系统程序的自动计算模拟,保证参数录入准确。总结算法应用规律,持续开发循环控制单元、相似日选择等一系列机器学习的光伏发电功率预测,适当结合信息化手段、人工智能,迎合适当发展潮流,并注重预测时间段的延长,从而满足实际需要[6]。

猜你喜欢

注意力向量发电
“发电”
向量的分解
让注意力“飞”回来
柠檬亦能发电?
聚焦“向量与三角”创新题
摇晃发电小圆球
“扬眼”APP:让注意力“变现”
摩擦发电
A Beautiful Way Of Looking At Things
向量垂直在解析几何中的应用