基于Res-LSTM网络的多元化电池剩余容量实时预测
2022-07-26黄祺尧张志宏
陈 果,黄祺尧,张志宏
(1.国网陕西省电力公司信息通信公司,陕西西安 710065;2.厦门大学信息学院,福建厦门 361005)
0 引言
随着社会经济的快速发展,新能源汽车和大规模储能的相关技术迎来井喷式发展[1]。大规模电池储能系统(Energy Storage System,ESS)由于其安全清洁、能量密度高、成本低、循环寿命长、响应速度快等特点,已广泛应用于各种工业、商业和居民场景中[2]。在不间断电源系统和储能系统中,蓄电池组是重要的储能设备,与电源系统的可靠运行密切相关。目前,市面主流的动力电池分为铅酸电池及锂电池。过充过放和电池老化等现象会加剧电池的老化,电池健康度下降,从而影响储能系统的正常供电[3]。电池单体的差异性导致了大规模电池成组中的莱比锡最小因子效应,极大损害了电池储能系统的循环寿命、安全性、可靠性和有效容量[4]。
目前在工业应用上没有可以用于在线检测电池实时剩余容量的方法,单体电池实时剩余容量的精准预测可以方便工作人员实时监控电池组中各电池的健康状态,能耗情况,提前采取安全性、经济性措施,是具有经济效益、安全效益与节能环保效益的重要研究方向。
在线监测电池实时剩余容量问题的研究,目前存在诸多难点,需要考虑:兼容多样化放电场景;兼容多样化健康度电池;电池剩余容量预测的实时性问题。国内外研究集中于观测累计较长时间的电池放电数据进行特征工程处理,或者使用电池放电前的充电过程曲线进行容量预测。在实际放电场景中很难获得该电池的充电过程数据,而较长放电时间才能进行预测也无法满足工业需求。难点是如何以较短的观测时间得到准确的预测结果;传感器信号处理问题。实际工况中电池放电的传感器数据存在大量的噪声和测量误差,采样间隔不一等问题。如何通过特征构造进行数据清洗,使得模型基于良好的数据学习到真实物理规律,是需要重点考虑的问题之一。
文献[5]以最小二乘支持向量机算法为主体,采用自适应粒子群算法对支持向量机的核函数进行优化,估算电池剩余容量(State of Charge,SOC)。文献[6-8]通过建立等效电路模型,使用改良滤波算法进行估计。
文献[9-10]使用堆叠长短期记忆人工神经网络(Long Short-Term Memory,LSTM)。文献[11]使用堆叠BiLSTM 对电池剩余容量预测问题进行研究。文献[12]基于卷积神经网络(Convolutional Neural Networks,CNN)和LSTM 复合模型,从时空提取输入数据的特征。文献[13]采用二阶RC 模型和一阶斯特林插值滤波算法对SOC 进行估计。文献[14-15]结合卡尔曼滤波相,提出基于自适应扩展卡尔曼滤波法的模型来估算电池SOC。文献[16-17]提出向量自回归滑动平均模型(Vector Auto Regressive Moving Average,VARMA)和LSTM 结合的算法,与传统时间序列预测模型相结合,预测锂离子电池电压和SOC。文献[18]提出在原有LSTM 基础上增加2 个门控单元,通过增强LSTM 内部输入和输出的交互,提高模型对于SOC 的预测能力。文献[19-20]提出了一种基于粒子群优化算法的LSTM 网络PSO-LSTM,通过粒子群算法对LSTM 网络关键参数进行优化,增强模型对SOC 的预测能力。文献[21]将LSTM 网络与迁移学习相结合,使训练样本较多的源数据信息可以被用来预测其他训练数据较少的电池SOC。
本文重点研究如何满足多种健康度电池在多倍率放电场景的电池剩余容量实时预测问题。提出基于Res-LSTM 网络的剩余容量预测。
1 电池相关概念
1.1 电池健康度
电池健康度(State of Health,SOH)表示蓄电池实际容量、性能状态等与新电池的性能差异情况,一般按照等级进行分类,通常和电池寿命相关。定义为电池额定容量与实际容量的比值,概括为健康度标签,如实际SOH 数值(用SOH表示)在60%~80%的电池,通常评价其电池健康状态为良好。SOH计算公式为:
式中:C0为电池的额定容量;Ct为电池经过完全放电所放出的实际容量。
1.2 电池剩余容量
电池剩余容量即荷电状态,反映电池的剩余容量,定义为剩余容量占电池额定容量的比值,其取值范围为0%~100%。SOC 数值(用SOC表示)为0%时表示电池完全放电,SOC为100%时表示电池达到满充状态。SOC计算公式为:
式中:Cn为电池的当前剩余实际容量。
随着电池的老化,1 组电池所能放出的实际最大电荷量不断减小,即满充状态时所拥有的电荷量在电池不断的老化过程中越来越少。剩余电荷受到多种因素影响,并不能完全释放,不同型号的电池可释放的电荷量不同。
1.3 放电倍率
放电倍率衡量电池放电的快慢,指电池在一定时间内累计放电到额定容量所用的电流值,通常用于描述电池的放电场景。其计算公式为:
式中:rate为放电倍率;I为放电电流。
2 基于安时残差连接的长短时记忆网络Res-LSTM
SOC 预测通过电池监控采集系统,采集电池多倍率实时放电过程中的传感数据,如电压、电流等。根据对电池和电池组可获得的各项外在的物理特性指标,通过数学建模、大数据分析和总结,获得电池组、电池单体的健康度指标,并预测在当前工况下,电池组或电池单体剩余的放电容量。
本文研究如何满足多种健康度电池在多倍率放电场景的SOC 实时预测问题,提出基于安时残差连接的长短时记忆网络Res-LSTM 网络的剩余容量预测,主要工作内容为:(1)提出了获取高质量电池传感信号数据,并且兼容多种采样间隔,同时减少测量误差的特征工程方案;(2)分析电池实时预测领域的特点,针对性地提出了改进Res-LSTM 神经网络预测模型;(3)提供了一套完整的电池SOC 实时在线预测的解决方案。
本文采用的电池为:电池品牌KELONG 6-GFM-100 型号电池,电池标准电压为12 V,电池额定容量为100AH;电池品牌光宇6-GFM-100 型号电池,电池标准电压为12 V,电池额定容量为100 AH。本文设定电池截止电压为10.9 V,即电压降至10.9 V以下时,放电停止。
2.1 多通道传感数据特征变换
对于实际场景下不同型号电池传感器信号存在不同采样间隔的情况,采用线性插值法对各健康度电池数据集进行下采样,使所有数据都处于同一采样分布上。
2.1.1 特征选择
利用皮尔逊相关性分析,选取相关性高的特征组合作为聚类向量,评估聚类效果,选择最终的特征组合方式。当相关系数为0 时,X和Y变量无线性相关性;X,Y变量正相关性越大,相关系数趋向于1;X,Y变量负相关性越大,相关系数趋向于-1,即:
式中:ρxy为皮尔逊系数;D表示方差。
本文对海量电池放电周期的数据进行皮尔逊相关性分析。对多倍率多电池健康度的放电特征与SOC 进行分析;对单一放电周期的放电特征与SOC 进行分析。分析结果如图1 和图2 所示。
图1 多倍率多周期的皮尔逊相关分析结果Fig.1 Multirate and multiperiod Pearson correlation analysis results
图2 单周期的皮尔逊相关分析结果Fig.2 Single cycle Pearson correlation analysis results
在多倍率多种健康度的电池放电特征中,电压保持了79.56%的线性相关性,说明在多样化的电池放电过程中,电压特征V具有较高的泛化能力,并且可以反映放电物理规律。其余特征累计放电量Q,电流I,电阻R,温度T,倍率C依次递减。尽管累计放电量在电池放电过程中与剩余电量呈理论相关性,在多健康度电池的总体计算下,在向量空间并没有表现出明显线性相关优势,这是由于在同一组电池放电过程中,累计放电量Q在同一时刻的理论值相同,而各个单体电池由于健康度不同,剩余电量不同,影响了累计放电量的线性相关程度。
同时,电阻R由于实际观测中对于传感器精度要求较高,正常工业场景观测误差较大。为了模型的普适性,选择电池放电电压V、电流I、截至当前时刻的累计放电量Q、放电场景温度T4 个特征指标。
为了验证了对累计放电量相关性情况的假设,进一步对单一周期内放电过程的特征皮尔逊相关性分析,Q的线性相关性在单周期内符合理论分析值,为100%。电流由于在恒流放电工况下单周期内各电池电流值相等,较全体数据分析大幅下降。单一电池放电特性有助于进一步对海量多工况电池的放电规律进一步掌握。因此,对在全体中线性相关较低,同时在单次放电中占据高线性相关的特征累计放电量Q给予特殊关注。
2.1.2 特征构造
由于电池数据中存在不同倍率训练数据分布不同的情况,为了进一步提取出用于区分不同工况下电池放电情况的特征,实验进一步对传感器观测特征电压、电流、温度进行变换,将其转变为相对于对应特征初始状况的变化量。构造特征放大了不同工况下电池放电情况的区别,使模型易于进一步捕捉不同倍率下电池放电变化规律,降低观测特征初始值带来的影响,增强模型的泛化能力。
由于存在浮充电压的情况,即在放电初始时,部分电池电压呈现波动上升的变化趋势。为了减小这种较短时间的上升趋势对电池SOC 预测带来的影响,在变化量特征构建算法的基础上,选择第1 个放电时间窗口内对应特征的最大值作为初始状态,使模型的输入特征数据均为相同的符号,加快模型收敛的速度,提高模型对真实规律的拟合。
2.2 基于安时积分法的改进Res-LSTM网络
对SOC 预测建模为时间序列预测任务,即观测一段历史时间的放电特征,输出当前时刻SOC 预测值。对时间序列相关的预测通常采用循环神经网络,如果输入序列过长,序列开头的信息会随着循环传递逐渐减少消失,导致预测任务所需的长期依赖的信息被遗忘。LSTM 作为一种改进后的循环神经网络,在循环神经网络的基础上,LSTM 加入了门控技术与记忆细胞状态,对循环神经网络的隐层进行改进,克服了循环神经网络无法记忆长期依赖的问题。解决了其在处理长序列数据时容易陷入梯度消失或梯度爆炸问题,具有更有效的长期预测能力[22-23]。
在电池放电领域中,安时积分法[24-25]作为经典的SOC 预测方法,在估算电池的放电时刻真实容量的基础上,通过实时计算初始时刻至当前时刻的时间内放电电流对时间t的积分,得到累计放电量。通过计算真实容量估计值和当前累计放电量之差,得到电池实时放电剩余容量,如式(5)所示。
式中:q为t时刻电流传感器观测值;SOC0为电池真实容量值。
安时法的计量存在累计误差,即随着使用时间的增加,安时法所得到的结果误差会增大,无法自适应修正。神经网络多层的非线性变换会影响Q对最终预测结果的表达能力,借用Res-Net 网络残差层思想,取该累计放电量原始信号,单独设置跳跃链接,跳过LSTM 单元层变换,加和作用于LSTM隐层输出结果,最终SOC 的预测带来加和的线性影响,更加符合电池放电的真实物理规律。
本文方法对累计放电量特征Q进行单独线性层建模,为进一步提升累计放电量特征的表达能力,对观测时间内累计放电量Q的N个连续原始采样信号,本文N取30,设置线性注意力权重网络,在系统网络结构图3 中作为Res-LSTM 模型的右通道网络。经过sigmoid 函数归一化,将2 部分通道聚合得到最终的SOC 预测值。
图3 Res-LSTM结构示意图Fig.3 Res-LSTM structure chart
3 模型实验验证
3.1 模型训练
依据所提特征工程与模型设计方案,在需要进行电池健康度预测的工业场景中,通过既定流程将所提算法模型应用到工业在线监测系统。具体流程为:首先开启UPS 并进行充放电测试;其次采用电池监控系统进行特征采集;然后进行算法模型的训练;最后将算法模型应用到电池状态实时监控系统中。
UPS 是一种不间断电源,能够提供更加稳定的放电,也是当今储能设施中大规模存在的设备[26-27],本文选择UPS 作为放电数据的采集源。
利用UPS 进行充放电测试。在特征采集方面,采用WiseBMS2000 电池监控系统,在放电过程约35 s 时,对电池组的单体电池电压、单体电池温度、单体电池内阻、单体电池容量、放电电流数据进行采集记录。通过图4 流程完成算法模型训练。
图4 电池SOC预测模型训练流程图Fig.4 Training flow chart of battery SOC prediction model
3.2 数据集
1)数据集实验环境。实验温度:25 ℃;实验湿度:65%;UPS 设备型号:KR3360;UPS 设备功率:60 kW;UPS 设备输入/输出:三相输入、三相输出;直流电压:348 V;电池数量:29PCS;采集目标:单体电池电压、温度、内阻、容量、放电电流;采集监控软件:WiseBMS2000。
2)电池放电实验步骤。首先开启UPS 并将后备电池接入UPS;利用UPS 的348 V 直流对电池进行充电操作;当充电电流小等于0.02C(2 A)且时间大于30 min 则认定电池进入浮充状态;接入三相阻性负载,电池组放电电流有3 种,分别对应0.3C,0.6C,0.9C;断开市电开始电池放电;放电至电池截止电压(单体电池10.9 V),电池空开断开;最终结束一轮放电。
3)数据缺失值处理。缺失值处理主要针对原始内阻传感器数据,通过对数据的初步观察发现部分电池的电阻值缺失,采用删除法弃用该部分电池。
4)数据异常值处理。数据的异常值代表该数值显著性偏离所属样本的其余观测值,在样本中需要进行剔除。在采集数据中存在初始时刻前几个电压采样点仍处于充电时的浮充状态电压值,偏离正常放电的平稳电压值,进行剔除。
5)数据集划分。在实验数据集的基础上,对各倍率各健康度的电池完整放电过程,构造多倍率放电测试样本集,同时在训练集中进一步划分训练与验证。
图5 为铅酸电池数据集中0.3C,0.6C,0.9C 3 种倍率下放电电池健康度分布,图例分别对应电池从健康到损坏的程度。
图5 各健康度电池分布图Fig.5 Distribution diagram of battery with different SOH
挑选其中70%的电池的完整放电过程作为模型的训练集,选择剩下的30%电池作为模型最终多场景放电多健康度电池放电的测试效果数据集。
3.3 实验平台配置及评价指标
本文实验使用的开发平台为Linux 内核,深度学习框架选用Keras 2.3.0,GPU 依赖库为CUDA 10.0 cuDNN 7.6.1,python 版 本 为3.6.0,GPU 为NVIDIA-TITAN-Xp 20G。
使用回归任务中常用的平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)作为模型的评价指标,同时避免剩余电量趋近于0 时计算指标产生精度爆炸问题,将分母由每个样本的SOC 预测值替换为该电池实际容量,修正后的EMAP为:
式中:yi为第i个样本的真实值;n为样本数量。
为了方便量化模型能力,采用EMAP为100%作为模型的准确率指标。
3.4 模型训练
训练至模型收敛,定义模型迭代忍耐度为在10个epoch 内,验证集MAPE 指标在0.01%的精度范围下,没有效果提升时结束训练。
模型基线与本文提出模型的训练参数设置如表1 所示。
表1 训练参数设置Table 1 Training parameter setting
3.5 实验结果与分析
3.5.1 基线对比实验
为了验证Res-LSTM 的优越性,本文选择SOC预测领域常用基线方法进行对比。
线性回归(Linear Regression,LR)是利用线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行回归分析。深度神经网络模型(Deep Neural Networks,DNN),分为3 层:隐藏层、输入层、输出层。将划分好的特征连接,作为输入层的输入数据,通过3 层全连接神经网络在隐藏层中进行隐藏特征提取,最后通过输出层得到最终的预测结果。支持向量机(Support Vector Machine,SVM)采用支持向量回归算法,设置高斯核函数进行非线性转化,使特征映射到更高维的特征空间中。在高维空间中,使训练集每一个样本点尽可能靠近超平面,完成对数据的拟合。LSTM 方法是将原生LSTM 作为基线实验,使用与本模型相同大小的参数量、训练时间。
本文采用相同训练方式,输入特征均为电压、电压变化量、电流变化量、累计放电量、温度变化量,使用MAPE 指标进行评估。实验结果如表2 所示。
表2 各模型EMAP准确率比较Table 2 EMAP comparison of different model %
在与多种方法的对比实验中,本文提出方法在数据集上准确率提升近12%。
3.5.2 多倍率鲁棒性测试
为了兼容多样化的放电场景,本文对比了原LSTM 与Res-LSTM 的改进模型效果,采用相同训练方式,输入特征均为电压、电压变化量、电流变化量、累计放电量、温度变化量。对各倍率电池测试集分别进行了EMAP计算,结果如表3 所示。
表3 多倍率EMAP计算测试结果Table 3 Test results of multirate EMAP %
从表3 可知,本文提出的Res-LSTM 网络模型在多倍率电池SOC 预测任务下修正EMAP准确率远高于未经调整的原LSTM 模型。
Res-LSTM 网络模型在各倍率的预测上方差较小,整体准确率分布较为集中,具有较好的多倍率工况下的泛化能力,而原LSTM 对各倍率数据的学习呈现出倍率越低,预测效果越差的情况,由于相同时间内,倍率越高的放电场景下电池放电越多,传感器信号特征变化越明显,通过单独的LSTM 结构进行信号捕捉可以很好地抓住特征变化,而对于低倍率较为平缓的特征变化预测较差,需要通过额外的信息进行补充,而Res-LSTM 很好地利用了累计放电量对SOC 的线性影响,通过累计放电量残差块作为基石,使得LSTM 网络的记忆细胞可以捕捉更细粒度的变化,达到泛化能力的提升。使用平均绝对值误差(Mean Absolute Error,MAE)作为准确率评价指标,即:
对每个样本的真实值和预测值相减取绝对值,计算n个样本的平均误差。
单个电池放电周期预测曲线,准确率指标为91%的完整放电循环电池SOC 预测曲线如图6所示。
从图6 可知,本文模型很好地拟合了SOC真实放电曲线情况,且在预测末尾阶段达到了接近0.5%的EMA误差。但在放电开始阶段对于电池的SOC预测效果较差,各对比方法均存在初期偏离较大的预测现象。原因分析为各健康度的电池在放电初期,电压等特征均能满足放电工况要求,部分健康度低的电池同时存在着容量再生现象,导致放电初期低健康度电池的放电表现和高健康度电池差异较小,对模型识别带来干扰。而随着放电的进行,健康度不同的电池放电表现差异逐渐明显,SOC 预测趋于准确。
其次,电池均为浮充状态后开始放电,放电初期的浮充电压存在一定波动带来了采集误差,即使模型特征进行了去噪,依旧存在部分误差干扰。因此,对于浮充后短时间放电情况下的电池SOC 预测今后具有较高价值的研究方向。
为了进一步考察模型泛化能力,同时在光宇品牌电池放电的数据进行SOC 预测评估,预测曲线如图7 所示。模型的预测结果基本拟合了SOC的真实放电曲线,同时在放电过程中,SOC 预测结果准确率不断提升。
图7 光宇品牌电池SOC 预测曲线对比图Fig.7 SOC comparison of prediction curves with Guangyu brand battery
本文选取开始放电1 个放电窗口后的20 min预测结果进行比较,预测结果如图8 所示。放电时间越长,预测值与真实值就越接近,SOC预测准确率随放电时间提升。
图8 20 min预测曲线对比图Fig.8 Comparison of prediction curves in 20 minutes
4 结语
电池的健康状态直接关系到系统和设备的可靠安全运行。通过数据驱动的方式实时监测电池的剩余容量判断电池组的健康状况,及时替换电池,维持供能稳定,对储能系统正常运转具有十分重要的意义。本文重点聚焦于如何满足多种健康度电池在多倍率放电场景的SOC 实时预测问题。
1)提出了对于电池放电过程传感器数据的高质量特征工程方案,可以较好地适应多种采样间隔、多倍率工况、多种健康度电池的传感器采集数据处理需求。
2)提出了一种Res-LSTM 网络。相比于原LSTM 网络,具有更好的多倍率泛化能力以及更高的预测准确率。
3)提出了完整的电池SOC 实时预测的解决方案,达到在电池开始放电采集数据时长350 s 后,以较高的准确率实时预测当前工况下电池剩余容量情况,具有很高的工业应用价值。
未来随着SOC 在线预测体系逐渐成熟后,提出今后的研究方向:(1)拓展模型应用场景方面:多规格电池数据兼容性和多种品牌电池兼容性。(2)预测时间压缩方面:在准确率下降可接受的范围内,进一步压缩模型所需观测时间;进一步兼容更高倍率,即更快速的放电工况。