基于CEEMDAN-RVM-LSTM 模型的锂电池剩余寿命预测
2023-11-03牛群峰刘江鹏
牛群峰,袁 强,王 莉,刘江鹏
(河南工业大学电气工程学院,河南郑州 450001)
随着新能源时代的到来,锂离子电池因具有储存方便、环境友好、循环寿命长等优点,广泛应用于储能设备,在城市交通和智能电网等领域发挥着重要作用[1]。然而,锂电池在实际使用过程中随着电池充放电循环的反复进行,由于电池内部化学反应和外部环境条件,电池不可避免出现老化、衰退,如未及时更换老化失效的电池会导致用电系统发生功能失效或损坏,并有可能发生重大安全事故。监控锂电池容量并进行准确及时的剩余使用寿命预测能够有效规避事故风险,保证公众生命财产安全[2]。
目前锂电池剩余使用寿命(RUL)预测方法主要分为两种。一是基于模型驱动的方法,Guo 等[3]建立锂电池二阶RC等效电池模型,通过对锂电池在不同寿命阶段的充电曲线进行自适应变换来量化容量衰减程度,达到估算电池健康状态的目的。Ashwin 等[4]通过研究固体电解质界面(SEI)膜厚度和热效应对电池容量的影响,提出一种二维电化学模型,实现电池寿命预测。虽然基于模型驱动的方法取得了良好的效果,但是利用模型驱动的方法在研究中往往需要花费大量时间建立锂电池预测模型,并且由于电池内部反应机制比较复杂,容易受到噪声以及环境干扰的影响,导致模型的泛化性能比较差。二是基于数据驱动的方法,不用了解锂电池内部变化的化学机理,只需对表征锂电池外部特性的历史数据进行分析,通过挖掘电池的退化特征和退化趋势来构建RUL预测模型,具有较强的实用性。近年来,随着深度学习理论的发展,其应用对象及场景不断扩展,其中长短期记忆神经网络(LSTM)非常适合处理时间序列预测问题。陈等[5]提取锂电池等压降放电时间作为健康因子,构建卷积神经网络(CNN)-LSTM 模型进行锂电池RUL的间接预测。
但是锂电池在电池容量退化过程中有严重的再生现象,影响寿命预测算法的准确性。针对锂电池寿命衰减过程中存在的容量再生问题,目前有效的解决方法是引入模态分解算法[6]。Cheng 等[7]利用锂电池的电流和电压参数,采用经验模态分解算法(EMD)与反向长短期记忆神经网络相结合的方式,有效地减少了噪声干扰,提高了RUL预测精度。尽管EMD 算法在信号处理中得到了广泛的应用,但它仍存在显著问题,例如端点效应和模态混叠,无法准确地根据循环前期的容量退化趋势进行RUL预测。而自适应噪声完整集合经验模态分解算法(CEEMDAN)通过添加自适应高斯白噪声,使得分解更为充分、重构误差更小,在提升预测模型的精度方面具有突出的优势[8]。
此外,传统的数据驱动模型只能提供RUL预测的点估计结果,无法给出预测结果的置信区间,在实际电池管理系统中,仅计算RUL的点估计对于系统决策维护是有限的。相关向量机(RVM)稀疏性更高、超参数简单、生成能力强,最重要的是它可以提供不确定性表达式[9]。Yao 等[10]提出粒子群算法优化极限学习机(PSO‑ELM)‑RVM 模型来预测具有不确定性表达式的电池剩余寿命,利用RVM 可以从数据中建立与容量的映射关系,并给出置信区间。
综上所述,针对锂离子电池退化过程中出现的容量再生现象,本文提出了CEEMEDAN-RVM-LSTM 模型用于电池容量及RUL预测。利用CEEMDAN 分解出容量数据中的随机波动分量和全局退化信息。建立RVM 模型捕获由于电池退化出现的容量再生引起的随机波动分量,同时建立LSTM 网络来拟合全局退化信息。最后,综合RVM 与LSTM 所得结果,从而准确预测电池容量与RUL,得到预测电池容量的置信区间。
1 相关理论介绍
1.1 CEEMDAN 理论
CEEMDAN 算法是集合经验模态分解算法(EEMD)的改进版本,它将非线性和非平稳时间序列分解为多个平稳分量。EEMD 将正态分布的白噪声添加到原始信号中,减少了模态混叠现象,但是它会增加处理时间。此外,在重建过程中可能会发生数据丢失,为了克服这些问题,提出CEEMDAN 算法,给定原始时间序列表示为x(t),定义Ei()表示使用EMD 算法分解得到的第i个模态分量,计算步骤如下:
(1)向原始时间序列中添加噪声系数为δ0的白噪声δ0ωi,表示为:
(2)使用EMD 算法对xi(t)分解并求均值,得到第一个模态分量IMF1:
接着计算第一个残差分量r1(t):
(3)通过对r1(t)+δ1E1[ωi(t)]进行EMD 分解,得到第二个模态分量IMF2:
同样继续计算第二个残差分量r2(t):
(4)重复步骤(2)~(3),则第m个残差分量和第m+1 个模态分量为:
(5)重复步骤(4),直到残差分量呈单调趋势,分解停止,原始信号被分解为:
式中:M为最终得到的模态分量的个数;R(t)为最终得到的残差分量。
1.2 相关向量机
RVM 是一种基于贝叶斯理论的机器学习方法,与支持向量机(SVM)相比,它允许使用任意核函数,不受Mercer 条件限制,有效降低了计算的复杂性和时间的消耗,并具有强大的泛化能力。RVM 基本原理为:
式中:ω=(ω0,ω1,···,ωN)是权重向量;ε~(0,σ2)为均值为0,方差是σ2的高斯噪声;核函数φi(x)=K(x,xi)。
由于tn是独立分布的,那么训练集的似然函数为:
RVM 对超参数的约束是每个权值ω 满足高斯先验分布:
式中:α={α0,α1,···,αN},为N+1 维的超参数向量。
依据贝叶斯原理推导得到全部未知参数的后验概率分布,即:
令A=diag{α0,α1,···,αN},则均值m和后验协方差矩阵∑表示为:
为了求得μ和∑,需要超参数α和σ2的值,使用最大似然估计求得估计值αMP和σMP2,并通过不断迭代计算求得超参数的最优值来确定模型权值。
式中:γi=1-αi∑ii,∑ii为后验协方差矩阵∑中的第i个对角元素;μi为μ第i个元素。
若设定x*为新的输入值,输出值t*的概率分布为:
1.3 LSTM 神经网络
LSTM 神经网络是循环神经网络(RNN)的变体,用于处理有关时间序列的预测和非线性映射问题。在RNN 的基础上,LSTM 通过在神经元中增加遗忘门、输入门和输出门三种门控机制,能够选择性地记忆历史信息,并具有更强的长期记忆能力。LSTM 网络结构如图1 所示。
图1 LSTM网络结构
遗忘门是确定每次在细胞单元状态中丢弃的信息:
式中:ft是t时刻遗忘门的输出值;Wf、bf是遗忘门的权重矩阵和偏置;[ht-1,xt]是输入向量,由电池容量序列和循环次数组成;σ是sigmoid 激活函数。
输入门决定每次进入细胞单元状态的信息:
式中:it是t时刻输入门的输出值;Wi、bi是输入门的权重矩阵和偏置;ct是当前细胞单元状态,由上一时刻的细胞单元状态ct-1与候选细胞单元状态组成,这两个细胞状态单元分别由遗忘门和输入门控制。
输出门确定每次从细胞单元状态输出的信息:
式中:ot是t时刻输出门的输出值;Wo、bo是输出门的权重矩阵和偏置;ht为单个LSTM 神经元细胞最终的输出信息,由输出门和当前细胞单元状态确定。
1.4 CEEMDAN-RVM-LSTM 的RUL 预测方法
本文所提出的预测模型结构框图如图2 所示,主要分为三个阶段:(1)提取锂电池容量退化数据,利用CEEMDAN 算法对其进行分解,得到本征模态分量(IMF)和残差分量(RES);(2)对分解后的IMF和RES分量构建数据集,划分为一定比例的训练集和测试集,使用RVM 拟合每个IMF序列,训练LSTM 网络去估计RES序列,将两者的预测结果进行有效集成,得到锂离子电池容量及RUL预测模型;(3)使用训练好的预测模型,获得未来的电池容量数据及相应的置信区间并计算RUL。
图2 预测模型框图
2 实验结果与分析
2.1 实验平台
本文实验设备使用联想小新Pro16 笔记本电脑,配置为AMD Ryzen 7 5800H CPU,16 GB 内存,64 位Windows 10 系统,实验软件采用MATLAB 2019a 版本。
2.2 实验数据集
本文使用的数据是由美国国家航空航天局(NASA)提供的锂电池寿命实验公开数据集,选取其中B0005、B0006、B0007 和B0018 四块电池的实验数据进行验证。该数据集是在室温下对18650 号锂离子电池(额定容量为2 Ah)进行循环充放电实验而获得的。充电测试是先以1.5 A 的恒定电流充电,在达到最大充电截止电压4.2 V 后,再以恒压方式充电,直至达到最小截止电流20 mA,结束充电。放电测试是以2 A的恒定电流放电,电压下降到放电截止电压时,结束放电,四块电池的放电截止电压分别为2.7、2.5、2.2、2.5 V。图3 为四块电池的容量衰减曲线,为验证所提方法的有效性,设置B0007 电池的失效阈值为1.5 Ah,其余三块电池均为1.4 Ah。
图3 锂电池容量衰减曲线
2.3 模型评估标准
为全面分析本文方法的优越性,本文采用均方根误差(RMSE)、平均绝对百分比误差(MAPE)和平均绝对误差(MAE)作为模型的评价指标,这三个指标均是越小说明模型越好,计算方法分别为:
式中:Ct和分别代表实际容量值和预测容量值;n为测试样本的长度。
2.4 CEEMDAN 对锂离子电池容量序列分解结果分析
图4 为EEMD 算法 和CEEMDAN 算法对B0005 电池容量衰减数据进行分解的结果,均包含多种频率的IMF分量及残差分量。其中IMF分量表示电池容量衰减过程中的由于容量再生导致的局部波动,残差分量为单调下降的平滑序列,反映了容量的全局退化趋势。对比两种算法的残差分量可以看出,使用CEEMDAN 算法得到的残差分量与实际容量衰减数据更加贴近,有助于提高组合预测模型的性能。
图4 两种算法的分解结果
图5 为EEMD 算法和CEEMDAN 算 法对B0005 电 池容量衰减数据的分解重构误差结果,可以看出CEEMDAN 算法的误差更小,表明其分解更加彻底。这是由于CEEMDAN 在EEMD 分解的基础上对白噪声也进行了分解,有效解决了EEMD 因分解后的噪声无法完全抵消导致重构误差较大的问题。
图5 两种算法重构误差对比
2.5 模型对比分析
为了验证本文所提出CEEMDAN-RVM-LSTM 对锂电池容量与RUL的预测性能,与EEMD-LSTM、EEMD-RVMLSTM 进行对比分析,EEMD-LSTM、EEMD-RVM-LSTM、CEEMDAN-RVM-LSTM 分别记为M1、M2、M3。实验分别使用四块电池容量数据中50%的数据构建训练集,剩下50%的数据构建测试集进行研究实验。
对CEEMDAN 所得结果,采用RVM 模型对IMF分量拟合。核函数是RVM 的重要组成部分,本文实验中使用了多核学习的方法,选用粒子群算法用以确定各个核函数的最优权重及参数,有助于提高准确度和拟合质量。使用LSTM 网络对RES分量进行估计,LSTM 的超参数设置如表1 所示。
表1 LSTM 超参数设置
图6 为三种模型对B0005、B0006、B0007 以及B0018 四块锂离子电池的预测结果,其中浅蓝色与浅粉色带状区域表示95%置信区间。与M2 相比可以得出,M3 在四块电池的预测曲线都更加接近实际容量退化曲线,表明利用CEEMDAN 分解后建立预测模型相比EEMD 可以有效提高预测精度,同时M3 输出的置信区间相对M2 来说也更加贴近实际容量曲线附近。另外可以看出,M1 模型的效果最差,这是由于在对高频信号的拟合方面,使用LSTM 网络不如RVM 准确稳定,LSTM 网络更适合学习长期依赖关系。从图6 中还可以看出,包含RVM 的模型的预测结果具有不确定性表达,即预测结果包含一个范围而不是仅有单点的形式,这也体现出RVM的优势所在。
图6 不同模型的预测结果
表2 为三种模型对比实验评价指标结果,可以看出,M1对四块电池容量预测的RMSE均在0.02 以上,模型效果较差。M2 与M3 之间的差距较大,说明相比EEMD,使用CEEMDAN对后续预测精度提升较大。本文方法M3 在四块电池上的三项指标均是最小的,RMSE、MAE和MAPE在0.017 9、0.014 和0.010 4 以内,最低为0.010 6、0.007 3 和0.005 2。以B0007 电池为例,M3 比M2 的RMSE降低了38.3%,MAE降低了34.1%,MAPE降低了36.7%,反映出较高的预测精度,可以较好地预测出未来的容量衰退趋势。另外从表2 中也能看出,B0006和B0018 电池的预测指标值相对偏高,这是由于这两个电池的容量退化趋势变动幅度较大。
2.6 RUL 预测
电池RUL的定义是从预测起点开始到电池寿命结束,即当电池实际容量退化至失效阈值时的剩余可使用循环次数。实验使用上文中所设定的每块电池容量失效阈值。并使用锂电池RUL预测的绝对误差AE和锂电池RUL预测的相对误差RE来衡量RUL预测精度,计算公式如式(29)~(30)所示:
式中:RULt和RULp分别代表锂电池到达失效阈值时的实际剩余循环次数和预测剩余循环次数。
本文模型对四块锂电池的RUL预测结果如图7 和表3 所示,图7 中浅粉色带状区域表示95%置信区间。预测值曲线基本在真实值曲线附近,能够很好地跟随真实值的趋势,此外真实值曲线基本都在预测值的置信区间范围内,证明本文所提方法不仅能够精确获得RUL预测结果,也能够提供电池容量衰退的不确定性表达。
表3 本文模型RUL 预测结果
图7 本文模型的预测结果
从表3 中可以看出,本文所提出的方法对四块电池RUL预测的相对误差分别为0、9.5%、5.2%和0,绝对误差不超过2,且实际剩余循环次数全部位于RUL置信区间内,表明了本文所提方法对电池RUL预测的有效性。
3 结论
本文提出基于CEEMDAN-RVM-LSTM 的组合模型来预测锂离子电池的容量与RUL,并提供预测的不确定性表达。使用CEEMDAN 算法可有效降低容量再生效应干扰,减少预测误差。选取NASA 电池数据集验证模型的预测性能,与EEMD-RVM-LSTM 及EEMD-LSTM 进行对比,本文所提方法对电池容量与RUL的预测表现最好,预测误差最低,RMSE保持在2%之内,最大MAE和MAPE分别为1.4%和1.04%,RUL绝对误差不超过2,并且具有置信区间的RUL预测结果可以为电池系统决策提供更可靠的信息。