基于数据预处理和集成机器学习的锂离子电池剩余使用寿命预测
2023-12-19王海瑞朱贵富
罗 杰, 王海瑞, 朱贵富
1.昆明理工大学 信息工程与自动化学院, 云南 昆明 650504;2.昆明理工大学 信息化建设管理中心, 云南 昆明 650504
“碳中和、碳峰值”已成为全球共识,电池储能系统迅速发展。锂离子电池作为一种清洁能源具有循环寿命长,充电速度快,环保低碳等优点,被广泛应用于电力系统领域、储能领域等。而锂离子电池在工作过程中内部反应复杂多变,当电池的剩余使用寿命(Remaining Useful Life,RUL)达到失效阈值时,若继续使用可能会引发安全事故。如三星Note7电池爆炸、中国南方航空公司CZ3539航班乘客使用锂离子电池移动电源起火,以及特斯拉发生的起火事件等。锂离子电池的老化是导致这些锂离子电池出现故障的原因之一[1-2]。因此,准确的预测锂离子电池剩余使用寿命,并且及时进行维护管理对于减少经济损失和避免安全事故发生具有重要的意义[3-5]。
近年来,锂离子电池剩余使用寿命预测方法主要可以分为基于模型方法和基于数据驱动方法[6-7]。基于模型的方法主要通过构造电池内部的动态结构,结合算法实现RUL预测。陈剑等[8]提出一种混合滤波算法(EKF-SVSF)在线实时估计电池容量。GAO Yizhao等[9]提出基于增强型降解电化学模型和双非线性滤波器的锂离子电池SOH估算方法,该方法在实验过程中充分考虑到锂离子活性材料退化、内阻增加等本身退化因素,不足之处是未考虑温度影响。这类方法容易受到环境因干扰,鲁棒性差。基于数据驱动方法不需要分析电池内部的复杂结构,通过提取电池相关的健康特征,利用机器学习算法建立预测模型,具有较高的灵活性和适用性。但预测精度容易受到数据质量的影响,例如电池容量的局部再生现象会对预测结果产生干扰。于是,ZHOU Yapeng等[10]将锂离子电池数据用经验模态分解(Empirical Mode Decomposition,EMD)算法分解为模态分量和残差序列后用差分自回归移动平均(Autoregressive Integrated Moving Average,ARIMA)模型建模分析从而预测剩余寿命。但传统的EMD算法存在模态混叠问题,针对于此问题,史永胜等[11]提出了一种基于自适应噪声完全集成的经验模态分解(Complete Ensemble Empiri-cal Mode Decomposition with Adaptive Noise,CEEMDAN)算法,将锂离子电池容量划分为主退化趋势和多个局部退化趋势两个部分,然后用长短期记忆网络(Long Short-Term Memory,LSTM)模型分别对分量建模预测,最后对预测结果集成。黄凯等[12]在数据预处理上通过自适应双指数模型平滑方法(Adaptive Bi-exponential Model Smooth,ABMS)解决容量再生问题,然后通过CEEMDAN分解处理数据。上述研究中仅使用单一的预测模型,泛化性能不足。于是,胡天中等[13]提出一种多尺度深度神经网络预测模型,刘征宇等[14]提出了一种将经验模态分解与门控循环单元(Gated Recurrent Unit,GRU)模型和差分自回归移动平均模型(ARIMA)相融合的锂离子电池寿命预测方法,具有良好的预测精度和稳定性,ZHOU Danhua等[15]提出基于时域卷积网络(Temporal Convolutional Network,TCN)的锂离子电池寿命预测,与传统的循环神经网络(RNN)模型相比,该网络结构具有捕捉局部再生现象的能力。刘丽等[16]提出一种将TCN与多头注意力机制(Multi-Head Attention,MHA)融合的剩余寿命预测方法,突出重要信息,通过加权特征提高预测能力。
因此,结合上述的优势,本论文提出了一种将CEEMDAN、TCN-MHA、ARIMA模型相结合的方法进行锂离子电池剩余使用寿命预测。利用CEEMDAN将锂离子电池容量信号分解为波动数据和主趋势两部分,解决容量再生干扰问题,结合TCN-MHA和ARIMA的模型特点,分别对波动数据和主趋势构建预测模型,最后将预测结果集成。通过NASA锂离子电池的四组实验数据对该方法进行分析验证。
1 预测模型及方法
1.1 自适应噪声完全集成的经验模态分解(CEEMDAN)算法
CEEMDAN算法是一种改进的EEMD算法,它结合了自适应噪声的处理,将非线性或非平稳信号分解成一组本征模态函数(EMD),引入参考噪声和自适应噪声,提高了信噪比和分解的准确性,并将噪声与信号分离解决噪声污染问题。CEEMDAN算法具有较好的时频局部化特性和自适应噪声处理、模态数确定、无模态混叠等优点。具体实现步骤如下:
(1)
2) 计算锂离子电池分解的第一个唯一的余量信号:
(2)
3)Ek表示经过EMD处理后得到第k个模态分量,进行i次实验,每次实验中,对信号R1(t)+ε1E1(ω(i)(t))进行分解,得到第2个模态分量以及第二个余量信号:
(3)
(4)
4) 对于k(k=3,4,5,…,K)阶段,重复步骤3)计算方法,通过EMD算法对信号分解,计算第k+1个模态分量:
(5)
5) 当余量序列极值点数小于或等于两个,分解终止,最终信号被分解为
(6)
1.2 时间卷积网络(TCN)
图1 TCN扩张因果卷积结构
本章节所提出时域卷积网络(TCN)就是融合循环神经网络(RNN)和卷积神经网络(CNN)优点于一体的网络模型。采用1-D FCN的结构,便于分析数据时序的特征[16]。该结构由扩张因果卷积和残差连接组组成,如图1所示。
扩张因果卷积中的因果卷积具有特殊的堆叠结构,拥有强大的时序序列处理能力,在处理时序数据时,任意时刻的输出仅由当前时刻及之前的输入所决定,没有未来的数据进行参与计算,前后数据保持因果特性,整体网络结构具有单一性。
扩张因果卷积中的扩张卷积又名空洞卷积,如图1所示为3层扩张因果卷积层组成,卷积核大小K为2,扩张因子D为1、2、4。扩张因子在标准的卷积特征图中注入了指定尺寸的空洞允许卷积核对信息进行间隔采样。通过增加扩张卷积的深度,获得更大的感受野[17],接受更多的时序详细信息。最后,TCN引入残差机制,使网络跨层传递信息,解决网络层数过多而造成的梯度消失与梯度下降的问题。
1.3 ARIMA预测残差
ARIMA模型又称差分自回归移动平均模型,是一类在时间序列数据中捕获一组不同标准时间结构的模型,非季节性模型可表示为ARIMA(p,d,q),p、d、q分别为模型的阶数。ARIMA模型包含移动平均模型(MA)、自回归模型(AR)、自回归移动平均模型(ARMA)三种形式。本模型在针对非线性平稳时间序列有良好预测方法,本文用于对锂离子电池分解后的平滑残差信号建模。建模思想如下:
1) 平稳化处理。判断分解后的锂离子电池残差信号是否平稳,如果数据不是平稳的,需要进行进行差分运算d次。
2) 模型识别。通过分析自相关函数(ACF)和偏自相关函数(PACF)为目标序列定阶。
3) 参数估计。通过观察赤池信息准则(AIC)和贝叶斯信息准则(BIC)的大小来选择已识别出的ARIMA模型的最佳阶数。公式如下:
AIC=-2lnA+2d,
(7)
BIC=-2lnA+dlnT,
(8)
其中,A是时间序列的似然函数,d是估计参数的数量,T为锂离子电池分解后的残差长度。
4) 残差检验。用训练好的模型对锂离子电池分解后的残差信号进行白噪声检验,若经过检验显示残差为白噪声,说明模型对数据的信息提取比较充分。
1.4 锂离子电池RUL预测方法框架
本文采取锂离子电池容量作为健康因子,针对于锂离子电池出现的容量再生、噪声干扰现象进行数据预处理后,分析数据特征,根据不同模型优势建模预测,提高锂离子电池剩余寿命预测精度。锂离子电池RUL预测方法框架如图2所示,具体步骤如下:
1)利用式(1)—(6)对锂离子电池容量退化序列进行CEEMDAN分解,得到3个表征局部波动和容量再生现象的IMF分量和一个表征整体退化趋势的残差R序列。
2)将模态函数和残差信号按照各50%比列划分训练集和测试集。
3)分别利用TCN-MHA模型和ARIMA模型对IMF分量和残差R序列建模,得到预测的IMF分量和残差R序列。
4)将各个模型的IMF预测分量和残差预测序列进行叠加,得到锂离子电池剩余寿命的预测结果。
2 实验和结果分析
2.1 数据集介绍分析
本文使用的锂离子电池数据来自NASA PCoE研究中心在美国爱达荷州国家实验室测试NASA锂离子电池数据(https://www.nasa.gov)。研究选择B5、B6、B7、B18号电池,额定容量为2 Ah,在室温24 ℃下进行充放电过程。在充电方面采用标准充电方式,电池以恒定电流1.5 A进行恒流充电,并设定了最大截止电压为4.2 V。当电池电压达到最大截止电压时,转为恒压充电,直至充电电流下降到20 mA时,充电过程结束。在放电方面,采用恒定电流2 A进行放电。NASA PCoE电池实验以电池容量退化至额定容量的70%作为电池寿命结束的标准。锂离子电池容量变化曲线如图3所示。
图3 NASA电池容量退化曲线
2.2 CEEMDAN数据预处理
由图3可以看出,电池容量存在容量再生等随机波动现象。为了减少噪声问题对容量数据的干扰,以电池B5为例,采用CEEMDAN对信号进行分解,得到3个模态分量(IMF1、IMF2、IMF3)和1个残差信号(R)(图4)。可以看出,IMF的复杂程度随着级数增加而不断降低,表示了锂离子电池的真实退化趋势。分解后的残差信号平滑稳定,呈现下降趋势,相比于原始信号反映了电池容量退化序列的主趋势,这将降低锂离子电池容量再生对预测结果的影响,进一步提高预测模型的预测性能。
图4 电池B5容量数据及分解结果
2.3 基于TCN-MHA预测模型
TCN网络层如图5所示,由4个卷积模块组成。随着网络参数更新,每层的输入分布也发生变化。为了适应这种变化,在膨胀因果卷积之后添加了参数归一化操作,以确保网络的稳定性和收敛性。为了提高模型对数据的拟合能力,TCN网络采用RELU激活函数。RELU激活函数通过去除负数部分并保留正数部分,使网络能够学习非线性关系,从而更好地适应复杂的数据模式。
本文选取4头自注意力机制,键向量为16,点积型注意力机制(Dot-product Attention,DPA)实现,用Concat层拼接多头自注意力输出矩阵,经过由两个Dense层组成全连接层降维,输出预测信息,结构如图6所示。以B6电池为例,模态分量(IMF1、IMF2、IMF3)预测结果如图7所示,TCN-MHA方法可以有效捕捉电池容量的各个模态分量局部波动特征,预测曲线较好贴合真实曲线,表明TCN-MHA具有较好非线性映射能力。
图5 TCN网络模型图6 MHA模型
图7 电池B6 IMF分量预测结果
2.4 模型参数
TCN-MHA网络模型能够从复杂的时间序列中深度提取相关特征信息,具有较高的精准度。相关参数如表1所示。
表1 TCN-MHA网络参数设置
ARIMA模型预测结果如图8所示。残差序列复杂程度低,序列相对平稳,适合ARIMA模型建模分析预测,模型中的参数(p、d、q)值如表2所示。
表2 ARIMA模型参数(p、d、q)
图8 ARIMA预测残差结果
2.5 预测结果
实验环境:R7 3750H处理器,NVIDIA GTX 1650显卡,16 GB RAM。Windows10操作系统、PyCharm2020.1、CUDA11.6.134、keras 2.9.0、PyTorch 1.8.0。
为验证集成模型预测方法的性能,以电池B5、B6、B7、B18为例,选择数据前50%作为训练集,后50%作为测试集,进行多组对比仿真实验。M1为未处理的容量数据对TCN建模,M2为未处理容量数据对CNN建模,M3为未处理容量数据对LSTM建模,M4为未处理的容量数据对ARIMA建模,M5为未处理的容量数据对TCN-MHA建模。M6为本文提出的CEEMDAN处理的容量数据对TCN-MHA-ARIMA的建模。图9为5种方法在NASA数据集下的单次预测结果(分别对应B5、B6、B7、B18号锂离子电池预测实验结果)。
从图9中可以看出本文提出预测模型(M6)可以有效的捕捉电池容量再生现象。预测精度高于TCN、CNN、LSTM、ARIMA、TCN-MHA方法,预测曲线较好拟合真实曲线。为进一步验证所提出RUL预测方法的优越性,在相同条件下,采用下式作为评价指标:平均绝对误差(Mean absolute error,MAE)和均方根误差(Root mean squared error,RMSE):
(9)
(10)
其中,C′(X)为预测值,C(X)代表实际值,S为预测循环次数。将本文方法与其他预测模型进行对比,结果如表3所示。
(a) 电池B5 (b) 电池B6
(c) 电池B7 (d) 电池B18图9 6种方法对各锂离子电池的预测实验结果
表3 测试评价指标对比 %
通过评价指标可以看出,单一的预测模型误差较大。其中,TCN预测精度最高,改进后的M5方法预测精度有所上升。本文提出的方法M6整体效果最佳,B5、B6、B7、B18 RMSE分别为1.76%、1.83%、1.61%、1.59%,实验误差较小。4组电池的均方根误差不超过1.85%,平均绝对误差在1.25%以内。以B5、B6电池为例,本文方法RMSE比单一TCN模型降低0.36%、0.33%,MAE均降低0.84%,说明该集成模型具有稳定的预测性能以及良好的自适应性。
3 结论
本文提出了一种CEEMDAN算法与TCN-MHA、ARIMA模型组合的寿命预测模型对锂离子电池的剩余寿命进行有效预测。主要结论有:
1)通过CEEMDAN算法可以将锂离子电池的容量数据分解为不同特征的分量,整体效果相较于未进行数据预处理的单一模型有所增强,减少了锂离子电池容量再生现象对剩余使用寿命预测的干扰,四组电池的预测曲线在失效阈值处拟合真实曲线,表明模型具有较好的准确性和稳定的预测效果。
2)根据模型特性和数据特点,分别采用TCA-MHA和ARIMA模型进行建模,通过NASA锂离子电池数据进行实验验证,将各自模型的预测结果进行集成,并于单一模型进行对比试验,预测效果均优于其他模型,解决了单一预测模型精度低、泛化能力差的问题。不足之处是CEEMDAN算法分解信号过程中,会增加训练时间,后续将再此基础上进行改进。