基于BI-LSTM神经网络的宽采样频率电池SOH估算
2022-10-25倪祥淦何志刚胡帅李伟权郭晓丹
倪祥淦,何志刚,胡帅,李伟权,郭晓丹
(1.江苏大学汽车与交通工程学院,江苏 镇江 212013;2.永康市质量技术监督所国家五金产品质量检测中心,浙江 金华 321300;3.浙江方圆检测集团有限公司,浙江 杭州 310018)
近年来,为了减少碳排放,解决能源短缺和全球变暖问题,人们越来越重视清洁能源的利用。锂离子电池(Lithium Ion Battery,LIB)具有能量密度高、安全性好、循环寿命长等优势,因此在各个领域被广泛应用,如航天航空、道路运输和便携式移动设备等。作为供能元件,LIB的安全性和经济性非常重要,这在很大程度上取决于LIB的健康状态(State of Health,SOH)。然而,LIB经过反复充放电循环后会出现电池老化问题,限制了电池存储能量和输出功率的能力,因此准确估算电池SOH至关重要。
容量是表征电池SOH的常用参数。当前电池容量降至额定容量的80%时,电池将达到终止寿命(End of Life,EOL),无法继续工作。基于模型和数据驱动的方法是常见的电池SOH估算方法。基于模型可分为基于等效电路模型的方法和基于电化学模型的方法。这些方法可以较快估算电池SOH,但SOH估算精度依赖于测试数据精度。此外,算法需要进一步地试验验证和调试参数来满足精度需求。随着机器学习技术的发展,数据驱动的方法广泛应用于SOH估算。该方法不需要建立复杂的电化学模型或等效电路模型,也不需要相关的电化学知识,只需要收集电池老化数据。Zhang等通过容量增量分析(Incremental Capacity Analysis,ICA)提取健康特征,利用支持向量回归(Support Vector Regression,SVR)算法构建SOH估算模型。Mawonou等根据电池运行期间收集的充电数据和行驶数据训练随机森林(Random Forest,RF)模型,并通过RF模型估计电池SOH。刘兴涛等利用曲线压缩Douglas-Puck算法向量化每个周期的恒流充电电压曲线,应用XGBoost算法建立锂离子电池退化模型并估计SOH。
锂电池通常在数百次或更多次充放电循环后才能达到EOL,数据的长期依赖性需要进一步考虑。具有长短期记忆(Long Short Term Memory,LSTM)单元的循环神经网络(Recurrent Neural Network,RNN)可以使用多个可变长度的输入来保持自学习的长期依赖性。因此,许多研究应用LSTM神经网络来估算电池SOH。Gong等基于锂离子电池充电过程历史数据,包括电压、电流和容量,利用LSTM神经网络估算电池SOH。张岸等使用生成对抗网络(Generative Adversarial Networks,GAN)扩展训练样本,使用卷积神经网络(Convolutional Neural Networks,CNN)和长短期记忆(LSTM)提取输入数据的特征并在线估计锂电池SOH。楚瀛等将单个采样周期内的电压、电流和温度采样序列进行不同大小的卷积,得到多视场的特征序列,利用LSTM挖掘特征序列的长期和短期关系以获得多个输出结果,并通过整合注意力权重获得SOH。
上述所有方法都能准确估算SOH,但这些算法几乎都是通过高频采样数据验证的,导致数据通信成本高。在宽采样频率下,电池的健康老化特征波动较大,数据精度较低。除此以外,尽管LSTM神经网络比传统RNN更适合处理长期序列数据,但这两种网络都只能在一个方向处理数据,它们只能依靠前一时刻的数据来预测下一个数据,往往会忽略未来的信息,而电池容量曲线急剧下降,即出现跳水现象,通过前一时刻的数据是难以预测的。
为了解决这些问题,考虑充放电倍率对电池老化率的影响,本研究设计了不同充放电倍率的宽采样频率充放电试验。基于试验数据提取健康特征,采用局部加权线性回归(Locally Weighted Linear Regression,LWLR)算法对健康特征下降趋势进行定性表征,解决了宽采样频率下健康特征的波动问题。最大信息系数(Maximal Information Coefficient,MIC)算法用于衡量健康特征与容量之间的相关性,选取相关性高的健康特征构造训练数据。为了进一步考虑电池老化的未来信息,在宽采样频率采样数据下提高电池SOH估算精度,本研究提出了双向LSTM(BI-LSTM)神经网络估算电池SOH。
1 电池试验设计
为进行锂离子动力电池特性分析,设计了一套完整的锂离子电池试验测试平台(见图1)。锂离子电池试验测试平台主要由软件控制系统和硬件系统组成。该系统的硬件部分包括电池测试系统、恒温箱、上位机及锂离子电池。各装置及单元通过计算机软件进行控制,并按照一定的逻辑功能和预设流程等操作完成电池试验过程的控制、数据采集和处理。
充放电倍率作为电池老化的主要指标,主要由用户行为决定。以较大倍率电流循环会产生更多热量,导致电池温度升高并加速老化过程。除此此外,在大倍率电流下表征电池SOH的健康特征更加难以提取,电池容量曲线急剧下降的概率也将大大提高。因此,在试验中应考虑不同的充放电倍率。目前基于试验室环境的电池数据采样频率大多为1 s/次,健康特征精度较高。但数据记录频率越高,数据通信成本越高。为降低数据通信成本,并保证SOH估算的准确性,本研究将数据采样频率设为60 s/次。试验中电池类型为镍钴锰523(NCM523)三元锂电池,标称容量2.5 A·h。电池上截止电压为4.2 V,下截止电压为3 V。试验步骤如下:
1)电池在25 ℃的恒温箱中静置2 h;
2)电池恒流充电至4.2 V,然后恒压4.2 V充电至电流小于等于0.05;
3)电池在25 ℃的恒温箱中静置1 h;
4)电池恒流放电至3 V;
5)电池在25 ℃的恒温箱中静置1 h;
6)重复步骤 1~5,直到电池容量降低到2 A·h。
电池的充放电倍率见表1。
图1 锂离子电池试验测试平台
表1 试验方案
2 SOH估算方法
2.1 SOH定义
锂离子电池的健康状态是指随着电池的使用,电池产生不可逆的衰退现象,该现象会影响电池外特性的诸多方面,因此在电池行业中对于锂离子电池的健康状态有多种描述方式,譬如电池老化程度、电池寿命等。容量是一种常见的健康指标,用于指示电池SOH,本研究将其用作SOH 指标,SOH定义为电池当前最大可用容量与额定容量的比值,公式如下:
(1)
式中:为当前电池的最大可用容量;为电池额定容量。
2.2 特征提取
对于在锂离子电池循环寿命测试下获得的电流、电压、温度、内阻以及可用容量等原始数据,由于其中包含了一系列冗余杂乱信息,并且数据稀疏造成计算量大,若直接将测量数据用于建立锂离子电池SOH估计模型,构建的估计模型往往是低效的。对于数据驱动模型,健康特征对最终SOH估算结果有较大影响。随着电池容量的下降,电池的外特性也会发生变化,电池健康特征也会随之改变。交通工具实际行驶中由于不同的驾驶习惯、天气和路况等因素,动力电池组的工作条件存在较大差异。在这种情况下,特征提取更加困难,难以满足实际需求。相对于复杂的行驶工况,动力电池一般采用恒流恒压充电方式进行充电,在这种模式下,电池工作状态稳定,更容易提取表征电池SOH的健康特征。Li 等基于恒流充电过程,采用ICA算法提取容量衰减特征,并以IC曲线的峰值电压和峰高作为SOH健康特征。然而,在实际情况下,IC曲线容易受到噪声和测量误差的影响,其峰值位置和高度难以准确获取。因此,本研究选择等电压区间的充电时间和恒压充电阶段的充电时间作为电池健康特征。如图2所示,随着电池充放电循环次数的增加,充至上截止电压所需的时间逐渐减少,电池恒流充电时间越来越短,电池恒压充电时间越来越长,电池容量不断下降,进一步验证了本研究健康特征选取的合理性。为了进一步选择最佳的等压充电间隔,以电池的标准电压为起始电压,选择了3.6~3.8 V,3.6~4.0 V,3.6~4.2 V,3.8~4.0 V,3.8~4.2 V,4.0~4.2 V共6个电压范围作为候选范围,并记为:
=[,,,,,]。
(2)
将等电压区间的充电时间和恒压充电阶段的充电时间组合,进一步得到基于试验数据提取的训练特征:
=[,]。
(3)
图2 电池充电电压曲线
(4)
表2 LWLR算法伪码
2.3 SOH估算
为了保证SOH估算准确性,提高计算效率,构建了MIC-BI-LSTM算法模型。通过最大互信息数(MIC)算法验证健康特征与容量的相关性,选取相关性较高的健康特征构建训练数据集。最后通过BI-LSTM神经网络估算电池SOH。
(5)
表3 MIC算法伪码
(6)
式中:()用于限制划分网格的数量,一般为数据量的0.6次方。
(7)
图3 MIC特征分析结果
循环神经网络RNN具有链状结构,可以保存之前的信息,使其能够处理长期序列。虽然RNN可以记住之前的信息,在处理时序问题方面具有一定优势,但它也有两个明显的缺陷:保留了过多的输入信息,增加了模型的复杂度;梯度下降,造成其长链状结构消失。基于RNN改进的模型,即LSTM模型能够克服这些缺陷,LSTM模型也具有链状结构,但它有一个更复杂的LSTM记忆单元,LSTM单元的内部结构见图4。从图4可以看出,LSTM单元有一个导入参数,对其进行升级和训练以决定哪些信息应该被记住,哪些应该被遗忘。其训练的过程如式(8)至式(10),步骤的最终输出如式(11)和式(12)。
=(+-1+),
(8)
=(+-1+),
(9)
=-1+tan(+-1+),
(10)
=(+-1+),
(11)
=tan()。
(12)
图4 LSTM单元结构
虽然LSTM神经网络比传统RNN更适合处理长期序列数据,但两种网络都只能在一个方向处理数据,只能依靠前一时刻的数据来预测下一个数据,而往往会忽略未来的信息。通常在输入和目标之间加入一个延迟来挖掘数据中的隐藏信息,将未来时刻的信息加入到网络的时间步长中。理论上,加入时间越长,可以获得的未来信息越多,但在实际过程中,添加太多信息会导致网络将大部分精力集中在记忆输入信息上,使其预测未来数据的能力下降。为了解决上述问题,本研究提出BI-LSTM神经网络,该网络由输入层、隐藏层和输出层构成,其中隐藏层由前向和后向两个LSTM网络组成,其结构见图5。BI-LSTM不仅可以获取输入数据的过去信息,还可以利用未来信息。
图5 BI-LSTM神经网络结构图
为了消除维度的影响,输入数据采用zero-mean归一化方法进行归一化。取数据集前90%的数据作为训练集输入BI-LSTM模型,训练电池组容量退化与健康特性之间的非线性关系,后10%的数据作为验证集和测试集,验证算法的准确性和该模型的泛化能力。为了评估模型在不同超参数下的估计精度,设置了一个固定的随机数种子,以保证LSTM模型的隐藏层权重在相同条件下初始化。模型在训练时会出现过拟合的问题,因此加入混合正则化项和Dropout层以防止过拟合,保证模型不会过分依赖某个神经元。将平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)分别用作损失函数和估计精度。
(13)
(14)
本研究基于锂离子电池试验测试平台采集的数据,验证了不同充放电倍率下的离线SOH估计结果。
3 结果和讨论
基于本研究提出的SOH估计方法,4种不同试验条件下的电池离线SOH估计结果见图6至图9。在4种不同的试验条件下,随着充放电倍率的增加,电池老化速率也会有所不同,充放电倍率越大,电池老化速率越快。1号电池经过800次充放电循环后SOH仍可达86.1%。而10号电池在400次充放电循环后SOH只有74.2%。
图6 1号电池估算结果
图7 4号电池估算结果
图8 7号电池估算结果
图9 10号电池估算结果
1号电池SOH估算结果的MAE和RMSE分别为0.165%和0.197%,4号电池估算结果的MAE和RMSE分别为0.221%和0.267%,估算值曲线与目标值曲线非常相似。估算SOH的最大相对误差分别为0.581%和0.458%,验证了所提出SOH估算模型的精度。
7号电池估算结果的MAE和RMSE分别为0.713%和0.741%,10号电池估算结果的MAE和RMSE分别为0.293%和0.370%,估算SOH的最大相对误差分别为1.601%和1.128%。可以发现,随着电池充放电率的增加,电池SOH估计精度也随之下降,但仍能保持较高精度,验证了SOH估算模型的泛化性。因此,所提出的模型在解决SOH估算问题方面具有出色的准确性和较好的泛化性。
为了进一步验证BI-LSTM预测模型的先进性和有效性,建立了不同试验条件下的电池在RNN,LSTM与BI-LSTM模型上的对比试验,结果见表4。其中LSTM在当前动力电池SOH估算中应用最多,RNN常用于处理长序列型数据,是LSTM模型的同族算法。结果显示,BI-LSTM在不同工况下对于SOH的预测更接近实际值,多个试验数据集证明了BI-LSTM预测波动更小,模型稳定性更好,具有更高的精度和泛化性。
表4 不同模型的精度对比
4 结束语
为了保证电池SOH估计的准确性,降低数据通信成本,考虑到充放电倍率对电池老化率的影响,基于试验室环境设计了不同充放电倍率下的宽采样频率充放电试验。为了解决宽采样频率下健康特征的波动问题,采用LWLR算法对健康特征下降趋势进行定性表征。采用MIC算法衡量健康特征与能力之间的相关性。基于BI-LSTM神经网络学习了容量和健康特征之间的非线性退化关系。根据单节电池历史数据离线估算电池SOH,最大相对误差为1.601%,并利用主流模型RNN和LSTM进行对比,结果表明所提出SOH估算模型具有较高的准确性与良好的泛化性,在宽采样频率下,不仅降低了数据通信成本,而且解决了锂电池的SOH预测准确率较低的问题,具备一定的工程应用价值。