基于ICA和Box-Cox变换的锂离子电池SOH估计方法
2022-03-15张吉昂
张吉昂,王 萍,程 泽
(天津大学电气自动化与信息工程学院,天津 300072)
锂离子电池以其输出电压高、循环寿命长和能量密度高等优点,正逐渐成为电动汽车、变电站和光伏电网的重要储能装置[1]。电池管理系统BMS(battery management system)可以对电池进行状态评估、风险预警、定期维护和更换,以保证电池的长期稳定运行。其中,准确的电池健康状态SOH(state of health)[2]估计是BMS的关键环节。SOH是表征电池老化程度的重要指标,一般表示为电池当前可用容量与初始容量的比值,一般认为该值下降到70%~80%时,电池寿命终止EOL(end of life)[3]。
不同于电压电流等可测量,SOH无法用传感器测量,只能通过对电池特征参数的观测与辨识,并结合数学算法进行定量估计。电池的SOH估计方法大致可以分为基于模型的方法[4]和基于数据驱动的方法[5],前者需要建立电池模型,计算较复杂,不适合BMS的在线应用;后者无需建立电池的物理模型,直接从电池的测量数据(如电压、电流、温度、阻抗等)中提取能够指示电池健康状态的健康特征HF(health factor),并采用一定的学习方法来构造电池的HF与SOH的映射关系,建立老化模型。然后在线获取当前循环次数下的HF测量值,输入到训练好的老化模型中,即可获取当前SOH的估计值。这类方法的实用性较强,适合SOH的在线估计。
容量增量分析ICA(incremental capacity analy-sis)是研究锂离子电池容量衰退的常用方法,该方法通过绘制容量增量曲线,将缓慢变化的充电电压平台转化为IC曲线峰值高度,电池处于不同的老化状态下的IC曲线会有明显不同,可以揭示更多反映电池老化的信息,且容易在线应用。IC曲线的相关特征,如IC峰的数值和位置[6],也常被用来作为健康特征HF(health factor)来估算电池的当前实际可用容量。ICA存在的问题主要是IC曲线的提取涉及电压和容量的差分,这容易受到噪声的干扰[7],限制了其应用。
现有研究常采用机器学习方法来建立HF和SOH之间的映射关系,这往往需要繁琐的超参数优化[8],计算量较大,影响了在线应用。许多健康特征往往和循环容量呈现近似线性的关系[9],从这个角度上说,相比于机器学习算法,建立线性模型能够避免繁琐的超参数优化,提升计算效率。但有些HF存在与SOH的线性相关性不够强的问题,影响了估计效果。文献[10]采用Box-Cox变换增强特征与容量退化的相关性,提升了估计精度。
基于上述分析,本文提出了基于ICA和Box-Cox变换的锂离子电池SOH估计方法。首先通过建立电池一阶等效电路模型,论证ICP与健康状态的强相关性。用卡尔曼滤波算法对IC曲线进行平滑处理,采用Box-Cox变换将训练周期的ICP和SOH序列转化为近似线性关系,然后通过线性拟合来实现剩余周期的SOH估计。在Oxford数据集和NASA数据集上进行实验验证,并将本方法与常用机器学习的方法进行对比,结果表明本方法克服了传统机器学习算法依赖较多训练集和繁琐超参数优化的缺点,具有较高的估计精度和计算效率,同时算法的鲁棒性较强,在不同训练周期下都能稳定收敛。
1 相关性证明
通过理论分析来论证电池恒流充电的IC曲线峰值高度与健康状态之间的强相关性。电池常用的模型主要是一阶等效电路模型[8],结构如图1所示。
图1 一阶等效电路模型Fig.1 First-order equivalent circuit model
其模型的数学表达式为
式中:U为端电压;I为输入电流,恒压充电电流一般选取1C~2C;Up为极化电压;R0为欧姆内阻;Rp和Cp分别为极化电阻和极化电容,在恒流充电阶段为定值,仅随循环次数而改变;Uocv为荷电状态SOC(state of charge)的函数,Uocv=f(SOC)。恒流充电下SOC的表达式为
式中,Q(n)为第n次充放电循环下的可用容量。此时的健康状态计算公式为
式中,QN为电池的出厂容量。
观察式(6),对于不同类型的锂离子电池,Cp的辨识值一般为数千量级,时间常数τ=RpCp为几十秒[11],且随着电池老化逐渐增大。而在1C电流下,充电时间为1 h,指数项在充电时间内很快衰减,故式(6)等号右边指数项可以忽略。在单次循环下,I Q(n)为常数。当达到最小值点,即曲线的拐点,此时式(6)有最小值。OCV-SOC曲线受健康状态的影响较小[12],故的最小值与循环次数n无关,在电池全周期设为常数k,则有
式中,ICP(n)为第n次循环下的IC曲线峰值高度。式(7)表明,ICP和健康状态序列是完全线性关系,但是由于做了数学简化,忽略了极化电流指数衰减项和OCV-SOC曲线随老化程度的变化,此外存在随机噪声对电压测量的影响,实际情况下不会呈现线性关系,但可以认为两者具有较强相关性。
2 健康特征提取
本文选取牛津大学电池老化数据集的Cell1~Cell8电池和NASA数据集的B0005和B0007电池进行实验。数据集介绍和电池类型参见文献[7]。
电池的放电工况是不可预测的,而充电工况一般采取恒流-恒压CC-CV(constant current constant voltage)模式,对CC阶段的电压变化曲线进行数值差分来获取dQ/dU,即
式中:L为差分步长;k为采样点数;Ts为采样时间;Q(k)和U(k)分别为第k个采样点的充电容量和电压值。将dQ/dU记作DQV。由于电压和电流传感器的测量精度有限,计算电流(容量)和电压的差分会带来大量噪声,影响IC曲线的形态和健康特征的提取,本文采用卡尔曼滤波KF(Kalman filter)算法进行平滑处理[7],优势在于可以根据测量数据实时滤波,适合BMS的在线应用。状态方程和观测方程为
式中:DQV(k)为平滑后第k个时刻的输出值;DQVm(k)为第k个时刻的观测值;w(k)和v(k)分别为第k个时刻的过程噪声和观测噪声协方差。
KF算法在线滤波的流程如图2所示。
图2中,A=1,H=1,y(k)和x(k)分别为第k个时刻滤波前后的IC曲线输出值,P(k)为第k个时刻的方差阵,x-(k)和P-(k)分别为k时刻状态变量和方差矩阵的先验估计,K(k)为k时刻系统的卡尔曼增益,Qf和Rf分别为过程噪声ω和观测噪声ν的协方差,ω和ν共同作用在DQV上,使其受到噪声污染。本文根据经验设置L=20 s,Qf=0.000 1,Rf=1,方差迭代初值P0=0.1,状态量初值x0=[0 0]T。滤波前后的IC曲线如图3所示。
图2 KF算法流程Fig.2 Flow chart of KF algorithm
图3 滤波前的IC曲线Fig.3 IC curve before filtering
由图3和图4可知,引入KF算法,IC曲线明显光滑,峰值高度ICP清晰可见,随着电池老化程度的加深,ICP不断降低,与容量的衰退呈现较好的关联性,印证了第1节的讨论。
图4 滤波后的IC曲线Fig.4 IC curve after filtering
为了进一步量化这种相关性,本文采用Pearson相关系数和灰色关联度GRC(grey relation coefficient)来对ICP与SOH相关程度进行衡量。计算公式分别为
式中:ICPi为第i次循环的ICP值;SOHi为第i次循环的健康状态值;n为总的循环次数;ρ为分辨系数,一般取0.5。Pearson系数从线性相关性的角度衡量两个变量序列之间的关联程度,其值位于[-1,1]之间,绝对值越大,相关性越高。GRC从两个变量序列的几何曲线相似程度的角度来衡量其相关程度,其值位于[0,1]之间,越接近1,相关性越高,分别计算各电池的ICP与SOH之间的Pearson系数和GRC,如表1所示。
表1 各电池SOH与ICP的相关度Tab.1 Relevance between SOH and ICP of each battery
由表1可知,各电池的Pearson系数的计算结果都在0.97以上,GRC基本在0.8以上,呈现出较高的相关性,这与前面的论证结果相符。
3 Box-Cox变换与线性模型建立
3.1 Box-Cox变换
理想情况下,ICP与SOH退化序列呈现完全线性的关系,如式(7)所示,然而由于电池容量退化过程的复杂性,其相关程度不能完全令人满意,为了纠正这种线性偏差,本文采用Box-Cox变换[10]进一步增强ICP与SOH衰退序列的线性相关性。
设因变量y=(y1,y2,…,yn)T,多元自变量x=(xi1,xi2,…,xiq)T,考虑线性回归模型为
式中:β为回归系数,β=[β0β1β2…βq]T;εi为不可测误差,εi~N(0,δ2);i=1,2,…,n,n为样本容量。
Box-Cox变换可以表示为
式中,xt和分别为变换前、后的变量。相应的Box-Cox反变换为
式中:c为保证x+c为正数的常数;λ为待辨识参数。此时的回归模型变为
此时x(λ)与y的相关性得到了增强。λ的确定方法主要有极大似然估计法和贝叶斯方法,本文采用极大似然估计法来辨识λ。即通过遍历搜索λ,使得数据联合分布似然函数有最大值。具体数学推导参见文献[10]。
3.2 电池老化线性模型建立
由式(7)可知,在数学简化下,ICP和SOH为完全线性关系,然而,考虑到电池参数老化和极化效应等影响,ICP与SOH呈现一定的弯曲度,如图5的方形和三角形散点所示。实际应用中不可能知道电池的全周期容量数据,但前N个循环周期的容量数据和特征数据可以通过核容法标定,N为建模预测起点SP(starting point)。由图4可知,电池的全周期容量退化与IC峰值衰减具有较好的一致性,可以认为ICP和SOH的非线性对应关系在电池全周期衰退中保持一致。所以通过前N个循环的数据进行Box-Cox变换来辨识λ,能够获知全周期ICP-SOH曲线的弯曲度信息和非线性程度,进而将ICP-SOH曲线变换为近似一条直线,并采用最小二乘法辨识线性模型的斜率k和截距b;在线应用时实时采集SP之后周期的电压电流数据并提取ICP,计算ICPλ并代入到建立好的线性模型中即可估计当前循环次数下的SOH。图5展示了N=20时的建模过程,圆形和菱形的点分别为SP前后的ICP与SOH序列。基于ICA-BoxCox变换的锂离子电池SOH估计方法的流程见图7。
图5 Cell1的ICP和SOH的对应关系Fig.5 Relationship between ICP and SOH of Cell1
图6 参数λ寻优过程Fig.6 Optimization of parameter λ
图7 ICA-BoxCox变换SOH估计流程Fig.7 Flow chart of SOH estimation using ICA-BoxCox transform
4 结果与分析
4.1 小样本训练集下的估计效果
建立SOH估计模型时,通常希望训练样本数N较小,因为训练周期的容量需要安时积分法核容获得,比较费时费力。Oxford电池用前20%的容量衰退数据来预测后80%,NASA电池用前30%来预测后70%。并与常用的机器学习方法最小二乘支持向 量 机 LSSVM[8](least squares support vector machine)和高斯过程回归GPR(Gaussian process regression)进行对比。其中LSSVM的超参数采用粒子群算法优化[8],GPR的超参数采用共轭梯度法优化。用训练集的原始ICP和SOH序列建立机器学习回归模型,在线应用时采集新循环周期下的健康特征数据,代入训练好的回归模型中,输出当前SOH的估计值。LSSVM方法的正则化因子γ和核函数超参数δ2的搜索范围为[10,1 000],粒子规模为30,迭代次数设为10次。GPR方法采用有理协方差核函数,均值函数初值设为3,方差函数初值设为[0 0 0],似然函数初值设为-1。3种方法的估计结果和误差百分比如图8所示。MAE和RMSE的计算结果如表2所示,同时列出了3种方法的计算时间。
图8 各电池的SOH估计结果Fig.8 SOH estimation results of each battery
图8(a)、(d)显示了对SP之前的ICP和SOH序列进行Box-Cox变换前后Cell1和B0005电池全周期的ICP和SOH的分布散点图。Box-Cox变换后的点中,圆点表示训练样本,用以建立线性模型(直线),方块表示测试样本,可知方块集中在线性模型附近,拟合效果较好。变换前后ICP和SOH的线性相关性明显增强,接近于一条直线,对比表1和表2可知,Pearson系数和GRC都较变换前有了很大的提高。估计结果和相对误差百分比见图8(b)(c)(e)(f)。更多电池结果见表2。Oxford电池的MAE和RMSE的计算结果均小于1%;NASA电池的MAE和RMSE的计算结果均小于2%。反映了本文所提方法具有较高的估计精度,并且只需要较少的训练周期样本数,同时该方法能够适应电池不一致性造成的多种容量衰退情形以及容量的局部再生现象。
表2 SOH估计结果Tab.2 Estimation results of SOH
LSSVM和GPR的估计结果和误差在图8中分别用点划线和点线标出。作为数据驱动类方法,两者需要较多的训练样本数,进而能够充分学习和映射容量衰退的特征细节,从而建立回归预测模型。当可供学习的样本较少时,会导致预测效果不佳,甚至发散。本方法的计算效率较高,原因是Box-Cox变换和基于最小二乘法的线性拟合所需的计算量很小,所以不会占有硬件系统的太多计算资源,适合用于SOH的在线估计;而机器学习算法的超参数对于其性能具有显著的影响,LSSVM方法的损失函数不可导,往往采用群算法进行超参数优化,这往往需要耗费大量时间,同时算法容易陷入局部最优解,而延长群算法的规模和迭代方式有助于找到更优解,但会耗费更长时间。相比之下,GPR的损失函数可导,可以采用共轭梯度法或类似的牛顿法进行点优化,计算效率有所改善。
4.2 不同训练集长度的估计效果
考察不同的训练集规模即N值对估计误差的影响,以检验算法的鲁棒性。Oxford电池的训练集比例从总循环次数的20%~80%以5%逐渐增加;NASA电池的训练集比例以步长7.5%从30%~75%逐渐增加。各电池不同SOH衰退阶段的SOH估计误差如图9所示。图中以训练集占比为横坐标,误差计算值为纵坐标,展示了Cell1和B0005的估计误差随训练集规模的变化曲线。
图9 各电池不同SOH衰退阶段的SOH估计误差Fig.9 SOH estimation errors of each battery at different SOH degradation stages
由图9可知,ICA-BoxCox方法的估计误差较稳定,不同训练周期数下,Oxford电池大部分点的MAE、RMSE和平均RPE都在1%以内;NASA电池的MAE和RMSE也在2.5%以内,没有出现发散现象,反映了较好的鲁棒性。随着训练周期数增多,GPR方法和LSSVM方法能够学习到容量衰退的特征细节,估计效果总体变好。整体来看,LSSVM的估计方法较差,原因是在较短时间内,粒子群算法难以搜索到较好的超参数解。3种算法的比较分析如表3所示。
表3 各算法比较Tab.3 Comparison among different algorithms
5 结语
本文结合容量增量分析和Box-Cox变换,提出了一种高效的锂离子电池SOH估计方法。本方法分为建模和应用两个阶段。在建模阶段,首先提取电池恒流充电过程的容量增量曲线,通过卡尔曼滤波算法进行在线平滑处理,提取峰值作为健康特征。接着对预测起点以前的健康特征和容量数据进行Box-Cox变换,用变换后的序列建立线性模型。应用阶段提取新的循环周期下的健康特征并计算特征的变换值,将其输入线性模型中预测当前SOH。Oxford和NASA数据集的实验结果表明,所提方法同LSSVM和GPR相比,估计精度较高,计算速度较快,鲁棒性较好。本文从增强特征与容量线性相关性的角度为锂离子电池的健康状态估计提供了一种新思路。未来可以将该方法推广到电池组的状态估计中,同时该方法在复杂工况下的适用性有待于进一步验证。