APP下载

基于充电过程的锂电池SOH估计和RUL预测

2022-10-20闵永军

储能科学与技术 2022年10期
关键词:协方差高斯电压

李 放,闵永军,王 琛,张 涌

(南京林业大学汽车与交通工程学院,江苏 南京 210037)

为缓解能源危机和日益恶化的环境污染,实现“碳达峰、碳中和”的目标,电气化交通已成为促进经济转型、优化能源结构、改善空气质量的重要举措[1]。电池是电动汽车的核心部件,锂离子电池因其高能量密度、无记忆效应和循环寿命长的特点,现已作为电动汽车的主要储能设备[2-3]。电池的健康状态(state of health,SOH)和剩余寿命(remaining useful life,RUL)是电池生命周期中表征性能的重要参数,很大程度上决定了电动汽车的安全性和可靠性,由于无法使用传感器测量,因此实现锂电池SOH 的实时准确估计以及RUL 的未来预测,有助于改善消费者的驾驶体验,推动电动汽车产业持续发展,同时实现电池批次回收利用,合理利用社会资源。

锂电池状态参数的估算,如SOH 实时估计,SOH 和RUL 预测,因涉及电池内复杂的电化学反应,目前仍然是一项具有挑战的任务,现可分为电化学模型、等效电路模型和数据驱动模型[4]。电化学模型可对电池的参数进行全面估算,但由于涉及参数较多和复杂的偏微分方程,仅适用于理论分析;等效电路模型的参数辨识和矩阵计算较为复杂,随着电池老化其精度也难以保证,在实际中难以应用[5]。

数据驱动方法可以被视为一个“黑箱”,克服了复杂的建模和参数辨识问题,有较好的应用前景。常用的方法包括以经验风险最小化为代表的如BP 神 经 网 络(back propagation neural network,BPNN)[6],极限学习机(extreme learning machine,ELM)[7],这类模型在训练集中能保持较好的回归效果,但易陷入过拟合。基于深度学习的卷积神经网络(convolutional neural network,CNN)[8]、长短期记忆网络(long short-term memory,LSTM)[9]和门控循环神经网络(gated recurrent neural network,GRNN)[10]等方法确实取得了优秀的预估精度,但样本需具备一定规模且受超参数影响较大。Tsang等[11]将模糊逻辑应用于电池健康状态评估,但无法输出准确的预测值。支持向量机(support vector machine,SVM)[10]和最小二乘支持向量机(least squares support vector machine,LSSVM)[12]在SOH估计和RUL预测中有较高精度且对异常值具有鲁棒性,但随着样本数目的增加导致运行时间过长。

健康因子选取方面,Wang 等[13]基于增量容量分析(incremental capacity analysis,ICA)提取IC曲线的峰值位置作为健康因子,该方法的优点是对电池类型不敏感,并能有效识别容量损失机制,但IC曲线的提取方法和噪声干扰会影响模型精度。杨胜杰等[14]提出测量电池表面温度和端电压,通过生成差分热伏安(differential thermal voltammetry,DTV)曲线的峰参数诊断电池老化情况,但不同倍率的充电电流会影响DTV 峰特征,进而影响模型精度。Hu 等[15]选取放电电压的样本熵作为健康因子,Huang 等[16]选取等电压上升间隔作为健康因子,然而单一健康因子难以全面跟踪电池退化,如忽略了温度的影响。王凡等[17]提取电压变化率、内阻等参数作为健康因子,在工程中存在电池内阻测量困难的问题;Liu 等[18]选择等压降时间作为健康因子,但电池实际工作时,其放电过程中电压、电流等参数变化较大,导致无法将模型应用于电动汽车的电池管理系统中。

理想的电池状态预估模型应该具备轻量化、健康因子易获取、有实际应用前景的特点。高斯过程回归适用于小样本,非线性的复杂回归问题,能准确捕捉电池的退化细节且鲁棒性较好,此外高斯过程回归能输出置信区间以量化结果的不确定程度[19]。本文基于车用锂离子电池的充电信息稳定且易获取的特点,经相关性算法筛选充电过程提取的多元特征参数作为健康因子,提出一种改进高斯过程回归的锂电池SOH 估计和RUL 预测模型,实现电池参数准确预估的同时输出置信区间。

1 数据介绍

1.1 数据集简介

本文采用美国航空航天局(NASA)艾姆斯卓越预测中心提供的公开电池数据集,对编号为B0005、B0006、B0007、B0018 的18650 型三元锂电池在25 ℃时进行充放电试验,电池额定容量为2 Ah。充放电规程如下:以1.5 A恒流充电至电压到达4.2 V 后以恒压充电,当充电电流降至20 mA时停止充电;以2 A 的电流放电,当B0005~B0018 电池电压分别降至2.7 V、2.5 V、2.2 V、2.5 V 时结束。充放电后将电池静置后进行下一次循环,并通过0.1 Hz~5 kHz 的电化学阻抗谱(electrochemical impedance spectroscopy,EIS)测量电池阻抗。直至电池实际容量下降至额定容量的70%时停止。实验过程中记录了每次充放电时电池的电压、电流、温度和阻抗信息,电池容量随充放电循环的退化曲线如图1所示。

图1 NASA数据集电池容量退化曲线Fig.1 Battery capacity degradation curve for NASA data set

1.2 电池健康状态和电池剩余循环寿命

由于研究角度的差异,对SOH有不同的定义,本文使用电池的当前可用容量占额定容量的比值作为电池SOH

式中,C0为电池额定容量;Ci为第i次循环时的电池容量;SOH(i)为第i次循环时的电池健康状态。

随着电池的使用,电池可用容量下降,设定电池SOH下降到0.7时到达报废标准,使用达到终止寿命(end of life,EOL),则电池的RUL可定义为电池当前SOH衰退至EOL时还可进行的循环次数[20]

式中,Cycle(EOL)为电池充放电循环至EOL时的循环次数;Cycle(i)为当前电池循环次数。

2 算法介绍

2.1 相关性分析算法

Pearson系数是衡量变量相关性最常用的指标之一,以Pearson 系数计算变量X、Y的相关性公式如下

式中,COV(X,Y)为变量X和Y的协方差;σX、σY为变量X和Y的标准差。变量之间相关性越强,则Pearson系数越接近±1。

最大信息系数(maximal information coefficient,MIC)由Reshef 等[21]提出,适用于多种数据类型且计算复杂程度适中,现广泛应用于机器学习、模式识别的特征选取。

MIC的基本原理为:若两个变量之间存在某种关系,可在两个变量的散点图上绘制网格,通过改变网格的大小和不同网格的位置,选取不同的组合将这两种关系划分明确。首先引入互信息这一概念,互信息是一个随机变量中包含的关于另一个随机变量的信息量,常用来衡量变量间的关联程度,其表达式如下

式中,I(x,y)为变量x和y的互信息;p(x,y)为联合概率密度函数;p(x)和p(y)为边缘密度函数。

将二维空间的离散变量x,y组成的集合记为S,其中S={(x1,y1),…,(xt,yt)}将集合S内数据划分为m段和n段,则得到m×n的网格,改变m和n数值可得到多种不同的划分方式,计算不同的网格划分方式的最大互信息值maxI(m,n),并进行归一化处理

最大的M(S)m,n即为MIC值

式中,B(t)用于限制划分网格的数量,一般设定B(t)为t0.6,变量之间关联性越强,则MIC 越接近1[21]。

2.2 主成分分析

为降低高斯过程回归的输入维数,减小模型复杂度并缩短运行时间,主成分分析(principal component analysis,PCA)可将高维数据映射至低维空间,并在所映射空间内保留大多数原始信息。计算步骤如下:将多维数据标准化后,求得数据协方差矩阵,基于奇异值分解计算其特征值和特征向量,将特征值从大到小排列,并以式(7)计算主成分累计贡献率。

式中,d为原始数据维数;d′为保留的特征值个数即降维后的维数。保留特征值对应的特征向量为主成分分析的解,一般取t=80%。

2.3 高斯过程回归

高斯过程回归(Gaussian process regression,GPR)是一种基于贝叶斯理论和核函数方法构建的机器学习模型,遵循结构风险最小化原则控制模型复杂度,实现训练表现和泛化能力的平衡,其特点如下:

(1)高斯过程回归可视为一类概率模型,可对其预测值输出置信区间,这给量化结果的不确定性提供了便利。

(2)核函数的引入在避免“维数灾难”的同时提高了模型的学习和泛化能力。

(3)高斯过程回归的推导由严格的概率统计理论支撑,模型内的超参数选取具备理论依据,而且对于低维回归问题待确定的超参数很少。

从函数空间视角的原理阐述高斯过程回归:可将高斯过程(Gaussian process,GP)定义为有限数量的具有联合高斯分布的变量集合,则高斯过程可视为由均值函数和协方差函数确定

式中,m(x)、k(x,x′)分别为f(x)的均值函数与协方差函数,其表达式如下

f(x) 可视为一种未知的潜在函数(latent function),考虑噪声εi的影响,观测值yi和f(xi)的回归可表示为

设有限个f(x)组成的f满足联合高斯分布

式中,u为f的均值函数,表示观测数据之前x对应f(x)的期望;Σ为f的协方差函数,在高斯过程回归起到度量集合相似性的重要作用,常以核函数的形式表示,其类型和超参数的选取直接影响到高斯过程回归的性能。

高斯过程回归根据训练样本数据,确定潜在函数f的分布,并利用推导的f得出测试集输入对应的输出值,如图2所示。

图2 高斯过程回归示意图Fig.2 Schematic diagram of Gaussian process regression

设ε为独立同分布的高斯分布,满足ε~N(0,),将含有噪声ε的潜在函数f*的先验分布表示为

y与f*的联合先验分布为

式中,K=K(X,X),K*=K(X*,X),K**=K(X*,X*),均为正定的协方差矩阵,X为训练集,X*为测试集。

结合训练集X和测试集X*,可得后验分布即预测式

式中,K*[K*+σn2I]-1y为预测均值矩阵up,K**-K*[K+σn2I]K*T为预测协方差矩阵Σp。则高斯过程回归的输出的95%置信区间为

2.4 改进高斯过程回归

锂电池容量退化过程中受电解液、电极等多种物化反应耦合影响,会出现第i+1 次循环的电池容量高于第i次的情况,称为容量再生现象,并有周期性的特点[22]。因此锂电池容量退化曲线具有很强的非线性和不确定性,由于单一协方差核函数能力有限,无法准确实现SOH 估计任务。基于神经网络协方差核函数局部逼近能力较强,泛化能力较弱的特点和周期核函数对电池周期性容量再生拟合较好的特点,将二者组合作为改进高斯过程回归的协方差核函数,均值核函数的选取较为广泛,本文使用线性函数,最终SOH估计模型选取核函数如下

均值核函数使用

协方差函数使用神经网络核函数和周期核函数

高斯过程回归是根据最大边缘似然的策略获取最优超参数,基于训练样本集构造边缘似然函数如下

其中,θ为超参数。

取负的对数边缘似然函数:

式中,G=K+σn

2I,对矩阵G的求逆运算使用Cholesky 分解:令G=LLT,其中L为下三角矩阵,以减少高斯过程回归的计算成本。

以式(20)为最小目标函数,对超参数求偏导,基于共轭梯度法使偏导数取最小值,以此得出超参数的最优解,求偏导式如下

为解决共轭梯度法受初值选取影响易陷入局部最优的问题,基于粒子群算法(particle swarm optimization,PSO)中群体和个体之间信息共享实现初值寻优,每个粒子在限定的空间中搜寻目标函数的最优解,且群体最优解与个体最优解实现信息共享,并以此影响其他粒子的位置,其原理如下

将高斯过程回归中训练集输入值与其观测值的平均绝对误差作为粒子的适应度值,使用粒子群算法对初值进行多次寻优,但当在协方差核函数的超参数选取差别过大时,会出现病态矩阵[23]。根据试错法,在[-5,5]之间进行初值寻优,粒子个数取15,c1=1.49,c2=0.7,w范围为[0.1,1.1],随迭代自适应调整并更新邻域内的粒子个数,w调整规则如下。

寻优开始时,记停滞次数c=0,当第1 次更新种群时,种群最小极值时记为fit1,若第i+1 次的fiti+1<fiti时,则c=c+1。若fiti+1>fiti,则c=max{c-1,0},并作如下判断。若c<2,则w=2w,若c>5,w=w/2。

2.5 算法流程

本文提取充电过程中电压、电流、温度作为特征参数,经MIC、Pearson 系数筛选后作为健康因子,以主成分分析降维后输入高斯过程回归模型中,选取组合核函数并使用粒子群算法对协方差核函数和均值核函数的超参数初值寻优,经极大似然法确定最优超参数后,高斯过程回归可输出其测试集的后验预测分布,即SOH的估计值和置信区间。基于SOH滑动采样后循环输入高斯过程回归模型,通过单步外推实现SOH 预测,当预测SOH 达到EOL 时,输出此时的循环次数即RUL 值,本文整体算法流程如图3所示。

图3 SOH估计与RUL预测流程Fig.3 SOH estimation and RUL prediction flowchart

3 实验结果

3.1 充电过程特征参数提取

电动汽车实际运行中,其电池的电压与电流随驾驶员的操作实时变化,而充电过程中电压电流参数更为稳定,参数规律性更强,图4为基于CAN总线采集的苏州某电动公交车运行片段中SOC、电压、电流的变化曲线,采样频率为0.1 Hz。前1000 s为电动汽车前往充电站时的各参数变化,后1000 s为充电时的各参数变化,可知其充电电流为恒流模式,且电压变化稳定,与NASA电池充电模式近似。对于大量在用电动汽车,基于电动汽车网联化、信息化的特点,电动汽车充电桩可通过GPRS无线网络向新能源大数据监管平台传输充电信息[24]。

图4 某电动公交车运行片段中SOC、电压、电流的变化曲线Fig.4 The change curve of SOC,voltage and current in the running segment of an electric bus

因此初步提取充电过程中的特征参数如下:充电过程中某区间电压升对应的充电时间TΔV,充电过程中电压到达4.2 V 时电压曲线与时间的积分SV,充电过程中某电压1000 s后的电压值V1000,恒流充电时间TCC,恒压充电时间TCV,恒压充电时间与恒流充电时间比值TCC/TCV,到达峰值温度的时间Tempt-max,最高温度Tempmax,平均温度Tempaverage。

3.2 健康因子筛选

MIC和Pearson系数用于衡量上述充电过程中提取的特征参数与SOH 的相关性,MIC 和Pearson系数的绝对值越大,说明该特征随电池循环的变化趋势与电池SOH的退化趋势相关性越强,保留MIC 和Pearson 系数均大于0.95 的特征参数作为SOH估计模型的输入可进一步提高模型精度。表1为充电过程所提取特征参数与电池容量的相关性分析结果,由于MIC 基于网格划分计算相关性,与容量相关性较高的健康参数会出现数值相等的情况。4 块电池最终提取健康因子如下:TΔV,Tempt-max,TCC,V1000,SV,如图5 所示。对于TΔV,驾驶员一般在电池电量较低时连接充电桩直至电池电量充满,而不是在电池电量为0 时,因此基于MIC 和Pearson 系数对4 块电池的电压升的起始点分别寻优:B0005~B0018起始电压分别为3.71 V、3.81 V、3.70 V、3.81 V,结束电压为4.20 V。对于V1000,B0005~B0007起始电压为3.80 V,B0018为3.90 V,以电池第120 次循环为例,上述5 项健康因子如图5所示。

表1 电池特征参数相关性分析结果Table 1 Relevance analysis results of battery characteristic parameters

图5 电池SOH健康因子选取示意图Fig.5 Schematic diagram of SOH health factor selection for battery

将以上5项健康因子进行主成分分析,选取第一主成分作为高斯过程回归的输入。表2为B0005各主成分对应的特征值,其第一项主成分F1贡献率超过99%。

表2 B0005主成分特征值Table 2 Principal component eigenvalues of B0005

3.3 SOH估计与RUL预测

选取B0005~B0007前100个循环周期作为训练集,B0018 选取前80 个;剩余循环周期作为测试集。基于PSO 对协方差核函数的超参数初值寻优后,以极大似然法选取最优超参数,最终高斯过程回归(PSO-NN+PE-GPR)的超参数如表3。

表3 高斯过程回归的超参数Table 3 Hyperparametric of Gaussian process regression model

平均绝对百分比误差(mean absolute percentage error,MAPE)和均方根误差(root mean square error,RMSE)以及RUL 预测绝对误差RULae作为模型评价指标,公式如下:

式中,N为测试集样本数量;为模型输出值;Qi为观测值;RULae为RUL 预测绝对误差;RULpr为模型预测RUL值;RULtr为电池真实RUL值。

图6 为PSO 优化的组合核函数(PSO-NN+PEGPR)SOH 估计结果以及单周期协方差核函数(PEGPR)、单神经网络协方差核函数(NN-GPR)、组合核函数(NN+PE-GPR)的SOH估计结果,由于健康因子与电池SOH高度相关,因此SOH的估计曲线对容量再生片段均有一定的跟踪能力,单一核函数SOH 估计模型在预测后期出现较大的偏移,未经超参数初值寻优的组合核函数SOH 估计模型准确度虽然高于单一核函数模型,但精度仍低于本文所用方法。

图6 不同核函数的SOH估计结果对比Fig.6 Comparison of SOH estimates for different kernel functions

表4 为不同协方差核函数SOH 估计结果评价,可知组合核函数NN+PE+GPR 的最大MAPE 为2.9605%,最大RMSE 为0.0220,其预测精度高于单协方差核函数的PE-GPR和NN-GPR。而经过粒子群优化的PSO-NN+PE+GPR 的最大MAPE仅为1.0376%,最大RMSE 为0.0148,证明本文提出的改进高斯过程回归提高了模型的预测精度。

表4 不同协方差核函数SOH估计结果评价Table 4 Evaluation of SOH estimation results for different covariance kernel functions

基于高斯过程回归的SOH 估计可输出置信区间,量化结果的不确定性,相关向量机(relevance vector machine,RVM)采用贝叶斯框架也可输出SOH 估计的置信区间[25]。图7 为高斯过程回归与RVM 的SOH 估计对比,二者对容量再生都有较好的跟踪能力,但SOH 估计的准确度仍有差距,测试循环前期二者均有较好的SOH 估计能力,在后期RVM 模型的精度下降较大,除少数点外,电池SOH真实值均落在PSO-NN+PE-GPR估计的95%置信区间内,而RVM 在前几个循环的估计较为准确,但随着循环次数的增加,其95%置信区间逐渐偏离真实SOH值。

图7 不同方法的SOH估计结果对比Fig.7 Comparison of SOH estimates from different methods

表5 为本文所提出PSO-NN+PE-GPR 模型与文献[26]的改进高斯过程回归和RVM 的SOH 估计结果评价,RVM模型SOH估计的最大MAPE和最大RMSE 分别为4.0011%和0.0373,高于本文模型的1.0376%和0.0148,证明同样输出置信区间的情况下,本模型具有更高精度。对于文献[26]中B0005 和B0006 的SOH 估计,本模型的RMSE 均低于0.01,文献[26]的RMSE 均大于0.01,由于RMSE 对大误差更为敏感,证明本文方法在SOH估计中异常值更少,精确度更高。

表5 不同方法SOH估计结果评价Table 5 Evaluation of SOH estimation results by different methods

对于RUL 预测,采用滑动窗口采样实现单步外推,窗口长度为19。基于神经网络协方差核函数具有较强的局部拟合能力的特点实现SOH 和RUL预测,由于B0007数据的特殊性,选取SOH=0.75 作为其EOL。图8 为GPR 与二次函数拟合预测结果对比,SOH 预测无法对未来的容量再生实现预测,但GPR的总体预测曲线与未来SOH真实值贴合程度较高,没有产生明显的偏移和异常值,除少数点外,SOH真实值均落在GPR预测的95%置信区间内,而基于二次多项式拟合的方法在循环后期误差较大。

图8 不同方法的SOH和RUL预测结果对比Fig.8 Comparison of SOH and RUL predictions by different methods

文献[26]和文献[27]均使用高斯过程回归在同样的预测起点进行SOH 外推预测,表6 为不同方法的SOH 预测结果和RUL 预测结果评价,可知本文RUL预测的最大绝对误差仅为1个循环次数,小于文献[26]RUL最大绝对误差为5个循环次数的预测结果;二次函数拟合法RUL 预测绝对误差最大为18 个循环次数,精度较低。对于文献[27],除B0018 外,本文所提出方法SOH 预测的RMSE 最大为0.0115,均低于文献[27]。

表6 不同方法SOH和RUL预测结果评价Table 6 Evaluation of SOH and RUL prediction results by different methods

4 结 论

本文基于电动汽车充电过程提出一种改进高斯过程回归的锂离子电池SOH估计和RUL预测模型。提取有关电压、电流、温度的多元信息作为特征参数,采用Pearson 系数和MIC 筛选后得到健康因子,以主成分分析降维简化模型输入,选取组合核函数并使用粒子群算法优化高斯过程回归的超参数。在NASA锂电池数据集中验证了该模型的有效性,实现了准确的SOH实时估计、SOH和RUL未来预测,并输出95%的置信区间。将实验结果与不同方法对比,经验证,本文所提模型有更好的精度:B0005~B0018 电池SOH 估计的最大均方根误差(root mean square error,RMSE)为0.0148,SOH 预测的最大RMSE 为0.0169,RUL 预测的最大绝对误差为1个循环次数。

在本文的研究中,B0005~B0007 的SOH 估计和RUL预测的起点为第100次循环,B0018为第80 次循环,未来减小训练集规模,实现更早起点的准确SOH估计和RUL预测是进一步的研究方向。

猜你喜欢

协方差高斯电压
数学王子高斯
概率论中有关协方差计算的教学探讨
谈谈电压
二维随机变量边缘分布函数的教学探索
从自卑到自信 瑞恩·高斯林
基于关节信息和极限学习机的人体动作识别
我们身边的电压
挑选超频CPU?先看看VID电压值
通用贴片式器件及应用电路(四)电压变换器ICL7660及ICL7662