APP下载

基于主成分分析和改进支持向量机的锂离子电池健康状态预测*

2020-11-27宋哲高建平潘龙帅郗建国

汽车技术 2020年11期
关键词:锂离子因子样本

宋哲 高建平 潘龙帅 郗建国

(河南科技大学,洛阳 471003)

1 前言

锂离子电池是新能源汽车的核心部件,在使用过程中,其性能会随着时间的推移而下降,为保证其工作可靠性,预测其健康状态(State of Health,SOH)以及剩余使用寿命,已成为当前研究的热点[1]。目前,数据驱动是锂离子电池SOH预测的主要方法[2]。其中,支持向量回归(Support Vector Regression,SVR)算法具有很强的泛化能力,能够保证全局最优,同时避免神经网络局部极小、过学习和欠学习等问题。例如:文献[3]利用SVR算法估计锂离子电池的SOH 和剩余寿命;文献[4]利用遗传算法(Genetic Algorithm,GA)对SVR 的关键参数进行优化,使用优化后的参数建立SVR预测模型,实现了锂离子电池剩余容量预测;文献[5]提出一种柔性支持向量回归算法进行SOH 预测。然而,SVR 模型具有较多的超参数,直接影响SVR的泛化性能和预测精度,为了提高SVR模型的预测精度,可利用粒子群算法(Particle Swarm Optimization,PSO)对SVR的参数进行优化。

另外,特征参数的选取直接影响数据驱动方法的预测精度。目前,大多采用易监测参数作为健康因子来预测电池SOH,如:文献[6]采用放电电压样本熵作为健康因子并利用支持向量机(Support Vector Machine,SVM)算法实现锂离子电池SOH 预测,但未对健康因子间进行主成分分析;文献[7]研究电池性能衰退过程中电池放电电压变化趋势,提取等压降放电时间差作为健康因子,但忽略了健康因子间的冗余与不足。众多研究中,大部分学者未考虑健康因子间的相关性,容易使所表达信息丢失或重叠,这将对预测精度产生很大影响。因此,提取能够显著表征锂离子电池性能退化状态且不含冗余或不足的健康因子是非常重要的。

基于上述分析,本文提出一种基于主成分分析的锂离子电池SOH 预测方法,该方法能够将多个反映锂离子电池健康状态的性能退化参数进行融合,既充分保留电池性能退化的相关信息,又可去除冗余。此外,结合粒子群优化算法,对SVR 算法的关键参数进行全局最优搜索,进一步提高SVR 模型的预测精度和计算速度。

2 基于主成分分析的健康因子构建

2.1 锂离子电池性能退化状态参数提取

随着充、放电过程不断进行,锂离子电池内部的电化学反应会导致电解液和电极材料不断消耗,固体电解质界面(Solid Electrolyte Interphase,SEI)膜增厚,从而导致其健康状态逐渐退化。尽管锂离子电池内部电化学反应机理十分复杂,反映其健康状态的容量或阻抗难以获取,但一些可在线测量的性能状态参数同样可以表征电池性能退化规律。

研究发现,在相同时间间隔内,电池放电电压差随着电池充放电循环次数的增加而逐渐增大,与锂离子电池容量存在一定的相关性。相同时间间隔内,处于不同放电周期的锂离子电池放电电压的下降程度称为等时间间隔放电电压差(Discharge Voltage Difference of Equal Time Interval,DVD_ETI)。DVD_ETI 数据序列提取方法如图1所示。

在第φ个放电周期,等时间间隔t内放电电压差可表示为:

式中,Vt_min、Vt_max分别为时间间隔t初始时刻和终止时刻所对应的电压;l为充放电周期数。

图1 等时间间隔放电电压差

所以,在各放电循环周期中所提取的DVD_ETI 数据序列为:

另外,还有一些参数可以反映电池性能退化状态,如文献[8]将电池端电压作为表征电池性能退化状态的特征参数,文献[9]将电池平均放电温度作为锂离子电池健康因子,文献[10]将电压值均方根作为健康因子。综上所述,为了充分反映锂离子电池的性能退化状态,本文选择等时间间隔电压差、等压降放电时间、放电电压值均方根、恒流充电时间、初始电压跌落值、放电功率、放电平均温度及电池端电压等8 个具有代表性的性能退化参数共同作为锂离子电池SOH 预测的健康因子。

2.2 主成分分析

上述选取的健康因子中,有些参数之间信息重叠较多,存在一定冗余,使问题分析变得复杂,同时为避免仅采用1~2个健康因子进行分析导致信息不足,需对健康因子参数矩阵进行主成分分析。主成分分析法主要通过降维产生几个线性无关的综合主成分来反映事物的大多数信息。主成分分析算法具体步骤如下:

a.样本矩阵获取。设样本数量为n,每个样本含有变量的数量为q,则构成一个n×q型样本矩阵:

式中,Xij(i=1,2,…,n,j=1,2,…,q)为第i个样本中的第j个特征参数。

b.标准化处理。在主成分分析前对特征参数进行标准化处理以解决量纲影响问题。本文采用正态分布标准化法:

c.计算特征参数之间的相关系数矩阵:

式中,rij(i,j=1,2,…,q)为标准化后数据的相关系数,rij=rji。

d.主成分贡献率。求取矩阵Rq×q的特征值λi(i=1,2,…,q),前m个主成分的累积贡献率为:

一般取累积贡献率超过80%的特征值所对应的前m个主成分,然后将所选主成分的得分矩阵作为预测模型的输入矩阵。

3 基于PSO-SVR的预测模型

3.1 支持向量回归模型

SVR 是SVM 在回归问题上的推广,具有很强的泛化能力,能够保证全局最优性,在处理一些非线性问题时具有独特的优势。SVR 的基本思想是通过某一个非线性变换将输入向量映射到高维特征空间中,然后在高维空间内对样本集进行线性回归。针对训练样本数据集D={(x1,y1),…,(xi,yi)},目标是使训练样本尽量拟合到一个线性函数f(x)上,使f(x)与对应的yi尽可能接近,线性回归函数为:

式中,w为权值向量;φ(x)为将样本x从原始空间映射到高维空间的映射函数;b为偏置值。

为了求解w和b,SVR 使用不敏感损失函数ε进行线性回归,将回归问题转化为关于变量w和b的凸二次规划问题:

针对上面的凸优化问题,引入拉格朗日乘子,可得式(10)的对偶问题:

由于径向基核函数(Radial Basis Function,RBF)具有较高的拟合和预测精度[11],本文选择RBF 作为核函数:

式中,γ为RBF核宽度。

3.2 基于粒子群优化的SVR模型

在高维特征空间,SVR模型中的惩罚参数C影响模型的复杂性和稳定性,核宽度γ影响样本分布的复杂程度[12]。因此,为了提高SVR 模型预测精度,降低模型复杂性,需确定C与γ的最优取值。PSO 算法具有简单易行、收敛速度快及设置参数少等优点,且能够防止陷入局部最优解。利用基于PSO 的SVR 算法寻找最优参数C和γ,可避免网格搜索法(Grid Search,GS)精度低、计算量大等问题。基于PSO的SVR算法流程如图2所示。

图2 PSO-SVR算法流程

速度和位置更新公式为:

式中,w为惯性权重;v为粒子速度;rrand1和rrand2为区间[0,1]内随机数;x为粒子的位置;C1、C2为常数;为第k代个体最优粒子位置;为第k代全局最优粒子位置。

4 基于主成分分析的PSO-SVR 锂离子电池SOH预测框架

本文将量子计算理论引入经典机器学习算法,提出一种基于主成分分析的PSO-SVR锂离子电池SOH预测框架,如图3所示,主要分为3个步骤:

a.健康因子构建。从锂离子电池充放电过程中提取能够反映电池退化状态的性能退化参数,然后利用主成分分析算法对提取的特征参数进行降维、去噪。

b.构建电池SOH 预测模型。结合历史电池容量退化数据,将主成分得分矩阵作为输入,对应周期下的容量作为输出,构建基于粒子群优化支持向量回归的SOH预测模型。

c.将测试集作为模型输入,计算电池在每次放电循环后的健康状态。电池健康状态定义为每次充电后电池最大可用容量与其额定容量的比值:

式中,Ck为第k次充电后电池最大可用容量;C0为电池额定容量;SSOH为电池健康状态。

图3 基于主成分分析的PSO-SVR预测框架

5 试验结果与分析

5.1 锂离子电池数据分析

试验所用原始数据是来自于美国国家航空航天局(NASA)的4组电池(B5、B6、B7、B18)充、放电循环数据[13]。本文以B18 数据为例,首先提取充、放电过程中具有代表性的8个健康因子,即等时间间隔电压差ΔU、等压降放电时间Ti、放电电压值均方根URMS、恒流充电时间Ta、初始电压跌落值ΔUa、放电功率P、放电平均温度T、电池端电压U,然后计算健康因子间的相关系数,结果如表1所示。从表1可以看出,不同健康因子之间存在一定联系,从而导致所表达的信息存在一定冗余。

表1 锂离子电池健康因子间相关系数

采用主成分分析算法去除健康因子之间的冗余部分,用更少的变量表达大部分参数信息。各主成分的特征值、贡献率和累积贡献率如表2 所示,使用Mi(i=1,2,…,8)表示得到的8 个主成分,第1 个主成分的累计贡献率为95.160%,能够较好地反映原有信息。

表2 主成分特征值、贡献率、累积贡献率

为验证主成分得分矩阵是否具有与电池容量同等表达电池退化状态的能力,采用皮尔森(Pearson)相关系数r与斯皮尔曼(Spearman)秩相关系数ρ对它们之间的关系进行定量分析,结果如表3所示,可以看出,去除冗余后的健康因子与容量之间相关性较强。因此,去除冗余后的健康因子可以代替容量作为表征锂离子电池性能退化的健康指标。

表3 主成分得分矩阵与容量关联度

5.2 结果及分析

5.2.1 基于主成分分析的PSO-SVR算法预测性能分析

为验证本文方法在电池SOH 预测中的效果,设计如下3 种验证策略:策略1,将前60 个主成分得分样本矩阵作为训练集,剩余样本作为测试集;策略2,将前80个主成分得分样本矩阵作为训练集,剩余样本作为测试集;策略3,将前100 个主成分得分样本矩阵作为训练集,剩余样本作为测试集。试验中,采用粒子群算法确定SVR 模型最优惩罚参数C和核宽度γ,以B18 数据为例,在策略1下的参数寻优过程如图4所示。初始参数中,粒子群算法种群数量设置为20,进化代数设置为200。由此可得SVR 最优惩罚参数C=36.82,最优核宽度γ=0.01,均方误差mse=0.021。为验证PCA-PSO-SVR预测模型的精度,将其与基于网格搜索法优化的SVR模型预测性能进行比较。

图4 粒子群算法寻优过程

试验评价指标采用平均绝对百分误差MMAPE、均方根误差RRMSE和绝对误差AAE:

式中,Yi为第i个样本的真实值;为第i个样本的预测值;N为样本数量。

MMAPE和RRMSE的值越小,表示模型预测值与真实值差距越小,模型性能越好。

对于每组锂离子电池数据集,依次执行上述3种策略进行验证。4组电池在策略1下的预测结果如图5所示。图6所示为B5电池上PCA-PSO-SVR算法与PCAGS-SVR算法绝对误差曲线对比结果。

图5 4组电池SOH预测结果

由图5 可知,基于PCA-PSO-SVR 算法的4 组电池的SOH预测值更接近真实值。从图6中可以看出,基于PCA-GS-SVR 算法的电池SOH 绝对误差在-0.025~0.015 范围内,而基于PCA-PSO-SVR 算法的电池SOH绝对误差在-0.015~0.015范围内,误差较小,说明PCAPSO-SVR算法预测精度高。

2种方法在4组电池数据集上的预测结果如表4所示。从表中可以观察到,在平均绝对百分误差以及均方根误差方面,本文提出的PCA-PSO-SVR算法预测性能均优于PCA-GS-SVR算法。

图6 B5电池SOH预测绝对误差曲线

表4 2种方法在4组电池数据集上的预测性能评价

5.2.2 PCA-PSO-SVR算法与现有方法的预测性能比较

为了进一步验证PCA-PSO-SVR 算法在锂离子电池SOH 预测性能方面的有效性,本文将其与现有的P-MGPR[14]、SE-MGPR[14]和Improved PSO-SVR[15]锂电池SOH 预测方法在3 组锂离子电池数据集上进行对比试验。试验过程中,上述3种方法均采用全部样本数据的60%作为训练集,剩余40%作为测试集。表5 描述了本文方法与上述3种方法在B5、B6及B7电池数据集上的预测性能比较结果。

从表5 可以观察到,本文提出的方法在锂离子电池SOH 预测性能方面均优于其余3 种方法。在平均绝对百分误差方面,PCA-PSO-SVR 相比于Improved PSO-SVR 在3 组电池数据集上平均减少了0.92 百分点,PCA-PSO-SVR 的平均绝对百分误差显著低于P-MGPR,在B6 电池数据集上减少了2.19 百分点。在均方根误差方面,PCA-PSO-SVR相比于Improved PSOSVR 在3 组电池数据集上分别减少了0.33、0.56 及0.67。PCA-PSO-SVR 与P-MGPR 和SE-MGPR 方法相比优势更加明显。上述结果证明了本文方法的有效性及适应性。

表5 4种方法在B5、B6及B7电池数据集上的预测性能比较

6 结束语

本文首先通过主成分分析算法对选取的具有代表性的8个健康因子进行降维,得到一个可以表征锂离子电池退化状态的健康指标,然后利用粒子群算法对SVR模型关键参数进行全局寻优,找出最优惩罚参数C和核宽度γ,构建了基于粒子群优化的SVR 预测模型,并与基于GS 网格搜索法优化的SVR 模型进行对比分析,结果表明本文提出的算法预测精度较高,最后与现有锂离子电池SOH预测方法进行对比验证,结果表明,基于主成分分析的PSO-SVR在实现锂离子电池SOH预测方面具有较高预测精度及较好的预测稳定性。

猜你喜欢

锂离子因子样本
全陶瓷电极可用于锂离子电池
选择性电沉积方法用于回收锂离子电池中的钴和镍
快速充电降低锂离子电池性能存在其他原因
基于放电过程的锂离子电池剩余寿命预测
山药被称“长寿因子”
规划·样本
直径不超过2的无爪图的2—因子
巧解难题二则
人大专题询问之“方城样本”
随机微分方程的样本Lyapunov二次型估计