纯电动客车荷电状态低故障预测
2020-10-12方卫东陈汉林陈子标
方卫东,陈汉林,陈子标
(福建工程学院 信息科学与工程学院,福建 福州 350118)
SOC(state of charge,荷电状态,用来反映电池的剩余容量)是电池管理系统的重要参数之一,SOC低故障是剩余容量占电池容量过低,在国标《电车汽车远程服务与管理系统技术规范》[1]中标注为重点故障。国内纯电动客车的SOC低故障常常发生在每日行车的最后时段,与充电后的SOC值、行驶里程、路况、载客量、天气等因素相关[2]。
在纯电动客车频繁发生的20项故障统计中,SOC低报警故障占总故障的4.63%[3]。SOC越低意味着放电深度越深,会导致电池寿命缩短及电压和电流输出不稳定,严重影响交通及行车安全[4]。纯电动客车SOC低故障预测主要是车辆能耗预测。当前国内对车辆能耗预测模型一般以续航里程作为指标,且着重分析车辆电池参数对里程的影响[5],或者是通过历史的平均能耗和电池剩余能量预测未来的行驶能量损耗[6-7]或者通过GPS轨迹信息预测未来一段时间的能耗[8]。这些方法需要建立复杂的路况模型、电池模型、车辆运行模型,计算量和估计难度较大。针对上述问题,本研究以随机选取某车企50辆纯电动公交车,近8 400万条运行样本数据为研究对象,提出基于ARIMA方法的SOC低故障预测模型,并采用混淆矩阵的真阳率与误诊率为评估指标,验证方法的有效性。
1 ARIMA模型的理论知识
ARIMA模型为差分自回归移动平均模型,是时间序列分析中最常见的一种模型,实际是差分运算与自回归移动平均模型(ARMA)的结合[9]。
设xt为时间序列,B为后移算子,即Bxt=xt-1,记为差分算子,则:
(1)
一般有:
(2)
式中Cid=d!/i!(d-i)!,表明差分后序列等于原序列的若干序列值的加权和。若xt在d阶差分后平稳,则满足式(3)的可称为差分自回归移动平均模型,记为ARMA(p,d,q)模型。
(3)
式中Φ(B)=1-Ø1B-…-ØpBp,为ARMA(p,q)模型的自回归系数多项式;Φ(B)=1-θ1B-…-θqBq,为ARMA(p,q)模型的移动平滑系数多项式。{εt},{εs}为零均值白噪声序列。
2 数据分析
2.1 数据基本特征
研究数据符合《电车汽车远程服务与管理系统技术规范》,具有驱动电机数据、车辆位置数据、发动机数据、整车数据、报警数据等[9]。其中,与SOC低故障相关的字段具有4项:充电开始时间、充电开始SOC、截止下次充电前消耗SOC、截止下次充电前运行里程。
纯电动客车每轮充放电的SOC变化有:
(4)
SOCt为纯电动客车t轮开始充电的SOC值,SOCt-1是纯电动客车t-1轮开始充电的SOC值,SOCChargingt-1是t-1轮充电时刻的总充电SOC,SOCConsumedt为t-1轮充电后车辆运行消耗的SOC。
由于纯电动客车在营运结束后会充电较长的时间,在结束充电的时候SOC一般为100%,并且由于路线较为固定的原因,每日的运行里程也较为固定。如图1部分展示某辆车截止下次开始充电前消耗的SOC与截止下次开始充电前运行里程之间的关系,实线为消耗的SOC,虚线为运行里程,星形标志为该过程发生SOC低故障。从图可以看出,即使在里程变化较小的情况下,不同运行周期SOC的消耗依旧不一致,这主要是由载客量、天气、路况、驾驶习惯等因素导致。如果需要定性的分析这些因素就需要建立复杂的路况模型、电池模型、车辆运行模型,而采用时间序列的分析方法可以更为简单直接地预测结果。
图1 消耗SOC与运行里程关系
2.2 SOC低故障阈值
将50辆纯电动客车从2019年11月到2019年12月的报SOC低故障时的SOC值拼接如图2显示,共计27 218次故障,有效故障56次,横坐标为充电次数,纵坐标为开始充电SOC值。从图2中明显可以发现故障时刻的SOC值均小于20%,因此可以确定SOC低故障的阈值为20%。
图2 SOC低故障情况
3 ARIMA模型预测
利用VIN(vehicle identification number,车辆识别号)为L*76407的纯电动客车2018年6月1日~2020年4月1日共计346次充电过程的起始充电SOC数据标定模型和训练样本,然后对50辆纯电动客车2020年4月1日~2020年5月1日的开始充电SOC进行故障预测。
出于数据的安全性考虑,车辆L*76407的VIN只显示第一位和最后五位作为标识,该车积累数据近2年,总数据量为3.9 GB,有效SOC低故障数量为25次,总行驶里程为7.5万km,数据的时间跨度为2018年6月1日至2020年4月1日,每日运行里程维持在140 ~175 km,单趟行程为34 km,固定行驶在湖南省永州市东安县。将车辆数据根据比例0.66分割为训练集和测试集如图3,训练集为实线,测试集为虚线,星形标志为该过程发生SOC低故障。
图3 开始充电SOC序列的训练集和测试集
3.1 序列季节性分解
一个时间序列是几种变化形式的叠加或耦合:趋势序列Tt、季节序列St、循环序列Ct、残差序列It。趋势序列是原始序列在较长时期内持续发展变化的一种趋向或状态,循环序列是不具严格规则的周期性连续变动,残差序列是由于众多偶然因素对时间序列造成的影响。时间序列Y可以表示为以上四个因素的函数,即:Yt=F(Tt,St,Ct,It)。其中F()常用的模型分为加法模型和乘法模型,从图3发现开始充电SOC序列的季节性并不明显,故而采用加法模型:
(5)
对开始充电SOC序列的训练集分解如图4所示。其中,季节序列具备明显的规律,趋势序列较为平滑,有利于后续的预测分析。残差序列围绕着横坐标轴不断上下波动,可以判断为白噪声序列,对其从小到大排序并取5%(-5.540)为预测值叠加量。
图4 季节性分解
3.2 趋势序列平稳性检验与参数标定
3.2.1 平稳性检测
对给定的时间序列进行ARIMA模型的分析与预测需要序列符合平稳性,否则会出现伪回归问题。ADF检测序列是否存在单位根可判断平稳性,存在单位根则是非平稳序列。对季节性分解后的趋势序列进行分析,检测结果表明:ADF值-1.529 404,大于1%、5%、10%的3个显著性水平下的临界值,统计量P值为0.518 919,大于临界值0.05,接受原假设,所以该序列为非平稳序列,需要进行差分处理。
3.2.2 参数标定
对趋势序列进行一阶差分处理如图5,结果基本对称且在0值附近波动,初步判断属于平稳状态。通过ADF平稳性检测结果表明:ADF值-3.045 144大于10%的显著性水平下的临界值,统计量P值为0.038 881,小于0.05,不满足存在单位根的原假设,故而一阶差分后的序列稳定,可对其进行ARIMA建模分析。
图5 趋势序列一阶差分
由于一阶差分后,序列已经维持稳定,差分阶数d=1,进而对趋势序列建立ARIMA(p,1,q)模型。根据一阶差分的ACF图(autocorrelation function,自相关函数),PACF图(partial autocorrelation function,偏自相关函数)的拖尾及截尾状况,可以得到相关的p,q参数。
对差分序列做ACF和PACF如图6所示,自相关5阶拖尾,偏相关6阶拖尾,即p=5,q=6。此时模型ARIMA(5,1,6),表达式为:
图6 差分序列定阶
(6)
则
(7)
最后计算出:
(8)
3.3 预测结果
将上述获取得到的模型用于测试集中进行拟合数据,结果如图7(a),均方误差为0.129。预测结果叠加季节性序列和残差叠加量-5.540,显示结果如图7(b),实线为测试集,虚线为预测结果,可以发现测试集中属于阈值线以下的故障点基本和预测结果符合。
图7 SOC低故障预测结果
3.4 典型纯电动客车故障预测
以50辆纯电动客车2020年4月1日~2020年5月1日的数据的SOC建立ARIMA(5,1,6)模型,从而验证模型的有效性与可行性。数据共948次充电过程,其中发生SOC低故障数为56次,由于故障样本占总数的十分之一以下,属于分类不均衡问题,故而采用混淆矩阵的准确率(ACC)、真阳率(TPR)、误诊率(FNR)作为评估指标。准确率提供了实验结果的全局信息,真阳率是正确预测为正的样本占全部正样本的比例,误诊率是实际为反例的样本中,预测为正例的占比,预测结果的二元分类混淆矩阵如表1。
表1 基于ARIMA的SOC低预测结果混淆矩阵
从表1可以观察到,TP(本身为故障,预测结果也为故障)是54个,TN(本身为正常,预测结果也为正常)是800个,FN(本身是故障,预测结果为正常)是2个,FP(本身是正常,预测结果为故障)是92个。
准确率:
真阳率:
误诊率:
从结果可知,2020年4月1日~2020年5月1日故障预测的准确率为90.1%,真阳率为96.4%,误诊率为10.3%,表明ARIMA模型具有良好的预测效果与实用性。
5 结论
针对于纯电动客车SOC低故障预测问题,首先分析了车辆运行周期的能耗特征,然后结合充电开始SOC特性,通过差分获得平稳序列,构建差分自回归滑动平均模型以拟合数据的趋势性和周期性,最后以湖南某运营公司的纯电动客车开始充电SOC数据进行模型参数标定,利用构建的模型预测与诊断故障,将结果与实际故障比较进行验证。结果显示,针对于不同的纯电动客车,真阳率在96.4%,误诊率在10.3%,验证了模型的故障预测有效性。
基于ARIMA的SOC低故障预测结果为公交运营公司的车辆排班与出行计划提供重要参考依据,对提高运营管理具有显现实意义,但是故障预测结果有10.3%的故障误诊率,如何提高真阳率的同时减低误诊率将作为未来的研究方向。