APP下载

基于CEEMDAN-SVR模型的柴油车氮氧化物瞬态排放预测

2021-05-14喻洋王艳艳李加强刘学渊何超魏恒吉江林

车用发动机 2021年2期
关键词:瞬态柴油车柴油机

喻洋,王艳艳,李加强,刘学渊,何超,魏恒,吉江林

(1.西南林业大学机械与交通学院,云南 昆明 650224;2.云南省高校高原山区机动车环保与安全重点实验室,云南 昆明 650224)

柴油机具有较高的动力性和燃油经济性,但是过高的NOx排放限制了柴油车在国内的推广和普及。准确预测柴油车在实际行驶过程中的瞬时NOx排放,有助于柴油车尾气后处理装置SCR根据NOx实际排放调整尿素喷射量,进而降低NOx排放。

近年来,机器学习算法被广泛应用于各个领域,并取得了较好的实际效果。利用机器学习算法分析了解机动车在实际道路行驶过程中,车辆各个运行参数和排放之间的因果关系,建立其相关模型变得尤为重要。通过机器学习可以不用考虑研究对象背后复杂的物理知识和化学知识,在拥有足够多数据的支持下,机器学习模型可以加入任何额外的复杂性[1],这是使用传统基于理化性质和经验[2]、半经验假设无法完成的[3]。同时,机器学习模型可以通过更改运行参数,更为直观地了解NOx排放情况;机器学习模型可以嵌入到ECU等汽车小的计算单元中,以便实时观测NOx排放情况。目前,文华等使用遗传算法优化BP神经网络权值对柴油机NOx瞬态排放进行预测,其模型的相对误差相对较小,相关系数R为0.95。Liu等[4]使用组合算法,包括主成分分析(Principal Component Analysis,PCA),遗传算法(GA)和支持向量机的集成方法,建立了柴油机瞬态NOx排放预测模型,该模型在训练和测试数据集方面表现出了较高的准确率,RMSE为51.12×10-6,R2为0.98。Alcan等[5]采用基于S型的非线性自回归外生输入(Nonlinear Autoregressive With Exogenous,NARX)模型预测稳态和瞬态下的NOx排放,建立不同参数值的模型,分析模型对参数变化的敏感性,找到最佳参数,其瞬态预测结果验证精度在70%左右。

从目前国内外的研究状况来看,大部分研究基于模型参数优化来提高预测精度,工作量大,且模型实用性和稳定性差。因此,本研究提出基于CEEMDAN-SVR的柴油车NOx排放预测模型,实现柴油车NOx浓度瞬态变化的准确预测。

1 方法论

1.1 自适应噪声完备集合经验模态分解

自适应噪声完备集合经验模态分解(CEEMDAN)是针对经验模态分解(EMD)和集合经验模态分解(EEMD)的不足提出的一种自适应白噪声数据分析算法[6],适合于柴油机NOx瞬态排放这种非线性和非平稳的时间序列数据[7]。CEEMDAN算法的基本原理是通过EMD分解NOx数据,获得本征模态函数(Intrinsic Mode Function,IMF),在IMF中自适应添加白噪声;将残余量重复上述过程,计算其余IMF分量,其计算公式如下:

Xi(t)=X(t)+wi(t),

(1)

(2)

(3)

式中:X(t)为NOx瞬时排放数据;wi(t)为第i阶白噪声,i=1,2,…n;E1(·)为序列分解的第一个IMF;εk-1为设置的每个阶段的信噪比。

1.2 支持向量回归

支持向量回归(SVR)是支持向量机二分类的一个分支,通过寻找一个超平面,以间隔最大化原则将样本点分为不同类别[8]。回归问题的思想是确定一个可以精确逼近未来值的函数,支持向量回归可用于函数估计、曲线拟合和时间序列预测。

SVR最终使用的预测函数是

(4)

式中:αi为拉格朗日乘数;xi为NOx排放数据的特征向量,包括发动机转速、油门踏板开度百分比、瞬时油耗、发动机负荷百分比和速度;b为常数;C是惩罚因子,表示对异常值的关注度,并确定αi的范围,C的值越大,离群值越多;核函数由K(xi,x)表示,是SVR模型中最重要的函数之一。常见的核函数有4种,高斯径向基函数是最常用的,因其在建模过程中具有较好的有效性和速度。

高斯径向基函数可以表示为

K(xi,x)=exp(-g‖x-xi‖2)。

(5)

式中:g为核函数的参数,与惩罚因子C一样重要;x和xi表示自变量。

1.3 CEEMDAN-SVR模型

柴油机NOx排放浓度序列数据受多种因素影响,是一种非平稳信号,由于CEEMDAN可以对非平稳、非线性的时间序列进行平稳化处理,所以本研究把自适应噪声完备集合经验模态分解和支持向量回归机结合(CEEMDAN-SVR),建立基于CEEMDAN-SVR的柴油机NOx排放浓度的预测模型,对NOx排放浓度进行预测。建立CEEMDAN-SVR的柴油机NOx排放浓度预测模型流程见图1。具体步骤如下:

1) 通过CEEMDAN对NOx排放浓度序列数据进行分解,产生多个本征模态函数(IMF)和一个残余量(RES);

2) 把CEEMDAN产生的多个IMF和RES分别进行SVR建模,初始化SVR的参数,将汽车尾气监控平台获得的发动机转速、油门踏板开度、瞬时油耗、发动机负荷百分比和速度作为输入变量,CEEMDAN分解的子序列作为输出;

3) 把上一步骤各IMF分量和RES通过SVR模型预测获得的结果整合,得到CEEMDAN-SVR模型预测NOx排放浓度的最终结果。

图1 CEEMDAN-SVR预测流程

2 数据来源和处理

2.1 数据来源

本研究数据来源于机动车尾气在线监控平台,其由NOx传感器、OBD(车载诊断器)和无线数据传输单元等组成,NOx传感器用于NOx实时排放的测量,OBD可以提供精确的车辆运行参数。本研究通过机动车尾气在线监控平台获取一辆昆明市国Ⅳ柴油公交车NOx实际道路排放数据,公交车柴油机参数见表1。为避免交通流量的影响,试验测试数据中包含了高峰时段和非高峰时段数据,该柴油公交车行驶路线包括了主城区和市郊路线,囊括公交车怠速、加速、匀速、减速和停车等各个工况数据,采集参数包括发动机转速、燃油消耗、油门踏板开度、扭矩百分比、车速和NOx排放体积分数。

表1 柴油机基本参数

2.2 异常值处理

在数据采集过程中,由于操作不当、设备故障和传感器异常等原因,数据中会存在一些异常值,异常值直接影响模型的精度和效果,因此,有必要对异常值进行分析和去除。

对于公交车各个参数中的异常值,主要存在部分数据离群和偏离样本中心较大等问题,因此,本研究使用箱型图判断数据是否为异常值[9],箱型图结构见图2。箱型图根据数据组最小值、第一四分位数(Q1)、中位数(Q2)、第三四分位数(Q3)、最大值判断数据分布情况,定义Q3-Q1=IQR为四分位距。由于离群值偏离数据中心较大,本研究根据排放数据实际情况,分别选取Q1-3·IQR和Q3+3·IQR作为异常值判断边界,删除小于Q1-3·IQR和大于Q3+3·IQR的数据。

图2 箱型图结构

经箱型图判断,在收集的试验样本中,存在55个异常值,占样本总数比例较少,但数据存在连续空值,因此,本研究采用均值对缺失数据进行填充。

3 试验结果和分析

3.1 对比模型及评价指标

为证明模型的实际效果,选取随机森林(RF)[10]、贝叶斯网络(Bayes)[11]、CEEMDAN-SVR、CEEMDAN-RF、CEEMDAN-Bayes五种模型进行试验对比。

本研究采用均方根误差(RMSE)、决定系数(R2)、平均绝对误差(MAE)和标准均方根误差(nRMSE)去评价模型性能,计算公式如下:

(6)

(7)

(8)

(9)

3.2 试验结果分析

经过异常值处理后的数据,使用CEEMDAN对数据进行分解,分解加入0.4的标准噪声差,允许的最大筛选迭代次数为20 000次,通过多次迭代充分去除数据中加入的噪声。CEEMDAN分解获得了13个IMF和1个残余量,结果见图3。随着分解次数的增加,序列的波动频率更加平缓,其中,IMF1到IMF6的子序列中包含较多的信息,复杂度依旧较高,最后一个残余量仅仅包含了一个单一趋势项,基本不包含有用数据信息。对子序列的预测结果见表2。

在试验中,子序列IMF1和IMF2由于复杂性依旧较高,通过SVR模型计算出R2仅为0.43和0.75,表明在分解过程中可能将噪声或者异常值分解进入了IMF1和IMF2中。随着分解次数的增加,子序列中含有噪声数据逐渐降低,SVR模型预测稳定性明显增强,R2接近1,表明预测值和实际值已经非常接近,预测效果良好。

SVR模型的建立基于Python的机器学习库sklearn实现,采用网格搜索寻找最佳超参数[12],搜索参数包括核函数、误差项惩罚参数和不敏感系数。经过网格搜索,最终确定模型核函数为RBF、误差项惩罚参数为0.8、不敏感系数为0.05时能获得较高准确性。为了确保模型的可靠性和重复性,使用交叉验证,70%的数据作为训练集,15%的数据作为评估集,15%的数据用于模型效果验证。

图3 CEEMDAN分解结果

表2 子序列预测结果

表3列出了各个模型预测性能对比结果,6个模型的预测结果见图4。可以看出,对于RF、Bayes和SVR模型,经过CEEMDAN分解处理过后,模型的性能有明显提升,RMSE分别提高了39.14%,45.65%和58.87%,MAE分别提高了26.79%,48.81%和53.94%,对数据的拟合效果R2分别提高了6.64%、8.28%和8.24%。表明CEEMDAN可以有效降低柴油机NOx瞬态排放的非平稳性,避免原始数据中噪声的影响,充分挖掘数据中隐藏的有用信息,有效预测柴油机NOx瞬时排放。

表3 模型性能参数对比

图4 模型预测结果

图5示出各个模型预测结果与测量值之间的绝对误差。观察发现与实际值偏差最大的点主要由RF、Bayes和SVR模型贡献,经过CEEMDAN算法处理后模型的绝对误差明显减少,误差值主要集中在100×10-6以内,表明CEEMDAN能有效提高模型预测稳定性和预测性能。在6个模型的预测绝对误差结果中,CEEMDAN-SVR表现最优,绝对误差主要集中30×10-6以下,具有更好的回归性和收敛性。

图5 模型绝对误差

总体来说,基于CEEMDAN-SVR的柴油车NOx瞬态排放模型比其他模型具有更高的预测精度,能明显提高柴油车的NOx瞬态排放预测结果,其稳定性也比单一模型更强。

4 结束语

利用CEEMDAN对实际道路行驶中的柴油车NOx排放数据进行了分解,将非平稳、非线性和非正态的原始数据平稳化,通过子序列提取数据中的局部特征信息,然后利用SVR模型对柴油车NOx排放进行建模预测,分解获得的子序列更有利于机器学习算法学习数据特征。

提出的基于CEEMDAN-SVR柴油车瞬态NOx排放预测模型具有较好的预测效果和稳定性,能较好地拟合发动机参数、车辆行驶等参数和NOx排放之间的关系,提高了柴油车NOx瞬时排放预测精度,为实际道路行驶中柴油车的NOx排放预测提供了一种新的思路和方法。

猜你喜欢

瞬态柴油车柴油机
周向拉杆转子瞬态应力分析与启动曲线优化
基于开放边界条件的离心泵自吸过程瞬态流动数值模拟
杭州明年起对新注册登记重型柴油车实施OBD在线接入
日企全面撤出欧洲柴油车市场
百万千瓦核电机组瞬态工况除氧器压力和水位控制
南京尚德柴油机有限公司
柴油机三种滤清器常见问题及保养要点
河柴重工新型船用高速柴油机上线装配
船舶柴油机密封条
FFT、PFT和多相位DFT滤波器组瞬态响应的比较