数据驱动下农用车辆柴油机NOX排放预测模型
2023-06-15李宇航庄继晖陈振斌
李宇航 庄继晖 陈振斌
摘要:针对农用车辆柴油机NOX排放与实际运行工况之间的复杂非线性关系,提出一种数据驱动下的NOX排放预测模型。基于车辆OBD采集实际运行数据,通过小波阈值降噪降低原始数据的非平稳性,采用集成特征选择算法完成模型输入特征的选择,同时融合BiGRU和注意力机制构成BiGRU-Attention模型,同时利用贝叶斯优化进行模型超参数选择。基于实车道路测试数据集分析,提出的模型相对于LSTM、GRU和BiLSTM-Attention模型NOX瞬时排放预测校正系数分别提高7.65%、3.26%和4.09%,模型平均绝对误差维持在0.001 4 g/s,在不同车辆数据集上预测校正系数均保持在85%以上,可以有效进行实际场景下NOX排放的高精度预测,为农用车辆柴油机NOX排放预测控制提供数据支撑。
关键词:NOX排放;小波降噪;特征选择;双向GRU;注意力机制;贝叶斯优化
中图分类号:S218.5: TP183
文献标识码:A
文章编号:2095-5553 (2023) 04-0128-09
Abstract: In view of the complex nonlinear relationship between NOX emissions and actual operating conditions of diesel engines in agricultural vehicles, a data-driven NOX emission prediction model is proposed. The actual operating data was collected based on vehicle OBD, and the non-smoothness of the original data was reduced by wavelet threshold denoising. The integrated feature selection algorithm was used to complete the selection of model input features. The BiGRU-Attention model was constructed by integrating BiGRU and the attention mechanism, and bayesian optimization was also used to select the model hyperparameters. Based on the experimental analysis of the actual vehicle road test dataset, compared with the LSTM, GRU, and BiLSTM-Attention models, the prediction R-square of the model in this paper was increased by 7.65%, 3.26%, and 4.09%, respectively. The mean absolute error of the model was maintained at 0.001 4 g/s. The prediction R-square was maintained at 85% on different vehicle datasets. This model can effectively predict NOX emissions with high accuracy in real scenarios and provides data support for NOX emission prediction control of diesel engines in agricultural vehicles.
Keywords: NOX emissions; wavelet denoise; feature selection; bidirectional GRU; attention mechanism; bayesian optimization
0 引言
柴油機因其油耗低、可靠性高等优点被广泛用于各行各业中,农业行业中柴油机被用于非道路农用机械以及农用运输车辆中,随着其应用场景的普及,柴油机排放问题也愈发引人关注,其中氮氧化物(NOX)是柴油机排放的主要气态污染物,也是大气污染的主要污染源之一。柴油机造成的NOX排放占发动机NOX总排放的80%以上,为治理柴油车排放污染问题,排放相关法规愈发严格,目前重型柴油车已实施国六排放标准,非道路国四标准也即将于2022年底应用[1]。
选择性催化技术(SCR)是降低柴油机NOX排放的一种有效方法,利用催化还原反应将氮氧化物变为氮气和水,被广泛用于农用运输车辆中。SCR系统的高效使用需要获得精准的柴油机NOX排放数据来控制尿素喷射速率[2],由于实际运行工况NOX排放信息存在数据延迟和漂移等问题,影响实际SCR系统的控制效率,获取NOX排放预测信息可以通过反馈补偿满足系统实时性要求。
NOX排放预测模型的构建与柴油机复杂运行机理有关,可以通过计算流体力学(CFD)利用NOX的物理化学过程获取NOX排放数据,但是CFD模型存在计算量大、标定困难等问题;也可以通过试验获取静态MAP映射图进行NOX排放预测,但MAP图法需要大量标定实验拟合柴油机各运行状态排放数据[3],同时对于瞬态NOX排放数据难以准确获取;大数据技术发展降低了柴油机实际运行工况数据获取难度,针对柴油机多参数非线性特性,数据驱动下的神经网络预测模型得以快速应用。
左付山等[4]构建了基于BP神经网络的NOX排放预测模型,可以实现车辆全工况下排放预测,在异常状态下仍可以保持较高的预测精度;Fang等[5]探讨了人工神经网络方法在预测高速直喷柴油机瞬态负载阶段NOX排放方面的适用性,利用瞬态输入特征构建ANN模型预测瞬态NOX排放,ANN模型预测的NOX排放量与快速NOX分析仪测量值吻合良好。
由于柴油机NOX排放数据具有明显的时间相关性,传统神经网络难以学习其时序关系,长短时记忆神经网络(LSTM)通过门控制将长短时记忆结合更适应于时序数据预测,邢红涛等[6]设计了一种基于混合CNN和LSTM的NOX排放预测模型,加入K-means聚类完成训练样本的分类,相较于原始LSTM预测模型表现更佳;温鑫等[7]建立了基于双向LSTM(BiLSTM)的NOX排放预测模型,通过学习数据前后两个方向信息实现NOX排放的高精度预测。门控循环单元(GRU)相比于LSTM网络更加高效快速,更加满足实际工程应用的实时性要求,谢锐彪等[8]提出一种基于双向门控循环单元(BiGRU)的NOX排放预测模型,通过主成分分析进行数据降维,采用粒子群优化进行網络超参数寻优,实现了NOX排放的高精度预测。
因此,提出一种数据驱动下农用车辆柴油机NOX排放预测模型,基于柴油车OBD获取车辆实际运行工况数据,通过小波阈值降噪完成数据预处理,利用组合特征选择算法进行特征选择,将筛选后特征作为模型输入,构建双向GRU网络,经过注意力机制进行关键时间点信息选取,通过贝叶斯优化算法实现网络超参数优化,可以有效提高NOX排放预测精度。
1 研究方法
1.1 小波阈值降噪
原始数据来源于实际工程场景,数据会叠加外界噪声,影响特征选取以及模型训练,容易导致模型过拟合[9],因此需要对数据进行降噪,降低数据非平稳性,小波阈值降噪通过小波变换可以有效完成时序数据的数据降噪。时间序列x(t)的连续小波变换(CWT)可以表示为式(1)。
XGBoost将损失函数进行泰勒展开,可以获取更高的收敛速度和准确性,增加模型的泛化能力,通过树分裂次数综合分析特征对模型预测准确性贡献,选取当前信息增益最大的特征用于分裂,将相应叶子中分数叠加为计算结果。
1.3 Bi-GRU网络
柴油机NOX排放数据与车辆运行工况相关,具有明显的时间相关性,对于排放数据的学习需要关注时间维度信息。LSTM作为一种特殊的具有记忆单元和门机制的递归神经网络,克服了传统RNN中存在的梯度消失和梯度爆炸的问题。通过门控制结合长短期记忆,能够有效获取数据时间维度深层依赖关系。
GRU网络是LSTM网络的一种改进体,在LSTM输入门、遗忘门和输出门三个门结构的基础上,将遗忘门与输入门结合为更新门,保留预测精度的同时通过简化结构提高计算效率,更适应于工程应用[15]。GRU网络结构如图2所示。
更新门选择历史信息保存在当前时间,重置门决定当前时刻输入与历史累积信息的融合,通过激活函数表征累积信息的遗忘程度。
GRU网络只能单向对数据进行学习,容易丢失反向重要信息,为充分分析和学习时序数据,采用双向GRU网络(BiGRU),通过前向和后向独立计算隐藏层状态,叠加获得最后输出结果[16],BiGRU对特征学习能力更强,更适合于时间相关性强的NOX排放数据。
1.4 注意力机制
注意力机制(Attention Mechanism)借鉴生物视觉存在选择性倾向,从复杂信息流中选取重要信息,可以更好地利用计算资源对关键信息进行学习,准确提取数据特征[17]。由于不同历史时刻与当前信息的相关度不同,通过注意力机制计算BiGRU输出权重,突出关键信息,可以有效提高模型的预测精度[18],注意力机制计算过程如下。
1.5 基于贝叶斯的模型超参数优化
为了加快神经网络模型训练速度,需要调整模型超参数,合理的超参数可以有效提高模型性能以及预测精度。人工调参经验性依赖高、不确定因素过多,常用自动调参进行超参数寻优,自动调参有网格搜索法和随机搜索法,网格搜索需要的计算量会随着参数的增加呈指数上升,随机搜索虽然能够加快运行速度,但是容易陷入局部最优解。因此选取贝叶斯优化算法进行模型超参数寻优。
贝叶斯优化是一种针对计算成本高昂函数的全局优化方法,其主要思想是假设目标函数符合高斯分布并且建立目标函数的统计模型,利用统计模型寻找预期目标函数最小值的位置[19],采样函数决定采样点选择,常采用期望改进函数(Excepted Improvement,EI)。贝叶斯优化模型超参数需要先设置超参数搜索域空间,选取随机样本点初始化预测模型,利用高斯分布获得超参数概率分布,取平均绝对误差评估并修正高斯模型,然后利用采样函数选取下一采样点,直至收敛为最优解或达到最大迭代次数[20]。
2 柴油机NOX排放预测模型建立
柴油机NOX排放预测模型由数据处理层、特征选择层、预测层、输出层组成,为加快模型收敛在输入训练前需对数据进行归一化处理[21],采用最大—最小(min-max)归一化方法,其计算方法如式(15)所示。
3 试验及结果分析
3.1 试验平台及数据
试验平台为不同车型的农用运输货车,试验车辆具体参数如表1所示,数据采集自车载排放诊断系统(On Board Diagnostics system,OBD系统),采集设备连接OBD口通电,通过CAN总线与车辆进行通讯并实时采集数据,利用4G完成数据云平台发送,主要采集参数包括:车速、大气压力、转速、燃料流量、排气温度、净输出扭矩、发动机负载、SCR后端NOX浓度、摩擦转矩、冷却液温度,SCR进气温度、NOX瞬时排放、经纬度等数据。
其中,预测模型训练与测试数据来源于1号车和2号车混合数据集,3号车数据用于模型泛化能力验证。考虑实际农用运输车工作环境的复杂性,为贴合真实工作场景,选取农村、城市和高速三种路段进行测试,数据采集频率为1 Hz,同时包括加速、减速、匀速、怠速等多种工况。针对采集数据受实际环境影响导致的数据异常点,依据3σ定理对数据进行清洗,去除偏差较大的异常值。预处理后三车速度变化图如图4所示,其中1号车有效测试数据5 000组,包含农村道路2 174 s、城市道路1 895 s以及高速道路931 s;2号车有效测试数据5 000组,包含农村道路1 759 s、城市道路1 905 s以及高速道路1 336 s;3号车有效测试数据5 000组,包含农村道路2 347 s、城市道路1 966 s以及高速道路687 s。各路段平均车速如表2所示。
模型构建数据选择1号车和2号车拼接混合数据集,共有10 000组时间间隔为1 s的数据,其NOX瞬时排放变化趋势如图5所示。在农村、城市以及高速路段按照8∶2的比例划分训练集和测试集,保证训练集和测试集数据均包含各路段数据。
对原始数据进行小波阈值降噪,降噪前后部分数据对比图如图6所示,降噪后数据相对于原始数据变化更加平滑稳定,小波降噪可以有效优化数据质量。
将降噪后数据进行特征选择,不同特征选择算法输出结果如表3所示。
根据皮尔森系数法,与NOX瞬时排放量线性相关性强的是SCR下游NOX浓度、车速、净输出扭矩、发动机负载以及SCR出口温度,皮尔逊系数均在0.35以上;根據互信息系数,NOX瞬时排放量相关性排序为:转速、SCR下游NOX浓度、车速、SCR出口温度以及发动机负载,互信息系数均在0.65以上;根据随机森林算法输出特征重要性,SCR下游NOX浓度、转速、车速、SCR出口温度以及燃料流量得分较高;根据XGBoost输出重要性得分,SCR下游NOX浓度、车速、发动机净输出扭矩、燃料流量以及发动机负载与预测准确度相关性更大。
综合各特征选择算法结果,选择车速、转速、SCR下游NOX浓度、燃料流量及SCR出口温度、净输出扭矩和发动机负载作为模型输入参数,舍去摩擦扭矩、冷却液温度等其余参数。
3.2 模型参数设置
预测模型超参数的确定采用贝叶斯优化法,设置批处理大小寻优范围为[32,64,128,256],训练次数寻优范围为[2 000,3 000,4 000,5 000],Dropout比率寻优范围为[0.2,0.3,0.4],隐藏层节点数寻优范围为[64,128,256],学习率寻优范围为[0.001,0.002,0.003],损失函数寻优范围为[MSE,MAE],优化器寻优范围为[Adam,SGD],设置最大迭代次数为200,贝叶斯优化结果如表4所示,优化结果即为NOX排放预测模型最优超参数。
MAE和RMSE反映模型预测结果与真实值的误差大小,数值越接近0,精度越高;R2数值在0~1之间,数值与模型精度呈正比。
3.4 模型结构对比
为验证小波阈值降噪和注意力机制对预测模型精确度的提升,对不同结构模型进行对比分析,将本文模型分别与未进行降噪处理的预测模型和进行降噪处理但未加入注意力机制的预测模型进行对比分析,试验数据和BiGRU网络超参数设置均相同,不同结构模型预测精度如表5所示。
由表5可知,本文模型相对于未降噪处理预测模型,MAE降低了0.001 g/s,约为预测数据集均值0.011 g/s的9%,R2提高了8.93%,RMSE降低了0.001 2,表明基于小波阈值降噪的数据处理可以有效提高模型预测精度;模型加入注意力机制后,模型MAE降低了0.000 7 g/s,约为均值的6.36%,R2提高了4.31个百分点,RMSE降低了0.000 6,说明注意力层通过突出关键信息可以有效提高NOX瞬时排放预测效果。图7为不同结构模型部分测试数据预测结果,结合图像可知,模型未进行数据降噪时对NOX排放数据跟踪存在偏差,数据降噪有效提高了模型对于NOX排放数据波动的跟踪能力;模型在未加入注意力层时对关键信息未进行有效筛选,在NOX瞬态排放突变处存在较大波动。
3.5 不同模型对比试验
为进一步分析本文模型预测效果,选择3种基准模型进行对比分析,分别是LSTM预测模型,包含三个节点数为64的隐藏层;GRU预测模型,包含一个节点数为64的隐藏层;BiLSTM-Attention预测模型,采用激活函数为tanh且节点数为64的网络结构。设置试验参数与本文模型相同,不同模型预测精度见表6所示。
由表6可知,本文模型相对于LSTM模型、GRU模型以及BiLSTM-Attention预测模型,MAE分别降低了0.001 1 g/s、0.000 6 g/s、0.000 3 g/s,分别约为测试数据集均值的10%、5.45%、2.73%;R2分别提高了7.65、3.26、4.09个百分点;RMSE分别降低了0.001 1、0.000 5、0.000 6。
图8为不同模型部分预测结果图,结合图像可知,GRU预测模型有效学习了NOX瞬态排放变化趋势,但与实际输出偏差较大;BiLSTM-Attention预测模型跟踪良好但在预测初期偏差较大。综合分析,本文模型预测性能优于基准模型LSTM模型、GRU模型以及BiLSTM-Attention预测模型。
3.6 模型泛化能力试验
为进一步分析模型在实际工程环境下的泛化能力,验证NOX排放预测模型在其余车辆上的预测表现,取独立于模型训练和测试之外的3号车数据进行验证分析,随机生成测试数据集1和数据集2,在新测试数据集1和2上的预测精度如表7所示,部分数据预测结果图9和图10所示。
NOX排放预测模型在数据集1和数据集2上均值分别为0.028 1 g/s和0.018 7 g/s,R2指标均在85%以上,RMSE均在0.007以下,同时数据集1和数据集2的平均绝对误差分别为0.003 8 g/s和0.005 3 g/s,在未进行针对性训练情况下模型具备一定的泛化能力。结合图9和图10可知在数据突变处模型预测效果变差,在数据存在波动下降的数据集2上预测精度有所下降,但是对于不同数据集,模型均能有效跟踪NOX瞬态排放变化趋势,表明预测模型能够有效学习NOX瞬态排放和相关参数之间的时序关系。
4 结论
针对农用柴油机NOX瞬时排放难以准确预测的问题,提出一种基于数据驱动的农用柴油机NOX排放预测模型。
1) 数据方面,采用农用运输车辆多车混合数据集,增加模型的泛化能力;使用小波阈值降噪对数据进行预处理;针对OBD采集数据特征的复杂冗余性,进行基于集成特征选择算法的特征提取,优化输入参数选择以提高模型预测的速度与精度。
2) 构建双向GRU网络充分挖掘数据间时序联系,通过注意力机制集中关键信息进行学习,并通过贝叶斯优化算法解决模型超参数寻优困难问题。仿真结果表明,本文模型在测试集数据上预测平均绝对误差在0.001 4 g/s,校正绝对系数约为93%,同时均方根误差维持在0.002 2,在不同车辆数据集上预测校正系数均能维持在85%以上,表明本文模型能够有效进行农用柴油机真实工作场景下NOX瞬时排放数据的高精度预测。
在未来研究中,将针对NOX排放预测模型进行车辆运行控制策略的设计与改进,为降低NOX排放量提供理论支撑。
参 考 文 献
[1] 徐萌, 王俊, 文奕钧, 等. 小型农用柴油机油耗和排放的多目标优化[J]. 中国农机化学报, 2022, 43(2): 112-120.
Xu Meng, Wang Jun, Wen Yijun, et al. Multi objective optimization of fuel consumption and emissions of a small agricultural diesel engine [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(2): 112-120.
[2] 杨蓉, 杨林, 谭盛兰, 等. 基于遗传算法——优化长短期记忆神经网络的柴油机瞬态NOX排放预测模型研究[J]. 内燃机工程, 2022, 43(1): 10-17.
Yang Rong, Yang Lin, Tan Shenglan, et al. Prediction model for transient NOX emission of diesel engine based on GA-long short term memory (LSTM) neural network [J]. Chinese Internal Combustion Engine Engineering, 2022, 43(1): 10-17.
[3] 戴金池, 庞海龙, 俞妍, 等. 基于LSTM神经网络的柴油机NOX排放预测[J]. 内燃机学报, 2020, 38(5): 457-463.
Dai Jinchi, Pang Hailong, Yu Yan, et al. Prediction of diesel engine NOX emissions based on long-short term memory neural network [J]. Transaction of CSICE, 2020, 38(5): 457-463.
[4] 左付山, 李政原, 吕晓, 等. 基于BP神经网络的汽油機尾气排放预测[J].江苏大学学报(自然科学版), 2020, 41(3): 307-313.
Zuo Fushan, Li Zhengyuan, Lü Xiao, et al. Prediction of gasoline engine exhaust emission based on BP neural network [J]. Journal of Jiangsu University (Natural Science Edition), 2020, 41(3): 307-313.
[5] Fang X H, Zhong F, Papaioannou N, et al. Artificial neural network (ANN) assisted prediction of transient NOX emissions from a high-speed direct injection (HSDI) diesel engine [J]. International Journal of Engine Research, 2021.
[6] 邢红涛, 郭江龙, 刘书安, 等. 基于CNN-LSTM混合神经网络模型的NOX排放预测[J]. 电子测量技术, 2022, 45(2): 98-103.
Xing Hangtao, Guo Jianglong, Liu Shuan, et al. NOX emission forecasting based on CNN-LSTM hybird neural network [J]. Electronic Measurement Technology, 2022, 45(2): 98-103.
[7] 温鑫, 钱玉良, 彭道刚, 等. 基于深度双向LSTM的SCR系统NOX排放预测模型研究[J]. 热能动力工程, 2020, 35(10): 57-64.
Wen Xin, Qian Yuliang, Peng Daogang, et al. NOX emission prediction model of SCR system based on deep bidirec-tional LSTM [J]. Journal of Engineering for Thermal Energy and Power, 2020, 35(10): 57-64.
[8] 谢锐彪, 李新利, 王英男, 等. 基于粒子群优化的双向门控循环神经网络燃煤电厂NOX排放预测[J]. 热力发电, 2021, 50(10): 87-94.
Xie Ruibiao, Li Xinli, Wang Yingnan, et al. NOX emission prediction of coal-fired power plants based on PSO and Bi-GRU [J]. Thermal Power Generation, 2021, 50(10): 87-94.
[9] 应铭, 冯国胜, 贾素梅, 等. 基于DSP的柴油机振动信号小波降噪实时性研究[J]. 内燃机学报, 2022, 40(4): 345-350.
Yi Ming, Feng Guosheng, Jia Sumei, et al. Real-time research of diesel engine vibration signal denoising by wavelet based on DSP [J]. Transaction of CSICE, 2022, 40(4): 345-350.
[10] 邓婕, 李舜酩, 丁瑞, 等. 基于小波阈值降噪的轴承振动信号虚假模态剔除研究[J]. 重庆理工大学学报(自然科学), 2021, 35(9): 103-108.
Deng Jie, Li Shunming, Ding Rui, et al. Research on eliminating false mode of bearing vibration signal based on wavelet threshold denoising [J]. Journal of Chongqing University of Technology (Natural Science), 2021, 35(9): 103-108.
[11] Mei Kai, Tan Meifang, Yang Zhihui, et al. Modeling of feature selection based on random forest algorithm and pearson correlation coefficient [J]. Journal of Physics: Conference Series, 2022, 2219(1).
[12] 杨云凯. 基于互信息的过滤式特征选择算法研究[D]. 长春: 吉林大学, 2022.
Yang Yunkai. Research on filtering feature selection algorithm based on mutual information [D]. Changchun: Jilin University, 2022.
[13] Guehairia O, Ouamane A, Dornaika F, et al. Feature fusion via deep random forest for facial age estimation [J]. Neural Networks, 2020, 130.
[14] 艾成豪, 高建华, 黄子杰. 混合特征选择和集成学习驱动的代码异味检测[J]. 计算机工程, 2022, 48(7): 168-176, 198.
Ai Chenghao, Gao Jianhua, Huang Zijie. Code smell detection driven by hybrid feature selection and ensemble learning [J]. Computer Engineering, 2022, 48(7): 168-176, 198.
[15] Liu Y, Pei A, Wang F, et al. An attention-based category-aware GRU model for the next POI recommendation [J]. International Journal of Intelligent Systems, 2021, 36(7): 3174-3189.
[16] Lin X, Quan Z, Wang Z J, et al. A novel molecular representation with BiGRU neural networks for learning atom [J]. Briefings in bioinformatics, 2020, 21(6): 2099-2111.
[17] 殷昌山, 楊林楠, 胡海洋. 基于注意力机制的农资标签文本检测[J]. 中国农机化学报, 2022, 43(10): 135-140.
Yin Changshan, Yang Linnan, Hu Haiyang. Text detection of agricultural materials labels based on attention mechanism [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(10): 135-140.
[18] Zhou L, Bian X. Improved text sentiment classification method base on BiGRU-Attention [C]. Journal of Physics: Conference Series, 2019, 1345(3): 032097.
[19] 金祖进. 大型光学镜面加工系统多重扰动误差分析及补偿控制策略研究[D]. 徐州: 中国矿业大学, 2022.
Jin Zujin. Research on multiple disturbance error and compensation control strategy of large optical mirror processing system [D]. Xuzhou: China University of Mining and Technology, 2022.
[20] Sun D, Xu J, Wen H, et al. Assessment of landslide susceptibility mapping based on Bayesian hyperparameter optimization: A comparison between logistic regression and random forest [J]. Engineering Geology, 2021, 281: 105972.
[21] 罗兵, 张建敏. 基于BP神经网络的农机安全评价敏感性分析[J]. 中国农机化学报, 2022, 43(3): 120-126.
Luo Bing, Zhang Jianmin. Sensitivity analysis of agricultural machinery safety evaluation based on BP neural network [J]. Journal of Chinese Agricultural Mechanization, 2022, 43(3): 120-126.