基于最小误差分析法的城市道路汽车行驶工况构建方法研究*
2022-04-15葛于杰顾友霖魏晓颖
葛于杰 , 严 明 , 陈 建 , 顾友霖 , 徐 鑫 , 魏晓颖
(扬州大学机械工程学院,江苏 扬州 225000)
0 引言
汽车行驶工况又称车辆测试循环,是汽车行驶时速度关于时间变化的曲线[1-2],该曲线体现了汽车道路行驶的运动学特征,是汽车行业一项重要且共性的基础技术[3],同时也是汽车各项性能指标标定优化时的主要基准[4-5]。现今,我国主要采用的是新欧洲驾驶周期(New European Driving Cycle, NEDC)汽车行驶工况[6],但由于我国拥有汽车人数的增加和城市道路复杂性的变化,NEDC已经不再适用于我国道路实际情况,因此建立适合于我国各地实际道路情况的汽车行驶工况迫在眉睫。
针对汽车行驶工况的构建,He等[7]提出了一种基于实时交通信息的全局行驶工况构建方法;Wang等[8]针对不同数据采用马尔可夫链构建了汽车行驶工况;Tong[9]引入汽车特定功率指标构建了香港电动巴士的行驶工况;Shen等[10]利用主成分分析和k-means构建上海混合动力公交车的行驶工况;Zhao等[11]采用主成分分析和数值统计的方法构建了长春市汽车行驶工况;Günther等[12]利用新颖的微行程模型构建了德国汉堡地区的汽车行驶工况;Mayakuntla等[13]设计了一种基于“行程段”的汽车行驶构建汽车行驶工况方法,在印度的城市取得了较好的应用。
本研究基于福州市汽车道路行驶数据,首先利用删除或插值补充的方式对异常数据进行预处理,同时根据运动学片段的定义进行运动学片段划分,并引入特征参数构建汽车运动特征体系;接着为简化计算数据,采用主成分分析将特征参数降维并利用k-means聚类算法将运动学片段分为低速、中速和高速三类;最后利用最小误差分析法构建汽车工况,并将综合参数值CPV作为工况合理性的评价指标,验证本研究构建的行驶工况的合理性。
1 数据预处理及运动学片段划分
1.1 数据采集
数据采集是在福州市道路上进行的,分为三份数据文件,将三组数据按经纬度绘制成汽车行驶路线图,如图1所示。从行驶路线图可以看出,测试路段覆盖范围广泛,采样的时间和距离也较长,保证了样本数据的多样性和代表性,真实体现出城市道路行驶状况,符合构建城市道路汽车工况载荷谱的要求。
图1 汽车行驶路线图
1.2 异常数据的处理
1)对于长期停车不熄火和采集设备在停车时所采集的异常数据,本研究采用移动平均滤波,对实验数据进行过滤处理,去除信号采集传感器获得数据中的噪声数据。
2)对于长时间堵车、断断续续低速行驶情况,本研究将其按照怠速情况来处理,设定一种邻域判定的方法。取某一个点,与它周围n个点进行速度大小判断,如果车速都小于10 km/h则判定为长时间堵车、断续低速行驶状态,将这一点数据按照怠速输出处理。
3)对于加、减速异常和由于高层建筑覆盖或过隧道等GPS信号丢失,造成所提供数据中的时间不连续等情况,本研究采用插补的方法对加、减速异常和时间不连续的数据进行补充。由于一般车辆的百公里加速时间都是大于7 s的,即最大加速度大约为4 m/s2,紧急刹车的最大减速度在7.5 m/s2~8 m/s2之间,故设定加速度在-7.5 m/s2~4 m/s2之间为正常加速度,范围之外的速度定义为异常数据,利用插值对速度进行处理,使加速度满足范围要求。对于时间不连续的数据,设定时间断点阈值为10 s,对于时间断点少于10 s的数据,利用均值插值对数据进行补充;对于时间断点多于10 s的数据,由于插值后会对工况构建产生影响,所以不予考虑,直接删除该断点数据。
4)对于怠速的处理,本研究设定怠速时间阈值为180 s,超过180 s部分的数据删除,以免某一时段怠速时间过长,造成在整体汽车行驶工况时间段内低速状态较多,各速度段时间分布不均,影响车辆工况构建的准确性[14]。
1.3 运动学片段划分
运动学片段是指相邻怠速区间内车辆行驶的相关速度信息。经由上一节异常数据处理后的数据将被划分为运动学片段,用于汽车工况的构建。为简化计算量并提高计算精度,删除运动学片段中时间少于60 s的,最终得到运动学片段划分数量如表1所示。
表1 运动学片段划分结果
2 汽车工况构建及评价
2.1 主成分分析
本研究所构建的汽车运动学特征体系由9种典型的特征参数组成,它们分别为平均速度VA、平均行驶速度VR、怠速时间比Zi、加速时间比Za、减速时间比Zd、速度平均偏差VSTD、平均加速度Aa、加速度标准偏差Astd和平均减速度Ad,分别用标号1~9表示。为降低计算时的复杂程度,同时构建出真实的汽车工况曲线,本研究利用spss软件对9种特征参数进行主成分分析,得到的总方差解释如表2所示,从表中可以看出前4个成分占比已经达到94.30%,超过限定的85%,故本研究将前4个成分作为本研究的主成分因子。
表2 总方差解释
2.2 k-means聚类
聚类是指将众多对象通过一定的规则分为若干类的过程,本研究通过k-means聚类将运动学片段分为低速A、中速B、高速C分别进行处理,最终组合成汽车工况曲线。迭代36次之后,实现了聚类中心的收敛。通过聚类将2 350个运动学片段分成三个类型,由于数据的误差,丢失3组数据,最终将2 347个运动学片段分为低速、中速、高速,具体的片段个数如图2所示。
图2 各类型运动学片段个数
2.3 汽车工况曲线的构建
聚类后将原有数据分为低速、中速、高速三种类型,为使最终构建的汽车工况曲线尽可能反映出城市所采集的数据源,即使误差最小化,本研究使用最小误差分析的方法来构建汽车行驶工况。首先计算得到每类运动学片段各特征参数的整体参数值Cmn,接着计算各类片段中每一个运动学片段的各特征参数cmn,并与Cmn进行误差比较,在各类中按照误差大小将运动学片段升序排列,得到基于误差大小的运动学片段A’、B’、C’,最后根据式(1)得到每类运动学片段对汽车工况的贡献时长,拟定的工况总时间为1 200 s。
式中,tk为k类(k=A’、B’、C’)运动学片段对汽车工况曲线的贡献时长,Tk为k类运动学片段的总时间,Tall为所有运动学片段的总时间。
从基于误差大小的运动学片段A’、B’、C’中抽取各类运动学片段满足所需的时间要求,各类工况的时间占比如表3所示,总共抽取时间1 225 s,得到的与有效实验数据误差最小的汽车行驶工况曲线如图3所示。结合表3可以看出:各个速度阶段的时间占比与运动学片段占比相近,中速阶段占比最大,这与原数据特征相符。
图3 汽车行驶工况曲线
表3 各类工况时间占比
2.4 汽车工况构建的评估
为了对所构造的汽车工况曲线进行合理性评价,本研究使用了综合参数值(CPV)作为评价标准[15],计算公式如式(2)所示,CPV是工况与原始数据各代表参数差异率的代数和,其值越小证明所构建的工况与实际情况越接近。
式中,VA为原始数据平均速度;VR为原始数据平均行驶速度;Aa为原始数据平均加速度;Ad为原始数据平均减速度;Zi为原始数据怠速时间比;Za为原始数据加速时间比;Zd为原始数据减速时间比;VSTD为原始数据速度标准差;Astd为原始数据加速度标准差; 为合成工况与原始数据对应参数的差异值。
同时通过对比分析汽车行驶工况与所采集数据源的各运动特征参数,评估工况构建的代表性,由于参数本身的差异性,采用相对误差的绝对值作为误差指标,具体公式为:
式中,ε为各特征值相对误差;xj为汽车工况的各特征值;Xj为原始数据中的各特征值。
通过上述误差构建,得到如表4所示数据,从表中可以看出:大部分特征参数的误差都不大于10%,在数据上满足误差要求,但速度标准差误差最大,这说明所构建的汽车行驶工况的速度波动性小于原数据中的速度波动,造成这种情况的原因主要有两点:1)基于最小误差得到的最佳运动学片段,没有对各个特征值进行权重参数分配,导致各特征值是按照平均权重进行分配,减弱了速度标准差的权重,导致误差增大。2)由于在数据预处理的时候,删除了一些秒数多于180 s和不足60 s的运动学片段,降低了所选运动学片段的真实性,导致所选片段中速度波动性降低,造成速度标准差的相对误差加大。整体而言,CPV的值较小,其余特征参数与数据源有着良好的符合度,因此所构建的城市汽车行驶工况有着较高的代表性和合理性,可以较好地反映福州地区的真实道路情况。
表4 特征参数误差及CPV值
3 结论与展望
针对某城市汽车行驶工况的构建问题,本研究首先对采集的原始数据进行删除及补充等预处理,并将其划分运动学片段;其次通过主成分分析将特征参数降维,同时利用k-means聚类算法将运动学片段划分为低速、中速、高速三种类型;最后基于最小误差分析法构建汽车工况曲线,并通过综合参数值(CPV)进行误差评估,得到以下结论:
1)采用删除数据和插值补充的方式对原始数据进行预处理,并基于9种行驶工况参数构建运动学特征参数体系,划分运动学片段,避免因异常数据导致的划分错误。
2)通过引入主成分分析将9种行驶工况参数降维,并设定聚类中心,通过聚类算法划分运动学片段,以简化计算的数据量。
3)基于最小误差分析法构建出汽车行驶工况曲线,将综合参数值(CPV)作为评价标准,得到CPV为1.218 3,在合理误差范围内,可以作为该城市行驶工况的参考。
本研究所提汽车行驶工况构建方法丰富了工况构建的方法体系,但所构建工况的速度标准差与数据源所示的有一定差距,波动性较大。进一步细化速度标准差的提取准则,减少速度标准差的波动性将是下阶段研究的重点内容,以提高工况构建的代表性与适用性。