基于ArcMap进行速度提取生成循环工况的方法研究
2020-07-24李浩然郭丛摇崔凯平杨恩华
李浩然 郭丛摇 崔凯平 杨恩华
摘 要:现行国际上的一些循环工况难以满足具体城市或特定驾驶情况下的要求,很难反映车辆实际的运行状况,选择合适的循环工况对节能减排有重要意义,于是制定新循环工况的方法是值得研究的。本文通过成都滴滴车原始运行数据,通过ArcMap软件先进行地图匹配,采集数据,得到适合的数据样本集,然后进行数据筛选和整合,得到其循环工况。通过误差分析表明本文建立循环工况的方法可以真实的反映实际的运行状况,得到的循环工况可以应用于其他仿真验证中,且建立循环工况的方法具有普适性。
关键词:ArcMap;循环工况;数据处理
1 引言
循环工况指的是车辆在一些特定的工况下速度与时间的关系曲线,它是通过大量的调查和数据处理得到的,其可以反映车辆实际道路运行状况的速度、时间等信息[1]。不同的地区和工况的实际运行工况是不同的,所以应该根据不同的地域或运用场景制定不同的循环工况。本文以成都滴滴车实际的交通数据为例,介绍了一种用ArcMap软件采集数据建立循环工况的方法。滴滴车的路线和停车地点不固定,具有一定的特殊性。数据处理的方法具有一定的普适性,运用软件采集的数据可以预测速度。循环工况建立之后,可以应用于其它的仿真验证。
2 介绍
循环工况可以反映车辆实际的运行情况,最直观的信息是车辆速度和时间的信息[2]。这些信息为车辆经济性能参数匹配及经济性测试提供理论依据;可以为汽车控制策略优化与开发等提供理论支撑;可以为某类车辆在特定地区的排放水平提供检测依据;可以为汽车动力系统参数匹配设计提供理论参考[3]。
本文用ArcMap软件先进行数据地图匹配,然后采集数据,之后对数据进行筛选和整合,得到循环工况,并对其进行误差分析。技术路线如图1:
3 相关研究
在文献[2]中,对西安市的部分城市客车运行数据短行程划分,利用主成分分析法和聚类分析法,建立了西安市城市客车瞬态循环工况;在文献[4]中,通过大量能反映公交车市区行驶特性的数据,利用多元统计理论的解析方法,建立了城市公交循环工况;在文献[5]中,建立了农用车循环工况,为农用车试验台提供数据及标准支撑。在文献[6]中,提出了一种构建电动汽车城市行驶工况,以西安市为研究对象构建了西安市电动汽车城市循环工况。
本文以成都市滴滴车数据为依据,建立滴滴车的循环工况,以此来介绍一种用ArcMap软件采集数据建立循环工况的方法。
4 建立方法
4.1 原始数据和数据预处理
本文使用的数据是成都滴滴车的数据,数据文件格式是txt,我们用WPS表格打开文件(WPS表格可以显示100万行数据,而Excel只能显示6万行数据,由于我们数据庞大,所以选择WPS表格),对数据进行分列处理,并添加表头,然后另存为xlsx数据文件。预处理的数据结构如表1:
表中的司机ID和订单ID已经进行了不可逆加密。时间戳是从格林威治时间1970年01月01日00时00分00秒起至现在的总秒数,是一种广泛应用的表示时间的方法,可以通过公式转换为北京时间。经度和维度是基于WGS1984坐标系,数据精确到了小数点后五位。
4.2 地图匹配和选择数据点
地图匹配就是将经纬度映射到相对应的电子地图中,本文采用ArcMap进行匹配和选择数据点。
①添加底图,选择中国底图彩色版;
②添加预处理后的xlsx数据文件。由于ArcMap版本问题,有些版本可能无法直接添加xlsx文件,若添加xls文件则会丢失大量数据。所以可以在ArcToolbox中的转换工具>Excel>Excel转表,进行添加数据;
③更改坐标系。右击列表中的数据,选择“显示XY数据”,X字段选择经度,Y字段选择纬度,点击“编辑”选择地理坐标系>world>WGS 1984>确认;
④第一次导出数据,使数据可选点。右击事件,选择导出,导出格式为Shapefile格式,点击保存,并确定,开始导出数据;
⑤选择数据点。选择的路段包括市中心和郊区,路段长度为10公里。为了方便取点,将路段划分成30段,平均每段330米左右,如下左图所示。在地图上按多边形选择路段上的点,右图中青色为我们选择的1号路段的数据点,打开属性表,导出选定数据为txt格式,导出选定数据为txt格式。同理将1-30段路一个月内所有工作日的数据提取出来,见图2。
4.3 数据的处理、整合和统计
第一步数据处理。将导出的txt数据文件另存为xlsx格式,然后打开xlsx文件,对数据进行分列处理。然后利用函数求得时间、距离、速度、加速度、时间差和时段。函数如下,见表2:
利用公式求得的数据要重新粘贴为数值,避免删除异常数据时结果随之改变。判断异常的依据是时间差,正常相邻两个样本点是同一车具有相关性的数据,在计算中这些相关的数据不会异常。如果相邻两个样本不是同一车的数据,那么按照上述函数计算必定会产生异常数据,可以发现异常数据的时间差是异常大的或者是负值,那么我们进行数据筛选,将这些异常数据删掉。第一步数据处理的结果如图3:
第二步数据整合。我们将1-15段路的全时段数据放在同一表格中,将16-30段路的全时段数据放在另一个表格中。这样做的原因仅仅因为30段路的数据过于庞大,一个上限为100万行的WPS表格無法储存。整合后的数据为了之后进行数据统计做准备。
第三步数据统计。利用数据透视表对数据信息统计。行标签选为时段,列标签选为路段,值选为平均速度。图4节选自生成的透视表中11月22日19点全路段的平均速度信息。本文就以这一时段的数据建立循环工况。
另一方面,还需要统计这一时段1-30每段路上的车辆,然后筛选出每段都出现的车辆(相对于某一条目标路段)。每段都出现同一辆车说明该车沿我们所选路段在行驶,我们选择该车,数据更具连续性。这样的车辆其实不在少数,所以我们需要从中选择更接近平均速度的车辆,作为这段时间的工况。筛选同一车辆的操作为:目标路段选为第一列,其他路段与第一段路对照,则选中第一列和第二列>条件格式>突出显示单元格规则>重复项>确定。筛选结果如图5,例如图中车辆:jupjviyl3zjtbpmy0iporokrtzp8Juu出现在了1-10段路中,说明该车沿着我们所选的1-10号路行驶,可以考虑该车的速度信息作为该段路上的工况。
所选路段很长,很难找到有一辆车完全按照我们所选路段行驶,所以我们选择多辆较长沿着所选路段的车辆拼接起来,形成整段路的循环工况。最终我们建立的循环工况如图6所示。长时间速度为0的点可能通过路口,也可能在等在乘客。
5 误差分析
建立循环工况之后,计算得到循环工况与同时间段所有车辆的速度平均值、标准差和加速度平均值,通过对比,平均值误差为12.29%,标准差的误差为1.47%,加速度误差为1.08%。对比结果如表3所示。
6 结论
本文首先利用ArcMap软件对成都滴滴车的原始运营数据进行匹配和采集,得到合适的数据样本集,然后对数据进行筛选和整合,得到循环工况。误差分析表明,本文建立循环工况的方法能真实反映实际运行情况,得到的循环工况可应用于其它仿真验证,循环工况的建立方法具有一定的普适性。
参考文献:
[1]蔡凤田.汽车节能与环保实用技术[M].北京:人民交通出版社,1999.
[2]陈全世等. 先进电动电动汽车技术[M].北京:化学工业出版社,2013.
[3]刘鹏.西安市XX线路公交行驶工况构建及混合动力公交动力系统参数匹配研究[D].长安大学,2017.
[4]吴其伟,吕林,锁国涛.城市公交车发动机循环工况的试验研究与建立[J].内燃机工程,2006(03):73-76.
[5]秦云,王丽佳.农用车发动机排放特性分析及循环工况建立[J].农机化研究,2020,42(10):264-268.
[6]叶毅铭,张大禹,卫龙龙,魏洪贵.纯电动汽车城市循环工况构建方法研究[J].汽车实用技术,2019(23):8-11+14.