基于轨迹数据的轨迹段生成与分析
2021-06-15王海涛
王海涛
摘 要:随着人们生活水平的提高以及人们生活节奏的加快,电动自行车以其轻便、简洁、低能、环保等特点广受人民的追捧与喜爱,我国电动自行车的数量也急剧增长,而随着该行业的迅速发展也随之带来了一些问题,例如交通堵塞问题、电动自行车交通事故、电动自行车失窃问题等。得益于定位系统和位置移动算法的快速进步,现全国部分地区的电动自行车安装了防盗追踪系统,为本文研究提供了海量轨迹数据。在轨迹数据处理方面,本文选取一个月内在电动车平台上的数据,该数据主要是反映车辆通过GPRS通道上报的数据,根据数据提供的车辆不同时刻经纬度及速度,对轨迹数据进行异常点清洗,采用基于启发式异常检测算法进行噪声过滤,根据时间及停留点进行轨迹分段和道路匹配,将处理好的数据应用Echarts进行可视化显示。
关键词:电动车平台 轨迹数据分析 数据可视化 GPRS通道
中图分类号:U491 文献标识码:A 文章编号:1674-098X(2021)01(a)-0108-03
Abstract: In recent years, with the development of China's economy and the acceleration of people's life pace, electric bicycle is widely popular and popular with its light, simple, low energy and environmental protection, and the number of electric bicycles in China has also increased greatly. With the rapid development of this industry, some problems have been brought along with it, such as traffic jam, electric bicycle accident, and electric bicycle theft. Thanks to the rapid progress of positioning system and location mobile algorithm, the electric bicycle in some parts of the country has installed anti-theft tracking system, which provides a huge amount of track data for this research.In the aspect of trajectory data processing, this project selects data on the electric vehicle platform within one month, the data is mainly is reported data through the GPRS channel response vehicles, according to data provided by the vehicle longitude and latitude and speed, the different time to abnormal point trajectory data cleaning, noise filter based on heuristic anomaly detection algorithm, track segmentation and road matching are carried out according to time and stop points, and the processed data are visually displayed by applying Echarts.
Key Words: Electric bicycles; Trajectory data analysis; Data visualization; GPRS passageway
近幾年,随着我国经济的发展与人们生活节奏的加快,电动自行车以其轻便、简洁、低能、环保等特点广受人民的追捧与喜爱,我国电动自行车的数量也急剧增长,而随着该行业的迅速发展也随之带来了一些问题,例如交通堵塞问题、电动自行车交通事故、电动自行车失窃问题等。所以对电动自行车行驶轨迹数据进行研究,可有效控制和管理以上问题。
首先,基于电动车轨迹数据的轨迹段生成与分析,可获得电动自行车的实时位置,将其进行可视化显示后,可观察出不同时间段,不同路段电动自行车的速度,从而分析出行驶速度过快的路段,提醒过大用户在该路段安全骑行,减速慢行,以此提高交通质量。
此外,通过对电动车轨迹数据的分析,也可有效追回失窃的电动自行车,从而保护广大人民的财产,保障社会秩序。
关于轨迹数据方向的研究,随着大数据及数据挖掘分析技术的快速发展,轨迹数据的研究也取得了诸多成果。人们通过对大量轨迹数据的分析研究,从中获取有价值的信息。其实际应用主要有以下两个方面:
(1)挖掘人类活动和迁移规则,并分析车辆和大气环境的运动特征。例如,优化城市交通路线,个性化推荐路线,道路网络预测和城市规划。
(2)大量的轨迹数据反映了一些人的行为、生活习惯、社交网络和趋势等私人信息。例如,攻击者可以根据用户的历史移动轨迹数据特征,并且可以挖掘其活动范围和活动场景。
1 轨迹数据获取
本文选取了615辆电动自行车在2017年7月1日至2017年7月31日时间跨度内的行驶轨迹信息,共2557021条数据,由于每辆电动自行车使用频率不同,故每个设备采集到的位置信息数量也不同,利用Django框架模式,将原始数据以id为键进行分组,并统计每组中数据条数,通过Echarts平台提供的柱状图模型进行直观显示。
1.1 轨迹噪声过滤
由于数据采集过程中,传感器容易受到各种因素的影响,例如,楼宇密集处、高架桥下、隧道等,会使得采集的数据不准确,发生位置偏移。为了使研究结果更加准确,在使用数据前需要对数据进行噪声过滤。
1.2 轨迹的提取
轨迹长度过长会使其复杂度增加,不利于数据挖掘分析的进行,故本阶段需要对已经经过初步清洗的轨迹数据进行分段。
轨迹分段主要有三类实现算法:
利用“时间间隔”分段。如果两个位置点之间的时间间隔超过了某一特定阈值,则认为该两点分别是两段轨迹的端点,从而将一条长轨迹分为两段较短轨迹。
基于轨迹形状分段。根据轨迹点的方向角度变化的大小进行分段,若变化超过了某一特定的阈值,就将其分为两段;另一种方法是“线简化”算法,其是利用了轨迹压缩的算法,将轨迹压缩点作为分段点,实现一条长轨迹转化为多条短轨迹。
基于语义信息分段。其中又包括两种方法:其一是根据停留点分段。还有一种是根据出行模式的不同。本文的原始数据中提供了车辆状态信息,可直观的判断出处于设防的车辆此刻为停留状态。此外,在此之前,进行了停留点的检测。故本文采用了语义信息分段中的基于停留点进行轨迹分段的算法。
2 轨迹可视化
本文采用Django框架MVT模型,其中T即Template,为表现层,负责呈现经过V即View处理后的结果。而Web端,采用了百度提供的鹰眼轨迹服务。根据鹰眼 Web服务 API v3.0介绍,鹰眼Web服务以HTTP/HTTPS的形式提供轨迹上传、查询、分析和地理围栏等功能,开发者需要从服务器端请求以调用这些功能。
电动自行车终端管理模块:统一管理系统内所有设备,每辆设备管理字段包括名称、车辆描述、创建时间、最后位置以及最后定位时间等,可对根据设备号对设备进行检索和删除。
电动自行车监控模块:其中又分为实时监控和轨迹查询两个部分,实时监控支持实时上传轨迹数据,可在地图上定位到设备的当前位置;轨迹查询支持根据设备号和日期查询特定设备一天内的所有行驶轨迹。
电动自行车移动性分析模块:主要通过对检索筛选后所呈现的轨迹分析其移动规律,如通过24h时间轴可分析出电动自行车一天中主要使用时间段;通过将速度以渐变色形式呈现,分析哪些路段电动自行车行驶速度较快等。
3 轨迹数据挖掘
本文对原始轨迹数据进行过预处理并完成了可视化的基础上展开的,通过之前的研究与实践,所采集的轨迹数据已经比较精确的呈现在地图上,合理运用系统的索引功能与速度显示功能,可从轨迹中发掘电动自行车的移动规律以及人们的行为规律等,这对解决电动自行车交通事故、电动自行车失窃以及人们出行规律有很大帮助。
3.1 速度分析
在可视化显示部分,本系统不仅显示了电动自行车行驶轨迹,而且还将电动自行车在每个轨迹点的速度通过色彩渐变直观地呈现了出来,颜色由红色为低速,渐变到黄色为中速,最后渐变为绿色为高速。通过对电动自行车轨迹速度的监控,可以从中分析出车辆所在路段路况。
3.2 出行量分析
电动自行车的出行量反映了人们日常生活规律、活动范围、聚居走向等信息,这对于分析人类社会活动属性以及人类社会发展状态有很大帮助。本文在时间段上电动自行车出行量的分析方面,着重探索了二十四小时中每个时间段电动自行车的出行量,从中挖掘使用者在一天中不同是时间间隔的活跃度;在空间范围内电动自行车出行量方面,本文探索了全国不同地区电动自行车使用密度,并通过所得数据分析了各地区产生差异的因素。
3.3 使用者分析
電动自行车的行驶轨迹不仅能反映出电动自行车位置移动变化信息,进一步分析轨迹信息,还可以从中挖掘出使用者本身的身份信息、所处环境以及社交网络等,通过对电动自行车行驶轨迹分析,可得到使用者日常行程信息、活动区域信息等。这些信息的挖掘一方面可以为电动自行车失窃问题提供查巡方向,使得能有效追回失窃车辆,维护社会治安;另一方面,挖掘到的使用者信息,可用于追查使用者本身,在某些刑侦案件中,可提供十分宝贵的线索。
4 结语
轨迹在大数据时代作为一个具有代表性的形式,不仅显示了位置移动变化,还反映了人们的个体属性、生活环境甚至社交网络等。而随着全球定位系统GPS的广泛应用,位置信息的采集也越来越容易,大量的轨迹数据中蕴含着庞大的信息体系,如果能合理高效地提取出这些信息,将会给未来社会、环境、安全等各方面带来巨大利益。本文是基于电动自行车轨迹的数据分段与分析。电动自行车作为深受现在人民追捧的一种交通工具,在受益与它的简洁、轻便、环保、灵活等优点的同时,也烦恼于它所带来的交通、安全等问题。本文的研究目的正在于为解决这些问题提供有效的方法策略。
参考文献
[1] 林树宽.基于GPS轨迹数据的拥堵路段预测[J].东北大学学报:自然科学版,2015,36(11):1530-1534.
[2] JD Mazimpaka.Trajectory data mining: A review of methods and applications[J].Journal of Spatial Information Science, 2016,13 (2016) :61-99.
[3] 高强,张凤荔,王瑞锦.轨迹大数据:数据处理关键技术研究综述[J].软件学报,2019,28(4):959-992.
[4] Elliot, Fishman, Christopher,等.电动自行车交通发展的主要趋势——近10年文献综述[J].城市交通, 2016,14(2):83-96.
[5] 杨阳,吉根林,鲍培明.基于网格索引的时空轨迹伴随模式挖掘算法[J].计算机科学,2016,43(1):107-110.
[6] Arifin Z, Ibrahim M R, Hatta H R. Nearest tourism site searching using Haversine method[C]// International Conference on Information Technology, Computer, and Electrical Engineering. IEEE, 2019:293-296.
[7] 王欣.基于聚类和距离的大数据集离群点检测算法[J].制造业自动化,2011,33(8):101-104.