APP下载

试论数据挖掘技术在智慧交通中的应用

2020-10-26孙兰军

运输经理世界 2020年3期
关键词:车流量高峰数据挖掘

文/孙兰军

1 前言

在当今社会快速发展背景下,城市的交通情况也是瞬息万变,因此,对于交通的控制成为城市发展过程中的重点工作。传统的控制方式与控制方法,已经不适应当今城市交通的发展。所以,智慧交通应运而生。智慧交通的出现,促使城市交通更加畅通,为城市交通管理等工作的展开打下良好基础。在智慧交通的发展中,要将数据挖掘技术应用在其中,从而实现城市交通的更好发展。所以,本文将针对数据挖掘技术在智慧交通中的应用相应内容进行阐述。

2 数据挖掘技术基本概述

数据挖掘是一个过程,主要是对大量的、有噪声的信息进行提取,将其中未知的、有用的信息提取出来。在社会的不断发展中,城市的进步使得不同数据信息得到快速增长,无论是个人信息,还是企业信息、政府信息等都有着飞速进步与发展,数据爆炸式增长。大量的数据以及可用的数据信息,带领人们进入到数据时代,在此背景下,也面临着一定的信息匮乏问题。在海量的数据信息中,提取有效信息成为人们的信息获取的重点,数据挖掘技术也应运而生。数据挖掘技术包含许多不同内容,比如,关联分析。关联分析通常情况下主要是指,两个对象或者多个对象之间存在的某种联系,其中的某个对象可以通过其他对象展开相应的预测工作。主要目的就是,对数据之间从存在的隐藏相互关系进行挖掘。关联一般情况下会被分为三部分,分别是简单、时序与关联,由两个关键指标对其相关性进行明确与度量。关联分析也因为自身特点,被广泛应用在销售分析以及事务分析中[1]。再如,分类分析。分类分析主要就是将描述和区分数据类别模型找出,从而对未知的数据类别进行预测。总而言之,数据挖掘技术对于智慧交通发展而言具有重要作用。因此,对于数据挖掘技术需要有关部门与相关工作人员能够给予更多关注与重视,对技术进行分析,并将其应用在智慧交通相关工作中。

3 我国交通系统发展现状

从目前我国城市交通系统发展中不难看出,在其中存在许多不同的问题。主要体现在以下几点中:(1)客流信息不足问题。目前城市公交车使用的IC卡,只具备付费这一功能,但是并没有身份识别功能与乘车记录功能。乘车卡性能与功能并不完善,对于乘客的乘车信息以及乘车流量信息无法进行及时的采集,这对于客流量的控制工作带来很大影响[2]。

图1 2010—2018年全年高速公路里程(单位:万公里,%)

4 数据挖掘技术在智慧交通中的应用

4.1 在交通数据预处理中的应用

在智慧交通的发展过程中,可以将其应用在交通数据预处理中。本数据的主要来源是某个城市各个路段车辆的抓拍设备中,所采取到的数据信息。数据主要集中在2月份到3月份之间。在这样过程中,抓拍设备因为不同原因会出现设备故障情况,比如,恶劣天气原因、车辆状况原因等,会造成数据出现错误,或者数据不完整情况产生。这一问题的出现,对于后续分析工作的展开会产生很大影响。为在最大程度上避免这一情况的产生,对于错误数据、不完整数据以及丢失数据等做好预处理工作,这样才能为后续数据分析工作的展开打下良好基础。为方便对数据的处理,可以将数据加载到相应的数据库中,结合数据库主要特点,对异常数据情况进行有效处理。在实际异常数据分析中,可以从以下几点展开:(1)对各个字段进行分析,对数据是否满足既定的业务含义进行明确。针对明显的错误数据,可以通过数字型字段通过阈值法进行明确[3]。(2)为使得隐含的异常数据能够被去除,要遵循正态分布原则展开相应识别工作与去除工作。在完成异常数据识别后,可以使用当前时间相邻的同期历史均值进行有效替代。(3)为使得数据样本的完整性与精确性得到保障,采样数据时间间隔要保证为五分钟,然后得出在某天中,数据采集个数是288。

4.2 在建立挖掘模型中的应用

本文主要选择的是某个城市快速路段的两个月内抓拍的数据,并按照时间顺序对其进行聚类分析。通过分析希望能够发现其中的一些典型车流量变化趋势与变化情况,然后,对不同类别车辆的流量模式背后时段特性进行识别,这样可以为日后车流量预测工作的展开打下良好基础,同时提供数据保障。在数据挖掘聚类期间,可以不需要人为对分类数进行明确。分类个数通常情况下,是通过聚类算法的方式,对其进行自动调整与明确。具体挖掘模型如下图(见图2)所示。

图2 挖掘模型建立流程示意图

4.3 实验结果分析

要通过聚类的方式,对数据特点进行明确。在待分析数据源、视图结构以及需要挖掘结构的构建过程中,要加强对SPSSModeler的应用。在本次的实验中,为找到并明确数据内部不同时间特点,可以采取聚类算法方式。希望得出数据自身能够分为不同类型,然后对不同类别之间的关系进行风分析。结合分类后的数据,对每类数据单独统计车流量曲线图,然后结合多条同类别曲线图,转化为流量模式曲线图。然后将曲线图集中在一个图中,从而得出五条车流量模式曲线对比图。

4.4 挖掘结果分析

通过两个月以来的数据分析得出五类车流量模式曲线对比图,以及各类样本分布情况,得出以下几个结论:

(1)二月数据分布相对均匀,并且被均匀分布在不同的类别中,三月数据主要集中在前三类中。由此可以看出,两月流量在总体上从存在一定的差异[4]。产生这一情况的原因是由不同因素造成的,比如,假期情况、天气情况等。

(2)通常情况下,工作日的车流量会被分为两种情况,结合图一中第一类曲线与第二类曲线情况,实际总体上较为接近,但是各自有着三个或者四个高峰点。这与市民实际生活中的早、中、晚上下班小高峰情况相对应,在这一过程中要注意,还有一个小高峰是在晚上九点左右。这两类情况在总体态势中大致相同,但是,各自有着不同的高峰时间,在不同时间段来临。而且的各自达到高峰的数据值存在不同,持续时间也有着一定的差异。

(3)两个月的周末流量,主要呈现出两种情况[5]。具体参考图一中的第三类曲线,第三类曲线峰值出现没有明显变化,只有几个小小平高峰,而且总体走势情况相对平缓。虽然数值波动不大,但是持续时间较长。结合对市民实际出行情况的分析,因为是非工作日,市民的日常出行情况不规律,并不会出现工作日的上班与下班高峰点。往往是在上午或者下午,出现持续时间较长的平高峰。

5 结语

综上所述,数据挖掘技术对于城市智慧交通的发展而言具有重要作用。因此,对于智慧交通需要相关工作人员以及部门等能够给予更多关注与重视,明确数据挖掘技术优势与特点。然后将其应用在智慧交通发展中,使得智慧交通能够在促进城市更好的发展中将自身作用与价值充分发挥。

猜你喜欢

车流量高峰数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
全球迎来“双胞胎高峰”
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
石庆云
努力攀登文艺高峰
软件工程领域中的异常数据挖掘算法
参考答案
“我将不断进取,向艺术的高峰挺进”