数据挖掘在高速公路运营管理中的应用
2016-05-30田科
田科
摘要:数据挖掘技术的推广应用为高速公路运营的管理和服务水平提升带来了便利。近年来,随着我国经济的不断发展,高速公路的通车里程不断增加,车辆通行量逐年攀升,传感设施的建设也越来越多,使得在高速公路运营管理的各种系统中存储的数据资源越来越多。文章对数据挖掘在高速公路运营管理中的应用进行了探讨。
关键词:数据挖掘;数据分析;高速公路;运营管理;数据资源 文献标识码:A
中图分类号:TP311 文章编号:1009-2374(2016)12-0049-02 DOI:10.13535/j.cnki.11-4406/n.2016.12.023
随着我国高速公路的通车里程不断增加,方便了司乘人员的同时也对管理者提出了新课题。高速公路运营管理过程中产生了大量的数据,占用了存储资源,却不能进行有效的融合分析,如何对这些海量的信息进行处理并对提升决策水平提供依据,是目前高速公路管理者需要解决的问题。通过数据挖掘技术,可以有效地解决这些问题,利用这些数据进行融合分析,为高速公路安全畅通提供了决策支持。
1 背景探析
从高速公路信息化数据量来看,我国高速公路具备大规模数据应用的基础。截至2015年,全国高速公路总里程达120000万公里;就河南省而言,高速公路通车里程约为6300公里,从2004年开始运营的高速公路联网收费系统至今已过去12年,累积的流水数据已达数百亿条,而且还以每天数万条流水的速度在增长,这些数据就像一片待开发且肥沃的土地一样,充满无限的可能和生机。
2 数据挖掘及其应用
数据挖掘可从大量乱序的、随机的、不确定的数据中根据需求,提取出隐藏较深并且有利用价值的信息。数据挖掘是一种涉及范围较广的学科,它不仅包含数据统计、模式发现、神经网络等内容,而且囊括了可视化、知识库系统等其他领域。现阶段,数据挖掘技术随着科技的不断进步逐渐完善,已经被普遍应用于各个行业:
2.1 在体育竞技方面的应用
美国一家科技公司研發的大数据挖掘软件曾被美国的多个篮球教练所使用,数据挖掘技术能够通过对篮球队中队员的排列情况进行分析得出有效的队形和战术。
2.2 在商业银行中的应用
数据挖掘在金融领域的应用越来越普遍、广泛,金融行业可利用数据挖掘系数对客户的信息进行分析和筛选,同时也进行一定的金融风险评估,通过数据挖掘软件不仅能够制定吸引客户的营销战略,而且对客户、信用卡以及投资产品等项目进行分类,以便为客户提供最适宜的金融项目。
2.3 在电信行业中的应用
电信行业会将数据挖掘软件应用于客户在年龄、入网时间、注册产品等数据的统计中,比如对客户是否使用了电信公司提供的某种产品进行统计,可以清楚地得出该产品是否被广大用户所接受,借此进行下一步产品营销的规划。
3 数据预处理方法
数据挖掘首先要对数据进行预处理,包含了多种功能和处理方法,下面针对高速公路数据特点对数据处理方法进行探讨:
3.1 数据清理
因为高速公路管理和系统设计等问题,数据库中往往存储了大量杂乱的信息内容,并不是所有的信息都有利用价值,如果数据中存在很多冗余数据,就会增加大数据挖掘的难度,影响分析结果,所以要进行数据清理工作,按照一定规则将错误的、有冲突的、不完整的数据进行清理。例如,高速公路中联网收费数据整理时,就会发现很多车牌识别错误、计重明显有偏差、车型判断错误等“脏数据”,可设计预处理功能将这些没有利用价值的信息进行清理,从而提升大数据挖掘的效率和准确率。不同的数据要采用不同的清理方式,在处理一些缺失的数据时,比如巡逻日志的登记有很多缺失的字段,要结合业务特点将可能丢失的数据进行填充,对于重复数据的清理则应根据实际情况进行清理后核对。
3.2 数据集成
根据数据挖掘的任务与目标,需要将不同来源、格式、性质的数据进行集中,为用户提供数据综合分析和共享,强化信息的使用效率并可以在不同角度提供决策支持。比如对高速公路的数据分析中,需要将分散的巡查日志、超限信息、施工信息、监控信息等数据进行汇总,为下一步的数据挖掘工作提供数据支持,这种集成能够将相关数据进行综合处理和分析。
3.3 数据转换
数据挖掘中需要进行数据格式转换,因为各个系统设计的时间较早,没有按照统一的格式和发展规划进行建设,造成数据的结构相差很大,部分模拟信号还没有进行数字化分析存储,为提升数据挖掘的效率,需要将数据进行统一处理,例如高速公路监控和各种车感器信息是非常好的信息来源,其中往往蕴含着各种事故信息、危险路段、恶劣天气等的规律,可为应急指挥提供决策支持,面对这些信息我们可以利用数据提取算法,提取其中的有价值信息,按照统一的格式进行数字化存储,为数据挖掘提供资源,对于其他较为复杂的信息来说,同样需要结合业务要求和规律进行分析和提取工作。
3.4 数据归约
将数据集成和转换存储后会形成海量的数据,除了设计建设高效的大数据分析平台外,对数据的规约也是精简数据量的有效方法,利用特征归约、样本归约、特征值归约等方法,可以将数据集上的分析挖掘更有效,且不影响分析结果。同时可利用信息可视化技术,建立可视化的信息分析模型,使得信息的分析结果形成抽象程度高、规律性特征清晰、展现能力强的可视化形式,为辅助决策提供多元化参考。
4 数据挖掘在高速公路管理中的应用
随着智能交通的发展,高速公路信息化建设和应用已经非常广泛,我国在该领域中投入了大量的人力和财力,数据挖掘的应用规模也在短期内增长迅速。
4.1 高速公路通行信息的数据应用
第一,通过对省内各高速公路收费站车辆来往信息,能够根据进出站、行驶路段、行驶时间等因素对车流量的情况进行分析,得出车流的分布特点,为高速公路收费系统的优化,提高通行效率提供数据依据;第二,通过对省内高速公路的收费数据进行归纳和筛选,与当地各项经济指标进行对比,建立预测模型,能够对未来一段时间内的联网收费情况进行预测;第三,通过对省内高速公路指定区域内的车流量数据信息,得出该区域路段的车辆密度,预测道路养护费用,降低运营单位成本投入;第四,通过对交通量等历史数据的分析并结合高速公路网模型,能够分析出各时段车辆分布图,遇到突发情况,可进行高效的指挥调度;第五,通过对车辆通行信息、气象信息、道路路况信息等融合分析,能够制定出安全驾驶的相关提示,最大限度地减少交通事故的发生;第六,通过对省内高速公路车辆通行记录和收费情况等数据的分析,能够提供高速公路未来规划依据。
4.2 对高速公路人员及管理的数据应用
通过对高速公路联网收费系统中收费人员的日常操作信息进行分析,比对通行车辆的统计数据,能够预防收费员出现违规收费的现象,同时还可通过工作人员的操作日志,如在岗时间、操作的具体步骤、操作流程、设备使用情况等数据进行分析,从而为升级现有系统提供参考依据,避免工作人员的操作失误,提升工作效率。
4.3 对高速公路司乘人员的数据分析
全省每天在高速公路上行驶的车辆数万计,通过对这些车辆通行信息的分析,统计不同种类车辆的分布和行驶规律等,调整服务区的设置和功能,为司乘人员提供个性化的服务,尤其是我国正处于全面发展高速公路电子不停车收费的今天,我们要努力提高管理效率,增强服务意识,发掘潜在用户,推动高速公路智能化的健康发展。
5 结语
综上所述,随着计算机技术的飞速发展,全国各地的高速公路都逐渐从信息化向智能化的发展方向,基础硬件设施投入不断加大,我们更应该在高速公路智能化管理上下功夫,利用数据挖掘技术结合行业特点能有效地为提升高速公路服务质量做出贡献,因此,我们需要投入更多的精力在数据挖掘的研究和推广中,全面地推动我国高速公路的智能化建设。
参考文献
[1] 郭刘恒.基于联网收费数据的实时滑动、动态校核的高速公路交通量预测方法研究[J].公路,2014,(12).
[2] 武兆伟.高速公路联网收费数据在路网监控中的应用研究[J].科技信息,2014,(14).
[3] 余丰茹.基于全车牌识别的高速公路联网收费数据挖掘系统框架研究[J].公路与汽运,2014,(4).
[4] 李猛.基于RFID技术多义性路径识别系统在高速公路联网收费中的应用[J].广东科技,2013,(16).
[5] 孙轶轩.基于数据挖掘的道路交通事故分析研究[D].北京交通大学,2014.
[6] 申宁.高速公路收费数据处理技术分析[J].中小企业管理与科技(上旬刊),2013,(2).
(责任编辑:蒋建华)