APP下载

基于大数据的城乡结合部仿真研究框架*

2021-11-28刘中飞邱荷婷

科技与创新 2021年11期
关键词:结合部数据挖掘城乡

刘中飞,张 军,邱荷婷

(首都经济贸易大学管理工程学院,北京100070)

1 引言

随着社会的发展以及国家政策的倾斜,人口的急速增长,越来越多的人都聚集在城市中,导致了城市交通的拥堵,特别是在大规模人群的城乡结合部的区域。为了更好地控制城乡结合部的交通,减少不必要的拥堵,用传统的交通控制与疏散的方式在一定程度上是行不通的。所以,智慧交通应用而生。智慧交通的出现,带来了许多现代化的管理方式,并减少了大量人力物力的浪费,使得城市的交通变得更加的流畅,减少了城乡结合部区域大量的拥堵问题。在智能交通中,数据挖掘有着无比关键的地位,是智能交通中最重要的一面。可以说,没有数据挖掘技术的应用,就没有智慧交通光明的未来。如果要想在城乡结合部大幅度减少交通拥堵问题,就必须更加深入地理解数据挖掘技术。

2 数据挖掘概念

数据挖掘是一个过程,主要是对大量的有噪声的信息进行有效的提取,从中可以得到一个自己想要的数据[2]。在社会快速发展的今天,大量的数据在各行各业都急速的增长,广泛可用的数据使得当今社会进入了数据时代,但是有许多的数据是无效的,要想从“数据海洋“中得到想要的数据是极其困难的一件事情,数据挖掘的重要性就凸显出来了,数据挖掘的实际应用解决了这个问题,数据库技术用于存储和管理数据,机器学习方法用于分析存储的数据,从而揭示了隐藏在海量数据中的大量“知识”。数据挖掘的技术可以挖掘以下几种类型的模式:相关分析、聚类分析、离散点分析、关联分析等。

相关分析:需要在分类和回归之前继续进行,可以分析、识别、分类、回归相关的属性,并忽略其他无关的属性。

聚类分析:相似度很高的对象可以聚集在一起。这些对象中可以根据类内相似度最大化和类内相似度最小化的原理进行聚类或者进行分组。

离散点分析:在数据集中包含了许多对象,这些对象与数据集中其他对象的一般行为有不一致的地方,这些点就是离散点。因为一般的数据挖掘技术把离散点给剔除了,但是有些稀有事物比正常事物更有趣,更能吸引人们的注意力。因此,离散点数据分析被称为离散点分析。

关联分析:又称为关联规则。如果两个或者多个事物之间存在某种关系,可以通过一个事物联系到其他的事物,并可以对其他的事物进行预测。主要是挖掘两者之间存在的隐藏的关系。其中,关联分析又可以被进一步分为单维关联规则和多维关联规则这两种类型。

这就是为什么数据挖掘技术在城乡结合部区域的发展中起着关键性作用的原因,接下来需要对数据挖掘的技术进行深一步的分析,并将其应用于城乡结合部的交通问题中。

3 城乡结合部的现状

近几年以来,中国交通发展越来越好,交通环境得到了很好的改善,但是,交通安全方面的措施却没有得到很大的改变,中国道路环境没有得到改变的根本原因是道路设计不规范、混合交通环境比较差以及一些安全措施不足等,这些问题在城乡结合部尤为明显。

随着国家政策的倾斜,政府对城乡结合部的关注越来越多。城乡结合部是中国快速发展过程中的一个特色区域,是最活跃的区域。城乡结合部具有距离市区较近、生活方便、信息流动速度快等多种优势,同时具有城市和农村的优势,成为城市向外延展的重要窗口。但是,由于城乡结合部人口众多,人们的交通意识比较淡薄,人流量巨大,导致了大量交通事故的发生。

其中,在城乡结合部地区道路设计不规范,人员众多,且社会关系构成较为复杂。在城乡结合部,主要的交通工具有电动车、摩托车,不良习惯有无证驾驶、超速行驶、违章停车以及不系安全带等具有安全隐患的问题[3],并且在城乡结合部,社会管理较为滞后,经济管理混乱以及规划管理无序。

4 大数据驱动下城乡结合部交通运行仿真

4.1 交通仿真研究

针对城乡结合部的种种难题,基于目前智能交通的大背景,将以大数据Hadoop技术的MapReduce计算中心和分布式数据库HBase存储融入到交通数据处理仿真平台。

4.1.1 区域交通系统数据挖掘

将选取具有强大并行能力的Hadoop平台,通过进行海量交通数据的分析,部署Hadoop集群,可以基于道路导航,使资源进行合理的分配,以此来改善有关道路的平衡问题。传统的单机方法无法解决这样的问题,未来解决这一类问题,可以借助Hadoop平台,因为这个平台具有强大的并行计算的能力,用此平台可以对道路的情况进行各种判断,此平台也可以提供高效的存储能力。

4.1.2 区域交通管理仿真平台

将通过虚拟化技术构建的服务器集群,为平台的搭建提供基本的硬件资源。在此基础上构建以Cloud Foundry为基础的PaaS平台,可以通过使用Cloud Foundry的框架和通信机制来完成集成的任务,这其中包括了有关交通的海量数据,可以将Hadoop的功能通过与Cloud Foundry平台相结合,建立一个集中大数据存储和处理的一个平台,这个平台可以满足当前的数据访问量以及业务计算的需求,这样就为大数据构建一个全新的交通仿真的平台。

4.2 存在的重点、难点问题

区域交通系统数据挖掘技术和区域交通管理仿真平台拟解决城乡结合部交通网络的复杂性和动态性的问题、制约因素的输入输出机制问题以及数据计算瓶颈问题。

4.2.1 城乡结合部交通网络的复杂性和动态性问题

城乡结合部的外部像“城”,内部像“村”的复合型决定了区域交通网络的复杂性,通过探索城乡运输网络中各种瓶颈的产生及其传播过程,并且找到交通拥堵的根本原因就是一个中心问题。

4.2.2 制约因素的输入输出机制问题

交通承载力包括了多种的力量:交通环境污染承载力、交通自然资源承载力以及交通心理承载力等,如何确定模型输入输出的变量是一个关键性问题,其中,合理的资源分配是重中之重,必须在交通拥堵和资源闲置之间找到一个平衡点。

4.2.3 数据计算瓶颈问题

随着计算机网络的快速发展以及在交通运输领域的应用,日常需要处理的交通数据已经呈现出大数据的许多特征。采用传统的数据信息处理方式已经遇到了计算分析的性能瓶颈。一方面,集中化的数据库成为整个系统的突破口,数据的递增,无疑给数据库带来了严峻的考验;另一方面,随着数据的递增,数据计算的时长在急速地增加,越来越不适应海量数据对时间的要求。

5 结论

随着社会的发展,城乡结合部是国家关注的重点,城乡道路交通是城市管理最重要方面之一。加强城乡交通状况管理,维护城乡交通秩序,是极其重要的一个点[4],且有利于推动城乡结合部的发展,而城乡结合部的发展符合国家政策的制定。但是发展不能急于求成,应结合中国的实际情况,并借鉴国外结合部发展的模式,以此来构建中国城乡结合部交通的发展[5]。

猜你喜欢

结合部数据挖掘城乡
构建新型工农城乡关系促进城乡融合
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
在城乡互动融合中推进乡村振兴
论城乡结合部学校中学生英语自主学习能力的培养
城郊结合部土地利用与土地管理研究
让城乡学子同享一片蓝天
品质提升 让城乡风貌各具特色
机床结合部特性的理论与应用研究