数据挖掘技术在军车使用情况判定中的应用
2018-01-24方旭朱敏王保琴肖春霞
方旭 朱敏 王保琴 肖春霞
摘要:有效使用车联网和数据挖掘技术,可以使军队车辆在日常行驶时更加规范、安全。本文从车联网与数据挖掘技术、技术应用的指导意义、数据挖掘技术在军车使用情况判定中的应用等方面进行分析,对军队正规化管理和使用军车具有借鉴作用。
关键词:车联网;数据挖掘;军队车辆
0引言
当前,随着经济的发展和汽车保有量的迅速增加,随之而来的道路安全和拥堵问题日益突出。为此许多国家和地区都在大力发展智能交通系统和智能汽车技术应对上述问题。在遵循军队相关车辆规定的基础上,通过车联网和数据挖掘技术的应用,对驾驶员的习惯进行规范,从而使军队车辆在执行部队公务和重大演习活动时更加安全地行驶,最终圆满完成保障任务,对相关职能部门来说具有很强的指导和借鉴作用。
1车联网与数据挖掘技术
1.1车联网
车联网是指利用通信、互联网、物联网等技术将各种车辆进行联网进而展开各种综合广泛应用,包括智能交通、汽车互联网及其应用、汽车通信网及其应用等。采用各种技术手段将车与车、车与人进行连接是其技术存在形式,在此基础上发展形成的各种产品与服务是车联网的核心。
欧美等汽车工业比较发达的国家,无论是在整体规划还是在技术开发和应用方面,都引领着全球车联网技术的发展,并取得了显著的成绩。2009年12月,美国交通部发布了《职能交通系统战略研究计划:2010-2014》,首次提出了车联网的构想;2014年美国国家高速公路安全管理局发布两份文件,就车队车技术标准对外征求意见,并促请立法。我国车联网已被列入重大专项,称为十二五期间的重点项目,获百亿元支持,而国家对车联网行业规范也逐渐重视起来,政府在产业规划、技术标准等多方面的支持将大大推进汽车物联网长夜全面铺开和提速。
车联网系统有三个要素,第一个要素是“端”,即车载终端上的RFID、雷达、摄像头等传感器,其作用是采集车辆信息和感知当前车辆行驶状态,并能与人和车进行交互,提供最直接的用户体验。第二个要素是“管”,即实现融合通信和接入互联网的能力,主要是把“端”采集和感知的人与车、车与车、车与路等信息接入网络和互联互通。第三个要素是“云”,即负责监听“端”和“管”发来的连接请求,提供高效、稳定的数据存储、处理、分析,最终为交通参与者提供服务。
1.2数据挖掘技术
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程,其定义是从海量数据中找到有意义的模式或知识,作为计算机科学的一个学术领域,基于数据库理论,机器学习,人工智能,现代统计学的迅速发展的交叉学科,在很多领域中都有应用。涉及到很多的算法,源于机器学习的神经网络,决策树,也有基于统计学习理论的支持向量机,分类回归树,和关联分析的诸多算法。
CRISP-DM(cross-industry standard process for data mining),即为”跨行业数据挖掘标准流程”,提供了一个数据挖掘生命周期的全面评述,包括项目的相应周期,它们的各自任务和这些任务的关系。所有数据挖掘任务之间关系的存在是依赖用户的目的、背景和兴趣,最重要的还有数据。它为一个KDD工程提供了一个完整的过程描述。该模型将一个KDD工程分为6个不同的,但顺序并非完全不变的阶段,所示如图1。
(1)商业理解、数据理解和数据准备是数据挖掘的第一个大的步骤,其中商业理解要求在理解项目目标和从业务的角度理解需求,同时将这个知识转化为数据挖掘问题的定义和完成目标的初步计划。数据理解阶段从初始的数据收集开始,通过一些活动的处理,熟悉数据,识别数据的质量问题,首次发现数据的内部属性,或是探测引起兴趣的子集去形成隐含信息的假设。数据准备是数据挖掘前期一个非常重要的步骤,数据准备的好坏直接影响了数据挖掘的效率和准确度以及最终模型的有效性。数据准备阶段包括从未处理数据中构造最终数据集的所有活动。这些数据将是模型工具的输入值。
(2)建模是数据挖掘最为核心的步骤,在这个阶段,可以选择不同的模型技术,模型参数被调整到最佳的数值。一般,有些技术可以解决一类相同的数据挖掘问题。目前常用的技术有:关联规则、决策树、分类、聚类、粗糙集、神经网络、遗传算法等。
(3)评价阶段是在开始最后部署之前,检查构造模型的步骤,确保模型可以完成业务目标。这个阶段的关键目的是确定是否有重要业务问题没有被充分的考虑。在这个阶段结束后,一个数据挖掘结果使用的决定必须达成。
(4)最后是部署階段。通常,模型的创建不是项目的结束。模型的作用是从数据中找到知识,获得的知识需要便于用户使用的方式重新组织和展现。根据需求,这个阶段可以产生简单的报告,或是实现一个比较复杂的、可重复的数据挖掘过程。在很多案例中,这个阶段是由客户而不是数据分析人员承担部署的工作。
2技术应用的指导意义
随着北斗系统的装配和相关用车规章制度的不断健全,军队特种车辆和军队公务用车的车辆派遣、调度、行驶路线、车辆状况、道路实时路况和对驾驶员能力的考核等日趋规范。但从实际来看,车辆行驶过程中还会遇到很多复杂情况,比如我院(文中出现的“我院”、“学院”等均指中国人民解放军重庆通信学院)位于歌乐山腹地,山路窄、陡坡多、坡度大、人流量复杂,加之重庆地区城市道路较为拥堵,部分私家车、出租车、大货车、行人不遵守交通规则等等,驾驶员即使驾驶水平再高,如果驾驶行为习惯和心态不好,极有可能在执行驾驶任务时出现行车危险并大幅缩短军车使用寿命。
数据挖掘技术可以通过挖掘研究对象的个体特征,发现研究群体的发展变化趋势,发现具有不同特征的数据子集之间的关联,最终实现科学预测未来某种事件发生的概率。基于车联网进行科学采集和分析数据是提供数据和预测依据、改进驾驶员日常驾驶习惯的坚实基础,而改进驾驶习惯首先要找出问题所在。通过深入分析挖掘驾驶习惯信息,有针对性地设计“军车使用情况评定”是驾驶员改正不良驾驶习惯的重要途径,是保证军队车辆安全使用、安全出行的有效办法。
3数据挖掘技术在军车使用情况判定中的应用
目前,基于驾驶行为的车险(UBI)正在逐步取代传统车险。美国、欧洲、日本等国的多家保险公司通过驾驶员的智能手机中的传感器或者车载设备(如OBD)上传的数据来评测驾驶员的驾驶行为,进行风险评估,以此来判定保险费用。对驾驶习惯良好的车主给予一定的保费优惠或折扣,而另一部分经常违章、暴力驾驶等驾驶行为不良的车主,其潜在行车风险大,理赔成本高,需缴纳的保费高。车辆行驶过程中,车载设备时时刻刻采集车辆的位置信息、车况和行车信息并上传到云端,产生的数据量相当庞大,且数据类型复杂。云平台接收客户端发来的数据请求,展开数据挖掘。通过对这些大数据进行挖掘和分析,准确地获取评估车辆状况、驾驶行为,划分车主的风险类别,从而给决策者提供有价值的信息。
本文借鉴UBI的成功经验,以模拟学院军队车辆日常使用产生的数据为样本,利用数据挖掘技术中的决策树算法来挖掘军车日常使用情况(文中出现的车牌、驾驶员姓名等一切数据信息均仅为测试使用)。根据车辆行驶时驾驶员容易出现的不良驾驶行为,重点对超速、激烈驾驶(急加速、急转弯、急刹车)、闯黄灯、压实线、变道转弯不打转向灯、不合理使用远光灯等情况进行权重预处理,然后建立合适的数据模型进行决策树算法分析。决策树模型如图2所示。
大部分专业驾驶员的素质和驾驶技术都是过硬的,主要是找出行车过程中几类不太重视或习以为常的危险不良习惯,进行有针对性的改进,从而提高行车安全性。本算法主要目的是区分出驾驶员某些习惯的好坏及严重程度。根据预处理好的样本数据进行计算,结果如图3所示。我们把分析好的结果以表格形式展示,以便管理者直观地参考、使用。
4总结
将数据挖掘技术应用到军车使用情况评定中,对车联网捕捉和记录的海量数据进行处理、分析;结合军队实际情况,运用了决策树算法,寻找和发现出可能造成行车危险和大幅缩短军车使用寿命的不良驾驶习惯,做出价值判断和决策,从而达到规范行车习惯、保障出行安全、爱护公务用车的目的。endprint