基于数据挖掘技术的汽车改进与研制分析
2012-04-29房茂燕梁磊汪民乐毕义明
房茂燕 梁磊 汪民乐 毕义明
[摘要] 本文以提高汽车品质为宗旨,提出了汽车制造商依托4S店采集数据的设想以及汽车数据库的构建模式,给出了汽车改进的类型,并提出了基于数据挖掘技术的汽车改进方案以及数据挖掘技术在汽车研制中的应用。
[关键词] 数据挖掘; 汽车; 数据库; 改进
[中图分类号]TP274; TP391[文献标识码]A[文章编号]1673 - 0194(2012)15- 0073- 02
1引言
随着生活水平的提高,汽车正逐步走进千家万户,我国已成为一个巨大的汽车市场,在这个市场上充斥着国产自主车型、进口车型以及合资车型。国产自主车型的优势在于价格低廉,但品质欠佳;进口车型的优势在于品质优良,但价格昂贵;合资车型介于两者之间,价格和质量略高于国产自主车型,低于进口车型。目前这3种车型在中国市场各占有一定的比例。但是随着居民收入水平的不断提高,对汽车品质的要求也越来越高,国产自主车型只靠低廉的价格来占领汽车市场的空间越来越小,特别是许多合资车的价格也在下降,已经和一些同级别的国产自主车型的价格不相上下。因此,如何才能提高国产自主车型的质量和品质,使国产自主车型不但价格低廉而且品质过硬,是国产汽车生产商要考虑的问题。只有依靠先进的设计理念、优良的品质、可靠的性能才能占领中国的汽车市场,并向国外市场发展,才能使国产自主车型发展为国内甚至国际知名品牌。
新车投产后,可能会存在这样那样的一些问题,有些是设计缺陷,有些是工艺问题或者是技术方面的不足。这些问题随着投产后用户的使用逐步暴露出来,对于汽车生产商来说,只有逐步对暴露的问题进行解决,并不断总结经验,才能使汽车质量不断提高。
数据挖掘(Data Mining)技术出现于20世纪80年代末,最早是在数据库领域发展起来的。数据挖掘(Data Mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在的有用信息和知识的过程[1]。因此,在运用数据挖掘技术对汽车进行改进时,首先要获取大量相关的数据信息。
2数据库的构建与数据采集
数据库是数据挖掘的基础,汽车的改进与新车的研发首先要有大量的数据支持,因此首先要建立合理的数据库。
2.1数据库的构建
对于某一款车型,汽车数据库的构建可以分为两种形式:第一种是以汽车的组成零部件为对象进行构建;第二种是以所售车辆为对象进行构建。这两种构建方式各有优势,下面分别进行介绍。
以汽车的组成零部件为对象进行构建数据库,根据每一对象可能出现问题的情况不同,对每一部件进行分析,对其可能出现的问题进行预想,并将此部件可能出现的问题作为此部件的对象属性。另外,考虑到预想以外的情况也有可能出现,因此,对于每一个对象的属性都是可以扩展的,当4S店采集到预想问题以外的情况时,将这一问题作为新的属性添加到这一对象中。如对一款新车A建立数据库,以车型A作为一个新类,将汽车的重要组成部分,如外形、底盘、发动机、变速箱等作为将对象。对于每一对象可能出现的问题进行预想,如底盘方面,某处漏油、异响等作为属性建立数据库。4S店根据进店车辆的维修保养情况以及车主反映某方面的问题对数据进行录入。由于人员素质不同,因此数据库的录入工作不能太复杂,最好采用选择的形式。对于某一数据,如果对象属性中没有此选项,则由工作人员负责添加,添加之后的项作为一项新的属性,其他数据采集点的人员再碰到此问题便可以对其进行选择。
以销售的汽车为单位购建数据库。一款新车投放市场以后,汽车制造商为此款车创建一个数据库,数据库以售出的汽车作为存储对象。每售出一台汽车数据库增加一项,这个数据库相当于为售出的汽车创建了汽车档案。每次车辆进4S店保养或维修,4S店工作人员都将汽车的状态以及故障情况,添加对应的项中。而每一项又包含各种属性,这些属性可以按部件分类,也可以按故障进行分类。这些属性也是提前预设好的,数据采集人员只负责添加数据,对于一些出现的问题而数据库中没有的属性,数据采集人员可以添加,添加后其他相关车辆也相应增加了此种属性。
这两种构建数据库的方法各有优势。第一种构建数据库的方法,以零部件作为对象,通过一段时间的数据采集,能够很快发现汽车的缺陷所在,在改进方面具有很强的针对性。第二种构建方法,以所售汽车为数据库的存储对象,首先对用户来说建立了汽车档案,能够及时为用户提供维修保养的建议,提高服务质量。另外,车辆数据的完整性较高。
2.2数据的采集与录入
对于汽车制造商来说,获取数据应该是一件比较容易的事情。每一家汽车制造商在其产品销售的城市都设有4S店,有些汽车品牌在一个城市不止有一个4S店。这些4S店负责车辆的销售以及售后服务。因此,4S店直接与汽车使用者接触,能够准确地获得关于车辆使用缺陷与不足以及客户改进需求的第一手资料。
对于数据的采集,可以将4S店的电脑作为数据库的终端,与生产商的数据库进行连接,并对终端设置用户访问权限,如4S店的工作人员只能查看添加数据,对于已有的数据无权修改等,这样4S店便可作为汽车制造商的数据采集节点,将所有4S店的电脑与数据库相连,这就构成了一张很大的数据采集网络。
当一辆车到4S店进行保养或者维修时,4S店的工作人员根据数据库中的各项对车主进行访问,并将得到的结果进行录入。如果是车辆维修,首先按照故障的位置,在数据库中找到相应的大项,然后,确认是人为事故还是机械故障。如果是保养,确定车辆的状态,同时,针对数据库对象预设的属性对用户进行访问,录入结果。
3基于数据挖掘技术的汽车改进
利用数据挖掘技术对车辆进行改进,主要是设定一定的规则,并通过软件编程对数据库中的数据进行分析,发现车辆潜在的问题,并确定问题所在,给汽车制造商提出汽车改进合理化建议。而汽车改进主要是对汽车投入市场后针对车辆在使用中发现的问题与不足以及客户反馈的问题进行改进或提高。对于汽车改进可以分为两类:一类是急需性改进,如生产设计缺陷等;另一类是非急需性改进,如对外形尺寸的改进。
急需性改进是指对汽车性能、安全方面的改进,对汽车的质量能有一个很大的提高。这与汽车部件的功能、位置、故障类型有关,数据挖掘系统通过对数据库中的数据进行分析,对于急需性改进进行及时的报警提示。下面举例说明基于数据挖掘技术对汽车急需性改进的发现过程。
设定一个基数a,设销售的车辆数量为m,当m > a时数据挖掘系统对数据库中的数据进行监测。设定一个临界值p1,数据挖掘系统能够根据数据库中的数据计算出在某一时间节点内所售车辆中某一部件出现故障的比率(不包括维修后出现)p,当p > p1 时,认为此部件的设计或工艺存在缺陷,然后判断此部件与汽车的性能、安全的关系,确定需不需要立即进行改进,如果需要立即改进,此时系统会做出提示,提醒汽车制造商,汽车的某个位置部件存在缺陷,汽车制造商据此分析部件的属性数据,对问题进行分析,确定问题所在并快速对缺陷进行改进。
非急需性改进是指一些问题对汽车的整体性能影响不大,或汽车用户提出的一些较为合理的建议,汽车制造商在对此款车进行改进时能够参考借鉴。下面举例来说明数据挖掘技术在汽车非急需性改进中的作用。
假设汽车制造商准备对某一款汽车进行改进,首先通过数据挖掘系统对采集到的数据进行分析,设定临界值p2,对于一些非急需性改进部件的问题率进行统计,当这些部件的问题率p > p2时需要对此部件进行改进,然后,针对此部件中的数据属性,分析改进的位置与改进方案。另外,对各问题按照出现频率进行排序,为汽车制造商改进汽车提供借鉴。
综上所述,基于数据挖掘技术的汽车改进的主要流程如图1所示。
4新车型的研究
一款新车型的研制,通常都要基于某种平台或某一车型。通过对相关汽车平台或车型数据的采集,能够发现这些平台的优势和不足,而新车的研制首先要尽可能避免存在先天缺陷和不足,因此,通过数据挖掘技术对相关数据的发掘,发现其基于平台或车型的缺陷或不足,对新车的研发有着重要的作用。所以,在研发新车之前,首先应该对其使用平台或基础车型的采集数据进行数据发掘,获取车辆的相关信息,同时,在研制新车之前需要对市场需求进行调研,了解社会需求以及对汽车性能的期望,这些数据的采集也可以通过4S店的问卷调查来实现。通过对这些信息的处理,获取新车研发过程中需要注意的问题与客户需求,从而研发出高质量、高性能的车辆。
5结束语
先进的设计理念是一款新车成功的基础,但是过硬的质量与性能才是其成功的保证。国产自主汽车只有依靠高质量、高性能的才能跻身世界名牌汽车的行列。只有重视对数据的积累,从数据中挖掘出产品存在的问题才能对产品进行改进,提高产品的性能与质量。同时,在研制新产品的过程中,只有充分借鉴老产品的经验,避免老产品中存在的问题,提高产品质量,才能使新产品受到欢迎。只有这样,我们才有底气说:中国人开中国车,我们信得过。
主要参考文献
[1] 李国强,曹巧莲,辛正宇,等. 浅谈数据处理的新技术——数据挖掘[J]. 科技创新与生产力,2010(6):82-85.
[2] 黄长江. 浅析数据挖掘[J]. 科技信息,2010(17):66-67.
[3] 杨道衡. 数据挖掘与数据挖掘服务实现研究[J]. 现代商贸工业,2010(17).
[4] 李小荣. 数据挖掘在企业历史数据中的应用[J]. 中国管理信息化,2011(2).
[5] 吴金炎. 数据挖掘与数据仓库技术在电子商务中的应用综述[J]. 福建教育学院学报,2010(4).