APP下载

大数据分析管理系统在新能源汽车事故分析中的应用

2024-03-24王娜李强

时代汽车 2024年2期
关键词:数据分析新能源汽车数据挖掘

王娜 李强

摘 要:随着新能源汽车的广泛使用,新能源汽车事故数据的分析处理越来越受到人们关注。传统的事故数据分析方式通常需要大量的人力和时间,而且往往只能分析少数的数据变量。数据挖掘技术以其强大的数据分析和挖掘能力,已经在新能源汽车事故数据分析处理中得到广泛应用,以帮助研究人员从事故数据中挖掘出潜在的规律和特征,为事故原因和解决方案的提出提供科学依据。本文设计了一套新能源汽车事故大数据分析管理系统,更加高效、有规律地分析新能源汽车事故数据。

关键词:数据挖掘 数据分析 新能源汽车

1 引言

近年来,随着新能源汽车的发展,其在全球范围内的销售量不断增长。与此同时,新能源汽车事故数据分析处理也成为了重要的研究领域之一。事故数据的分析处理可以为制定相应的交通规则和提高交通安全性提供有益的参考依据[1]。但是,传统的事故数据分析方式需要大量的人力和时间,且只能分析少数的数据变量,限制了数据的分析深度和广度。为了提高新能源汽车事故数据分析处理的效率和准确性,数据挖掘技术被应用于新能源汽车事故数据分析处理领域中。数据挖掘技术可以挖掘大量的数据,找到隐藏在海量数据背后的真实信息,帮助研究人员从事故数据中更准确有深入地发现规律和特征,为事故原因和解决方案的提出提供科学依据[2]。因此,本文旨在探讨数据挖掘技术在新能源汽车事故数据分析处理中的研究现状、存在的问题及解决方案。

2 数据挖掘技术在新能源汽车事故分析中的应用

随着新能源汽车的不断发展,特别是电动汽车的普及,其在道路安全方面带来了新的挑战。为了达到更高的安全性能,减少交通事故的发生,数据挖掘技术在新能源汽车事故分析中得到了广泛应用[3]。数据挖掘技术在新能源汽车事故分析中的应用主要包括以下三个方面:

2.1 事故模式挖掘

使用数据挖掘算法可以对大量的新能源汽车事故数据进行处理和分析,从而找出发生事故的常见模式和规律。通过挖掘事故模式可以有效地提高新能源汽车产业安全性能,并开发相应的预防机制。

2.2 风险评估和预测

数据挖掘技术的另一个重要应用领域是新能源汽车风险评估和预测。通过对相关数据的统计分析和建立合适的数据模型,可以对车辆的潜在风险进行评估和预测,以实现更加准确的安全性工程决策。

2.3 智能驾驶和自主导航

数据挖掘技术有助于新能源汽车开发智能驾驶和自主导航技术。通过对车辆控制系统和传感器数据的分析,可以在极短的时间内判断出车辆周围的道路、障碍物和其他车辆位置,并且实现自主化的驾驶与导航操作。

3 存在的问题

新能源汽车在未来交通中将起到越来越大的作用。但是,随着新能源汽车的发展和日益普及,由于新能源汽车本身的特殊性质、复杂性和安全难题,新能源汽车事故造成的人员伤亡和财产损失仍然存在不容忽视的风险。因此,新能源汽车事故分析具有重要的意义,在此过程中,数据挖掘技术被广泛应用。但是,在实际应用中,数据挖掘技术也存在一些问题。

3.1 数据获取困难

由于大多数新能源汽车没有安装行车记录仪,导致数据的获取非常困难。一些新能源汽车厂商为了减轻对用户的干扰或节约成本,未能安装准确的传感器,这使得获取数据变得更加困难。

3.2 数据质量差

由于数据获取困难,不少新能源汽车企业没有完全重视数据质量的重要性。因此,在事故数据处理过程中,许多数据质量存在较大的问题。使用这些数据进行分析会导致结果的不准确。

3.3 特征提取与分析难度大

新能源汽车的数据较为复杂,涵盖了很多不同领域的数据。由于新能源汽车的复杂性和特殊性,如何有效地进行特征提取和分析是一个挑战。而且,新能源汽车的数据还与用户的行为习惯、环境变化等因素密切相关,这使得数据的清洗和预处理困难[4]。

3.4 数据安全问题

在新能源汽车事故分析过程中,由于数据涉及用户个人隐私,数据泄露风险会给数据分析和应用带来很大风险。

4 新能源汽车大数据分析管理系统

为了更加高效、有规律地分析新能源汽车事故数据,特研发了一套新能源汽车事故大数据分析管理系統。该系统的实现可分为三大部分,其中第一部分为多源数据预处理系统。该系统通过对不同来源、不同结构的新能源汽车数据进行汇聚和预处理,将处理后的采集数据形成结构化的原始数据、数据片段及特征数据,并保存至Mysql数据库,以方便后续分析模型使用。第二部分为事故数据分析系统,该系统使用各种工具手段,例如新能源汽车事故模式识别模型和事故特征模式匹配追踪模型等,以便提取大量数据背后的事故发生规律及其关联因素。第三部分为测试验证系统,主要关注单要素和多要素安全量化分析算法模型的测试及验证。该系统使用大量事故车和正常车数据来验证模型的输出结果,以确保安全要素的各种特征得到完整的确认。系统的总体结构图如图1所示:

4.1 多源数据采集预处理系统

该系统主要包括以下几个功能:

数据采集:通过多种方式和渠道采集数据,包括爬虫、API接口、日志文件、数据库等。该功能能够实现高效、灵活、准确地获取所需的数据,并对数据源进行适当的筛选和过滤以保证数据的准确性和完整性。

数据预处理:对采集获得的数据进行初步整洁、转换和标准化处理,确保数据的一致性和规范化,包括数据清洗、数据转换、数据集成、数据规范化等。有效的数据预处理能够为后续的数据分析和挖掘工作提供可靠的基础。

数据存储:将预处理后的数据存储在适当的数据仓库或数据管理系统中,包括关系型数据库、非关系型数据库、数据湖等。具体的存储方式取决于数据的类型和规模,同时需要考虑数据的安全性和可扩展性。

数据访问:为用户和需求方提供方便快捷的数据访问接口,包括图形化界面、API接口、数据导出和数据共享等多种方式,满足不同用户的各类数据查询和数据挖掘需求。同时需要考虑数据的隐私保护和安全访问等问题。

为了实现多源数据采集预处理系统的快速采集和预处理不同来源和类型数据的能力,系统需要按照数据采集和预处理的需求设计软件架构。图2所示:

主要包含以下四个模块:高速队列消息模块、数据实时计算模块、实时缓存模块和数据总线接口模块。这些模块将协同工作,确保数据的高效采集、实时计算、快速缓存以及数据总线接口的平稳連接。这样的软件架构能够为多源数据采集预处理系统提供高效、可靠的数据处理能力。

1)高速队列消息模块,其作用是接收来自新能源汽车国家监管平台和其他数据平台的实时数据,并将其传输给数据实时计算模块和实时缓存模块,以进行高吞吐量的分布式计算和缓存。

2)数据实时计算模块,其作用是对接收到的数据进行合法性检查、结构化处理和安全相关数据项提取。

3)实时缓存模块,其作用是暂存平台接收的数据,并按需分发给多个实时计算模块,以实现海量数据的实时处理。

4)数据总线接口模块,其作用是实现各模块间数据的调用及消息传递,并将预处理后的数据存储于安全信息数据库中,以便按类别进行管理。

4.2 事故数据分析系统

事故数据分析系统主要的功能模块有事故数据管理模块、事故数据切片管理模块和事故分析及可视化模块。

4.2.1 事故数据管理模块

事故发生后,需要进行现场调查并记录基本信息,包括事故、车辆和动力电池信息。这些记录可供事故分析人员在线查阅,以便了解事故情况、车辆状况和电池状况。以上数据将被提交到系统中,脱敏并保存,以支持后续的数据管理和使用。为简化理解,建议将长句分解并减少重复使用。具体的管理功能如下:

数据列表:该功能可展示所有已经录入的事故车数据列表,并可通过各种筛选方式进行查询和排序,以快速找到所需记录。

数据查询:该功能可根据唯一识别码或其他关键字对数据进行搜索,并将匹配的结果呈现在列表中,方便用户查看和处理。

数据删除:该功能可根据用户选择的条件,对指定的事故数据进行删除操作,从而清理系统中已失效或无效的数据记录。

数据修改:该功能可允许用户对已录入的事故数据进行编辑和修改,例如更新车辆信息或者更正事故描述等。

数据导入:该功能可以将批量的事故数据一次性导入到系统中,从而避免手动录入时发生重复或输入错误的情况。同时,系统也可进行数据校验,确保导入的数据格式正确,并进行后续的数据脱敏和保存。

以上几个功能有助于用户对事故数据进行管理和维护,提高了工作效率和数据质量。

4.2.2 事故数据切片管理模块

为了从事故车数据文件中获取对事故分析有价值的信息,需要进行数据切片。数据切片过程包括两个步骤,第一步是通过对静态数据字段(例如:车辆信息、事故信息、动力电池信息)进行筛选,确定模型所需的目标车辆;第二步则是根据选定的切片数据项和范围,对目标车辆的动态数据文件进行动态裁剪,生成最终的数据切片文件。

4.2.3 事故分析及可视化模块

针对已经发生的事故,如何分析事故因素并找到关键原因,对于预防类似事故的再次发生具有重要的意义。事故分析及可视化模块有三个具体的功能:

事故纵向分析:纵向比较分析即不同时间段内同一地区或某一宏观环境中事故的比较。该方面分析可以了解事故总量的变化趋势、事故形势的变化情况以及对现有交通管理措施的改进等。其中,模块会考虑多个因素,例如人为因素、天气条件等,并提供可视化图表,帮助用户更好地理解数据。同时,通过数据挖掘技术,用户也能从纵向变化趋势中发现事故的规律和模式,从而更精准地制定交通安全管理措施。

事故横向分析:横向比较分析即对不同地区或相似区域的事故进行比较。该方面分析可以找出某些区域或路段和其他地区相比容易发生交通事故的原因,以便更好地制定防范措施。例如,可以通过大数据技术,在全国甚至全球范围内对相同条件下的事故数据进行比对,在此基础上了解全国交通安全形势,查找问题症结,促进乃至引领行业转型升级与创新发展。

事故模式分析:事故模式分析即根据历史事故数据和相关信息建立数学模型,从而对事故发生可能性进行预测并采取有效的措施加以遏制或减轻事故的发生。该模块将综合考虑驾驶员、车辆、道路环境等多个因素,利用大数据挖掘出事故发生的规律,并通过可视化图表呈现给用户。其中,针对高频的某一类别事故,可根据有效性评价指标,通过建立常见事故发生模式来进行后续二次事故预测,以便指导公安部门和参与行业进行整改发力。

5 结论

目前传统新能源汽车事故研究分析方法有限,无法深入分析事故根本原因,更无法提供有效的安全预警。本文将数据挖掘技术引入新能源汽车事故分析中,提出了基于大数据思维的研究方法。这种方法能系统地分析新能源汽车的全生命周期数据,在此基础上构建了新能源汽车事故大数据分析管理系统。该系统可以充分收集和分析新能源汽车在使用过程中的事故信息,对于整合相关部门资源、加强道路管理、提升安全方案等方面具有支持作用[5]。针对不同类别的事故资料进行深入分析,可以发现其问题所在并采取相应措施,从而有效地提升行业的安全性,推进新能源汽车高质量发展和促进行业转型。

基金项目:2022年江西省教育厅科技项目”新能源汽车用户数据及车辆健康数据挖掘及分析方法研究”(项目编号:GJJ2202505)。

参考文献:

[1]吴志强,廖承林,李勇.新能源电动汽车消防安全现状与思考[J].消防科学与技术,2019,38(1): 148-151.

[2]佟丽珠.新能源汽车安全问题现状分析[J].时代汽车,2018,300(09): 62-63.

[3]张文,王东,郑静楠,等.电动汽车领域的大数据研究与应用[J].大众用电,2016(S2):64.

[4]贺玲,吴玲达.数据挖掘中的聚类算法综述[J].计算机应用研究, 2007,24(1):10-13.

[5]方凯正,陈佚,刘沙,等.新能源汽车安全分析及发展建议[J].汽车实用技术,2020,307(04): 24-26.

猜你喜欢

数据分析新能源汽车数据挖掘
探讨人工智能与数据挖掘发展趋势
基于并行计算的大数据挖掘在电网中的应用
浅谈新能源汽车的概况和发展
关于新能源汽车发展的若干思考
基于新能源汽车产业发展对汽车专业人才培养的思考
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究