新能源汽车运行故障数据分析与自动追溯模型研究
2022-11-20阮永娇孙承臻陈娅鑫
阮永娇,陈 昕,孙承臻,陈娅鑫
(辽宁工业大学 汽车与交通工程学院,辽宁 锦州 121001)
随着新能源汽车的推广和使用,新能源汽车故障报警问题成为学者和生产企业关注和研究的重点与难点。学者对新能源汽车单一故障类型或者整体故障进行大量研究。赵洋[1]结合数理统计方法和机器学习模型,实现电动汽车的动力电池电压离群故障和容量异常故障两种潜在故障的挖掘分析。吴浩等[2]通过对整车信息进行分析,实现了对新能源汽车故障可视化。郭家辉[3]通过对电动汽车的故障报警记录分析,得到了每种车型的易发故障。林美钗[4]借助温度传感器实现了新能源汽车电池过热报警。丁杰[5]针对纯电电动车电池自燃事件,研究出一套动力电池的监控预警方法。陈烁等[6]通过软硬件结合设计了辅助显示系统,实现了新能源汽车的故障报警与显示。孙少飞等[7]通过研究新能源汽车的车辆故障分析方法、装置及服务器,提高了汽车故障诊断的准确度和故障诊断效率。武建伟[8]设计出新能源汽车的远程监控平台,实现对新能源汽车的实时监控,获取信息并服务于车辆,保障车辆安全运行。
1 运行故障数据分析
新能源汽车的运行故障在进行追溯时,以新能源汽车的报警大数据为依据,基于报警大数据分析,进行新能源汽车的运行故障追溯研究。
1.1 报警大数据
新能源汽车报警大数据的数据字段中与报警密切相关的有报警类型名称、报警时总里程、报警时电池电压、报警时电机温度、报警时电机电压、报警时电池最高温度、报警时电池最低温度共7 个数据字段。通过python 编程进行数据预处理,删除存在异常值的样本,为了减少数据字段量纲不同,数值相差较大引起误差,采用最小—最大标准化方法通过编程实现数据样本的标准化。预处理后的报警数据,如表1 所示。
表1 预处理后的报警数据
1.2 相关性分析
报警时总里程、报警时电池电压、报警时电机温度、报警时电机电压、报警时电池最高温度、报警时电池最低温度6 个字段作为影响报警类型的重要因素,求解其彼此相关系数如表2 所示。从表中的结果可知,报警时电机电压和报警时总里程、报警时电池最高温度和报警时电池最低温度具有较强的相关性,但只有报警时电池最高温度和报警时电池最低温度是同一属性的参数,因此可以2 者取1 作为模型输入参数,由此构建报警类型自动追溯模型时,选择报警时总里程、报警时电池电压、报警时电机温度、报警时电机电压和报警时电池最高温度5 个特征参数。
表2 相关系数
2 报警类型自动追溯模型构建
2.1 拆分策略
新能源汽车报警类型有19 类,为多分类问题,所以采用“一对其余”(简称OvR)拆分策略,将报警类型多类识别问题拆分成为19 个正反识别问题,形成19 个报警类型识别器,其拆分示意图如图1所示。
2.2 转化函数
转化函数用于识别任务中的真实值与预测值的相互转化。本文选择的转化函数是对数几率函数,如式(1)所示。其中Tz=w x+b,z的作用是将特征参数所反映的真实值转化为模型需要的正反预测值。
2.3 模型求解步骤
根据已经确定的拆分策略与转化函数确定模型的求解步骤如图2 所示,其中每个步骤的具体内容如下文所示。
Step1:将新能源汽车故障报警数据划分为训练集(X1,Y1)和测试集(X2,Y2)2 个集合,其样本个数分别为p、q。
Step2:利用训练集(X1,Y1)样本,基于机器学习中的逻辑回归算法,通过python 编程随机赋予识别器中转化函数自变量的未知数wki、bk,得到报警类型识别器fk,其中wki代表第k个识别器中转化函数的第i个变量的值,bk代表第k个识别器中转化函数的截距值,k=1,2,…,19,i=1,2,…,5。
Step3:将Step2 中的结果以及训练集(X1,Y1)的数据代入转化函数,求解每个样本在不同识别器fk中的转化函数值。
式(2)、(3)中:xji代表第j个样本第i个变量的值,zjk代表第k个识别器中第j个样本对应的转化函自变量数值,j=1,2,…,p。
Step4:根据训练集中第j个样本在第k个识别器fk中的转化函数值yjk,求解其对应的识别值cjk。
Step5:根据训练集中第j个样本在第k个识别器fk中的识别值cjk求解该样本的识别结果mj。
Step6:计算训练集中所有样本的识别结果,得到M=(m1,m2,…,mp),同对应的故障报警类型作比较并计算训练集自动追溯的准确率η。
Step7:若准确率η大于或等于0.95,则返回wki、bk的值,并输出到excel 表格中。若准确率η小于0.95,则返回Step2 重新定义识别器中转化函数自变量的未知数wki、bk。
模型求解流程,如图2 所示。
图2 模型求解流程
3 模型训练与评估
3.1 模型训练
通过python 编程划分训练集与测试集如表3、表4 所示,将115 554 条新能源汽车故障报警数据按照留出法7∶3 划分为训练集和测试集,其中训练集包含80 887 条样本数据,测试集中包含34 667条样本数据。并通过机器学习求得自动追溯模型参数的结果如表5 所示。
表3 训练集
表4 测试集
表5 自动追溯模型参数(w,b)的结果
续表
根据表5 可以得到19 个报警类型识别器,每一个识别器都是对有一种报警类型的识别。样本的识别结果为“正”或者为“反”,遍历19 个识别器后,若有且仅有一个识别器的结果为正,那么对应的报警类型则为该样本的最终报警类型;若同时有多个识别器的结果为正,则选取置信度最大的报警类型,即识别器中z 值最大的类型,作为该样本的最终报警类型。根据识别器关系式中每项特征参数的系数可知其本身在每类故障报警中的重要程度,根据表5 自动追溯模型参数的结果显示,在这19个识别器中报警时电池电压、报警时电机温度和报警时电池最高温度3 个特征参数的相对比重要,其次是报警时总里程,而报警时电机电压重要程度最低。在新能源汽车生产研发过程中应当侧重于电池性能和降温两方面的研究。
3.2 模型评估
通过python 编程,针对最终的模型通过测试集数据进行报警类型自动追溯,如表6 所示。
表6 测试集(X2,Y2)自动追溯与人工识别对比分析
自动追溯模型对测试集34 667 条数据进行报警类型自动追溯所用时间为0.97 s。
人工查看新能源汽车的故障原因,熟练工作人员识别1 次至少需要300 s,34 667 次报警,人工识别所用时间为10 400 100 s,自动识别效率高,识别成本低。
4 结束语
本文通过新能源汽车报警大数据分析,得到各类报警类型频发时对应的特征参数的取值范围,对报警类型与特征参数进行关联分析,建立新能源汽车的报警类型自动追溯模型。自动追溯模型生成的识别器关系式中每项特征参数的系数反应其本身在每类故障报警中的重要程度,为生产研发过程中应当侧重于哪方面改进完善研究提供依据。自动追溯模型识别精度高达0.98,比人工识别用时短,识别效率高,识别成本低,可以及时根据车辆的平台的监测信息对车辆提前做出预判。一方面可以及时向车主反馈故障原因,方便车主及时采取应对措施;另一方面可以及时向管理机构反馈信息,协助其做好故障处理准备。自动追溯更好地缓解造成交通拥堵,从而提高交通安全。