基于数据挖掘的电动汽车充电设施充电安全故障特性分析
2022-04-28李光熹徐纬河
许 笑, 高 翔, 李光熹, 徐纬河
(国网连云港供电公司, 江苏 连云港 222200)
0 引 言
与传统燃料汽车相比,电动汽车环保且无噪声,发展电动汽车有助于缓解能源短缺和环境污染,电动汽车充电桩是电动汽车发展的前提。充电桩运行时产生海量数据,这些数据类型、属性等多样化,给后续对数据的统计及分析带来困难。同时,电动汽车充电过程存在安全性问题,会给用户带来财产威胁和充电安全威胁等影响[1]。电动汽车充电过程中影响安全性的因素包括动力电池、充电设施、供电设备等方面[2],其中充电设施故障率较高是制约电动汽车发展的主要因素[3]。充电设施一般放置于室外,环境等不可控因素都会影响充电设施的安全运行[4]。因此,采用数据挖掘技术分析充电设施运行安全故障特性成为电动汽车的发展趋势是非常重要的。
目前,结合数据挖掘技术的充电设施故障特性研究已成为国内外学者研究重点。文献[5-7]对当前数据挖掘技术及大数据技术进行总结分析,研究如何应用到电网中。文献[8]基于数据挖掘的方法,提取电池SOC状态的重要影响参数,结合GA-BP神经网络对电池SOC的状态进行评估。文献[9]基于大数据技术,挖掘台区异动信息,建立判别体系,实现对台区异常状态进行预警分析。文献[10]针对充电设施的安全隐患及故障类型,通过数据采集技术和数据挖掘方法,建立数据挖掘模型,并将其输出作为预测故障的基础。文献[11]通过分析电池管理系统(Battery Managment System,BMS)的保护需求以及充电桩对BMS的响应率,结合层次分析法,建立电动汽车一体化的BMS响应率指标体系。文献[12]基于随机森林模型的数据处理方法,对充电桩数据源进行数据挖掘,结合机器学习算法,建立故障预测模型,预测即将发生的故障。文献[13]基于随机森林算法,训练出故障诊断器模型,用于诊断直流充电桩的开关模块,该方案具有现实意义。
基于上述背景,本文首先基于直流充电桩的工作原理及充电安全影响因素进行分析,其次研究数据挖掘处理方法,详细介绍数据挖掘的数据提取、数据预处理、数据特征挖掘3个步骤,进而分析安全故障数据特征,建立充电设施一体化故障树,通过提取规则,分析各层故障源和具体故障类型之间的内在关系。最后,基于数据挖掘技术对2021年3月~4月江苏省各充电站充电设施的运行数据如电压、电流、温度等进行特征挖掘,结合充电设施一体化故障树,对主要故障类型及次数进行统计,验证了该数据挖掘方法对充电设施安全故障特性分析的实用性。
1 直流充电桩工作原理及充电安全影响因素分析
1.1 直流充电桩工作原理
普通直流充电设备系统结构主要由充电设备控制器、人机界面、IC卡读卡器、电源转换模块、计量计费模块、急停按钮组成。充电站电气系统的三相交流电经过整流滤波后,进入驱动电路控制的高频DC/DC功率变换器,进行电压调节,然后由功率变换器中的高频变压器进行电气隔离,再通过滤波获得直流输出,同时可对直流输出进行采样检测,发送到控制器进行决策。常见的直流充电桩工作原理如图1所示。
图1 常见的直流充电桩工作原理
1.2 直流充电桩安全影响因素
1.2.1 绝缘问题
影响充电设施绝缘性的因素包括外壳防护能力、电气间隙与爬电距离、介电强度、绝缘电阻、接触电流、冲击耐压等。
1.2.2 环境因素
充电设施常年放置于室外,其环境因素是不可控的,充电设施内部有许多个模块和大量高精密度的电力电子元件,台风、冰雹、雨天、高温等恶劣天气环境都会影响这些元器件的性能及绝缘性,威胁着充电设施的安全运行,进一步可能导致安全事故的发生。
1.2.3 通信问题
充电设施在运行过程中会实时与BMS系统进行通信,充电桩的输出电压、电流大小会根据BMS系统的指令进行调整,当电动汽车充电结束时,BMS会发出指令要求终止充电。若通信中断,充电桩继续输出,会出现电池过充,可能发生事故;充电设施内部充电控制器也会实时与充电桩计费控制单元(TCU)进行通信,外界的网络攻击如窃取、篡改数据等操作,都会给用户和运营商带来财产及信息安全问题。因此,可靠的通信可以保障用户的财产安全及用户信息安全。
2 数据挖掘处理方法
数据挖掘是指对海量数据进行分析,并从中提取信息以达到不同的目的。本文通过数据挖掘算法对充电设施故障特性进行分析并统计,以备后续工作及决策。数据挖掘流程一般包括数据提取、数据预处理、数据特征挖掘处理等。
2.1 数据提取
电动汽车充电设施的运行状态数据来源包括互联网、BMS系统以及运营监控平台,充电设施运行状态量如电压、电流、温度等数据异常都会给充电设施带来安全隐患,而初始数据集的各种数据类型、属性等多样化,给后续对数据的统计及分析带来困难,因此需要进一步处理从各个数据来源采集到的数据。
2.2 数据预处理
从科学到工程,从管理到过程控制,数据分析是许多知识领域研究的基础。以符号和数字属性的形式获取充电设施运行状态的数据,这些数据来源于不同平台和性能不同的传感器,且类型多样,属性具有不同程度的复杂性。因此,需要进行数据预处理操作,其主要目标是为挖掘数据特征并发现用于解决问题或做出决策的知识奠定基础。
2.2.1 不良数据处理
传感器测量的数据在采集、存储、传输过程中会产生不良数据,还有可能是本地信道通信质量、充电设施或电动汽车故障引起的不良数据。由于这些不良数据会对状态估计结果产生负面影响,因此需要识别这些不良数据,并更正检测到的不良数据[14]。
(1)不良数据的检测。不良数据对状态估计产生影响,故有必要对其进行检测。不良数据可分为两类:单个不良数据,由于高干扰或设备配置不正确,只有一个测量值会有较大的偏差;多个不良数据,多个测量值同时出现偏差。
加权最小二乘法(WLS)和卡方检验可分别用于充电设施运行状态估计和检测不良数据的存在。状态估计广泛应用于真实电力系统,以确保电力系统的最佳运行。测量值与状态变量之间的关系为
Z=h(x)+e
h(x)=[h1(x1,x2,…,xn),…,hm(x1,x2,…,xn)]
(1)
式中:x——n×1的状态变量向量;
Z——m×1的测量向量;
h(x)——将状态变量与测量值关联的非线性变换;
e——m×1的误差向量,表示测量误差,服从零均值高斯分布。
一般情况下,测量值的数量大于状态变量的数量。因为方程的数量大于未知数的数量,所以式(1)有无穷多个解。WLS的目标是从这些可能的解决方案中找到最佳的解决方案,可以通过最小化计算值和测量值之间的残差来实现。加权平方差J(x)表示为
(2)
式中:m——测量值的数量;
其中,非线性函数h(x)通过使用泰勒级数展开进行线性化。
h(x+Δx)≈h(x)+H(x)·Δx
(3)
式中:H(x)——雅可比木矩阵。
(4)
结合式(1)、式(3)、式(4),式(2)可以改写为
(5)
式中:R——加权矩阵,对角线元素是每个测量值误差的方差。
取式(5)的一阶导数,并找到最小值。
HTR-1HΔx=HTR-1e
(6)
令G=HTR-1H,即
GΔx=HTR-1e
(7)
式中:G——增益矩阵。
如果系统是完全可观测的,那么G是一个正定对称的稀疏矩阵。
(8)
(9)
(10)
(2)不良数据的修正。基于WLS法和卡方检验对充电设施运行时的不良数据进行检测,得到不良数据集合。当不良数据出现过多时,不能一味将其舍弃,可利用人工神经网络(ANN)对其进行修正。首先使用正常数据作为输入训练ANN模型,训练优化好的ANN模型具有预测功能。然后将不良数据前一时刻的正常数据作为ANN的输入,由于ANN的输出表示正常数据的预测值,因此输出的预测值将用来替换不良数据值,以此修正不良数据,为后续数据质量评价和数据转换奠定基础。
2.2.2 数据质量评价
基于不良数据的处理结果,进行电动汽车充电设施运行状态数据质量评价,根据运行状态数据特征,充电设施运行状态数据质量评价体系如图2所示。
图2 充电设施运行状态数据质量评价体系
充电设施运行状态数据质量评价模型如图3所示。
图3 充电设施运行状态数据质量评价模型
首先对充电设施运行状态数据集进行检测,包括充电设施运行时的各子模块电压、电流、阻抗、温度等数据间的相关性进行描述。然后通过规则库和智能算法库,进行规则权重和指标评价处理,形成数据质量报告。其中规则库是指在检测充电设施运行状态数据质量的基础上形成的问题规则集合;规则权重处理是指利用专家系统或者其他人工智能算法对各规则按照其重要程度进行权重分配;智能算法库是指数据质量评价过程所使用的算法集合;指标评价是指根据规则权重对各规则进行打分评价的过程,并形成最终的数据质量报告。
2.2.3 数据转换
数据转换包含以下几种处理方式,目的是构造出更合适数据处理的描述形式。
(1)数据合计处理:对采集到的充电设施运行状态数据进行不良数据的修正及数据评价等操作后,再对其进行总结归并处理,可用于数据的多粒度分析。
(2)数据规范化处理:将采集到的数据按一定比例映射到特定的区间中,更好地进行比较评价,其方法包括最小-最大标准化法、零-均值规范法等。
最小-最大标准化法是将最小值归为0或者-1,最大值归为1,其余值分布在最大值与最小值之间。标准化后的值x′为
(11)
式中:xi——样本里第i个原始数据;
xmin——原始数据样本里最小值;
xmax——原始数据样本里最大值。
(12)
式中:n——原始数据样本的数据个数。
标准差S为
(13)
则规范化后的值x″为
(14)
(3)数据泛化处理:将原始低层次的数据对象泛化为高层次(更抽象)的概念,比如温度属性,可以泛化到更抽象的概念如高温、常温和低温。
(4)属性构造处理:基于原有属性的特点,根据计算公式,构造出新的属性。比如充电设施某个模块的接触器温度与环境温度两个原始属性的差值,可以构造出一个新的属性为接触器的温升。比如电网线路上的供入电量与供出电量的差值,构造出线损这个新的属性。
2.3 数据特征挖掘
充电设施运行状态数据通过互联网传输,其数据量庞大,通过对前述的各种数据来源的数据进行预处理,将其输出、输入到充电设施运行状态数据挖掘模型,对复杂数据进行简化,比如降维抽取特征等,才能保证结果的实时性和有效性,能够有效控制充电设施的运行状态。
抽取数据特征常采用主成分分析法(PCA),通过PCA提取主成分(PCs),PCs是使数据方差最大的基础。在此基础上处理数据,可以获取大部分的方差,这是区分每个数据的重要信息类型。主要分为3个过程,首先是将分类信息添加到数据的过程;然后是对增强数据执行PCA的过程,该过程包括协方差矩阵的计算和主成分的选择。最后,确定在特征空间上投影数据的权重矩阵。
2.3.1 分类信息扩充到数据
定义Zclass为类别数,C(X)=[C1,C2,…,CZclass]为输入量X的每个分类信息。如果X属于类i,则X的类标签Ci就设为Pi,否则Ci设为Ni;确定Pi和Ni后,使Ci对所有X都具有正态分布。
例如,X的3个实例分别为X1、X2、X3,其对应的类标签为1、2、2,其分类信息为
(15)
(16)
(17)
对于具有正态分布的C1,第一个元素P1、-N1、-N2的均值应为0,标准差应为1,在此基础上,可以确定P1、N1的值,进而确定P2、N2的值。
将C(X)扩充到X,还需要对X进行标准化,使得X的每个因子呈正态分布,将标准化后的输入量定义为Xnorm。扩充数据Xaug定义为
(18)
其中,Xnorm的维度为1×Zinput,Zinput就是输入的数量;C(X)的维度为1×Zclass;Xaug的维度为1×(Zinput+Zclass)。
2.3.2 基于PCA的特征提取
将PCA方法应用于上述得到的Xaug,可以提取到主成分PCs。初始的PCs维度为1×(Zinput+Zclass),如果要降低输入数据的维度至Zfeature (19) 其中,PCi的维度为1×(Zinput+Zclass);Waug的维度为(Zinput+Zclass)×Zfeature。Winput和Wclass对应于扩充输入中的输入和类。 2.3.3 确定变换矩阵W 将Waug与Xaug相乘,可以得到特征空间上的转换数据Xfeature: (20) 通过选择合适的充电设施数据挖掘方案,设计合理的数据挖掘模型,分析安全故障数据特征,展示数据挖掘结果。数据挖掘流程图如图4所示。 图4 数据挖掘流程图 故障树是使用事件符号和逻辑符号显示物理系统的逻辑结构。网络的输入和输出应由“IF-THEN”规则确定。我国制定了故障树符号统一的标准,部分故障树基本符号及其含义如表1所示。 表1 部分故障树基本符号及其含义 建立故障树的步骤如下。 步骤1:故障树的建立从对象中所有故障的根源件作为顶部事件的陈述开始。 步骤2:找到输入事件,得出下层输出事件。 步骤3:重复步骤2,直到获得底部事件(具体故障原因)。 步骤4:用逻辑符号连接所有级别的事件,形成故障树。 规则表述如下: IFP,THENQ (21) 式中:P——由“与”和“或”连接的一组先决条件,pi∈P; Q——一组结果,qi∈Q。 当规则满足先决条件时,即可得出结论。 研究常见的故障类型,主要是由仪器故障、机械故障和通信故障引起的顶部事件,建立故障树。充电设施一体化故障树如图5所示。 图5 充电设施一体化故障树 由“或”逻辑来连接,充电设施故障树的输入包括18个节点,对应故障源X1~X18。充电设施故障树的输入源如表2所示。 表2 充电设施故障树的输入源 接着,从故障树中提取“IF THEN”规则,例如:IFX2THENY1,IFX3THENY1;IFX6THENY5,IFX11THENY5。 充电设施故障的输出有6个节点,对应Y1~Y6个故障类型。充电设施故障树的输出如表3所示。 表3 充电设施故障树的输出 对2021年3月~4月江苏省各充电站充电设施运行数据,如各个模块的电压、电流、温度、阻抗等数据进行提取、预处理及特征挖掘,通过上述建立的充电设施一体化故障树分析,对故障类型及次数进行统计,对主要故障类型包括仪器故障、机械故障和通信故障进行统计。充电设施各故障类型占比如图6所示。 图6 充电设施各故障类型占比 由图6可知,充电设施的仪器故障和通信故障占比较高,而本身的机械故障占比较低。常见的仪器故障原因又分为控制器故障、断路器故障、避雷器故障以及接触器故障;常见的通信故障原因分为BMS通信故障和TCU通信故障;常见的机械故障原因分为充电枪故障和电子锁故障。仪器故障、机械故障和通信故障各故障次数分别如图7~图9所示。 图7 仪器故障各故障次数 图8 机械故障各故障次数 图9 通信故障各故障次数 结合3月~4月的充电设施运行数据分析,由图7~图9可知,BMS通信故障、控制器故障、TCU通信故障和断路器故障次数较多。BMS通信故障还分为握手阶段通信超时、配置阶段通信超时、充电阶段通信超时、结束阶段通信超时、车辆就绪超时等多种故障,其故障原因主要是BMS绝缘模块发生故障或者BMS采集模块故障等因素造成的;控制器故障可以从控制器过热、控制器溢出、控制电压过高或控制电压过低推断出来;TCU通信故障一般是充电桩与计费模块通信超时,其原因主要是TCU离线和TCU辅助电源损坏;断路器可用来分配电能以及对线路、元器件等进行保护,当发生异常如短路、过载时实现对电路的自动切断,电压异常、电流异常、老化、触头不能闭合等原因都会导致断路器故障。通过数据特征挖掘展示故障类型,分析其产生原因,可为充电设施的安全运维奠定基础,对提高充电设施的稳定性和安全性具有一定的作用,同时推动电动汽车的发展。 本文首先对直流充电桩的工作原理及充电安全影响因素进行分析。其次研究数据挖掘处理方法,详细介绍数据挖掘的数据提取、数据预处理、数据特征挖掘3个步骤,建立合理的数据挖掘模型。进而分析安全故障数据特征,建立充电设施一体化故障树,分析各层故障源和具体故障类型之间的内在关系。最后,基于数据挖掘技术对2021年3月~4月江苏省各充电站充电设施的运行数据如电压、电流、温度等进行特征挖掘,结合充电设施一体化故障树,对主要故障的类型及次数进行统计,分析其故障产生原因,为充电设施的安全运维奠定基础。但是,本文尚未考虑各个故障之间的相关性对整体充电设施的影响,需开展进一步的研究。3 充电设施一体化故障树
3.1 故障树分析
3.2 一体化故障树
4 算例分析
5 结 语