基于深度学习的电气设备多源数据有效融合方法

2024-06-10王睿李健柳洪波杨磊

电子元器件与信息技术 2024年2期

王睿，李健，柳洪波，杨磊

山东泰开隔离开关有限公司，山东泰安，271000

0 引言

电气设备和系统在现代工业、交通和生活中扮演着关键角色。为了确保其可靠性和效率，对设备进行持续监测并从中收集数据已成为标准实践。这些数据来源于各种传感器、日志和控制系统，其形式和结构各异。对工程师和研究人员来说，如何从这些数据中提取有意义的信息，识别模式和趋势，以及进行决策支持，是一个长期且关键的任务。近年来，深度学习技术在图像识别、自然语言处理等领域取得了显著的成果，这为其在电气设备数据融合中的应用提供了启示。

1 深度学习的基本概念

深度学习作为机器学习的子领域，旨在通过模拟人脑的结构和功能来学习数据的表示。其核心是使用多层神经网络，常用的是前馈深度神经网络和递归神经网络。每一层都由多个神经元组成，通过连接权重将信息从一个神经元传递到另一个神经元。随着网络的深入，这些表示变得更加复杂和抽象。深度学习已在图像识别、语音识别和自然语言处理等多个领域显示出卓越的性能。其成功的关键在于能够自动从原始数据中学习高级特征，避免了手动特征工程的需要。当处理大量数据时，深度学习模型通常比其他机器学习算法更为优越。

2 电气设备多源数据特性评价

2.1 异构性

异构性是电气设备多源数据的显著特点之一。在电气系统的日常运行中，各种传感器、仪器和监控设备会产生大量数据，这些数据在来源、格式、质量、时间尺度和空间尺度上可能都存在差异。例如，温度传感器可能提供每秒一次的读数，而电流测量设备可能每分钟记录一次。此外，数据可能来自不同的物理量，如电压、电流、频率和阻抗，这些物理量的单位和量纲也各不相同。因此，处理和分析这些数据时需要考虑其内在的异构性，确保正确地解释和利用每项数据。数据的异构性也为数据融合和分析带来了挑战，简单地将不同来源的数据整合在一起可能会导致信息的丢失或误解。为了充分利用这些数据，并从中获取有价值的信息，需要采用适当的数据预处理、转换和融合方法，确保考虑到每组数据的特性和价值。

2.2 动态性

电气系统在运行过程中会受到多种因素的影响，导致其状态和性能发生持续变化。数据的动态性反映了这些变化，包括周期性变化、突发事件和长期趋势。例如，电气负荷可能会随着日常活动的进程、季节变化或特定事件而发生波动。同时，设备的老化、环境条件的变化或系统中的故障都可能导致数据的瞬时变化。这种动态性要求在数据分析和决策过程中采用实时或近实时的方法，以捕获和响应这些变化。而且，数据的动态性也意味着静态模型或一次性的分析可能无法准确地描述和预测系统的行为。因此，要有效地处理和利用这种动态数据，需要采用能够适应变化、学习新知识并及时更新的分析方法和工具。

2.3 相关性

电气设备多源数据的相关性在不同数据之间呈现出明显的内在联系和互动模式。在电气系统的各个组件和设备中，常常可以观察到相互依赖的关系。这种关系在数据中表现为统计相关性、因果联系或共同的行为模式。电流与电压之间可能存在固定的相位差关系，电气设备的温度上升与其工作负荷的增加具有直接联系。对数据分析者而言，识别这些相关性可以揭示系统的内在机制、预测未来的行为或检测异常。同时，基于单一数据源的分析可能会忽略其他数据的影响，导致分析结果的偏差。为充分利用数据的相关性，需要采用综合的数据分析方法，确保所有相关数据的信息和价值都得到充分考虑[1]。

3 基于深度学习的电气设备多源异构数据融合

3.1 基于自动编码器的特征提取与融合

（1）单个自动编码器融合

单个自动编码器融合方法主要依赖自动编码器的能力来实现特征提取和融合。自动编码器是一种无监督的神经网络结构，设计用于学习数据的有效表示。其结构包括编码器部分和解码器部分。编码器将输入数据压缩到一个低维的潜在空间，而解码器则试图从这个潜在空间恢复原始数据。在电气设备多源异构数据融合的场景中，可以利用自动编码器的编码部分从各个数据源中提取特征，并将这些特征融合为一个统一的表示。由于自动编码器能够捕获数据中的主要模式和结构，此方法能有效地整合来自不同源的信息，并为后续的分析和决策提供有用的输入。当处理大量的电气设备数据时，这种基于单个自动编码器的融合方法为确保数据的完整性和一致性提供了一个有效的策略。

（2）堆叠自动编码器融合

堆叠自动编码器融合方法通过多个自动编码器层次结构实现更深层次的特征提取和融合。每一层的自动编码器都负责提取其输入数据的某种特征，并将其输出作为下一层自动编码器的输入。通过这种层叠方式，模型能够从原始输入数据中学习到多层次、多尺度的表示。在电气设备多源异构数据的融合应用中，堆叠自动编码器可以从各个数据源中分别提取浅层和深层特征，并将这些特征整合到一个统一的高维表示中。这种高维表示包含了输入数据的丰富信息和结构，为后续的分析和应用提供了坚实的基础[2]。

3.2 注意力机制融合多源特征

（1）软注意力机制

软注意力机制为数据融合提供了一种权重分配策略，使模型能够在多个数据源之间分配不同的关注度。基于该机制，模型可以为每个数据源分配一个权重，这些权重是根据数据的内容和上下文动态计算的。在电气设备多源异构数据融合中，软注意力机制可以根据每个数据源的贡献和重要性为其分配权重，从而确保在融合过程中给予关键信息更高的优先级。此外，软注意力机制还提供了对模型决策的可解释性，因为权重可以直观地展示模型对不同数据源的关注度。在实际应用中，该机制可以有效地整合来自多个传感器或设备的数据，确保在整个融合过程中都能够捕获到关键的信息和模式。

（2）硬注意力机制

硬注意力机制为数据融合提供了一种明确的选择策略，允许模型在多个数据源中选择最重要的部分进行处理。与软注意力机制不同，硬注意力机制并不为每个数据源分配权重，而是直接选择某些数据源进行处理，忽略其他数据源。在电气设备多源异构数据融合中，硬注意力机制可以根据每个数据源的重要性或贡献选择性地进行融合，从而确保关键信息得到有效处理。此融合方法的优点在于其计算效率，因为模型只需处理被选中的数据源，而无需处理所有数据源。但此机制也需要精确的策略来决定何时和如何选择数据源，以确保融合结果的准确性和完整性。

3.3 基于多任务学习的融合

（1）共享表示学习

共享表示学习是多任务学习中的一种策略，旨在通过共享模型的部分结构，如隐藏层，为多个任务提供一个共同的表示。这种表示形式可以捕获不同任务之间的相似性和关联性，从而增强模型的泛化能力。在数学上，假设有两个任务1T1和2T2，其共享表示可以通过以下方式进行建模：

f(x)=h(Wx+b)

其中，f(x)是输入数据x的共享表示，h是激活函数，W和b是共享权重和偏置。

对于每个特定的任务，可以基于共享表示f(x)构建特定的预测层：

y1=g1(f(x))

y2=g2(f(x))

其中，g1和g2是任务特定的函数，y1和y2是两个任务的输出。

从上述公式可以看出，通过共享表示，不同的任务可以利用相同的底层特征f(x)。这不仅减少了模型的参数数量，还有助于在数据较少的任务中，通过其他任务的数据进行正则化，从而提高模型的性能。

（2）相关性建模多任务学习

相关性建模多任务学习关注于明确捕捉和建模多个任务之间的相关性。该策略的核心思想是，通过学习任务间的依赖关系，可以更好地指导每个单独任务的学习过程，从而提高整体性能。

设有任务集合{T1,T2,…,Tn}，每个任务Ti对应一个输出函数fi。在相关性建模多任务学习中，任务间的关系可以用一个相关性矩阵R来描述，其中元素rij表示任务Ti和任务Tj之间的相关性。

其中，h是激活函数，W和b是权重和偏置，rij是相关性矩阵的元素。

此公式表示，任务Ti的输出不仅由其自身的输入数据驱动，还受到其他任务的影响。相关性矩阵R的元素值决定了这种影响的强度。从上述公式可以观察到，相关性建模多任务学习能够明确地捕捉任务之间的依赖关系，使得在某个任务数据较少或存在噪声时，可以借助其他相关任务的信息进行补充，从而增强模型的鲁棒性和泛化能力[3]。

3.4 序列数据的深度学习方法

（1）基于LSTM的序列数据融合

基于LSTM的序列数据融合策略针对时序数据的特性，利用LSTM的长期记忆能力来融合来自不同源的序列数据。LSTM全称为长短时记忆网络，是递归神经网络的一种变体，专为处理具有时间依赖性的序列数据而设计。在融合方法中，各个数据源的序列首先分别输入到LSTM结构中。考虑一个序列输入xt，LSTM的更新可以表示为：

ft=σ(Wf[ht-1,xt]+bf)

it=σ(Wi[ht-1,xt]+bi)

Ct=ft⊙Ct-1+it⊙¯Ct

ot=σ(Wo[ht-1,xt]+bo)

ht=ot⊙tanh(Ct)

其中，ft、it、ot分别为遗忘、输入和输出门；Ct和ht是当前时刻的单元状态和隐藏状态；W和b为权重和偏置；σ是Sigmoid激活函数，⊙表示逐元素乘法。

当各个数据源的序列通过LSTM处理后，其输出隐藏状态ht可以被视为该数据源在时刻t的特征表示。这些特征表示随后可以通过各种方法进行融合，如简单的加权平均或更复杂的神经网络结构，从而得到一个综合的序列特征表示。这种基于LSTM的融合方法能够充分捕捉序列数据的时间动态和多源数据的互补信息。

（2）基于卷积网络的序列数据融合

基于卷积网络的序列数据融合方法利用卷积神经网络（CNN）的局部感受野和权重共享特性，从时序数据中提取局部模式和特征。卷积操作可以捕捉数据中的短期依赖关系，而池化层则可以降低数据的维度并提取关键信息。

考虑一个输入序列x的一段，卷积操作可以表示为：

ci=σ(W*x[i:i+k]+b)

其中，W是卷积核，k是其大小，*代表卷积操作，σ是激活函数，b是偏置项。在融合过程中，各个数据源的序列首先经过卷积层进行特征提取，得到的特征图可以通过池化操作进一步处理：

pj=max(c[j:j+p])

其中，p是池化窗口的大小，上述操作是最大池化。

经过卷积和池化操作后，各个数据源的序列被转化为一组特征图。这些特征图可以进一步通过全连接层或其他融合策略进行整合，从而得到一个综合的特征表示。基于卷积网络的序列数据融合方法利用了卷积网络在处理格点数据（如图像和时序数据）上的优势，能够有效地捕捉多源数据的局部模式和全局结构[4]。

4 结语

综上所述，电气设备多源数据具有其独特的特点，如异构性、动态性和相关性。为了有效地处理和利用这些数据，深度学习技术提供了一系列融合方法。自动编码器、注意力机制、多任务学习以及卷积神经网络等方法在多源数据融合中都展现了其出色的性能。这些方法能够捕获数据中的复杂模式和结构，确保数据的完整性和一致性。随着技术的进步和研究的不断深化，预期未来会涌现更多的多源数据融合技术，为电气设备数据分析和应用提供更多的可能性。