面向发电设备预测性维护的传感数据特征抽取方法
2018-01-22张守利韩燕波
张守利,苏 申,刘 晨,韩燕波
(1.天津大学 计算机科学与技术学院,天津 300072;2.北方工业大学 a.大规模流数据集成与分析技术北京市重点实验室,b.计算机学院,北京 100144)
随着工业生产数据采集技术的日趋完善,工业生产设备的预测性维护日渐成为工业界和学术界讨论的热门话题。一般的讲,工业生产设备的预测性维护指的是利用实时产生的工业生产数据,借鉴数据分析技术分析工业生产设备的运行状态,并进一步预测设备潜在的故障和威胁,从而提高工业设备的可靠性。得益于深度学习近年来的长足发展,深度学习成为工业设备预测性维护的主流方向[6-8]。这类方法将工业生产数据作为神经网络输入,利用设备的经验标签进行网络训练,进而实现在线设备状态监测,发现早期故障,为设备的维护提供预警信号。这类方法的缺点在于,工业生产数据是典型的大数据体量且价值密度往往很低。基于深度学习建立预测模型时,如果输入神经网络的数据量不足,则预测效果不好,如果输入神经网络的数据量过多,则大大增加学习成本,使得模型的计算开销难以负担。
应用深度学习算法解决发电厂的设备预测性维护的一个重大挑战是大量部署的传感器所引起的数据特征维度过高问题。例如,发电厂中的风烟系统中部署了上千个传感器测点,那么其所产生的数据维度就可达上千个,如此高的数据维度大大增加了神经网络的学习成本。大量研究实践证明,特征降维能够有效地消除无关和冗余特征,提高模型的学习效率,改善预测精确性等。近年来,越来越多的研究者应用特征提取技术对高维数据进行降维。主成份分析(PCA)作为常用特征提取方法,被广泛用在众多的研究领域中,从高维数据集中提取新的特征变量[15]。PCA从观测变量内部的相互关系来整理信息,将变量加以适当的正交变换依次找出相互关联性高的变量组。将可能相关的原始数据集转换成线性不相关的新的特征集合,实现高维数据向低维的压缩。因此,PCA的提取效果依赖于不同维度数据间的相关性,不同维度的数据相关性越强,降维效果越明显,反之亦反。然而,对于发电厂的传感器而言,由于其天然的特性:不同发电系统的传感器时钟存在差别以及工业设备的运行原理(例如,对于火力发电机组,给煤量增大一段时间后,机组功率会随之提高)导致了数据关联的延迟,从而造成传感器之间的关联性发生改变。
现有降维方法[1-5]一般不关心不同数据之间延迟关联,因而在发电厂中无法直接运用这些方法来有效地实现高价值密度的数据特征提取。面对上述问题,本文提出了一种面向延迟相关的传感数据特征提取方法。该方法利用基于皮尔逊相关系数的曲线排齐算法,调整不同传感器数据之间的时间差,使得调整之后的数据相关性达到最大;然后利用PCA对调整之后的传感数据进行特征提取,从而得到一个容量较小但仍能反映原始特征的数据集;最后,针对电厂设备的预测性维护问题,建立基于深度学习算法的预测性维护模型。利用特征提取之后的新特征数据对模型进行训练。经过实验验证本文所提出的预测模型相对与传统的基于包限值的预测方法具有较高的准确性,同时基于曲线排齐的特征提取方法降低了模型的学习成本,提高了模型的性能。
1 问题定义
本文的研究动机来自于发电厂的真实需求:设备预测性维护。一个发电厂有300多台发电设备,每台发电设备上部署了约40个传感器,用来监控发电设备的运行状态。这些传感器不间断产生了海量的传感数据。发电设备的预测性维护模型则是建立在对海量传感数据进行分析基础上。然而在海量数据上进行复杂的数据分析和挖掘通常需要很长时间,运算量非常巨大。
特征提取就是从原始的数据中提取更加可靠、有效的信息生成新的特征数据,同时使得数据的维度也被压缩[12]。主成份分析PCA是常用的特征提取的方法。其将高维的数据通过线性变换投影到低维空间,从而得到最能够代表原始数据的新特征数据。然而由于发电设备传感器数据之间存在延迟相关,直接使用PCA对传感数据进行特征提取的效果并不明显。
在工业生产领域中,设备之间的相互作用普遍具有先后传递性。例如,磨煤机系统中,存在“给煤机”和“磨煤机”两个设备,给煤机负责将煤块输送到磨煤机中进行粉碎。某一时刻工作人员加大了给煤机输送的煤量,那么当前磨煤机的工作负荷则无法满足给煤机所输送的煤量,需要加大磨煤机的工作负荷。而磨煤机的工作负荷增大之后,磨煤机上的电流会随之变大。根据磨煤机系统的这种运行原理,可以清楚了解到,给煤机和磨煤机之间的相互作用具有时间上的先后传递性。也就是说,在t1时刻增大给煤机的给煤量,磨煤机的电流信号不会立即在t1时刻增加,而是在(t1+Δt|Δt>0)时刻发生改变。因此,在对发电设备的传感数据进行分析时,若不考虑数据之间的时差,则会造成相关性的误判,即认为相关的数据不具有相关性。本文对某发电厂磨煤机系统、风烟系统等主要发电设备上所部署的2123个传感器进行数据采集,采集时间从2014-07-01到2016-01-30,生成了超过30万条数据样本。本文借鉴文献[17]给出的时移序列相关系数的特征对这些传感数据进行相关性分析,发现有1 430个传感器之间存在相关性,其中214对之间存在着延迟相关。这种延迟相关会降低PCA特征提取的效果,也会造成预测模型的不准确性。
为了避免传感数据之间的延迟相关对于特征提取效率的影响,本文提出了一种面向发电设备预测性维护的传感数据延迟相关的特征抽取方法。首先利用曲线排齐算法解决数据的延迟相关问题,然后利用PCA对排齐之后的数据进行特征提取,提取原始数据中的关键特征,降低数据特征维度。最后基于深度学习模型中的LSTM神经网络模型建立设备的预测性维护模型,利用提取的新特征数据进行模型的训练,从而实现设备故障的预测。
2 基于相关性的特征提取方法
2.1 面向延迟相关的曲线排齐
不同的传感器产生的数据之间存在延迟相关。为了减少信息的丢失,提高预测模型的准确性,我们必须首先解决这个问题。曲线排齐算法针对延迟相关的曲线进行排齐,常用的方法主要是期望最大化算法。文献[17]针对时序数据的时差问题,提出了双序列曲线排齐方法。本文借鉴文献[17]中所提出的基于相关系数最大化的曲线排齐方法S-GEM来对传感数据中的具有延时相关的数据进行排齐。其基本思路是计算两个序列X1和X2之间的时间错位函数d(t)=dk(t),基于这个时间错位函数寻找一个时间差Δt=d(ti)使得,X1(t)和X2(t+Δt)的皮尔逊相关系数ρ(X1(t),X2(t+Δt))达到最大。
然而,S-GEM算法面向的是两个序列的时间错位问题。对于多个序列,最能想到的“暴力”解决方法是:先选定一个序列作为参照序列,依次计算其他的序列与参照序列的Δt,从而实现对所有传感器数据的排齐。但是,这种方法存在两个关键难题,一是选择哪个序列作为参照序列;二是,哪些序列有必要进行排齐,对于一些本身就不存在相关性的序列,就没必要进行曲线排齐。
为了解决上述难题,首先将所有的传感器划分到不同的组。假设同一组内的数据具有一定的相关性,因此,对于同一组内的序列,则可以随机选择任何一个作为参照序列而不会影响排齐的效果。
4) 更新v的值,重复步骤1)直到分组中的元素不再发生移动。
算法1实现了曲线排齐的过程。
算法1 曲线排齐算法SAlinement输入:原始传感器数据SensorData,K-Means聚类簇个数k输出:新的数据组成的分组ClusterAssement1.VarDataSet=LoadDataSet(SensorData);//加载传感数据,2.VarClusterAssement=Kmeans(DataSet,k);//初始化聚类算法3.For(VarSensorinDataSet){4. VarPearsonSet;//当前传感器与所有分组的相关系数集合5. For(VarClusterinClusterAssement){6. VarR=Cluster.GetReference();//每个分组内的参照曲线7. VarΔt=G-SEM(Sensor,R);//计算错位时间8. If(Δt!=0){9. VarNewSensor=Alinement(Sensor,Δt);//曲线,返回排齐后的曲线10. VarCoefficient=Pearson(NewSensor,R);//计算排齐之后的曲线与参照曲线的相关系数11. PearsonSet.put(index,Coefficient,NewSensor);//存放当前分组的索引号,相关系数}VarMaxPearson=PearsonSet.GetMax();//获取最大的皮尔逊相关系数12. Varoindex=ClusterAssement.getIndex(sensor);//查询传感器初始所在的分组13. VarNcluster=ClusterAssement[Maxperson.index];14. If(oindex!=MaxPearson.index){15. VarOcluster=ClusterAssement[oindex];16. Ocluster.remove(Sensor);17. Ncluster.add(MaxPearson.NewSensor);}18.returnClusterAssement;}
利用算法1会得到不同的分组,同一组内的传感器数曲线之间都具有最大相关性,而且这些分组中的数据不再存在延迟相关的时间错位问题。
2.2 基于PCA的特征提取
主成份分析(PCA)算法是一种典型的统计数据分析方法,是在原始数据集中抽取最有价值特征的一种有效方法。PCA会对新求出的“主元”向量的重要性进行排序,根据需求提取前m个“主元”向量,从而达到降维的效果,同时也最大程度保持了原有数据的信息。
定义一个具有n个观测值的数据矩阵X.这个矩阵由p个维度的随机变量构成。每个维度都代表了一个传感器,如下式。
X=x1,x2,x3,…xP.
利用PCA进行特征提取目的是找到一个新的数据矩阵Y=Y1,Y2,…,Ym,(m≤p)来代表原始数据矩阵。它满足Cov(Yi,Yj)=0,i≠j,i,j=1,2,…,m和Var(Y1)≥Var(Y2)≥…≥Var(Ym)Cov(Yi,Yj).其中Cov(Yi,Yj)是Y中的成份之间的协方差,表示Y中的每个成份都是相互独立的。Var(Yi)是主成份的方差,表示了每个成份的重要性,每个成份的重要性在Y中依次递减。
算法2实现了利用PCA进行特征提取的过程。
算法2 特征提取算法PCAModel.输入:传感器数据SensorData,数据的维度H,特征提取之后的特征维数信息含有量阈值输出:新的特征数据ReconMat1.VarDataMat=loadDataSet(SensorData);//加载数据传感数据,生成数据矩阵2.For(vari:H){3. VarMeanVals=mean(DataMat[i]);//数据矩阵每一列特征均值4. VarMeanRemoved[i]=DataMat[i]-MeanVals;}//数据矩阵每一列特征减去该列的特征均值5. VarCovMat=Cov(MeanRemoved[i]);//计算协方差矩阵6.VarEigVects=linalg.eig(mat(conMat));//计算协方差矩阵的特征向量7.VarEigVals=linalg.eig(mat(conMat));//计算协方差矩阵的特征值8.VarExplainedVariance=Argsort(EigVals);//对每个特征向量的贡献度由大到小排序9.For(VarxinExplainedVariance){10. sum+=x;11. topNfeat++;//记录特征矩阵的索引的最大值12. if(sum>?)//获取总贡献度大于?的13. break;}14.For(Vari=0;i 对于给定设备的历史特征数据和标签,预测模型输出设备将来会发生故障的概率。给定概率阈值φ,如果预测模型的输出数据超过阈值φ,那么认为这是一个故障即将发生的信号。故障发生的概率计算依赖与相当长的一段时间的历史记录与趋势,传统的有监督学习算法只是简单的把输入序列作为独立的特征,不能捕获到序列之间的时间依赖性。 循环神经网络(RNN)可以被看作一种深度学习的神经网络。不同于前馈神经网络,它的内部状态不仅仅依赖于当前的输入,还依赖之前的网络状态。循环神经网络模型以其更高的非线性能力、更高的精度和收敛速度,非常适合处理带有时间信息的序列数据。但是传统的RNN是不能长时间的存储之前的输入信息,而长短时记忆(LSTM)神经网络引入记忆元,通过控制门可以控制新到的信息对神经元已保存信息的扰乱程度,从而使得LSTM模型可以学习长期依赖信息,较长时间的保存并传递信息。LSTM 已经成功的用在了各种的序列建模任务中[4]。本文使用LSTM的神经网络为发电设备建立故障预测模型。把设备的故障预测问题定义为一个二分类问题,LSTM所建立的预测模型的输出yt本质上也是一个二进制向量,表示设备的状态。也就是说,LSTM输出目标dt是一个具有2个类别的二进制向量dt∈{0,1},其中用1表示故障标识,0表示正常运行标识。 本文用LSTM循环神经网络建立设备的故障预测模型。输入序列为长度为L的特征向量序列x=(xt-L+1,…,xt),这些特征向量通过加权连接被传递到一堆多个循环相连的隐藏层,以计算隐藏的向量序列h=(ht-L+1,…,ht).输出向量为y=(yt-L+1,…,yt). 为了验证上述算法的有效性,笔者基于真实的电厂设备传感器数据,对照历史故障日志记录,实现本文所描述的算法,确定相应的实验指标,验证方法的可行性以及有效性。 本文的Spark集群采用基于Yarn的资源调度模式,由5台装载CentOS release 6.4系统,Spark-2.1.0以及Hadoop-2.7.0软件的服务器搭建而成,内存主节点配置6 GB,从节点机器配置为3 GB,其他硬件配置均相同。 实验中使用的数据集来自发电厂的真实传感器数据。利用发电机组中的5个重要设备所产生的传感数据进行实验验证,具体信息见表1.其中每个传感器每秒产生2条传感数值,对原始数据进行频率为每3 min的采样,最终生成本文所用的实验数据。数据的时间从2014-07-01 00:00:00到2016-01-31 23:59:59.以电厂设备的真实维修检测记录,作为实验结果的参照对比对象。表1中的故障发生次数表示当前设备所发生故障的次数。 表1 实验数据信息表Table 1 Information of data set in experiment 利用上述数据利用文本算法进行实验验证,通过比对历史日志记录分析实验结果,使用准确率和召回率对本文算法的有效性和性能进行评价。 准确率(Precision):准确率代表预测的故障有多少是准确的,准确率越大说明预测的精度越高。 召回率(Recall):召回率代表有多少正确的故障被预测出。 本文利用表1中的数据作为实验的数据集,其中前80%的数据作为训练数据,剩下20%的数据作为测试数据。 以下4个预测模型作为本文实验的对照方法。 T-Method:表示电厂现有的预测模型,是基于传感器包限值的预测方法。实时监控单个传感器的数值变化,如果单个传感器的数据超过了初始设置的上限包限值或者低于下限包限值,则认为发生了故障预警信号。 LModel:把采集到的原始传感器数据直接输入到LSTM网络的设备预测模型中。 SModel:使用PCA对采集到的原始传感器数据进行特征提取,新生成的特征数据输入到LSTM网络的设备预测模型中。 P-LModel:本文所提出的方法。先对原始传感器数据执行曲线排齐,再由PCA进行特征提取,最后把生成的新数据输入到LSTM的网络预测模型中。 使用电厂现有的故障日志记录作为正确的结果集。利用3.2中所定义的实验指标验证本文方法的正确性与有效性。共计执行了10次训练预测过程,记录每次实验的准确性与召回率,最后求取所有实验的平均值,实验结果如图1所示。 从图1中可以看出,传统的基于包限值的预警方法的准确率平均为53%,召回率平均为47%.而基于深度学习的方法的准确率平均75%,召回率平均为83%.这说明使用深度学习的预测方法比传统的基于包限值的预测方法有效。因为基于包限值的预测方法必须是数据发生了明显的异常之后才会检测到对应的异常,而基于深度学习的预测方法能够学习数据本身隐含的数据趋势,在数据发生越线之前就能做到提前预警。 此外,通过图1可以看出,LModel由于采用的是原始数据集进行的训练与预测,其准确率与召回率最高,SLModel与P-LModel的准确率和召回率稍低于LModel.主要是由于PCA进行特征提取之后,新生成的数据较原始数据来说丢失了少量的信息,影响了模型的准确率和召回率。但是本文的P-LModel由于在执行PCA之前对延迟相关的数据进行了排齐的处理,使得降维之后的数据在相同维度下的信息量得到了提高,所以其准确率和召回率均高于SLModel。且对比LModel来说,二者之间的差距十分微小。证明了本文方法的有效性。 图1 不同设备的实验结果Fig.1 Precision and recall for different equipment 图2展示了使用LModel,SLModel以及P-LModel进行模型训练的平均时间。其中LModel的平均训练时间为3.04 h.SLModel的平均训练时间为2.23 h,而P-LModel为2.1 h.其中包含了对数据进行预处理的时间。对比发现,经过特征提取之后大大降低了数据的维度,大量减少了训练的数据量,使得训练时间得到减少。比较SLModel和P-LModel,在相同的信息含有量的前提下,利用本文的特征提取方法得到的新的特征数据维度要比直接使用PCA进行特征提取之后的数据维度小,因此模型的学习时间也稍低于SLModel.以磨煤机A为例,原始的数据特征有49维,在保证信息含有量为98%的前提下,经过本文的数据预处理之后,提取后的特征维数降为9维,而直接进行PCA计算的特征维数为14. 图2 不同设备的模型训练时间Fig.2 Training time for different equipment 实验表明利用文本的特征提取方法对模型进行预测,大大提高了模型的学习效率,且相对于利用原始数据进行预测的方法来说,准确率与召回率之间的细微下降也是位于可接受范围内。 特征提取是利用机器学习或者人工智能方法进行建模之前常用的数据处理步骤。文献[1]借鉴有监督回归算法,实现了一种监督综合特征提取[2-3]方法,利用功能性的学习范例对时间序列类型的输入转换为标量的输入学习问题进行建模。实际上忽略了特征提取的阶段。文献[4]为复杂的IT系统提出了一个日志驱动的故障预警系统,能够自动的从IT系统的日志中自动提取特征,通过发现历史数据中的长期结构,利用LSTM方法实现早期故障预测。KIMURA et al[6]采用张量分解法,提出了一个网络日志数据建模和事件提取方法。虽然上述的研究方案能够自动的从日志文件中提取出特征,但是这些方法也不适用与本文的特征提取问题。原因有两方面,一方面,上述方法中的日志文件中的格式都是预先定义好的,所以相对容易提取到它们的特征和模式。而本文所面临的传感数据是无组织的,需要深度挖掘数据背后隐含的特征与模式;另外一方面,上述研究问题中的故障发生时间相对清楚,所以用来标签处理的日志文件是有效的,利用其建模的结果也是相对准确的。而本文所面临的故障记录是人工的,所以无法确保故障发生时间的准确性,这对于标签的处理是一个挑战。 基于机器学习的预测性维护方法是最为流行的设备故障预警手段。一些学者利用常用的机器学习模型,从线性判别分析到更复杂的逻辑回归分析以及神经网络等被用来进行预测[7]。KIMORA et al[5]采用监督机器学习技术,将网络故障与网络日志数据关联,建立基于日志生成模式的在线模板提取方法来表示异常的日志。文献[8]利用人工智能向后传递神经网络为异常的机器建立了一个预测模,从而提高了半导制造业的整体的产品质量与产量。文献[9]建立一个多分类机器学习方法来处理预测性维护分类问题中数据集的不平衡。文献[10]基于模糊逻辑理论,建立了一个决策系统,能够判定缝纫机针的生命使用期,从而可以为缝纫机针确定一个可预测性维护的方案。数据流处理系统上的在线故障预测[11]是基于对系统状态的观测值。这个方法使用了含有三个分类器的决策树,适用于在线的设置,能够在必要触发。文献[12]利用短时傅里叶变换(STFT)预处理传感信号。基于一个简单的频谱矩阵和深度学习框架,建立了一个大内存存储检索神经网络来诊断轴承的故障。文献[13]分析了振动信号来提取轴承的行为模式,利用一些机器学习的模型,例如K-NN,SVM和K-means对故障类型进行分类,然后利用协同推荐(CRA)来分析所有模型输出结果的相似性,从而实现提前建议。上述文献都在一定的程度上解决了预测性维护的问题,但是他们的方法无法直接应用在发电厂的设备预测维护中,一方面是因为电厂发电设备的传感器数量超过一万个,其不断产生的数据属于“宽”且“高”,此外传感器的天性使得不同的传感器数据之间存在着时间上的错位,而上述文献中所使用的数据集维度相对较低,同时没有考虑到时间错位;二是上述的解决方案依然主要依赖于专业的领域知识,而发电厂的生产环境十分复杂,对于开发人员来说,实现对专业领域知识的学习是一个很大的成本与负担。 本文针对发电厂海量传感器数据的特征维度过高对于预测性维护模型的挑战,以及对海量高维数据特征过程中遇到的传感器数据延迟相关性问题,提出了一种基于曲线排齐的特征提取方法,从高维的数据特征中提取关键的新特征。首先借鉴基于数据相关性最大的曲线排齐方法对传感数据排齐,从而解决传感数据的延迟相关。然后利用经典的特征提取算法-PCA进行特征提取。提取之后的新特征维度得到降低,同时所包含的信息量并没有减少依然能够很好的反映设备的状态信息。最后使用深度学习模型:LSTM神经网络,建立设备的预测性模型。实验表明,相对于传统的基于包限值的预测方法,本文所提出的方法能够提高预测的准确度,而基于曲线排齐的特征提取方法在保证了预测准确性的同时降低了模型的训练时间。 [1] SUSTO G A,BEGHI A.Dealing with time-series data in Predictive Maintenance problems[C]∥IEEE International Conference on Emerging Technologies and Factory Automation.2016:1-4. [2] SCHIRRU A,SUSTO G A,PAMPURI S,et al.Learning from time series:Supervised aggregative feature extraction[C]∥Decision and Control (CDC).2012:5254-5259. [3] SUSTO G A,SCHIRRU A,PAMPURI S,et al.Supervised aggregative feature extraction for big data time series regression[J].IEEE Transactions on Industrial Informatics,2016,12(3):1243-1252. [4] ZHANG K,XU J,MIN M R,et al.Automated IT system failure prediction:A deep learning approach[C]∥Big Data (Big Data),2016 IEEE International Conference.2016:1291-1300. [5] KIMURA T,WATANABE A,TOYONO T,et al.Proactive failure detection learning generation patterns of large-scale network logs[C]∥IEEE Computer Society.International Conference on Network and Service Management.2015:8-14. [6] KIMURA T,ISHIBASHI K,MORI T,et al.Spatio-temporal factorization of log data for understanding network events[C]∥INFOCOM.2014:610-618. [7] WARRIACH E U,TEI K.Fault detection in wireless sensor networks:A machine learning approach[C]∥Computational Science and Engineering (CSE).2013:758-765. [8] LIU Y.Predictive modeling for intelligent maintenance in complex semiconductor manufacturing processes[D].US:The Unversity of Michigao,2008. [9] BABAN C F,BABAN M,SUTEU M D.Using a fuzzy logic approach for the predictive maintenance of textile machines[J].Journal of Intelligent & Fuzzy Systems,2016,30(2):999-1006. [10] GU X,PAPADIMITRIOU S,PHILIP S Y,et al.Online failure forecast for fault-tolerant data stream processing[C]∥ICDE.2008:1388-1390. [11] HE M,HE D.Deep learning based approach for bearing fault diagnosis[J].IEEE Transactions on Industry Applications,2017,53(3):3057-3065. [12] CHANG P C,WU J L.A critical feature extraction by kernel PCA in stock trading model[J].Soft Computing-A Fusion of Foundations,Methodologies and Applications,2015,19(5):1393-1408. [13] HOCHREITER S,BENGIO Y,FRASCONI P,et al.Gradient flow in recurrent nets:the difficulty of learning long-term dependencies[C]∥KREMER S C,KOLEN J F.A field guide to dynamical recurrent neural networks[S.l.]:Wiley.IEEE press,2001. [14] GRAVES A,SCHMIDHUBER J.Offline handwriting recognition with multidimensional recurrent neural networks[J].Advances in Neural Information Processing Systems,2009:545-552. [15] JOLLIFFE IT.Principal component analysis,2nd edn[M].New York:Springer series in statisticsSpringer,2002. [16] SUSTO G A,BEGHI A.Dealing with time-series data in Predictive Maintenance problems[C]∥IEEE.International Conference on Emerging Technologies and Factory Automation.2016:1-4. [17] 姜高霞,王文剑.时序数据曲线排齐的相关性分析方法[J].软件学报,2014(9):2002-2017. JIANG G X,WANG W J.Correlation analysis in curve registration of time series[J].Journal of Software,2014(9):2002-2017.2.3 基于深度学习的设备预测性维护模型
3 实验与评价
3.1 实验环境与数据
3.2 实验指标
3.3 实验与评价
4 相关工作分析
4.1 特征提取技术
4.2 预测性维护
5 结束语