APP下载

基于机器学习的波数据分析处理方法

2019-11-18褚冬生李光耀肖庆国

电子技术与软件工程 2019年18期
关键词:傅里叶浅层机器

文/褚冬生 李光耀 肖庆国

1 波数据

波数据是指无法使用传统工具或方法进行分析处理的,以信号为载体或可以表征为波动形式的数据集合。作为一种特殊的大数据,波数据涵盖了声音数据、心电图数据、地震波数据和工业传感器数据等具有明显振动特征的数据。波数据的结构复杂、数量庞大、增长迅速,具有复杂性、多样性、间接性等特性,不能直接利用传统的统计等分析方法,需要利用纵向信息对数据进行分析。

波数据的来源是多方式多途径的,大体可概括为:

(1)自然界中的振动产生的波动数据;

(2)医疗过程中采集到的具有波动特性的人类生命体征数据;

(3)工业生产制造过程中产生的、由传感器采集到的具有波动特性的数据;

(4)大量离散数据统计后形成的具有波动特征数据。

海量的波数据隐藏着大量信息,结合波数据的特性与机器学习方法来挖掘波数据的内在信息价值是大数据时代下的一种创新和应用。

2 机器学习

机器学习是人工智能领域中最能够体现智能的一个分支[2]。1956年,在达特茅斯会议上,阿瑟 萨缪尔提出了“机器学习”概念,将其定义为“不显式编程地赋予计算机能力的研究领域”。机器学习致力于研究如何通过计算的手段,利用经验来改善系统自身的性能。机器学习的主要内容是从数据中产生模型的算法。在大数据时代,巨大的数据储量和高效率的计算设备使得以神经网络为代表机器学习算法展现出卓越的性能。

如图1所示,机器学习的完整周期由4个阶段构成:

(1)定义目标问题;

(2)整理数据集;

(3)建立模型,调节参数;

(4)模型测试。

3 波数据处理方法

自然语言处理中的文本数据经过onehot[3]或word2vec[4]处理后才可以作为机器学习模型的输入,计算机视觉中的图像数据需要经过多层卷积[5]操作才能得到表征图像的语义向量。与自然语言处理领域和计算机视觉领域中的数据处理过程类似,波数据也需要经过数据预处理提取特征后才可以作为机器学习模型的输入数据。

3.1 波数据的特征提取

基于波数据具有的连续性、波动性以及周期性等特性,我们采用信号分析领域中的处理方法对波数据进行预处理。

3.1.1 傅里叶分析方法

傅里叶分析(Fourier analysis)是分析学中的一个重要分支。通过傅里叶变换,可以将任何连续测量的波形数据,分解成为为不同频率的正弦波信号的无限叠加。傅里叶变换公式如下:

其中t是时间,i是变换因子,F(ω)是f(t)的像函数,f(t)是F(ω)的像原函数。

正弦波形是成分最为单一的一种波形,任何一种正弦波形都可以用振幅、相位和偏距表示。通过对原始波数据进行傅里叶分析,得到多组振幅、相位、偏距的线性组合向量作为原始波数据的特征表达。

3.1.2 小波分析方法

与傅里叶分析方法相比,小波分析(Wavelet analysis)是频率的局部化分析,聚焦信号的任意细节的效果,可以解决傅立叶变换在处理波数据时造成的时间信息丢失的问题。

图1:机器学习的完整周期

表1:波数据处理过程主要使用的浅层学习模型

表2:波数据处理过程中使用的深度学习模型

小波变化公式如下:

其中s表示范围,p表示位置,t表示时间。对于保留时间信息的波数据,使用小波分析方法分析后可得到一系列关于时间-范围的小波信号组合,将这些小波信号通过傅里叶分析得到的特征向量加权组合,即可得到原始波数据的特征表达。

3.2 机器学习算法模型

按照机器学习算法模型的计算复杂度,可以将机器学习算法模型分为浅层学习模型和深度学习模型。

3.2.1 浅层学习模型

浅层学习模型在结构上基本可以看成带有一层隐层结点如支持向量机(SVM)模型、集成学习(Boosting)模型,或不带隐层结点如线性回归(Linear Regression)模型和决策树(Decision Tree)模型。浅层学习模型可解释性强,在小样本的数据集上泛化性好。波数据处理过程主要使用的浅层学习模型如表1所示。

3.2.2 深度学习模型

深度学习通过建立具有阶层结构的人工神经网络(Artificial Neural Networks)实现端到端的监督学习或无监督学习。Rosenblatt[6]在1957年提出的单层神经网络又称感知器是第一个具有学习能力的人工神经网络,结构如图2所示。g表示z1和z2的激活函数,a1到a4表示输入神经元的数值,W11到W22分别表示每条连接上的权值。

图2:单层网络结构图

单层神经网络可以拟合任意的线性函数,但无法拟合如异或运算等非线性函数。在单层神经网络中添加中间隐藏层成为深度网络来加强神经网络的拟合能力。

随着计算机运算能力的飞速发展,深度神经网络模型的发展也越来也快。2012年提出的AlexNet[7]由5层卷积层与3层分类层构成,并获得了当年的ImageNet图像识别比赛的冠军;2014年由牛津大学的视觉几何组(Visual Geometry Group)和Google DeepMind公司合作研发的VGG-Net[8]证明了网络的深度是决定模型能力优良的关键部分;2016年何恺明、任少卿等提出的ResNet[9]网络模型解决了深层次网络模型中的梯度消失问题。波数据由于其固有特性,在处理过程中我们使用的深度学习模型如表2所示。

4 结语

波数据作为一种特殊的大数据,具有一些大数据的特征,如:大量性、多维性(时间、空间)、实时性[10],同时又因为数据单调导致价值密度低。因此,相较于传统大数据如图像大数据、文本大数据的分析处理方法,波数据的分析处理方法在数据的特征提取部分存在着很大的不同。由于波数据与信号数据的特性具有较高的相似性,本文采取了信号分析领域的信号处理方法来实现特征提取。机器学习算法模型的选择则需要综合考虑算法任务,数据集的规模、及计算资源、任务时间要求等外部

因素后选取适合的算法模型。

猜你喜欢

傅里叶浅层机器
机器狗
机器狗
基于浅层曝气原理的好氧颗粒污泥的快速培养
双线性傅里叶乘子算子的量化加权估计
基于小波降噪的稀疏傅里叶变换时延估计
未来机器城
浅层地下水超采区划分探究
基于傅里叶变换的快速TAMVDR算法
包气带浅层地热容量计算方法商榷
快速离散傅里叶变换算法研究与FPGA实现