APP下载

基于LSTM单特征输入的短波可用预测研究*

2019-11-28尚教凯张海勇

舰船电子工程 2019年11期
关键词:短波数值频率

尚教凯 张海勇 徐 池 徐 铭

(1.海军大连舰艇学院信息系统系 大连 116018)(2.大连长兴岛经济区中小学素质教育实践基地 大连 116317)

1 引言

短波通信在舰船通信保证方面具有重要意义。科学技术的不断进步推动着短波通信向着建链速度更迅捷[1]、数据传输容量更大的方向发展,但实现准确的短波通信频率预测是制约着远程短波通信质量提升的关键问题。ITS-HF系列短波频率预测软件虽然能够实现复杂链路程序化[2],但该系列预测软件的输入条件过于苛刻,且局限性较强,使其应用于保障舰船通信质量中的效果不好[3]。短波频率作为典型的非线性时间序列,有学者基于模糊小波、神经网络、混沌理论等算法对时间序列预测开展研究,任淑婷采用模糊小波神经网络方法对短波频率进行预测,预测后的相对误差在9%左右[4~5],但工程实现的难度较大[6]。

传统的人工神经网络通过人工进行特征提取的方式进行模型训练,但随着“大数据”的提出,人工建立模型中的效率及容错率低、扩展升级慢等问题暴露了出来,传统的人工神经网络方法并不能适用于挖掘大量数据的特征。

深度学习采用“逆向思维”方式,以大量数据为基础,借助神经网络能够自主学习的特点,通过不断的反复学习历史数据并优化,拟合出最优的一个模型。其中LSTM(Long Short-Term Memory)长短期记忆人工神经网络非常适合于非线性时间序列上的数据特征提取。

本文介绍几种时间序列算法,并通过模型仿真对比,得出适用于短波可用预测的算法。

2 算法介绍

2.1 移动平均法

移动平均法是使用最近的实际数值来预测后续时间数值的方法,主要用于即时短期预测。它的原理是在时间序列固定长度的集合中取平均值,并逐项推移,依次计算,也就是在预测每个新的后续时间时,会将集合中最早的数值删掉,并将要预测值得上一个预测值或实际值添加到数值集合中,从而实现通过移动平均来消除时间序列中的不规则变动和其他变动,从而预测出时间序列的长期趋势。

2.2 ARIMA模型介绍

ARIMA模型(Autoregressive Integrated Moving Average model)也叫做差分整合移动平均回归模型,是在自回归模型(AR)、移动平均模型(MA)、自回归移动平均模型(ARMA)基础上的扩展[7]。

1)自回归模型

自回归模型主要描述当前数值与历史数值间的关系,重点是要确定阶数 p,即自回归项数。公式如下。

公式中,yt是当前数值,μ是常数,p是阶数,ri是自相关系数,et是误差。

2)移动平均模型

移动平均模型主要描述自回归模型中误差项的累加,重点是阶数q,即滑动平均项数。公式如下。

3)自回归移动平均模型

自回归移动平均模型为AR和MA两个模型相结合,公式如下。

4)ARIMA模型

将ARMA模型和差分法结合,就得到了差分自回归移动平均模型ARIMA(p,d,q),其中d是使之平稳所做的差分次数。公式如下。

其中,L是滞后算子(Lag operator),d∈z,d>0。

2.3 LSTM模型介绍

LSTM(Long Short-Term Memory)长短期记忆人工神经网络是深度学习算法中RNN(Recurrent Neural Network)递归神经网络的变型。首次由Hochreiter&Schmidhuber[8]提出,随后由 Alex Grave进行改良,实现时间序列中能够记住长期历史信息,并避免长期依赖问题。

LSTM依靠三个门来实现相应的功能。

1)忘记门

该门通过查看ht-1和xt(即上一个输出以及当前输入),并为Ct-1(上个细胞状态)输出0或1的数字。1代表“完全保留”,0代表“完全丢弃”。从而决定在细胞状态里将哪些信息丢弃。计算公式如下。

2)输入门

该门分两步来实现决定哪些信息会被存储。第一步由sigmoid先决定哪些值准备更新,然后通过tanh层创建向量C͂t并将该向量加到细胞状态中。计算公式如下。

第二步将细胞状态更新,即Ct-1更新为Ct。计算公式如下。

3)输出门

运行sigmoid函数确定要输出细胞状态中的哪部分,再通过tanh函数与sigmoid函数的输出相乘,从而输出决定输出的信息。计算公式如下。

3 算法效果对比

3.1 模型输入

由于无法提供足以支撑建模需求的远距离两点间可用频率的样本数据,本文采用ITS-HF软件中RE533模型导出的两点间最高可用频率(MUF)的数据对基于LSTM的远程短波可用频率预测方法进行验证研究,数据由两部分组成,一部分是由2014年8月31日0900至2015年3月1日0800的跨度半年,间隔1h的时间,另一部分是北京市石景山区与福建省福州市台江区两点间通信的最高可用频率的数值。以上两部分组成了4368组该时刻最高可用频率的样本数据集合,该数据是从ITS-HF系列软件中的RE533模型中导出来的,以MUF的数值为研究对象,数据如下。

表1 MUF(两点间最高可用频率)数据情况

运用此数据样本进行短波最高可用频率规律的研究,由于数据较多,图像显示过于密集不便于观看,这里以前200组数据为例,其变化趋势如图1所示。

图1 前200组MUF变化趋势

从图1中可以观察出来,MUF每天变化受电离层影响是较大的,但相邻两天的变化趋势近似,并且连续几天内相对稳定,这与澳大利亚柯顿(CODAN)公司的NGT自优化短波电台的CALM系统的核心原理是相符的,即短波的传输条件在一天之中变化很快,但是在几天之内是相对稳定的,所以,在过去几天的同一时刻获得的链路质量数据,比当天几小时前获得的数据要更加重要[9]。

3.2 模型设计

本文仿真模型均由Python平台实现,为满足Python平台读取输入数据的要求,将样本数据存储为.csv文件,并在读取文件后将数据进行预处理,即样本数据中的MUF列的数组转换为数据集矩阵,之后将数据集进行标准化处理,使得数据在0~1之间,消除奇异样本产生的不良影响,提升模型的计算效率。标准化处理后的数据集分成训练集和预测集两部分,前4000组数据作为训练集,后368组数据作为预测集,先由训练集对模型进行训练,再通过训练后的模型针对训练集最后时刻时间之后的368h的MUF数值进行预测,预测结果与预测集中的实际值做均方根误差,并将过程可视化为图表,将均方根误差和图表的对比作为分析算法效果的依据。

3.3 结果分析

各模型运行后的结果如图2~4所示。

图2 移动平均法模型仿真结果

图3 ARIMA模型仿真结果

图4 LSTM模型仿真结果

图中蓝色部分为训练集部分,黄色部分为预测集中的实际值,绿色部分为预测集中的预测值。图4中由于数据密集,且拟合效果较好,分不清实际值与预测值,截取预测集片段如图5所示。

图5 LSTM模型中预测集截取片段

各模型的均方根误差及运行时间如表2所示。

表2 各模型运行的均方根误差及时间

从图表中可以观察出来,移动平均法运行速度最快,但结果不理想,只能大概预测出上升或下降的趋势,而且存在延迟;ARIMA模型运行时间最长且并没有较好地预测出结果;LSTM模型运行时间较快,预测结果最为理想,误差很小。

可以得出移动平均法及ARIMA模型并不适用于时间半年,间隔一小时为样本数据的短波可用频率预测。

4 结语

本文根据电离层变化的非线性特点,结合深度学习擅于发掘非线性关系的特性,将LSTM模型引入到短波通信频率预测中,充分利用历史的经验数据,用模型算法实现对未来约20天的每小时间隔的点对点间远程短波通信可用频率的预测。通过几种时间序列算法的建模对比,结果表明在时间跨度半年,间隔一小时为样本数据的短波通信可用预测中,深度学习的LSTM模型运行时间较快,结果最为精准,更适用于进行两点间最高可用频率预测。

猜你喜欢

短波数值频率
区块链和边缘计算驱动的短波电磁频谱管理新架构
体积占比不同的组合式石蜡相变传热数值模拟
数值大小比较“招招鲜”
处理器频率天梯
舰船测风传感器安装位置数值仿真
铝合金加筋板焊接温度场和残余应力数值模拟
某型机载短波电台干扰其他系统工作故障分析
振动与频率
人防短波数据通信现状与发展
无线电频率的特点