APP下载

基于双注意力机制门控循环单元的光通信采样定时偏差估计方案

2023-06-09廖彦衡雷印杰

现代计算机 2023年6期
关键词:注意力偏差神经网络

廖彦衡,雷印杰

(四川大学电子信息学院,成都 610065)

0 引言

近年来,各种技术的发展使相干光通信成为主流通信手段之一。在光通信过程中,首先由发射机的数模转换器(DAC)调制载波的IQ 分量再传输到接收机。这些IQ 信号在接收机又通过模数转换器(ADC)转换成数字信号[1⁃2]。接收机的模数转换ADC 会产生采样定时偏差,会使相位发生旋转,带来相位误差。所以为了信号能很好地补偿采样定时偏差,消除偏差对信号的影响,需要一种能进行高精度且兼容多种调制格式的估计方案。

对于采样定时偏差,人们已经研究了许多估计方法。然而传统方法的估计结果不够准确,计算比较复杂,对于高带宽和高波特率的光系统中的信号应用场景来说,它们还不太适用[3]。例如,传统时钟误差检测算法之中最为经典的Gardner 定时误差估计方法[4],只能应用于二进制相移键控(BPSK)、正交相移键控(QPSK)两种调制格式。同时在采样率上也受到2倍采样率的限制,每个码元需要两个采样点。另一个例子是基于先导和决策树的光传输方法,它只适用于正交频分复用(OFDM)系统[5⁃6]。随着光通信技术的不断发展,传输距离不断增加和调制方式也持续提升。这些传统的估计方法逐渐无法满足如今传输系统的估计的需要,因为它们普遍存在较大的误差,甚至是不兼容一些调制格式。此外,这些估算方法也比较耗时,会导致存取时间较长。

随着神经网络的不断发展,由于其灵活性和有效性被广泛应用于解决通信网络中的问题[7⁃8]。然而关于利用神经网络来估计采样定时偏差的研究还相对较少。为了解决上述问题中的不足,我们提出了一种DAGRU 网络估计方案,以克服传统估计方法的一些不足。在网络训练过程中,GRU 可以通过门控单元有选择性地遗忘或保留关键信息,以实现对信号序列的有效建模[9⁃10]。同时注意机制也被广泛用于各种网络中,它们会选取对当前任务更关键的信息,给予其更高的权重用于神经网络的特征提取和学习[11]。但目前研究中使用两重注意力机制,来分别关注不同层级的信息的研究还比较少。

所以本文提出了一种双重注意力机制,以更好地提取信号的全局级别信息与群级别信息,从两个层面来分别建立采样偏差与信号序列间的关系,使神经网络估计到更多特征。实验部分对QPSK、16QAM 和64QAM 三种调制格式的信号进行了对比实验,同时也将DAGRU 与其他常见的递归网络进行了比较。DAGRU 模型可以利用信号幅度直接估计采样定时偏差,且对于不同的调制格式,平均绝对误差(MAE)和均方根误差(RMSE)都在0.05 symbol(0.4 ppm)以内。实验结果表明,DAGRU 可以应用于1.25 倍采样率与各种调制格式,而且估计时间短、精度高、鲁棒性强。

1 采样定时偏差原理

在这一节中,主要介绍采样定时偏差以及它产生的原理和数学表达式。当采样频率偏差没有发生时,收发端采样频率都为TS,收端采样点与发端采样点存在固定时间偏差ε。采样定时偏差可以看作是一种符号定时偏移,采样定时偏差的采样间隔为-Ts/2 ≤ε≤Ts/2。由于采样定时偏差是由采样频率完全相同的发射器和接收器产生,但发射器和接收器的采样时间不同,所以会产生相位旋转,进而产生相位偏差。接收器采样时刻与发射器采样时刻固定的偏差如图1所示。

图1 接收器采样时刻与发射器采样时刻固定的偏差图例

接收器含有采样定时偏差的信号为y[n],无采样定时偏差影响的信号为x[n],则采样定时偏差的时域信号和频域信号公式可分别表示为

2 DAGRU网络结构设计

2.1 DAGRU整体框架

含有采样定时偏差的信号是一段序列,且存在一定时序性与前后关联性,所以需要使用在自然语言处理方面取得良好效果的循环神经网络。GRU 是循环神经网络的一种,且具有结构简单、效果优异的特点。同时神经网络可以通过训练自行提取特征用于估计,通用鲁棒性很强。所以我们设置了一个含有双注意力机制加GRU 的神经网络,来学习信号序列中与偏差值有关的特征。其具体结构如图2所示。

图2 DAGRU网络结构

在整个网络结构中,我们为了增强网络对于信号序列的特征提取能力,提升其对序列前后联系性的学习能力,在GRU 网络的基础上更改了网络结构,添加了双注意力机制的结构,这样有助于进一步提升估计的精度。其第一个注意力机制为全局级别注意力机制,第二个注意力机制为群级别注意力机制。信号在输入偏差估计模型前,分为两路处理。一路信号将原始序列进行了简单分组,这是为了保留信号序列中所蕴含的原始特征;另一路则是将信号通过双注意力机制提取特征。再让两路信号组合后送入偏差估计模型。偏差估计模型中的GRU中的门控单元能实现对信息的差异性选择,从而能够对时间序列进行有效建模。实验结果表明,这种网络界结构能使实验获得更高的准确率。

2.2 网络训练设置

本节介绍了网络训练的一些具体参数和设置。采样定时偏差估计采用回归预测的方式,所以我们选择SmoothL1Loss作为损失函数,并将需要估计的采样定时偏差x放入以下公式。

按照公式(3)的推导, 我们可以发现,SmoothL1可以以两种方式限制梯度。当x小的时候,曲线是光滑的,梯度会随着x变小;而当x大时,梯度最大只能是1,不会因为过大而对网络参数造成破坏。当采样定时偏差预测值与标签之间的差值小于1时,SmoothL1的导数就比较小,这使得损失收敛更加稳定和快速。同时,采样定时偏差估计容易出现一些离群值,使用该损失函数可以降低对离群值的敏感性,减少个别信号估计误差大带来的影响,使梯度变化相对较小,在训练过程中损失更加稳健。

同时在估计任务之后,为网络选择Adam 优化器。首采样定时偏差信号序列属于稀疏梯度问题,Adam 使用动量和自适应学习速率来加速收敛,可以适应稀疏梯度,也可以减轻梯度振荡的问题。其次,用于训练采样定时偏差数据量比较大,Adam 适用于大规模数据和参数的场景。然后,信号在传输中可能含有大量的噪声,Adam 善于处理含有高噪声的信号。总之这个优化器计算效率高,对内存要求不高,很适用于此任务。

3 采样定时偏差估计实验

3.1 实验场景分析

光通信中信号传输的实验场景如图3 所示。在Tx 端,一个100⁃Gbaud 的64 QAM、16 QAM和QPSK 信号首先被1.25倍上采样,然后通过一个滚降系数为0.1 的根升余弦滤波器进行脉冲整形。来自DAC 输出的信号驱动IQ 调制器对外腔激光器(ECL)的光源进行调制。在与90°相移混合后,它构成了调制的光信号。该光信号通过单模光纤(SSMF)传输与光带通滤波器(OBPF),相干检测接收。其中激光线宽被设定为50 KHz。在Rx端施加了范围为-0.5~0.5 symbol(-4~4 ppm)的采样定时偏差。在DSP 过程中利用训练好的DAGRU模型,进行定时偏差估计。

图3 基于DAGRU的STO估计方案的原理和实验场景

3.2 实验数据预处理

在接收端的仿真信号数据中施加了采样定时偏差,范围为-0.5~0.5 symbol(-4~4 ppm)。每个数据的数据长度为2000,包含一个随机的采样定时偏差值。总共对150000 万组数据进行训练,30000组数据用来验证,20000用来验证。数据详细参数见表1。

表1 光信号数据集

在实验中,网络不能直接从信号序列的实部和虚部学习和提取特征。为了使网络更好地提取特征,我们在探究实验中计算了信号的幅度和相位信息送入网络。实验发现幅度信息有助于网络建立采样定时偏差值与幅度值之间的联系。所以所有数据都需要进行计算幅度这项预处理,然后将幅度送入神经网络进行训练。设信号序列为x(n),xR(n) 代表信号实部,xI(n)代表信号虚部,其幅度计算公式如下。

3.3 不同神经网络对比实验

本实验数据主要使用了表1 中调制格式为64 QAM 的数据。将这组数据计算幅度后分别送入DAGRU,LSTM 和FCNN 三种神经网络进行对比实验。计算它们在不同采样定时偏差下的MAE和RMSE,结果如图4所示。

图4 不同神经网络STO

可以看见,此任务中FCNN在两端进行偏差估计误差较大,LSTM 效果也略差于DAGRU。DAGRU 网络在此任务中估计效果最为稳定,信号在-0.4~-0.5 symbol 和0.4~0.5 symbol 这两端也没有明显估计偏差,MAE 与RMSE 误差均在0.05 symbol 以内,其准确率明显高于LSTM 与FCNN。此实验说明了双注意力机制加递归神经网络适用于信号这种具有前后关联性的序列,能很好地建立采样定时偏差与信号序列幅度之间的关系。

3.4 不同调制格式对比实验

上述对比试验,证明了DAGRU 网络在采样定时偏差估计任务中效果的优越性。这一节我们对DAGRU 进行了不同调制格式的对比试验,以研究在不同调制格式下神经网络的泛化能力,证明其可以运用于多种调制格式。本实验数据主要使用了表1中调制格式为64 QAM、16 QAM和QPSK 的数据。将这三组数据计算幅度后分别送入DAGRU网络进行对比实验,观察调制格式升高带来的影响。

我们对64 QAM、16 QAM 和QPSK 三种调制格式下的误差曲线进行比较,结果如图5所示。

图5 不同调制格式STO

三种调制格式下MAE 与RMES 数值都很低,均小于0.04 symbol,说明DAGRU 方案性能出众。其中,随着QAM 格式的升高,在载波上利用幅度和相位表示的bit 位越多, 其MAE 与RMSE会随之提升,说明调制格式的升高对误差估计精度产生了一定的影响,但整体估计精度并没有明显的下降。实验说明DAGRU 在QPSK任务上估计精度很高,16 QAM 与64 QAM 的MAE 与RMSE十分相近,也取得良好的估计效果,这说明了DAGRU估计方案可以适用于64 QAM等高阶调制格式,且效果良好。

为了更直观地观察DAGRU 在采样定时偏差任务上估计的效果,我们绘制了采样定时偏差预测情况的散点图,从图6可以看出三种信号的测试样本都是高精度预测的,没有严重偏离的离群点和严重影响MAE 的样本。通过不同调制格式的对比,QPSK 信号预测最精确,16 QAM与64 QAM预测效果接近。

图6 STO散点预测图

4 结语

本文提出并通过实验证明了一种用于多种调制格式信号的相干光通信系统采样定时偏差估计的智能化机器学习方案,在相干光通信的接收端利用DAGRU 算法模型对采样定时偏差进行估计。实验结果表明,本文提出的含有双重注意力机制的DAGRU 网络估计的准确率远高于LSTM 和FCNN。DAGRU 对于信号序列具有良好的采样定时偏差估计能力与鲁棒性。在QPSK、16 QAM 和64 QAM 实验中,根据MAE和RMSE 两大回归评价标准,提出的方案可以在0.05 symbol 精度范围内估计准确绝大部分介于-0.5~0.5 symbol 区间的信号,且没有误差很大的离群点。随着光通信系统传输容量的增加,带宽需求也不断增高。该方案对光接入系统中的采样定时偏差估计任务提供了一种新的智能化高精度方法,也提供了一种利用神经网络解决光通信信号噪声问题的思路。

猜你喜欢

注意力偏差神经网络
让注意力“飞”回来
如何走出文章立意偏差的误区
两矩形上的全偏差
神经网络抑制无线通信干扰探究
“扬眼”APP:让注意力“变现”
A Beautiful Way Of Looking At Things
基于神经网络的拉矫机控制模型建立
关于均数与偏差
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定