基于深度学习的两跳放大转发中继网络多中继选择策略
2020-04-09方国杏贾楠楠张逸凡王龙龙王淑贤彭张节
方国杏,贾楠楠,张逸凡,王龙龙,王淑贤,杨 茹,彭张节,2*
(1.上海师范大学信息与机电工程学院,上海201418;2.东南大学信息科学与工程学院移动通信国家重点实验室,江苏南京211189)
0 引 言
协作通信技术是通过网络中移动节点的彼此协作进行通信,可提高无线网络的容量及可靠性.在无线通信中,该技术已被用于对抗无线衰落,从而提升系统性能.协作中继节点的数据处理方式包括放大转发协议(AF)和译码转发协议(DF),前者只是简单地把接收到的数据放大之后转发出去;后者在对接收到的信号译码及编码之后再转发出去.本研究的中继节点采用AF数据处理方式.
在中继选择方案中,通过全局选择协作中继来提高网络性能,中继节点被允许进行自适应功率调整的策略,这会造成大量的网络开销.从实际的角度考虑,限定中继节点的功率水平的网络更加可行.本研究假设每个中继都有两个功率水平:零和最大功率,即一个中继节点要么用允许的最大功率参与协作,要么保持沉默状态.
大数据驱动的人工智能技术取得了长足的进步,在语言、图像处理领域的运用非常成功.伴随着并行计算架构的发展,深度学习技术也具备了在线运算的能力,高实时性以及低复杂度等优点使其能与无线通信紧密地结合[1-5].
在由一个信源、一个信宿和多个并行转发放大中继节点组成的网络中,提出一套基于深度学习的多中继选择策略,研究分析该策略下,网络的平均接收信噪比(SNR)和能效的性能.
1 系统模型和问题描述
1.1 系统模型
两跳AF 中继无线网络系统框图如图1所示,主要由三部分组成:一个信源节点S,一个信宿节点X,N 个并行的AF 中继节点,分别用Ri表示,i=1'2'…'N.其中,S 和X 之间没有直达信道,须通过中继节点的协作才能进行通信.每个中继节点只有一根半双工的全向收发天线,可用于发送和接收.分别用fi和gi表示S 到Ri和Ri到X 的信道状态信息(CSI),i=1'2'…'N.假设第i 个中继节点已知其信道状态信息fi和gi,并且X 已知全局信道状态信息.每次传输时,在信源处使用的功率为P,在中继处使用的发射功率为Pi.当信源和信宿之间有发送任务时,中继节点要么以全部功率协作,要么不协作通信[6-7].
图1 两跳AF中继无线网络系统框图
其中,w是信宿中的噪声;vi是第i个中继中的噪声,假设噪声都是具有零均值和单位方差的独立同分布复高斯随机变量.因此,可以计算出信宿节点的平均接收SNR[7]
1.2 问题描述
信宿节点X的平均SNR最大化问题可表示为:
在最大化接收SNR 的同时,为每个中继分配了单独的功率约束.因此,在中继选择策略中,总发射功率随着协作中继的集合变化而变化.该系统的能效可以表示为:
2 基于深度学习的多中继选择策略
式(3)是一个非线性、非凸的0-1整数规划问题,只能采用穷举法求得该问题的最优解,但是随着中继节点的数量增大,该问题的时间复杂度呈指数型增长[8-9].本研究通过深度神经网络无限逼近该问题的最优解.
2.1 训练数据集预处理
2.1.1 生成训练数据集
1)根据大小为N×2的信道状态信息矩阵Hm生成大小为N×4的训练样本;
2)根据所有的信道状态信息数据集m={1'…'M},重复步骤1;
3)将dm变 成 大 小 为1×4N 的 矢 量,通 过 堆 叠生 成 训 练 数 据 集D ∈RM×4N,即D=
2.1.2 定义关键绩效指标(KPI)
通过KPI对训练数据集进行标签.在通信中,可以选择任何性能评判准则作为KPI指标,如能效、误码率(BER)和平均接收SNR等.本研究选择信宿节点的平均接收SNR作为KPI.
2.1.3 为训练数据集标签
为确定一个训练样本的类别标签,计算每个协作中继集合的KPI,选择达到最大KPI 的协作中继集合的索引,作为该训练样本的类别标签.
2.2 构建模型
DNN-relay-net 模型是一个具有5层结构的神经网络模型.第一层是一个具有256个隐藏节点的全连接层(Dense),输入是一个大小为1×20 的训练样本d'm,以max(x,0)为激活函数;第二层为Dropout 层,以0.08 的概率随机舍弃第一层一部分的权重;第三层是一个具有128 个隐藏节点的全连接层,以max(x'0)为激活函数;第四层为Dropout层,以0.08的概率随机舍弃第三层一部分的权重;第五层是一个具有31个隐藏节点的全连接层,以softmax为激活函数,输出对应训练样本的预测标签.
3 仿真及结果分析
图2 3种选择策略的平均接收SNR比较
图3 为基于3 种中继选择策略的能效性能曲线.从图3 中可以看到,随着P 不断增大,3 种中继选择策略的能效均增大.随机选择策略的能效最差,而基于DNN-relay-net 模型的选择策略在一段时间内能效高于最优选择策略,这是因为DNN-relay-net 模型在预测时,并未达到100%的正确率,在发射功率较低时,最优选择策略倾向于同时使用5 个中继节点获得最优的平均接收SNR,而DNN-relay-net 模型选择总功率较小的协作中继子集,在两者平均接收SNR 几乎相等的情况下,DNN-relay-net 模型获得更高的能效;随着发射功率的增大,DNN-relay-net模型的能效开始逐渐低于最优选择策略.
图3 3种选择策略的能效比较
通过测试样本的平均预测时间衡量模型的时间复杂度[9].表1 分别显示了基于DNN-relay-net 模型的中继选择策略和基于最优选择策略的测试样本的平均预测时间.通过表1 可以看到,DNN-relay-net模型的时间复杂度明显低于最优选择策略.
表1 2种策略时间复杂度比较
4 结 论
将两跳中继网络中的多中继选择问题描述为一个多分类问题,利用基于深度学习的方案(DNN 神经网络)构建分类模型,并选择协作中继子集,最大化平均接收SNR.仿真结果可以看出,该策略可以获得与最优算法相当的平均接收SNR,同时降低了时间复杂度.然而,该策略存在一定的误分类情况,在发射功率较高时,能效明显低于最优选择策略.下一步将通过对策略的改进,提高分类精度.