基于无监督DNN和Sub-6GHz的毫米波功率控制算法
2023-08-24孙长印毛亚宁王军选
孙长印,毛亚宁,江 帆,王军选
(1.西安邮电大学 通信与信息工程学院,陕西 西安 710121;2.西安邮电大学 信息通信网络与安全重点实验室,陕西 西安 710121)
蜂窝网络流量爆发式增长的驱动需要有更多的频谱支撑当代无线通信系统的发展。其中,毫米波(millimeter Wave,mmW)频段因其具有高带宽等优势而备受关注。在第五代移动通信技术(5th Generation Mobile Communication Technology,5G)中使用mmW将缓解目前运行的4G蜂窝通信系统中的频谱短缺问题[1],这使得mmW技术成为5G蜂窝通信系统的关键技术之一。
mmW频段充足的频谱资源可以为蜂窝网络提供更大的容量。同时,mmW还具有受环境影响小、速率高、能量集中且方向性好等优点[2]。除此之外,mmW频段的天线尺寸相比于Sub-6GHz 频段的更小,为元器件在终端的高度集成化提供了便利,其配合大规模多入多出(Multiple Input Multiple Output,MIMO)技术部署规模更大的天线阵列,可提高系统的抗干扰能力和频谱利用效率[3]。但是,mmW波长短和衍射能力差,易受物体遮挡,导致其较大的传播损耗和较小的网络覆盖范围。因此,mmW组网通常需要基于多频段mmW异构网络结构改善链路间歇传输及切换频繁等突出问题,在该异构网络框架下优化问题是资源管理的关键[4]。同时,为了改善mmW链路间的干扰及其频繁的切换问题,资源分配如功率控制技术成为解决问题的主要手段。
传统功率控制算法在mmW网络中存在随着mmW频段所需天线数量的增多,其获取信道参数的开销增加及目标优化算法通常需要多次迭代更新。因此,需研究mmW频段多用户干扰信道的传输和速率最大化的功率控制问题。干扰管理已经成为改善系统性能受限问题的重要手段,相邻终端产生的干扰具有非凸性,导致功率控制问题不存在最优解。因此,功率控制问题的研究重点就集中在探索次优及高性能的实现方式上。随着研究的深入,提出了一些经典的功率控制算法被提出,如迭代注水算法[5]、加权最小均方误差[6](Weighted Minimum Mean Square Error,WMMSE)算法、干扰定界算法[7]以及穷举搜索算法[8]等。经典算法在mmW系统运算时可能会进行大量的复杂矩阵运算,加之用户的信道信息获得开销大和位置实时变换等影响,导致传统算法不能很有效地处理这些问题。
深度学习的兴起为改善上述问题提供了一个可行的方向,在提供良好性能的同时可以大幅度减少计算时间。例如,基于传统算法输入与输出之间非线性映射关系,文献[9]利用深度神经网络对WMMSE功率控制算法进行逼近,结果表明在使用时间少于传统算法5%的情况下可以达到传统算法约98%的性能。虽然该方法的复杂度较低,但其性能也受限于WMMSE算法的性能。文献[10]利用无监督算法直接在训练阶段将传输和速率最大化作为优化目标,在一定程度上打破了传统算法的性能瓶颈,但存在用户数量和信道系数非广义、理想信道估计等问题,对于实际通信场景和mmW频段的性能表现未知。文献[11]针对下行mmW大规模MIMO系统提出了一种基于强化学习的功率控制算法,基于快速爬坡算法得到基站对多终端最优的功率分配。但是,上述mmW网络的功率分配算法都需要mmW频段信道参数作为输入,这一点与传统算法类似,存在包括mmW系统由于数量众多的天线信道估计开销和频繁切换产生的波束搜索开销等问题。
近年来,有研究者发现mmW信号的到达角度、离开角度以及角度功率谱与Sub-6GHz信号具有一致性,并将此用于mmW和6 GHz以下的频段组成的mmW异构网络系统[12]。文献[13]对利用低频预测高频信道参数进行了研究,通过把mmW信道信息获得方式转化为压缩感知问题,再结合K-最邻近思想与广义近似消息传递(Generalize Approximate Message Passing,GAMP)算法对信道估计问题进行求解。文献[14]证明了一定条件下存在映射函数,使得利用Sub-6GHz信道信息可以直接预测出最佳的mmW波束和阻塞状况,并用深度神经网络实现了这种映射关系。文献[15]研究了神经网络对Sub-6GHz信道信息和mmW最优功率分配之间非线性关系的拟合,但其采用的是WMMSE算法训练,神经网络的性能也会受到WMMSE算法可达到系统性能的限制,得到的功率控制不是全局最优的。以上文献表明,利用Sub-6GHz信号辅助mmW进行功率控制具有可行性,相较于mmW频段,Sub-6GHz 的信号测量质量高、信道数量少及开销小。因此,利用Sub-6GHz 信道信息辅助mmW系统的无线资源管理值得研究。
针对现有研究中存在的性能受限、算法复杂度高及mmW信号测量开销大和质量差等问题,拟提出一种利用无监督DNN和Sub-6GHz频段跨频预测mmW频段的功率控制算法。该算法利用无监督深度学习,直接将最大化mmW传输和速率作为网络损失函数,并且利用集成学习组合多个独立训练的神经网络进一步提升算法性能。同时,利用神经网络实现使用Sub-6GHz 频段预测mmW频段的最佳功率分配,从而改善mmW信号测量带来信令开销大和测量质量差的问题。通过将噪声功率加入网络的输入特征提升模型对不同噪声功率的适应性,增强模型的泛化性能。为了验证所提算法的可行性,将其与加权最小均方误差算法、最大功率控制算法、随机功率控制算法和二进制穷举搜索算法等4种算法的系统和速率进行对比。
1 系统模型
假设用户单天线干扰模型中共有K=4个基站和用户,基站只与单个终端进行消息传输。每个基站都配备了Sub-6GHz频段以及mmW频段的均匀线性阵列天线(Uniform Linear Array, ULA),两者的天线数量分别为Msub-6和MmmW。Sub-6GHz用于信道信息获取及上行数据传输,而下行数据传输主要发生在mmW频段[16]。多用户通信模型如图1所示。
图1 多用户通信模型
(1)
为减少mmW链路的信号损耗,基于码本的波束赋形算法,假设fk∈MmmW×1和fj∈MmmW×1分别表示基站k和基站j下行波束形成向量,和分别表示用户i到基站k和基站j的mmW频段信道信息,则用户i处收到的mmW信号的表达式为
(2)
(3)
由香农公式可得单位带宽上用户i的接收速率表达式为
(4)
(5)
式中,βi>0表示每个用户的权重。此时,和速率最大化问题为
s.t. 0≤pk≤pmax
k=1,…,4
(6)
则最优的功率分配表达式为
(7)
此时,只要求得最优的功率分配p*,系统加权和速率就能取得最大值Rmax。
2 Sub-6GHz辅助mmW功率分配
通过对利用Sub-6GHz辅助mmW进行功率分配的问题进行分析,证明在特定条件下存在从Sub-6GHz信道信息到mmW最佳功率分配的确定性映射关系。
假设用户的位置信息为(x,y),则用户和基站之间的信道信息[14]可以表示为
设χ={(x,y)}为用户可以存在的所有地点信息的集合,若hsub-6∈Msub-6×1和hmmW∈MmmW×1分别表示用户的Sub-6GHz频段和mmW频段的信道信息,则Hsub-6={hsub-6}和HmmW={hmmW}分别是所有用户的Sub-6GHz和mmW信道信息的集合。此时,从用户地点信息到两种频段等效增益的映射函数[8]可以分别定义为
(8)
(9)
此时可以求出用户i的Sub-6 GHz信道增益到mmW信道增益的映射为
(10)
结合式(6)和式(10),可以将和速率最大化问题转化为
s.t. 0≤pk≤pmax
k=1,…,4
(11)
结合式(7)和式(11),可得mmW系统最优功率分配表达式为
(12)
3 DNN模型
3.1 模型设计
利用一个全连接的深度神经网络解决式(11)的功率控制问题。网络由包含K2个节点的输入层、K个节点的输出层和L-1个全连接的隐藏层组成,层的索引从0到l,具体的网络结构如图2所示。
图2 神经网络示意图
若第k层是隐藏层,则网络当前层的输出向量为
ck=ReLU(BN(Wkck-1+bk))
(13)
式中:ck的长度为lk;ck-1表示网络前一层的输出向量,其长度为lk-1;Wk表示第k-1层和第k层之间的权重矩阵;bk是长度为lk的偏置向量;BN(·)表示批量归一化函数;ReLU(·)表示线性整流函数max(x,0)。为了初始化模型的输入层,定义l0=K2,c0=hsub-6。
输出层决定了所有基站的发射功率,其计算表达式为
(14)
式中:WL表示第L-1层和第L层之间的权重矩阵;bL是长度为lL的偏置向量。需要注意的是,由于发射功率必须在[0,max]之间,因此输出层使用Sigmoid函数作为激活函数。那么,就可以得到基站i向用户i的发射功率的表达式为
(15)
式中,cL,i表示第L层输出的第i个元素。
3.2 训练网络
文献[9]和文献[11]是利用WMMSE算法产生的功率控制结果训练神经网络,其损失函数定义为网络输出和WMMSE算法之间的差距。该算法具有较低的在线计算复杂度,但利用该算法训练的网络其性能不会优于WMMSE算法。因此,在训练网络时需要对传统算法做出改变。首先,舍弃传统的有监督算法,采用无监督学习,直接最大化和速率。其次,训练过程中计算传输和速率时,直接利用mmW频段的信道增益,即利用神经网络逼近Sub-6GHz频段信道增益与mmW频段最优功率分配之间的映射关系。具体而言,将式(11)中的目标函数作为训练网络的损失函数,表达式为
(16)
(17)
式中:m为小批量样本的数量;t是迭代次数。通过式(17)可以得到损失函数对θ的导数gt,然后对θ更新迭代,更新表达式为
(18)
式中:ε为学习率;ot+1和qt+1为一阶和二阶矩估计;μ和υ分别为一阶矩估计和二阶矩估计的衰减速率;τ表示防止梯度为Nan的数值稳定常数。具体来说,使用Adma优化器对参数θ进行更新迭代最小化损失函数,计算步骤如下。
步骤1初始化参数。ε=0.001,μ=0.9,υ=0.999,σ=10-8,Xavier初始权重参数集θ,m0=0,n0=0,迭代次数t=0。
步骤2计算包含m个样本的小批量导数gt。
步骤3更新一阶矩估计和二阶矩估计,表达式分别为
步骤4根据式(18)更新权重参数集,θt→θt+1。
神经网络训练时的具体参数如表1所示。
表1 神经网络参数
3.3 集成深度神经网络
在神经网络的训练过程中发现,即使采用充分的训练数据和利用式(16)中新定义的损失函数,也不能保证对每个Sub-6 GHz信道增益都能输出最优的功率分配p*,因此梯度下降法有可能导致网络陷入局部最优。为此引入集成学习的思想进一步提高功率控制的性能,使其可以靠近全局最优,集成学习通过组合多个弱学习器获取最优的性能。对于功率控制问题,提出建立一个集成深度神经网络,该网络由M个单独训练的网络组成,假设所有单独训练的网络都具有相同的结构,简化集成网络的实际部署。一个集成深度网络由M组不同初始参数和独立生成的数据进行训练,最终可以增强学习器的分集增益[17]。
为了通过集成学习提升模型性能,将网络的输入hsub-6分别送到M个训练完成的网络中,第m个网络定义为Net-m,其输出的功率控制结果为pm,选择器收集所有网络的输出以及和hsub-6对应的mmW频段信道增益hmmW。然后计算每个网络输出功率对应的mmW频段用户传输和速率,选择最高的和速率对应的功率控制结果作为集成网络的输出。具体的集成神经网络结构如图3所示。
图3 集成神经网络结构
使用集成功率控制网络需要注意的是用MSGD训练神经网络经常会陷入局部最优,因此组合多个弱DNN可以显著提升和速率性能。深度网络只需少量矩阵乘法,计算复杂度较低,而集成神经网络是以线性方式增加复杂度的,因此其复杂度不会显著增加。通过训练多个不同参数和训练集的神经网络提升分集增益,这种方法也可以用于其他一些符合条件的功率控制方法。
3.4 模型泛化性能
4 仿真结果及分析
4.1 数据集选取
由于实际信道信息的生成存在困难,因此依照一般工程中的常规做法,即通过射线追踪获取信道信息。样本数据由3D射线追踪软件构建的Deep MIMO数据集产生[18],该数据集里的双频段通信场景O1包括频率在3.5 GHz的Sub-6 GHz基站数据集O1_3p5和28 GHz的mmW基站数据集O1_28。此外,考虑到在线训练所需的巨大开销,采取非在线方式对网络进行训练。
4.2 实验场景设置
为验证所提算法的合理性和有效性,设定了两种通信场景。
场景1主街道。场景1模拟了大量用户在马路上散步时的情况,马路两边设立对称分布的4个基站,每个用户均匀散布在基站覆盖的范围,每个基站随机选择一个用户进行通信,选中每个用户的概率相同。
场景2十字路口。场景2选择的是两条街道的交叉地段,以模拟用户通过路口的情形。4个基站散布在十字路口的4个角落,所有的用户均匀分布在基站的覆盖范围,数据生成方式同场景1,具体参数设置如表2所示。
表2 仿真参数
4.3 Sub-6GHz辅助mmW可行性分析
通过分析模型输入为Sub-6 GHz和mmW时的用户和速率,从而验证Sub-6 GHz信道参数预测mmW功率控制的可行性。具体来说,场景1和场景2都通过单天线传输信息,训练方式是将4个用户的Sub-6 GHz和mmW信道增益当作模型的输入,将mmW频段的功率分配结果当作模型的输出,即Sub6-mmW表示利用Sub-6 GHz预测mmW,mmW-mmW表示利用mmW预测自身功率分配。
Sub6-mmW和mmW-mmW在场景1和场景2下的和速率分布情况具体如图4所示。由图4可以看出,在场景1下,Sub6-mmW与mmW-mmW所得到的和速率分布情况大致相同。在场景2下,Sub6-mmW有大约10%的样本和速率略低于mmW-mmW,且位于30%以下的部分。考虑到该部分对应于边缘用户,说明可能由于场景2下用户分布比较集中于十字路口,边缘用户较多,容易受到相邻基站干扰。此外,场景1和场景2下Sub6-mmW的总和速率分别达到了mmW-mmW的98.35%和96.91%。
图4 场景1和场景2下和速率分布
通过以上分析,尽管在某些局部Sub6-mmW的性能略差于mmW-mmW,但两者性能还是非常相近。因此,使用Sub-6 GHz信道增益辅助mmW功率控制是可行的。
4.4 和速率性能分析
在场景1和场景2下,假设基站和移动端都使用单天线进行收发,且使用建立好的集成神经网络模型对两个场景分别训练,并将WMMSE算法、最大功率控制算法、随机功率控制算法和二进制穷举搜索算法作为对比算法。二进制穷举搜索算法是在发射功率区间[0,pmax]上搜索,使得所有用户传输和速率最大的功率分配。为降低计算复杂度,采用二进制对其约束,即基站发射功率只能选0或者pmax,理论上最坏情况下需要搜索2K-1次才能获取最优功率分配,为保证搜索次数较少时的性能,每次搜索从所有分配中随机选取。由于WMMSE算法需要多次的迭代才能达到较好的性能,因此在场景1下设置WMMSE算法迭代次数最大值为30。为了方便与所提算法进行比较,二进制穷举搜索算法的最大搜索次数和集成神经网络的规模最大也设置为30,而场景2设置为20。随机功率控制由于每次的分配都是随机生成的,因此其性能存在一个小范围的变换。对其进行多次初始化后取其用户传输和速率最大值作为对比输出,随机功率控制算法和最大功率控制算法不随迭代次数变换。
将所提算法与WMMSE算法、最大功率控制算法、随机功率控制算法及二进制穷举搜索算法进行对比,在场景1和场景2下不同功率控制方式总和速率的对比情况如图5所示。
图5 场景1和场景2下不同算法总和速率对比
由图5可以看出,在两种场景情形下,随着迭代次数的增加,所提算法、WMMSE算法和二进制穷举搜索算法的平均系统和速率都在增加,而所提算法明显优于另外4种算法。场景1相对于场景2用户较多分布于小区中心区域,信噪比较高,整体和速率较大。具体而言,场景1中集成/迭代次数分别是10、20和30时,所提算法的和速率是WMMSE算法的1.236、1.125和1.134倍。此外,当迭代次数小于12时,二进制穷举搜索算法平均和速率相比于所提算法表现较差,可能是由于有一部分样本还没搜索到最优功率分配。当迭代次数大于15时,二进制穷举搜索算法和速率性能接近所提算法,此时几乎所有样本都搜索到最优的功率分配。场景2在集成/迭代次数分别是5、10和15时,所提算法的和速率是WMMSE算法的1.212、1.106和1.105倍,是二进制穷举搜索算法的1.34、1.12和1.05倍。当WMMSE算法的迭代次数较大以及用户数量较多时,会带来更大的线性复杂度。如果计算资源受限,只运行少量的迭代,那么所提算法的性能增益就会更加明显。
通过所提算法、WMMSE算法、最大功率控制算法、随机功率控制算法及二进制穷举搜索算法计算出所有样本的用户和速率,在场景1和场景2下不同算法和速率分布情况具体如图6所示。
图6 场景1和场景2下不同算法和速率分布
由图6可以看出,在场景1中:通过最大功率控制算法求出的测试样本系统和速率主要分布在[0,15]区间,超过98%的样本系统和速率低于15 bit·s-1,随机功率控制算法有75%的样本和速率低于15 bit·s-1;WMMSE算法计算出的样本和速率主要分布在[4,23]区间,有大约20%的样本分布在和速率小于12.5 bit·s-1,而所提算法主要分布在[17,24]区间,和速率小于17 bit·s-1的概率为0;二进制穷举搜索算法样本分布接近所提算法,和速率大于20 bit·s-1的样本约占75%,而所提算法约为87%。在场景2中:随机功率控制算法和最大功率控制算法对所有样本计算的和速率主要分布在[8,12]区间;WMMSE算法分布在[0,17]区间,有大约15%的样本和速率小于5 bit·s-1;二进制穷举搜索算法有约12%的样本和速率分布在[0,14]区间,而所提算法的样本和速率主要分布在[14,17]区间。CDF分析表明,在两种场景下所提算法性能在整个性能区间表现优于其他4种算法。
为了量化比较,表3列举了不同功率控制算法对于所有测试样本的平均和速率。
表3 不同算法平均和速率比较
从表3可以看出,在两个场景下,所提算法所有样本和速率分别是WMMSE算法的1.133倍和1.105倍,这些结果验证了使用无监督算法预测mmW功率控制具有的良好的性能。
4.5 模型泛化性能分析
为验证网络输入层加入噪声功率之后的和速率性能,在所提算法的基础上设计了一种输入维度包含噪声功率的改进模型。具体来说,在场景1中将噪声功率分别设置为[-70,-75,…,-125](dBm·MHz-1),然后计算出对应噪声功率下所有测试样本的平均和速率,即由原始网络计算的和速率。同时,为增强网络泛化能力,数据集3生成方式是对每个样本加入噪声功率,噪声功率从区间[-70,-75,…,-125]中随机取。每次迭代使用不同的随机种子,此时网络的输入由原来的K2变成K2+1,然后对网络进行训练,使其具备处理一定范围噪声的能力。不同噪声功率下原始网络和输入层加入噪声功率对网络的和速率性能的影响如图7所示。
图7 输入层加入噪声功率对和速率影响
由图7可以看出,当噪声功率为-95 dBm·MHz-1时,输入噪声的网络性能对原始网络性能的占比约为93.33%,而噪声功率为-125 dBm·MHz-1时占比已经达到了99.19%。这表明在噪声功率较小的情况下,DNN网络输入维度加入噪声之后性能网络损失很小,此时的模型具有较高的泛化能力,对不同功率的噪声具有较好的适应性。
5 结语
利用深度学习技术改善了Sub-6GHz预测mmW功率控制的问题,实现了mmW系统中高效实时的功率控制。首先,利用无监督神经网络,直接将最大化用户mmW频段和速率作为损失函数,实现了从Sub-6GHz到mmW频段最优功率分配的函数映射,即输入Sub-6GHz信道信息即可预测mmW最优功率分配。同时,还实现了多个网络的集成。接着,通过将噪声功率加入神经网络的输入层,从而提升网络的泛化能力。最后,利用Deep MIMO数据集对模型进行了测试与评估。仿真结果表明,所提算法对mmW频段功率分配具有较好的预测能力和泛化能力。但是,所提算法只研究了传输功率在固定区间的情况,未来的工作将致力于研究mmW通信加入发射功率约束时的功率控制。