基于LightGBM的LAA/Wi-Fi混合网络的竞争窗口自适应预调整
2021-06-08冯义磊唐震洲
冯义磊,唐震洲
(温州大学计算机与人工智能学院,浙江温州 325035)
为了应对未来爆炸性的移动数据流量的增长、海量的设备连接、不断涌现的各类新业务和应用场景,第五代移动通信系统(5G)呼之欲出.5G系统在为用户提供更高性能服务的同时,也对频谱资源提出了更高的要求,但是申请新的频谱资源是极其昂贵的.免授权频段LTE技术(LTE-U)的提出可以用来缓解频谱资源不足的问题,该技术的主要思想就是将LTE部署至5G Hz免授权频段,充分利用免授权频段来拓展LTE的工作频谱.但是,5G Hz免授权频段已经部署着大量Wi-Fi网络,LTE-U的引入将会对这些Wi-Fi网络产生干扰.为了能和Wi-Fi网络公平友好共存,在Rel-13 3GPP中提出了基于载波聚合结构(CA)和先听后说(LBT)机制的授权频谱辅助接入技术(Licensed Assisted Access,LAA)的概念①参见:3GPP. Study on Licensed-assisted Access to Unlicensed Spectrum [R]. 3GPP, 2015..
LAA和Wi-Fi共存网络的性能在很大程度上取决于LBT中的随机退避机制.由于竞争窗口的大小对随机退避的性能具有关键性作用,近几年来,很多工作围绕着竞争窗口的优化而展开.文献[1]中,提出了一种通过马尔科夫链和比安奇模型[2]相结合的数学模型来寻找蜂窝基站最优的固定的竞争窗口(Contention Window,CW)大小的方法,而固定的CW可能会造成在同一时刻有更多的LAA 基站接入信道,并且当网络发生冲突时,固定的CW无法有效缓解网络冲突的情况.文献[3]中,提出了一种基于LBT的竞争窗口大小的自适应算法,该算法采用了一种感知的LAA基站(eNodeB,eNB)方案,通过比较两个退避(退避窗口)周期之间的繁忙时隙的比率来调整CW的大小,但CW的更新仅仅是通过eNB的感知而没有考虑来自UE的反馈,这可能会造成隐藏节点的问题.文献[4]中,提出了一种改进的LBT算法,它是根据相邻节点之间交换的信息来调整LAA中的CW大小的,但这需要LAA节点之间的信息交换和传输额外的信令.
上述工作的竞争窗口调整,均是在冲突已经发生的情况下才进行的,而事实上,此时的网络冲突已经相当严重了.根据相关规定,当一个传输机会(Transmission Opportunity,TXOP)的第一个子帧的混合自动重传请求(Hybrid automatic repeat request,HARQ)确认中至少有80%是NACK(Negative ACK)时,才会将竞争窗口增加到下一个等级①参见:3GPP. Evolved Universal Terrestrial Radio Access (E-UTRA); Physical Layer Procedures (Release 15) [R].3GPP, 2018. 下文出现的3GPP均可参见此注释..在这种情况下,已经有大量的信道资源被浪费了.基于这方面的考虑,假如我们能够提前预测下一个TXOP第一个子帧的NACK是否会达到甚至超过80%,那么就可以提前调整网络中的某些参数,以此减少下一个TXOP中的网络冲突情况.
为此,本文提出了一种基于机器学习的竞争窗口自适应调整机制.具体而言:首先,下一个TOXP第一个子帧的NACK占比是否会大于80%,这显然是一个二分类问题,考虑到LightGBM算法[5]在分类问题中的优异性能,本文引入LightGBM算法,根据对以往NACK占比的观察,来对这个分类问题进行判断;然后,根据判断结果来干预下一个TXOP的竞争窗口.本文将其和其他5种常用的分类算法(决策树[6]、AdaBoost[7]、梯度提升策树GBDT[8]、随机森林[9]和XGBoost[10])进行了比较,实验结果表明,LightGBM能够获得最优的性能.基于LightGBM的竞争窗口自适应调整机制能够将LAA/Wi-Fi混合系统的吞吐量提升21.27%.文献[11]中也采用了类似的思想,基于前向反馈神经网络(Feed Forward Neural Network,FFNN)提出了一种基于竞争窗口自适应方案,该方案利用FFNN来预测后续TXOP的NACK数量从而提前干预竞争窗口的大小,然而,其预测准确率只能达到85%.相比较而言,本文所提出的分类模型能够达到91.6%的准确率和0.98的AUC值(Area Under Curve).在文献[11]中,通过预测TXOP中最后4个子帧反馈的NACK数量并结合前面4个子帧反馈的NACK数量和Wi-Fi监视器收集到的信噪比来自适应地调整竞争窗口的值,这与3GPP标准中的不一致.根据3GPP标准,TXOP的第一个子帧反馈的NACK数量代表了网络冲突情况.本文正是遵循3GPP的标准提出的预测模型.在文献[11]中是通过Wi-Fi监视器收集Wi-Fi信号的信噪比,把该信噪比传给LAA基站,然后基站根据信噪比自适应地调整竞争窗口的值,这就需要额外对Wi-Fi设备进行改动.而本文所采用的方法是:用预测到的下一个TXOP中第一个子帧反馈的NACK数量占比是否达到80%来自适应地预调整竞争窗口的值,该方法仅需在现有LAA机制上增加一个预测模块,对Wi-Fi设备的软硬件不需改动.
下面将介绍LAA与Wi-Fi异构网络的系统模型,介绍NACK占比预测,包含数据描述、数据的预处理、预测模型等,介绍本文提出的竞争窗口自适应预调整机制,并给出结果分析,包含系统模型的参数设置、预测模型的结果对比、实时预测的结果等.
1 系统模型
本文考虑一个LAA与Wi-Fi的混合网络,网络中包含LAA eNB和LAA UE(User Equipment)等LAA节点,以及Wi-Fi接入点(Access Point,AP)和Wi-Fi UE.
Wi-Fi节点采用分布式协调功能(Distributed Coordination Function,DCF)机制[2]进行信道接入.一个Wi-Fi节点想要发送数据之前将会检测信道是否空闲,如果信道空闲,仍然需要等待分布式帧间间隙(Distributed Inter-frame Spacing,DIFS)的时间长度,若是在DIFS时间后信道仍然是空闲的,那么节点将会立即传输数据,否则,节点将会执行退避过程,当退避窗口的值为0时,节点立即发送数据,如果发送数据失败将会使竞争窗口的值增加一倍.
LAA节点采用的LBT机制①参见:3GPP. Evolved Universal Terrestrial Radio Access (E-UTRA); Physical Layer Procedures (Release 15) [R].3GPP, 2018.接入信道.同样在LAA网络中,一个eNB想要在下行链路上传输数据,首先需要监测信道,直到信道持续空闲达到Tf+mp⋅Tsl,其中,Tf=16μs ,Tsl为一个时隙的持续时间,为9μs,而mp的取值取决于接入优先级,详见本页注释①参见:3GPP. Evolved Universal Terrestrial Radio Access (E-UTRA); Physical Layer Procedures (Release 15) [R].3GPP, 2018..然后开始随机退避,每经过一个空闲时隙时间Tsl,随机退避计数器的值就会减1,直到0为止,此时,eNB立刻启动数据发送,随机退避计数器的初始值为[0,CW]L内的一个随机整数.竞争到信道之后,eNB获得一个TXOP来传输数据,即在TXOP时间内可以不停地发送数据而不用去争抢信道.
LAA采用HARQ机制进行数据传输.当接收端收到的数据错误,并且不能通过前向纠错(Forward Error Correction,FEC)解析出正确的数据包时,将会向发送端发送NACK,请求发送端重传错误的数据包.接收端发送NACK的情况有两种:一种是由于网络冲突发送NACK,当发送端至少有两个节点同时发送数据时,将会产生冲突,接收端收到错误的数据包,然后接收端将会向发送端发送NACK请求重传出错的数据包;另外一种情况是,由于链路原因造成的数据包错误,并且接收端不能通过FEC纠正出正确的数据包,这时也会向发送端发送NACK.由于冲突发送的NACK,将会在TXOP的第一个子帧反馈时一起发送给发送端;由于链路原因发送的NACK,将会在TXOP的每一个子帧的反馈中发送给发送端.因此,TXOP的第一个子帧反馈的NACK情况从侧面反映了网络的冲突情况.
在3GPP官方文档中,CW调整机制如下.基站如果想要在物理下行共享信道(Physical Downlink Shared Channel,PDSCH)上传输数据时,首先会根据信道接入优先级p∈ { 1,2,3,4}设置CW的初始值为 CWmin,p(在该优先级下的最小CW值).在LAA网络中,我们选择LBT机制为Ca(tCategory,Cat)3LBT①参见:3GPP. Evolved Universal Terrestrial Radio Access (E-UTRA); Physical Layer Procedures (Release 15) [R].3GPP, 2018.,对应的优先级p为3,其中Tmcot,p=8ms ,也就是TXOP为8 ms.如果是在TXOP的第一个子帧的HARQ反馈为NACK的数量占比至少为80%时,将会在p优先级的LBT机制中增加CW到下一个更高的值,否则,把CW的值设为p优先级条件下的最小CW值.当CW为p优先级下最大的CW值时,传输k次后将会设置为CW的最小值,其中k∈{1,2,3,…,8}.
事实上,当TXOP的第一个子帧的HARQ反馈为NACK的数量占比达到80%时,网络拥挤情况已经很严重了.若是能够提前预测到在下一个TXOP中的网络拥挤情况,那么我们就可以调整某些参数,让网络拥挤情况减弱.
2 NACK占比预测
2.1 数据描述
由于本文的系统模型是关于LAA与Wi-Fi共存的异构网络的,数据的传输需要尽量接近真实的场景,因此我们选择ns-3①参见:http://code.nsnam.org/. 下文出现的ns-3均可参见此注释.中的laa-wifi-coexistence模块中的LAA与Wi-Fi共存网络室内场景作为我们的仿真场景.在LAA与Wi-Fi混合网络中,每个网络各有8个基站,每个基站下随机分布着20个用户终端,分别设定20s和15s的仿真时间,用于产生训练集和测试集中所需要的数据.数据集中的特征与标签的组成与基站的CW、退避窗口和NACK占比有关,因此当仿真结束,将会输出这些数据列:CW更新时的时间、基站的编号、更新前的CW、更新后的CW,退避窗口更新时的时间、基站的编号、更新前的退避窗口、更新后的退避窗口,每一个子帧的时间、基站的编号、NACK占比等.
2.2 数据的预处理
我们想要预测的是下一个TXOP中的第一个子帧的反馈为NACK的数量占比是否超过80%,由于NACK的产生只能通过LAA网络的HARQ反馈产生,并且NACK的数量与上一个CW、当前CW、上一个退避窗口和当前退避窗口的值息息相关,因此,数据集中的特征列为当前TXOP中LAA基站所有站点的上一个CW、当前CW、上一个退避窗口和当前退避窗口的值,标签列为下一个TXOP中的第一个子帧反馈为NACK的数量是否超过80%,若是超过设置为1,反之,设置为0.
数据预处理之后,得到训练集共有2 538个样本、测试集共有1 536个样本.在训练集中,正例有301个,占比11.86%,负例有2 237个,占比88.14%;在测试集中,正例有208个,占比13.54%,负例有1 328个,占比86.46%.其中每个样本共有32个特征和1个标签,32个特征是指8个LAA eNB的上一个CW的值、当前CW的值、上一个退避窗口的值、当前退避窗口的值.
2.3 预测模型
为了解决特征维数高、数据量大的问题,微软于2017年提出了基于梯度单边采样技术(Gradientbased One-Side Sampling,GOSS)和独立特征合并技术(Exclusive Feature Bundling,EFB)的LightGBM[5].LightGBM是一种轻量级的梯度提升树(Gradient Boosting Decision Tree,GBDT)算法,它在原有的GBDT算法的基础上,主要运用了GOSS、EEB、基于直方图的排序算法、叶子生长(Leaf-wise)树生长策略等优化算法.
LightGBM算法流程如下.
当数据量较大时,采用GOSS技术对样本进行采样,对于梯度越小的样本则赋予越小的权重.对于稀疏的高维数据,很多特征是互斥的,采用EFB的优化策略,将这些互斥特征合并为#bundle个维度.
对于二元分类GBDT,采用类似于逻辑回归的对数似然损失函数,损失函数L为:
1)初始化弱分类器.弱分类器为:
其中c为拟合值.
2)对最大的迭代次数t=1,2,… ,T(其中最大迭代次数T=1 000)有:
a)对样本i=1,2,… ,m,其中Y∈ {0,1},计算负梯度,
b)对特征值构建直方图,计算各个切分点的增益,寻找最优分割点,利用(Xi,rti)(i=1,2,…,m),采用Leaf-wise的树生长策略,生成一颗CART分类树,得到第t颗分类树,其对应的叶子节点区域为Rtj,j=1,2, …,J,其中,分类树的最大深度为7,J为分类树t的叶子节点的个数,J=150;
c)对叶子区域j=1,2, …,J,计算最佳残差拟合值,
由于(4)式比较难优化,使用如下近似值代替,
d)更新强学习器,
3)得到强学习器f(X)的表达式:
3 竞争窗口自适应预调整
为了减弱LAA和Wi-Fi共存网络的冲突情况,我们想要通过预测下一个TXOP的第一个子帧的HARQ反馈中是否至少有80%的NACK来预测下一个TXOP网络中是否发生冲突,若预测出发生冲突,我们将会再次调整CW,使CW增加至下一个更高的值.
3.1 特征提取
根据以上介绍可知,我们需要提取的特征是LAA所有eNB的上一个CW、当前CW、上一个退避窗口的值和当前退避窗口的值.为了能够预测到下一个TXOP的第一个子帧的HARQ反馈是否至少有80%的NACK,需要在当前TXOP中CW更新之后进行特征提取.由于在当前TXOP中CW的更新是在收到当前TXOP的第一个子帧反馈后进行的,所以我们在该时刻后进行特征提取然后进行预测.此外,还需确定哪一个子帧是TXOP的第一个子帧.经过分析,我们知道在一个TXOP中每一个子帧的反馈时间相差1 ms,因此,第一个子帧的反馈就是当前子帧的反馈时间与上一个子帧的反馈时间差值大于1 ms时的当前子帧反馈.在确定第一个子帧的反馈后,将会开始特征的提取.
3.2 模型预测
在实时预测阶段,为了在竞争窗口自适应预调整机制之前完成预测,我们缩短了模型预测的时间.在系统模型之外进行模型训练,把训练好的模型和模型所需的各个参数保存到一个文件中.在进行预测时,把保存的训练模型和提取出来的特征代入到预测函数中进行预测,根据预测结果进行阈值划分,大于阈值的设为1,反之设为0.通过这种方式,模型预测阶段就可以省去训练模型的时间了.
3.3 竞争窗口自适应预调整
在3GPP官方文档中,CW的更新是在基站接收到当前TXOP所发送的第一个子帧的反馈为NACK的数量占比至少为80%之后,但事实上,当达到CW更新条件时,网络的拥塞情况已经很严重了.减轻网络的拥塞情况,可以通过在合适的时间减少合适的站点发送数据来实现,这样既可减轻网络拥塞情况又能保证网络吞吐量提升.正如我们所知道的,在退避阶段时,只有当退避窗口的值为0时,站点才能发送数据,但是退避窗口的取值是在[0,CWp- 1]中随机选择的,在不改变现有的退避机制情况下,不可能通过直接改变退避窗口的值来进一步减少站点发送数据的机会.若是能提前预测到下一个TXOP中网络的拥塞情况较为严重时,那么就可以在CW更新之后并且退避窗口更新之前再次调整CW的值到下一个更高的值,这样退避窗口在更新时就有更大的概率选取较大的退避窗口的值了,从而达到降低站点发送数据的概率,进而实现减轻网络拥塞的目标.经过上述分析,为了缓解网络冲突,我们提出了竞争窗口预调整机制,该机制指的是在当前TXOP中预测下一个TXOP是否发生较为严重的冲突,若是发生,将会在CW更新之后并且退避窗口更新之前再次调整CW的值到下一个更高的CW值.
4 结果分析
4.1 系统模型参数设置
对于系统模型的仿真,我们选用ns-3代码库中的名称为laa/ns-3-lbt的代码作为异构网络的仿真代码,因为在该代码中含有LAA与Wi-Fi共存网络场景模块.在该代码中本文选择laa-wifi-coexistence模块中的LAA与Wi-Fi共存网络室内场景进行室内异构网络的仿真实验.如图1所示,我们采用了一种室内模拟场景来仿真LAA与Wi-Fi共存的异构网络,其中基站和用户终端放置在一个120 m × 50 m的无墙建筑中.这个方案是基于文献[12]中提出的室内场景进行评估研究的,但是放置在图1中的基站位置更接近真实的场景,而且不同网络基站的交叉放置增加了LAA eNB和Wi-Fi AP之间的干扰,这将有助于我们通过得到更多的NACK数量来更好地预测在下一个TXOP中的第一个子帧的HARQ反馈中是否有80%的NACK.在本次仿真实验中,LAA和Wi-Fi网络中各有8个固定位置的基站,每个基站周围配置20个UEs和STAs(Station,STA),UEs和STAs的初始位置是随机洒落在建筑物中的,在数据传输过程中采用二维平面随机游走的移动模型来更新位置信息.
图1 LAA与Wi-Fi室内模拟场景
对于传播模型,我们选择由3GPP提出的文件传输协议(File Transfer Protocol,FTP)1模型,FTP 1模型中的λ设为2.5.选择LBT的优先级为Cat 3,TXOP的长度为8 ms.当数据传输时,选择用户数据报协议(User Datagram Protocol,UDP)传输协议.
4.2 预测模型结果对比
各种预测模型的性能指标见表1,接受者操作特性(Receiver Operating Characteristic,ROC)曲线见图2.
表1 预测模型的性能指标
图2 预测模型的ROC曲线
图2包含了决策树、AdaBoost、GBDT、随机森林、XGBoost和LightGBM等6种预测模型的ROC曲线,这6种机器学习算法均采用网格搜索法以寻找最优的参数来实现关键参数的设置.表1表示的是6种预测模型的性能评价指标的数值.从图2可以看出,XGBoost和LightGBM的ROC曲线包含的区域较大.在图2中,我们选取真正例率(True Positive Rate,TPR)的值最大和假正例率(False Positive Rate,FPR)的值最小时所对应的阈值作为类别划分的标准,根据该阈值可以得到表1中的性能评价指标.表1中决策树算法和随机森林算法的准确率实际为0.264和0.304,由于分类算法的准确率不会低于0.5,所以我们考虑更换预测输出的符号,从而得到表1中的两种算法的准确率.从表1可以看出,LightGBM的AUC值最大,但是和XGBoost的差别不大,考虑到LightGBM相对于XGBoost的模型训练时间短、占用内存小的优点,我们选取了LightGBM作为系统模型的预测算法.
4.3 实时预测的结果
以上已将LightGBM、XGBoost等6种预测模型进行了对比,最终确定将LightGBM带入到LAA与Wi-Fi共存网络中进行实时预测,然后根据预测的结果进行竞争窗口自适应预调整.由于我们的系统模型是采用C++编写的,因此LightGBM采用同样的编程语言加入到系统模型中.在进行实时预测之前先训练好需要带入到系统模型中的算法模型,这样可以节省实时预测时预测模型的训练时间,降低时间复杂度.图3表示的是把LightGBM训练模型带入到系统模型后的不同阈值所对应的吞吐量.如图3所示,第一组实验共有200个阈值,阈值间隔为0.005,通过比较不同阈值所对应的LAA与Wi-Fi异构网络的吞吐量,可以发现当阈值为0.46时,所对应的吞吐量最大,于是进行第二组实验,在阈值为0.46的基础上再进行更小的阈值划分,在0.46左右的区间进行阈值划分的间隔为0.001,最终我们发现当阈值为0.464时,所对应的吞吐量最大,这时就不再进行阈值划分了,一方面因为0.001的阈值间隔已经包含足够小的阈值了,另一方面是因为就算再进行阈值划分,对LAA与Wi-Fi异构网络的吞吐量的提升的影响也是微乎其微.
图3 LAA与Wi-Fi混合网络的吞吐量
表2描述了采用竞争窗口预调整机制时,将LightGBM预测模型代入到系统模型后的性能指标.不使用竞争窗口自适应预调整机制时,LAA与Wi-Fi异构网络的吞吐量为54.826 M/bps,加入机制后,最大吞吐量为66.485 M/bps,吞吐量提升了21.266%.
表2 LightGBM预测模型代入到系统模型后的性能指标
5 总 结
LAA与Wi-Fi混合网络模型产生的数据采用LightGBM等6种机器学习算法进行预测,LightGBM算法的准确率和AUC值最高.考虑到CW的调整与实际的网络冲突不完全符合,本文提出了基于LightGBM算法的竞争窗口自适应预调整机制,采用该机制后LAA/Wi-Fi混合网络的吞吐量提升了21.266%.