一种H2H和M 2M 共存下基于异构云的资源分配算法

2020-05-29肖书春马文峰

南京邮电大学学报(自然科学版) 2020年2期

田辉，肖书春，马文峰，王聪，何雷

(1.陆军工程大学野战工程学院，江苏南京 210007 2.中国人民解放军66382部队，河北保定 074100)

5G网络要在现有网络的基础上将系统容量提升1 000倍来支持数目巨大且类型各异的节点通信［1-3］。而在这种节点类型多样化的网络中主要包含两类通信模式：传统的人对人（human-to-human，H2H）通信以及海量的机器对机器（machine-to-machine，M2M）通信。其中M2M通信是指在没有人为干预的情况下机器与机器之间的通信，其目标就是实现人、机器和系统之间互联互通［4-5］。而M2M通信的特征主要包括：设备数目巨大、功耗低、业务数据包小以及单向业务传输等［6-7］。

在H2H与M2M通信共存网络中按通信模式将节点划分成两类：人类型通信（human-type-communications，HTC）用户和机器类型通信（machinetype-communication，MTC）设备。由于两种通信模式差异巨大，因此在共存场景中需要考虑如何利用有限的资源做到既能够保证HTC用户的服务质量（quality of service，QoS）需求，又能够应对MTC设备的海量接入。目前已有很多学者就该问题开展了研究，其成果主要集中在共存场景下的资源分配［8-9］、接入控制［10-13］以及性能分析［14-16］等问题。文献［8］设计了一种应用于LTE上行传输的包调度算法来降低M2M 通信对H2H通信的影响。文献［9］提出了一种基于等待队列的资源分配算法，在满足H2H通信QoS需求的前提下提升M2M通信的能效。文献［10］设计了一种基于信道信息的MTC节点接入控制策略，来减少对H2H业务的影响以及降低MTC节点间的接入冲突概率。文献［11］提出了一种基于节点类型划分的随机接入策略来解决共存场景中的接入控制问题。文献［12］提出了一种考虑不同业务QoS需求的机会用户分配策略。文献［13］针对MTC节点采用CSMA/CA接入协议，以实现在共存场景中两类节点在LTE中PRACH信道上的并行接入。文献［14］分析在保证HTC用户的QoS需求的前提下MTC设备随机接入时延性能，并提出了一种MTC设备资源分配策略来降低接入时延。文献［15］在WiFi网络中对智能电网所存在的H2H和M2M业务的传输时延进行建模分析。文献［16］分析了在超密集网络（UDN）中H2H和M2M共存对网络的下行覆盖面和上行负载等性能指标的影响。

文献［8-11，13，15］所提策略只考虑单个网络如何利用自己的资源来保障H2H和M2M通信QoS需求。当网络中存在海量节点（包括HTC用户和MTC设备）同时接入时，由于单个网络资源受限，无法为每个节点分配资源，因此，为了应对海量节点接入请求，这些文献提出了两种解决方法：（1）可以通过优先级来接入网络［8-9，11，13］；（2）所有节点平等竞争接入网络［10，15］。其中，若按照优先级接入网络时，只能通过牺牲低优先级节点的性能，来保证高优先级节点的可靠传输。当网络中存在的高优先级节点数目很多时，低优先级节点可能都无法进行业务传输。而若按照相同的优先级随机接入网络时，当节点数目多且资源不足时，由于随机接入可能造成接入碰撞概率增加，甚至整个网络都处于瘫痪状态。因此，这两种方式不能很好地解决大规模节点接入问题。此外，文献［12，14，16］研究了如何利用异构无线资源来解决H2H和M2M通信性能的保障问题。然而，这三篇文献所提的解决方案本质上都是利用多基站（网络）间的负载均衡，来缓解传输资源不足的问题，没能达到利用有限的无线资源极大地提升网络资源利用率的目标。

针对该问题，本文设计了一种基于网络协同的异构云无线接入网络框架来解决H2H和M2M共存场景中的异构网络资源分配问题。为了保障H2H业务的QoS需求以及支持M2M业务海量传输，每个服务提供商（service provider，SP）将自己的资源分成两部分：一部分用于构建异构云无线接入网络为M2M业务提供服务；剩余部分用于保障H2H业务的QoS需求。为了消除异构云无线接入网络私人供给过程中引发的贡献过度和“搭便车”问题，采取了一种公共物品私人供给博弈论框架对SP的资源分配进行建模，同时分析该博弈纳什均衡的存在性和唯一性。然后，提出了采用反应函数求解的博弈资源分配方法和最佳反应动态博弈资源分配迭代算法，来获得纳什均衡。仿真结果表明，提出的方法能够消除贡献过度和“搭便车问题”。此外，相比于传统方法，在利用相同的无线资源前提下，所提算法能够明显地提升了网络容量，可有效地解决M2M 业务的海量接入和H2H业务的QoS保障的问题。

1 异构云无线接入网络架构

在异构无线环境中存在N个无线接入网络，如图1所示，其中每个无线接入网络包含一个SP和多个末端接入节点，包括HTC用户、MTC网关节点以及MTC设备。本文主要考虑HTC用户和MTC设备的上行通信。由于单个无线接入网的资源受限，因此考虑每个SP提供部分无线资源（本文主要考虑频谱资源）构成一个虚拟公共网络，利用公共网络来应对海量节点的接入需求，将该虚拟网络称为异构云无线接入网络，简称异构云。由于异构云都是异构资源，这就要求每个接入网的使用者必须是多模终端。然而目前绝大多数MTC设备尺寸和功能受限，无法支持多种模式传输。因此针对MTC设备接入异构云时，可采用分层架构，即MTC设备必须利用MTC网关节点转发，才能通过SP与远端服务器进行通信。对于HTC用户，由于其功能强大，可直接通过SP接入到核心网。这里假设MTC设备采用蓝牙、ZigBee和WiFi等低功耗的方式与MTC网关节点通信。注意每个参与构建异构云的SP才能免费使用其中无线资源。N=｛1，2，…，N｝表示异构网络中所有SP的集合，Di=｛1，2，…，Di｝表示属于SPi的所有MTC网关节点集合，Hi=｛1，2，…，Hi｝表示属于SPi的所有HTC节点集合，Bi表示SPi（∀i∈N）的带宽。

考虑到M2M业务的特点，H2H通信的QoS保障以及H2H和M2M两类业务之间的干扰消除这三个方面的因素，每个SP可利用异构云传输M2M业务，然后利用自己剩余的无线资源来保证H2H通信。由于M2M很多业务的随机性，所以并不是所有SP都会同时使用异构云；同时M2M业务的数据包很小但数量很多，这就导致了每个SP占用异构云无线接入网络资源的时间很短。假设这种公共网络［1］资源很多，这就导致了每个SP在某段短时间内需要较多的无线资源来支持这种M2M随机突发业务，而异构云恰好能够满足；最后，这种异构云由于资源的异构性，可考虑资源在空间上复用，提升网络资源利用率。正是基于以上三点原因，本文设计利用异构云传输M2M业务，降低网络拥塞，保证两类通信的性能。

在使用异构云传输M2M业务时，每个SP会首先根据其M2M 业务量计算所需的异构云频谱资源。然后SP感知异构云无线接入网的空闲频谱资源，判断其能否满足传输需求。若能，则占用所需的空闲频谱来传输M2M业务；否则，将占用所有空闲频谱。在获得充足频谱资源时，SP会根据通信需求为每个M2M网关节点分配资源。但是当SP获得的频谱资源小于其需求时，SP会根据M2M业务或MTC网关节点的优先级进行资源分配。同时，SP还会一直感知异构云的空闲频谱资源，直到获得的资源满足SP需求或传输结束。正如前所述，每个SP占用异构云资源的时间不长，且会根据其M2M业务量的波动来动态调整频谱资源的占用量。因此，即使SP在某一时刻获得的频谱资源不能满足其业务需求，但由于异构云可用频谱资源变化很快，SP能在较短的时间内获得足够的资源，来支持M2M业务传输。

2 异构云私人供给问题

异构云的构建过程分成两个阶段：（1）首先每个SP判断其资源能否满足其业务需求，若不能满足，则参与下一阶段网络构建过程，否则退出；（2）确定参与异构云构建的SP根据自身的情况确定贡献多少频谱资源。不失一般性，假设所有SP都愿意参与构建该公共网络。下面以SPi（∀i∈N）为例详细阐述异构云无线接入网络的构建过程。SPi将自己的频谱资源划分成两部分：一部分用于构建异构云，称这部分资源为公共消费品或贡献量gi（gi≥0）；而剩余资源用于保障自己HTC用户的QoS需求，这部分资源成为私人消费品xi（xi≥0），其中gi+xi=Bi。定义αi为SPi的贡献度，即αi=gi/Bi。

分表示SPi使用异构云无线接入网络后能够获得的传输速率，即SPi的公共网络收益。由于频谱复用度与SP的空间分布以及频谱配置相关：当每个SP之间的距离足够大且频谱配置较好时，所有SP使用异构云无线接入网络中的相同频谱资源都不会相互产生干扰，所以每个SP的频谱复用度都为1，此时获得的收益为最大值；而当SP间距较小时，在使用异构云的任何频谱都会被其他SP干扰，则每个SP的频谱复用度为0，此时获得的收益为最小值。所以，频谱复用度的取值范围是0≤λi≤1。式（1）中的第二部分表示SPi提供给HTC用户的平均速率，即使用私人消费品后的收益。

在异构云构建过程中，每个SP都会以最大化自己的平均传输速率为目标来确定贡献量。根据式（1），如果当频谱复用度λi＞gi/G（∀i∈N）时，SP会更愿意将自己的频谱资源贡献到异构云中来获得更高的平均传输速率。如果这种情况发生，那么SP就没有足够的资源来保证HTC用户的QoS需求，因此需要限定每个SP的贡献量。此外，假设每个SP都是自私的，只会考虑自身的利益最大化。因此在异构云无线接入网络构建过程中容易出现“搭便车”现象，即会存在SP不提供频谱资源但是会使用已经构建的异构云无线接入网络。因此，每个SP需要根据自己两类业务的需求设定贡献度的可行区

其中，每个SP在贡献度可行范围内选择贡献量来最大化平均传输速率Ri（gi，G）。

3 异构云的私人供给博弈模型

在经济学中，公共物品是指一种资源，它是公开免费使用的，而且具有无归属性［17］。其中公共资源的高效使用、提供以及保护等问题得到了广泛的研究［18-20］。当公共物品由每个参与者自愿提供时，每个参与者的动力就是从公共物品中获得相应的收益。例如，某个小区需要修一条马路，而费用由小区各业主自愿承担。在这个例子中，马路就是公共物品，每家居民参与修建这条马路的动力就是为生活提供便利性。而异构云符合经济学中对于公共物品的定义，因此可以利用公共物品私人博弈理论对异构云无构建问题进行建模分析。

为了对异构云进行博弈建模，首先需要设计每个参与者（SP）的收益函数。若直接采用每个SP的平均传输速率作为收益函数，会出现“搭便车”现象以及贡献过度问题。为了解决这一问题，将每个SP的收益函数设计为

为贡献度范围限定因子。在式（3）中的第一项是异构云收益乘以贡献量，以刺激SP贡献自己的频谱资源，从而保证异构云具有充足应对MTC设备海量接入。式（3）中的第三项为惩罚项，该项的功能就是进一步激励SP贡献频谱资源，同时防止出现贡献过度问题。可以看出，当贡献度过大或者过小时，惩罚力度都会增大，因此会将贡献度控制在以为中心的一个范围内。此外，可通过设置贡献度门限和惩罚因子β来调整贡献度可行范围［］的大小，实现收益的最大化。而每个SP如何根据业务量来确定贡献度可行范围不在本文讨论范围内，但是会在仿真中研究贡献度范围限定因子对系统性能的影响。

然后，定义异构云私人供给博弈为

其中，N表示参与者集合，即所有SP；Si表示纯策略集合，即SPi的公共消费品gi，这里认为每个SP的策略集合是一个连续空间，即0≤gi≤Bi，∀i∈N；ui表示SPi的收益函数。定义gi为SPi贡献量策略，g-i为除SPi外所有其他SP的贡献量策略组合。

在异构云无线接入网络私人供给博弈中，每个SP会根据其他用户的选择策略，来选择一个贡献量策略gi，从而达到最大化自己收益的目的。因此，该博弈可以正式表示为

博弈的最终结果就是得到一个稳定性的策略集合，即为纳什均衡。纳什均衡是一种联合策略，在该策略中，每个博弈参与者的策略都是对其余博弈方的策略组合的最佳对策。当达到纳什均衡时，不会有博弈参与者单方面地改变自己的策略来寻求最大化收益。下面分析本文设计的博弈G能否达到纳什均衡，若存在，如何获得纳什均衡。

3.1 纳什均衡存在性分析

纳什均衡的存在性分析如以下定理。

定理1 当λi＞0，∀i∈N，G是一个超模博弈，它一定存在一个纳什均衡解。

证明：式（3）对gi和gj（∀i，j∈N，i≠j）求二阶偏导数，可得

∂ui/∂gi∂gj＞0。而这又说明收益函数ui具有增量差异。且又因为ui对于gi和g-i都是连续的，以及策略空间Si是R上的一个紧的子集。根据超模博弈的定义［21］，异构云私人供给博弈G是一个超模博弈。同时，根据文献［21］的定理1，博弈G的纳什均衡一定存在。

从定理1可知，只有当所有SP在参与博弈过程中的频谱复用度都大于0。该博弈才能获得解，得到纳什均衡。因此可以看出网络空间的频谱复用增益才是SP博弈的关键。只有当SP的空间分布以及频谱配置合理，每个参与者都能享受到频谱复用带来的增益，这个异构云才能够稳定构成，从而解决H2H业务的QoS保障和M2M 业务海量接入的需求。

3.2 基于博弈的资源分配方法设计

本小节提出了两种资源分配方法来获得博弈的纳什均衡。首先，提出了一种采用反应函数求解的博弈资源分配（Reaction Function based Resources Allocation，RFRA）方法来求解纳什均衡。反应函数就是每个博弈参与者针对其他博弈方策略的最佳反应构成的函数［17］。而各个参与者反应函数的交点就是纳什均衡。由于每个SP的收益函数都是多元连续函数，令∂ui/∂gi=0，可得gi的反应函数R（g-i）为

然后，求出N个反应函数联立后的解，即可得到博弈G的纳什均衡。

同时，设计一种最佳反应动态博弈资源分配迭代（Best Response based Resources Allocation Iteration，BRRAI）算法来获得纳什均衡。在每次迭代中，每个用户按照下标顺序，在其他SP策略的基础上，以最大化效用为目标选择自己的最佳贡献量。然后不停地迭代直至所有SP的策略不变。算法的具体描述参见算法1。

证明：根据文献［21］的定理2，当满足如下条件时博弈G的纳什均衡存在唯一性且BRDI算法能够收敛：（1）博弈的策略集为连续空间；（2）该博弈为超模博弈；（3）满足可扩展性，即对于所有的e＞1，∀i∈N，都有eR（g-i）＜R（eg-i）。

根据策略集｛Si｝i∈N的定义以及定理1，条件（1）和（2）能够满足。下面需要证明可扩展性，可得

综上所述，如果当条件式（9）满足时，根据文献［21］的定理2，超模博弈G的策略纳什均衡唯一，且BRRAI算法能够收敛到该纳什均衡。因此定理2证明完毕。

定理2给出了BRRAI算法适用条件，可在仿真和实际应用该算法时，通过提前验证所设置的参数能否满足条件式（9），即可得知该算法用于求解本文所提的博弈问题。在实际执行BRRAI算法时，假设网络存在一个中心控制器负责收集和分发各个SP的策略，以及控制每个SP的执行顺序。在每次迭代中，按照中心控制器的控制命令，每个SP在其他SP所做决策的基础上选择贡献量，并将策略上传至中心控制器。该过程不停地迭代直至算法收敛。

4 仿真性能分析

本节利用MATLAB软件对本文所提算法的性能进行分析和评估。假设系统的参数为：β=20，C=1。为了有效地验证文本所提算法的性能，在仿真中加入了两种对比算法：全网收益最大（Social Payoff Maximization，SPM）算法和传统接入控制（Conventional Access Control，CAC）算法。在SPM中，每个SPM算法都是以全网效益最大化为目标来选择自己对异构云无线接入网络的贡献量。对于CAC算法，每个SP利用自己的资源为HTC用户和MTC设备提供服务，而不考虑多网间的协同。不失

图2描述了BRRAI算法在不同参数下的收敛性能。其中，该图的仿真参数设置如下：10个SP所拥有的频谱资源按照下标顺序分别设置为｛5，6，7，8，9，10，11，12，13，14｝MHz，10个SP的平均信噪比按照下标顺序分别设置为｛10，11，12，13，14，15，16，17，18，19｝dB。从图2中可以看出，BRRAI算法的收敛速度非常快（迭代次数不超过2次）。这是因为BRRAI算法通过反馈获得了全网信息，能够加速算法的求解速度。进一步说明集中控制算法适用于动态变化的网络。同时，BRRAI算法的收敛性能不会受到参数αCi和λi改变的影响。

表1给出了不同参数下各个SP对异构云的频谱贡献量。仿真参数设置如下：10个SP所拥有的频谱资源按照下标顺序分别为｛5，6，7，8，9，10，11，12，13，14｝MHz，10个SP的平均信噪比按照下标顺序分别为｛10，11，12，13，14，15，16，17，18，19｝dB。从表1中可以看出，本文设计的惩罚机制能够有效地消除“搭便车”现象，并且能通过调节参数和λi来控制每个SP的贡献量。此外，从结果还可看出，λi越大越能刺激SP贡献频谱资源，同时每个SP的贡献量还与平均信噪比有关，平均信噪比高的SP，其贡献量也越大。这是因为每个SP的收益函数式（3）与频谱复用度λi以及平均接收信噪比正相关，λi越大，越能激励SP贡献更多的频谱。

表1 不同参数下各个SP的贡献量 MHz

图3画出了不同算法下各个SP的平均速率曲线图。10个SP的平均信噪比按照下标顺序分别为｛10，12，14，16，18，20，22，24，26，28｝dB。该图表明，对于四种算法，每个SP的平均速率都会随着平均信噪比的增加而提升。相比于CAC算法，本文所提的两种算法能够明显地提升各个SP的平均传输速率，增加资源利用率。而且这种性能差异会随着带宽资源的增加而更加明显。这是因为本文设计的两种算法充分利用频谱资源在空间上的复用增益，一段频谱可以同时在多处使用，可有效地提升整个网络的传输速率，此外随着网络资源的丰富，这种性能提升会更加显著。此外，SP的自私性会导致BRRAI算法和RFRA方法的性能要劣于SPM 算法。而本文所提的两种方法在不同的带宽资源下都能获得相同的性能。

5 结束语

文中提出了两种异构网络的资源分配方法来缓解共存场景中H2H业务的QoS保障和M2M业务的海量传输带来的资源分配压力。为了保证共存场景中H2H和M2M业务的性能，每个SP将资源划分成两部分：一部分构建异构云用于M2M业务传输；而剩下的部分用于H2H业务传输。为了解决在异构云构建过程中带来的贡献过度以及“搭便车”问题，本章采用了博弈论对SP的资源分配过程进行建模，并证明了该博弈为超模博弈，然后分析该博弈纳什均衡的存在性和唯一性；接着，设计了两种资源分配方法来获得纳什均衡。仿真结果表明，相对于传统的接入控制方法，本文所提出的两种资源分配方法能够明显地提升网络资源利用率，既能够应对M2M业务的海量接入特性，又能够预留充足的资源保障H2H业务的QoS需求，从而降低两类业务间的影响。