面向节能的神经网络流量预测探讨

2021-05-28陈秀敏黄毅华刘兵何宇锋

移动通信 2021年3期

陈秀敏，黄毅华，刘兵，何宇锋

（1.中国电信股份有限公司研究院，广东广州 510630；2.珠海世纪鼎利科技股份有限公司，广东珠海 519085）

0 引言

随着5G的全面商用，由于其采用的频率更高、单站的覆盖范围小，以及为满足5G高可靠、广覆盖、低时延等特点，5G的站点数目相比4G急剧增加，虽然5G单位比特耗能比小于4G基站，但是绝对能耗则不容小觑。如何在不影响网络业务和用户感知的前提下，有效降低整体网络能耗，提高能量效率，是现5G的一个热门讨论课题。

通信网络节能方案可以划分为基站节能方案和网络级节能方案。基站节能方案主要考虑从设备硬件、软件特性等方面优化设备能耗，而网络级节能方案考虑多制式网络之间协作实现全网能耗最优的效果。基站设备节能方案主要有两种方式，即硬件节能方案和软件节能方案，硬件节能降低基站设备的基础功耗，软件节能从业务运营角度出发对硬件资源进行合理调配，让基站设备更高效运行。常见的节能策略主要有符号关断、通道关断、载波关断、深度休眠等基础型节能，以及通过小区/微站关断及下行功率优化、智能节能等方式强化节能的增强型节能。

从运维的角度来看，节能并不仅仅以降低能量消耗为单一的目标，节能的目的是实现网络运行所产生的能量消耗与网络提供的服务的性能之间的一种折中状态，或者说，是在不影响网络提供服务关键性能指标的前提下降低能量消耗。

在实际应用环境中，面对基站属性的差异、网络数据（业务类型、服务质量情况、网元负载情况等）的变化，不同预测模型/算法与实际情况的匹配程度是不同的。本文侧重的是从业务流量预测的角度去辅助节能策略的选择，针对业务流量存在的季节性提出在LSTM网络预测流量时间序列的基础上，引入指数平滑模型处理时间序列的季节性，使改良后的模型既可以最大限度地拟合流量时间序列数据，又可以在长期预测中保持预测性能的稳定和可靠，达到提升预测精度从而精准节能以保障网络服务关键性能指标的目的。

1 流量与能效

1.1 能源效率评价

基站主设备能耗主要由机柜能耗和载频能耗组成，载频能耗主要由功放、基带处理、电源、模拟电路等构成，占主设备能耗的90%，是基站主设备能耗的主要组成部分，其中又以功放的能耗占比最高，因此要想降低基站主设备能耗，可以从射频功率和能耗入手。

一般来说，网元的EE（Energy Efficiency）KPI表示为数据量除以所考虑网元的能量消耗。在无线接入网络的情况下，也可以使用EE KPI变量，用覆盖面积除以所考虑网元的能量消耗来表示[1]，如式(1)所示：

EEMN,DV要求采集5G网络功能（NF）的数据量（DV）和能耗（EC），在NG-RAN，DV测量的是每个小区的数据量。

为了评估是否达到节能的效果，需要一个能用来确定节能前后所获得收益的指标。此处引入能源的绝对度量和相对度量，前者ECR（Energy Consumption Rating）通常定义为基站发射机的峰值功率除以最大数据吞吐量的比率。为了使该度量更具实用性，ECR测量的应该在网络上成功传输每信息位所消耗的能量。相对度量能量消耗增益ECG（Energy Consumption Gain），指的是对使用节能技术的基站（被测系统）能源性能与未采用该方法的基准系统进行比较，简单说就是比值Eb/Et，其中Eb是参考系统消耗的能量，Et是被测系统的能量。ECG值越大，被测系统的工作效率越高。与ECR指标一样，为了提供公平的比较，需要注意以公平的方式进行能量计算，例如在比较两个基站设计时，应确保在相同的流量负载条件下并且两个系统服务的用户数相同。

1.2 流量与能源的关系

对无线网络中的数据流量分析表明，各小区之间的流量负载通常都是非常不均衡的。参考文献[2]对200个小区的分析中，可以发现即使在高峰时间，90%的数据流量仅由网络中40%的站点承载。因此，在不同的业务负荷条件下使能源消耗最小化的技术是一个重要的研究方向，在这里我们将分别描述针对低和高业务负荷两种情况下的能耗。

在低流量负载的情况下，基站有能力用比用户当时所需带宽更多的可用带宽来向用户传输数据。根据香农定律C=Blog2(1+SINR)，信道容量随可用带宽呈线性增长，随信噪比呈对数增长。噪声功率一定的情况下，信号发射功率越高信噪比越高。因此可以用频谱来换取能源效率，并在保持服务质量的同时实现能源节约。例如在复杂但频谱效率高的窄带宽的16-QAM调制方式，和相对简单的宽带宽的QPSK调制方式之间做选择，选择带宽宽的后者就会比选择带宽窄的前者更节省能源。这种情况，就是利用了空闲带宽资源来减少能源消耗。

图1显示了这种方法的ECG增益预测结果，其为给定数据速率下所需信噪比（SINR）的函数。一般来说，随着频谱效率的提高，所需信噪比也随之提高。α值指允许的带宽扩展系数，例如，α=2的带宽扩展将允许16-QAM调制（4 bit/s/Hz最大数据速率）被QPSK（2 bit/s/Hz最大数据速率）取代，这将需要较低的SINR。结果表明，随着信噪比的增加，使用带宽扩展技术对ECG的潜在改进也在增加。

图1 低流量负载的ECG增益预测结果

当业务量较大时，基站可能同时向多个用户传输数据。在这种情况下，通常可以利用多用户多样性来增加通过资源调度和分配策略实现的总体多用户容量，根据用户在时间、频率或/和空间域中的瞬时信道条件来分配资源。如MIMO采用了适当的链路适应和资源调度方法，来确保在分配的资源内采用最节能的传输方式以满足所需的QoS级别。性能的提高可以转化为发射机的能量进一步减少。以文献[3]为例，图2给出了不同MIMO预编码方案与以单用户MIMO分集方案空频分组编码（SFBC）为基准情况下的ECG性能对比。图中可见利用更高分集度的多用户MIMO方案在每个信息位所需的发射机能量方面可以实现较低的成本。当移动用户数量足够大时，性能评估结果表明，多用户可以实现5倍的能量增益。

图2 高流量负载下不同编码方案的ECG对比

2 流量预测模型架构

流量和其他的时间序列一样，存在明显的季节性周期特性。比如在一周内呈现中间高、两端低的周期变化，这说明流量业务的使用在工作日中达到高峰，在周初和周末趋向低谷，同时在年度中也存在相应的季节周期性变化。又比如在经济发达的城市，高峰往往出现在8、9月份，因为此时的社会活动非常活跃，而低谷则出现在春节期间，此时大量的人员返乡过年，大城市人口密度明显下降，从而移动业务的使用也进入了一年中的低谷。而在经济相对欠发达地区，由于返乡过节人员的持续密集流入，相应的移动业务的使用达到高峰，反而使春节期间的网络流量逐步进入一年中的峰值。除了周期特性外，移动网络流量时间序列也受到不断出现的异常波动影响，比如人群聚集、网络异常等突发性因素，这对站点级的流量时间序列预测产生影响。对此我们提出使用引入了指数平滑模型的LSTM网络的模型架构HW-LSTM来预测流量。

2.1 LSTM网络模型

RNN（Recurrent Neural Network，循环神经网络）是一系列能够处理序列数据的神经网络的总称。基本的RNN模型只处理前一个单元的输出，距离远的单元的输出，因中间经过多次处理，其影响会逐渐消失。所有递归神经网络都具有神经网络重复模块链的形式。在标准RNN中，该重复模块具有非常简单的结构，例如单个tanh层。长短期记忆模型LSTM（Long Short Term Memory）是一种特殊的RNN，能够学习长期的规律，也具有这种类似链的结构，但重复模块具有不同的结构，有四个而不是一个神经网络层。图3所示为RNN的链式结构，每个时间片使用的是相同参数，图4所示的LSTM引入了门（gate）机制用于控制特征的流通和阻断。门是一种选择性让信息通过的节点，它们由Sigmoid神经网络层和逐点乘法运算组成。Sigmoid层输出0～1之间的值，每个值表示对应的部分信息是否应该通过。0值表示不允许信息通过，1值表示让所有信息通过。LSTM的巧妙之处在于增加了三个这样的门（输入门、遗忘门和输出门），使自循环的权重是可变可控的，用于保护和控制信息流向量状态。

图3 RNN单元结构

图4 LSTM单元结构

研究人员发现基于深度学习的LSTM可以很好地拟合非线性的时间序列数据，并且能有效改善RNN所存在的梯度消失和梯度爆炸问题。梯度消失和梯度爆炸是由于RNN的权值矩阵循环相乘所引起的。关于梯度消失，是指梯度被近距离梯度主导，导致模型难以学到远距离的依赖关系，传统RNN采用连乘积的形式来计算状态，多个小于1的项连乘造成了梯度消失，LSTM之所以可以解决梯度问题，是因为它避免了无休止的连乘，而是边加边乘。虽然LSTM仍然有可能发生梯度爆炸，但由于LSTM的其他路径非常崎岖，和普通RNN相比多经过了很多次激活函数（导数都小于1），因此LSTM发生梯度爆炸的频率要低得多。通常处理梯度爆炸的方法为梯度截断，就是将超过阈值θ的梯度降为θ。

2.2 指数平滑模型

在时间序列中，我们需要基于该时间序列当前已有的数据来预测其在之后的走势，三次指数平滑Holt-Winter算法可以很好地进行时间序列的预测。时间序列数据一般具有趋势性和季节性的特点。趋势描述的是时间序列的整体走势，比如总体上升或者总体下降；季节性描述的是数据的周期性波动，比如以年或者周为周期。指数平滑法有几种不同形式，此处使用的是三次指数平滑Holt-Winter模型，因其引入了趋势和季节成分，于是可以对同时含有趋势和季节性的时间序列进行预测。式(2)为累乘三次指数平滑的预测公式，式中L是一个季节的周期数，St为水平成分，It为季节成分，bt为趋势成分。

本文中我们分析了某大型城市的三个重要会展场所的流量时间序列的季节性成份，发现5分钟粒度的时间序列存在明显的天周期成份，图5为从其中一个区域5分钟粒度时间序列中分解出的天周期成份和趋势成份。

图5 趋势成份与天周期成份

从图中可以看到该区域从10月9日至16日总体流量变化趋势呈现上升状态，而其天周期表现为零点至3点30分前后流量直线下降，3点半后逐级上升，在晚上9点前后达到高峰后，转为下降趋势，模型分解出的趋势、周期成份很好地反映了真实情况下的流量变化规律。

2.3 HW-LSTM模型

作为非线性模型，LSTM可作为复杂的非线性单元用于构造更大型深度神经网络。不管是RNN还是LSTM及其衍生主要是随着时间推移进行顺序处理，但一旦遇到不完全按时间一环扣一环形成的时间序列数据就可能会导致预测偏离。

如前文所述，业务流量随时间有波动性和突发性，从而产生离群值，对时间序列的平稳性会产生影响，使预测准确度降低，特别是进行较长期的预测，比如用5分钟粒度的数据进行一天或多天的长期预测，或者用天级数据进行一周或一月的预测。无论是LSTM还是指数平滑模型都是基于对前期的预测然后再对后期进行迭代预测，当前期预测出现离群值，则会对后期的预测产生较大的影响，甚至会使趋势发生较大的偏离，为了避免这一问题，本文提出一种将LSTM模型与指数平滑模型进行组合的方法（下文称为HW-LSTM），使用LSTM预测时，如果出现大于阀值的离群值，则采用指数平滑的预测值代替，由于指数平滑模型引入了水平项、趋势项和季节周期项，会使其预测结果较为符合带有周期性和突发性的时间序列的长期规律，将其结果馈入LSTM模型，可以使对业务流量的预测结果更加准确。HW-LSTM处理流程如图6所示：

图6 HW-LSTM结构

如图6所示，当LSTM在t时刻预测值不在设定的值域范围(a,b)内时，则选择指数平滑模型同期t时刻的预测值替换LSTM的预测值充当到下一步的模型输入Yt-1，从而起到影响下一步ˆtY的预测结果的作用，通过不断的循环迭代，使指数平滑模型起到了对LSTM网络的修正作用，使LSTM网络在进行长期预测时更加稳定可靠。

如上节所述，HW-LSTM模型需要在LSTM模型迭代预测时根据预测值是否在值域范围(a,b)内，对是否馈入指数平滑预测值进行决策，本文中我们依据时间序列在当前预测时间的95%置信区间的上下限值来确定值域范围(a,b)的取值，95%置信区间的计算由最大后验概率MAP方法计算得到，在计算过程中设定MAP方法的初始先验服从P(θ)～N(μ,σ2)正态分布。式子如下：

3 模型评估试验

为验证模型的有效性，此处选取国内某大型城市三个重点区域7天的时间序列流量数据，时间粒度为5分钟，单区域数据量为2 114条，我们截取前1 826条数据为训练数据，后288条数据为测试数据，预测时间长度为24小时内的5分钟粒度流量，这三个区域经常承担该城市大型会展活动，属于人群密集、流动频繁的区域，在短时间内可能出现人流的巨增，给基站带来很大压力，无论从基站节能保障的角度，还是从安保的角度，都需要对小时间粒度的流量进行准确预测。以往基于5分钟的准确预测具有一定的难度，而在使用本文提出的HWLSTM模型预测方法后可以取得更好的预测结果。表1是基于HW-LSTM的预测精度与基于单独LSTM模型的预测精度对比。通过比较，可以看到我们提出的HW-LSTM得到了比单独使用LSTM更加准确的预测结果。

表1 HW-LSTM预测精度与LSTM预测结果对比

图7是三个区域的流量预测时序图，左边为HWLSTM预测结果，右边是LSTM预测结果。图中红线为真实值，蓝线为预测值，灰色阴影为95%置信度下时间序列上下波动区间，通过对比图7，可以直观观察到本文提出的HW-LSTM对该三个区域流量的预测相比LSTM得到的预测结果更精准更细腻。

图7 HW-LSTM预测时序图和LSTM预测时序图

4 结束语

本文所提出的HW-LSTM模型是一种将指数平滑模型与LSTM模型进行组合改良的序列数据预测模型，利用两个模型自身各自的特点，使HW-LSTM模型既有LSTM模型良好的拟合性，又具备了对异常波动点的抑制，可以较好地预测小时间粒度的流量时间序列。试验数据也很好地印证了HWLSTM模型的优势。美中不足的是，HW-LSTM模型并不是一个独立的深度学习网络，需要两个模型进行协调工作，在效率上不如单独的LSTM模型，下一步的研究将考虑如何把两种模型从算法层面上更好地结合，以提高模型的预测效率。