雾无线接入网中基于内容流行度和信息新鲜度的缓存更新策略

2022-09-22孙长印王军选

电子与信息学报 2022年9期

江帆梁晓孙长印王军选

(西安邮电大学通信与信息工程学院西安 710121)

(陕西省信息通信网络及安全重点实验室西安 710121)

1 引言

随着近年来移动互联网平台的迅速发展以及各类智能设备的空前增长，对于数据流量的需求也呈现爆炸式高速增长[1]。截至2021年底，仅蜂窝物联网用户在我国已达13.99亿户[2]，逼近移动电话用户规模。然而，由于无线网络通信资源有限，大规模的数据流量会使得移动通信网络面临时延增加、通信拥塞甚至通信中断的困境。在低时延、高效数据处理需求的驱动下，雾无线接入网(Fog-Radio Access Network, F-RAN)作为一种新型网络架构，能够充分利用边缘设备-雾接入点(Fog Access Point, F-AP)的通信、计算、存储能力，有效缓解大规模数据流量带来的无线网络负载压力[3]。因此，可以将用户感兴趣的热门内容提前缓存在雾接入点，从而减少无线通信中回程链路的负载压力，降低用户的请求时延。在信息缓存过程中，缓存的内容一般包含两种类型：静态内容和动态内容。静态内容不随时间的改变而改变(如电影、图片、音乐等)；而动态内容会随时间的改变发生变化，一般用来表征设备所处环境的实时状态(如道路通行状态、停车场空位情况、车辆位置等)，该类内容通常对于时延非常敏感且具有动态特性。虽然移动边缘缓存技术能够有效减小信息传输的端到端时延，但是随时间和环境的动态变化，如何保证已缓存动态内容的信息时效性，避免信息滞后甚至信息失效值得深入探究。因此，相关研究提出了采用信息年龄(Age of Information, AoI)作为度量动态内容新鲜度的指标，其定义为信息从产生到使用的时间差，即AoI越大信息越滞后，反之，则表示信息越新鲜[4]。与时延指标不同，AoI与信息的产生时间、缓存时间等因素密切相关；而时延则一般取决于信息的比特大小，队列的分组到达强度等因素。在实际的网络中，智能终端侧的AoI不仅与传输时延有关，也取决于信源节点内容的生成过程，中间节点的转发与处理等过程等。因此，如何为用户提供满足时效性需求的动态内容，已成为近年来雾无线接入网中缓存策略的研究热点[5,6]。

传统的内容缓存策略，如先入先出(First In First Out, FIFO)，最近最少使用(Least Recently Used, LRU)，最不经常使用(Least Frequently Used, LFU)等已经在有线网络中得到了广泛使用，但上述策略没有考虑内容流行度，其性能效率受限[7]。近些年，通过预测内容流行度来提高内容缓存效率已成为目前缓存策略的研究主流。在相关的研究工作中，文献[8]提出一种基于联邦学习的上下文感知流行度预测策略。文献[9]提出一种基于深度强化学习的协作边缘缓存方法。但是，目前大多数基于流行度预测的缓存算法并未充分考虑内容流行度的时空动态性，且仅考虑了静态的内容缓存策略，而没有考虑如何维护已缓存的动态内容的时效性。

基于已有研究，本文提出一种基于内容流行度和信息新鲜度的缓存更新策略。该策略主要包含基于流行度预测的内容缓存和基于信息新鲜度的缓存更新两方面。首先，根据用户的历史位置信息，使用Bi-LSTM神经网络训练得到用户的移动模型，从而预测用户在下一时段所处的位置区。然后，根据预测得到的用户所在位置区，结合用户偏好模型，得到各位置区内的内容流行度分布。最后，使用最流行缓存策略(Most Popular Caching, MPC)将流行内容缓存在多个雾接入点(F-APs)中[10]。针对已缓存在F-APs中的内容，本文以最小化时延为目标，为具有不同流行度分布的内容设置不同的缓存更新窗口，从而保证已缓存内容的新鲜度。仿真结果表明，所提出的算法可以有效地提升缓存命中率，在保证内容新鲜度的同时，最大限度地减小平均时延。

2 系统模型

如图1所示，考虑结合边缘缓存的雾无线接入网(F-RAN)场景，其中包含云服务器，云服务器所覆盖的若干个雾无线小区、随机分布的提供内容的源节点及用户。假设用户所发出的内容请求包含静态内容和动态内容，且该内容流行度具有时空动态性，即内容流行度会随所处时间空间不同而改变。将图1所示网络又进一步划分为若干个独立的位置区，假设用户可以在各个位置区之间随机移动。令L={1,2,...,l,...,L}表示所划分的位置区集合，U={1,2,...,u,...,U}表示整个区域的所有用户集合。考虑有限时间内的内容缓存情况，故将时间轴划分为离散集合T={1,2，...,t,...,T}。在每个时间周期t内，假设用户的位置不发生变化，用户u在t时刻所处的位置用lu,t表示，用Ul,t={1,2,...,ul,t,...,Ul,t}表示在t时间段处于l位置的用户集合。假设用户设备(User Equipment, UE)会自动记录用户的历史请求信息和移动位置信息，且每个位置区都已部署一个F-AP来为UE提供包含接入、切换、内容请求等在内的服务，部署在不同位置区的F-AP可以共享整个区域内的用户的位置信息。假设每个位置区的F-AP具有相同大小的内容存储空间，设为C。F={1,2,...,f,...,F}代表整个系统内源节点所提供的所有内容的集合，其包含了静态内容和动态内容，每个内容大小为φ。为了减少用户请求时延并考虑到F-APs有限的缓存空间，只将部分流行度较高的内容缓存在F-APs中。考虑到用户并非只会请求流行度高的内容，流行度较低的内容也可能会被请求，因此将所有的内容上传到云中心存储备份。

图1 基于F-RAN的缓存系统模型

为了实现高效的内容缓存，云中心首先结合系统内的用户信息，进行线下流行度模型训练，并将训练好的模型发送到F-APs处。在每个时间周期t开始时，各位置区的F-AP再结合训练好的模型和位置区内的用户历史位置信息和历史请求信息，进行线上的流行度预测，进而得到位置区内的流行度分布。根据预测得到的流行度分布，使用MPC策略将流行度高的部分内容缓存在F-AP中。假设已缓存在l位置区的静态内容集合可表示为Sl,t={1,2,...,sl.t,...,Sl,t}，动态内容集合表示为Cl,t={1,2,...,cl.t,...,Cl,t}。为保证所有缓存在F-APs中动态内容的时效性，需要为每个动态内容设置缓存更新窗口，令其为Wcl,t。记Alc,t为t时间段缓存在l位置动态内容c的信息年龄。若用户所请求的动态内容cl,t已缓存在本地的F-AP处，且Alc, t≤Wcl,t，用户将直接从FAP处下载该内容；如果Alc, t>Wcl,t则表示该动态内容已失效，F-AP需要先从源节点处获取最新的动态内容，再传输给用户，因而就产生了1次缓存命中。而当用户请求的动态内容并没有缓存在本地FAP时，用户请求将会被路由到云中心，则认为缓存未命中。

3 基于内容流行度预测的缓存策略

由式(2)所建立的最大化缓存命中率目标函数可以看出，全局缓存命中率取决于各位置区的缓存命中率的分布，且内容流行度会随着位置区中用户集合的变化而变化。如果能够对用户的位置区进行精准预测，再将用户位置预测和该位置区内的用户偏好模型结合，会进一步提高内容流行度预测的精确性和针对性，从而有效提高缓存命中率。因此，所提出的基于内容流行度预测的缓存策略首先针对用户的位置区进行预测，然后结合用户偏好模型，得到各位置区的内容流行度分布。最后，利用最流行缓存策略将流行度高的内容缓存在F-AP中以最大化缓存命中率。

3.1 用户位置预测

由于用户当前所处位置与用户的历史位置及未来位置之间存在紧密的制约关系，获取用户过去位置信息的同时挖掘未来可能的位置信息显得非常的重要。本文采用了双向长短期记忆(Bi-directional Long-Short Term Memory, Bi-LSTM)[11]以线下线上结合的方式，对用户的位置进行预测。其中，Bi-LSTM结合了两种长短期记忆网络(Long-Short Term Memory, LSTM)，一种 LSTM能从前往后分析输入的位置序列信息，另一种 LSTM能从后往前分析输入的位置序列信息，因而将用户历史位置信息输入到Bi-LSTM神经网络进行训练，即可得到用于预测下一时刻用户的位置预测模型。

3.2 用户偏好预测

最后，基于预测得到的内容流行度分布，则利用MPC缓存策略将流行度较高的内容缓存在F-AP处。

4 基于信息年龄的更新窗口设置

图2 缓存内容的信息年龄(AoI)变化示意图

其中，P2问题的目标函数是最小化平均更新概率，这等价于最小化平均时延D¯c。此外式(21)中的约束条件C1也等价于式(22)中的约束条件C1，式(22)中的约束条件C2也等价于式(21)中的约束条件C3。根据Wc和Nc的线性关系，虽然P1和P2在数学上不等价，但可以通过求解P2来找到P1的最优解。根据文献[16]可以证明问题P2是凸的，因此可以利用凸优化工具来解决P2问题，进而得到P1的最优解，最后即可得到各缓存内容的更新窗口长度。

5 仿真与性能分析

为了评估内容流行度预测的准确性，本文利用从MovieLens[18]网站下载的真实电影评级数据进行仿真实验。此数据集由用户ID、电影ID、电影类型、电影评分以及时间戳组成。电影类型一共可分为18种，这18种电影类型组成了一个18维特征矢量。当电影具有1个特征时，就将该内容特征矢量所对应的位置设置为1，否则设置为0。此外，当用户对电影的评分≥3 时，视为用户偏好此部电影；否则视为用户不偏好此电影。将内容流行度预测的周期t设置为1 d。为了与位置预测结果相对应，在BALI-2的数据集中我们共提取了分布在90个位置的102名用户的位置数据，对应于MovieLens数据集中的102个用户信息，并假设两个数据集所包含的用户是相同的。由于用户的内容请求既包含静态内容又包含动态内容，假设每个内容请求最大为1M，其他仿真参数设置参见表1。

表1 仿真参数

图3展示了Bi-LSTM神经网络和LSTM神经网络预测准确率的对比图。从图中可以看出Bi-LSTM的预测准确率比LSTM准确率高，这是由于相比较LSTM而言，Bi-LSTM神经网络可以同时利用正向和反向的LSTM层，更为精准地挖掘到输入信息中历史位置和未来位置之间的关系。图4展示了本文所提出的用户位置预测方法对一个随机选定用户进行30 d的位置的预测结果与用户真实位置的对比图。可以看出，所提出的用户预测模型在绝大多数时间段内，都能较为准确地预测出用户所处的位置区。

图3 Bi-LSTM和LSTM的准确率对比图

图4 用户位置预测随时间的变化

图5展示了内容流行度预测误差在划分位置区和不划分位置区的分布情况，可以看出划分位置区的绝大多数预测误差都分布于0-0.1，平均预测误差为绿色横线所示的0.0404。而不划分位置区的平均预测误差为橙色横线所示的0.137。这是因为考虑位置划分的流行度预测算法充分考虑了内容流行度与用户位置之间的关系，因而对于内容流行度的预测更为准确。

图5 内容流行度预测误差

为了评估本文所提出算法的缓存性能，分别选择了3种基准对比方法，即基于流行度已知 (最优方法)的缓存方法，最近最少使用(LRU)缓存方法以及无位置预测的缓存方法。其中，基于流行度已知 (最优方法)缓存方法是根据真实流行度的分布情况来缓存流行度较高的内容；最近最少使用(LRU)缓存方法的基本原理是当用户有新的内容请求时，F-AP只缓存近期用户请求过的内容，而将之前长时间未使用的内容删除；无位置预测的缓存方法则是不考虑位置区的划分，结合整个区域内的用户历史请求信息与用户偏好模型实现流行度预测，将较为流行的内容缓存在各个F-AP中。

图6展示了4种缓存算法缓存命中率随F-AP缓存容量增长的变化情况。从图6的仿真结果可以看出，随F-AP缓存容量的增长，4种算法的缓存命中率都增长。同时，可以观察得到本文所提算法的缓存命中率最接近于最优方法的性能，且明显高于其他两种对比算法。这是由于本文所提出算法充分考虑了内容流行度与用户所处的位置之间的紧密关系，使得内容流行度的预测的结果更加准确，缓存命中率也得到了提升。而LRU缓存方法的缓存命中率最低是因为其没有考虑内容流行度的动态变化。

图6 缓存命中率随F-AP缓存容量的变化情况

图7描述了考虑不同内容流行度分布情况下基于信息年龄的最佳更新窗口结果，其中横轴序号1-10代表内容流行度按照降序分布排列的10个内容。在仿真中，将每个F-AP能够缓存的内容条目数设置为10，且内容流行度选取基于本文第3节的流行度预测算法得到的内容流行度分布。给定平均的AoI要求为不大于100 ms。

从图7可以看出，利用所提出的基于信息年龄的最佳更新窗口设置算法，不同流行度的缓存内容动态地设置了不同的更新窗口，且流行度较高的内容采用了更小的更新窗口(如内容序号1)，从而保证了较为流行的内容具有较高的新鲜度。图8描述了不同内容流行度分布情况下基于信息年龄的最佳更新概率。从图8可以看出，较流行的内容的更新概率更低，表明所提出的方案避免了F-AP频繁地对较流行内容进行更新，因此在AoI需求和时延两方面性能之间取得了平衡。

图7 不同流行度内容的最佳更新窗口

图8 不同流行度内容的最佳更新概率

图9对比了给定不同的AoI要求，分别采用动态更新窗口和恒定更新窗口两种情况下，服务时延的变化情况。可以看出，采用所提出的动态窗口更新方式能够在满足AoI的要求下，明显降低时延。这是因为动态窗口更新算法以最小化延时为目标，能够在满足信息年龄的要求下，动态地选择内容更新窗口，进而降低时延。

图9 时延随要求AoI的变化情况

6 结束语

为了提高边缘缓存算法的缓存命中率以及保证已缓存内容的时效性，本文在雾无线接入网中提出了基于内容流行度和信息新鲜度的缓存更新策略。首先使用训练好的Bi-LSTM神经网络对用户位置进行预测，从而得到用户在下一时间段内用户的位置区；进而结合用户的偏好模型获得各位置区内的内容流行度分布。考虑到F-AP有限的缓存计算能力，以最大化缓存命中率为目标，利用最流行缓存策略将流行度较高的部分内容缓存在F-AP中。此外，为了保证已缓存在F-AP处内容的新鲜度，进一步以最小化时延为目标，为具有不同流行度分布的内容设置了最优的缓存更新窗口，从而保证已缓存内容的新鲜度。仿真结果表明，所提出的缓存策略相比已有缓存策略能够实现更高的缓存命中率。且通过为具有不同流行度的内容动态地设置更新窗口大小，能够在保障内容的时效性的同时，有效地的减小平均服务时延。