边缘环境下计算密集型应用的卸载技术研究
2020-08-03刘炎培赵进超
刘炎培,朱 淇,赵进超
郑州轻工业大学 计算机与通信工程学院,郑州 450002
1 引言
根据Hootsuite最新全球数据报告显示,目前全球有51.1亿独立移动用户,相比去年增长了2%,2019年全球互联网用户数量同比2018年增长了9%,到2021年底,全球移动数据流量将达到每月466亿GB,其中智能手机将占86%,全球将迎来网络数据信息爆炸式增长的互联网时代。此外,随着5G网络的日益普及,增强型移动宽带、大规模机器通信和超可靠低延时通信三大业务类型对运营商的传输网络和核心网络构成了巨大挑战。由于这些应用程序场景可以为用户带来更高的带宽速率、更多的网络连接和更低的时延,导致核心网络需要在单位时间内处理的数据大小和业务请求呈指数型增长。因此,随着移动设备和物联网设备承载的网络流量的增加,移动云计算模式所采用的集中式处理模式[1-2]因离终端设备比较远,已不能满足用户的日常需求,并且对时延和能耗等性能要求较高的计算服务来说,这种模式会引起高延时、网络堵塞等问题[3]。故针对这些问题,业界提出了移动边缘计算。
移动边缘计算[4]被认为是蜂窝基站模型现代化演变和5G技术发展的关键因素。MEC将计算和存储资源引入到移动网络的边缘,降低终端设备的计算时延和能耗,提升用户对移动互联网应用的体验质量并减轻了云计算中心高负载情况。与此同时,MEC也需要计算卸载技术的支撑[5],计算卸载技术作为MEC研究的热点之一,已得到广泛的研究。计算卸载是指将终端设备的计算数据上传至云中并进行一系列计算处理的技术。在万物互联的信息时代下,要想实现传输数据低延时、服务器低能耗、移动终端资源高存储这些情况,需要将复杂的计算任务卸载到网络边缘服务器上进行计算处理。
MEC不仅推动了5G技术的发展,以计算卸载为代表的技术更是成为MEC领域中的热门话题之一。文献[6]从MEC的安全性问题进行了相关研究。文献[7]从MEC的计算、资源分配和内容缓存等角度出发,介绍了当前MEC的关键技术进展。文献[8]详细总结了D2D通信的流量卸载技术。文献[9]针对现有分布式系统和MEC系统的不可预测性,提出了基于异构分布式系统的自适应机器学习的调度框架和用于机器学习模型优化的移动边缘计算系统。虽然这些研究取得了一定的成果,但大多是从MEC的整体架构或算法优化方面出发,很少从MEC理论研究和部署方案上进行梳理并分析对比,总结当前5G所需的MEC部署方案和卸载方案,也缺少在5G环境下MEC领域中未能解决的研究问题和挑战。因此,本文对当前MEC部署方案和计算卸载方案进行了详细的论述,通过对当前MEC计算卸载技术的研究成果进行分析、对比和总结,介绍了适合5G环境下MEC部署方案和计算卸载方案。
2 移动边缘计算
2.1 MEC概念
欧洲电信标准协会(European Telecommunications Standards Institute,ETSI)通过将边缘计算融合到移动网络的架构,提出了移动边缘计算[10]。移动边缘计算是指将移动终端的计算任务卸载到网络边缘处,在网络边缘执行计算和存储的一种新型计算模型。即通过移动网络融合传统的集中式数据中心的云计算服务平台,将原本位于云计算中心的服务、计算、存储等功能“发散”到移动网络的边缘处,在网络边缘处部署具有计算和存储能力的边缘节点,使其能够满足移动互联网行业并提供快速连接、实时数据操作、安全和隐私保护等方面的需求。
2.2 MEC网络架构
ETSI中描述的参考体系结构主要由功能元素和参考点组成[11]。图1表示详细MEC参考框架。Mp表示和MEC平台应用相关的参考点,Mm表示和管理相关的参考点,Mx表示和外部实体相关的参考点。该网络架构主要包含两部分:移动边缘系统层和移动边缘服务器层。
图1 MEC网络架构
MEC可以被位于用户设备(User Equipment,UE)中的应用程序直接访问,或由第三方客户通过客户服务门户(Customer Facing Service,CFS)访问,UE和CFS门户都是通过MEC系统级别管理与MEC系统进行交互。MEC系统管理层中的用户应用程序生命周期管理(Life Cycle Management,LCM)代理将请求(如MEC系统中的UE应用程序的启动、终止或是重新定位)传递给移动运营商的操作支持系统(Operational Support System,OSS)。然后OSS决定是否批准该请求,授予的请求被转发到移动边缘编排器上。其中移动边缘编排器是MEC系统管理的核心功能,能够根据应用程序需求将虚拟的MEC资源分配给即将启动的应用程序。
MEC系统管理层与MEC服务器管理层相互连接,组成移动边缘平台管理器和虚拟化平台管理器。其中,MEC服务器管理层负责分配、管理和释放MEC服务器内的虚拟化基础设施提供的虚拟化计算/存储资源。MEC服务器是参考体系结构的一个组成部分,表示虚拟化的资源,并在虚拟化基础设施上作为VM运行MEC应用程序。
2.3 MEC部署方案
MEC服务器所拥有的计算和存储资源功能,能够为互联网用户提供MEC服务。然而,如何在网络中部署MEC服务器是需要考虑的首个重要问题。故对当前主流的MEC部署方案进行阐述。
(1)Mobile Micro Clouds(MMC):MMC通过将服务器部署在基站以降低用户访问云服务时的时延[12-13]。如图2所示,MMC部署中未将任何控制实体引入网络中,并且控制功能以分层方式进行部署。各个MMC既可以直接互连也可以回程互连,以实现用户在网络移动中VM的迁移工作并保证了服务的连续性。
(2)Small Cell Cloud(SCC):SCC主要是通过额外的计算和存储能力来增强小基站(SCeNB)的功能,云增强型SCeNB可以利用网络功能虚拟化(Network Function Virtualization,NFV)集成其计算能力[14]。通过将小型单元管理器(Small Cell Manager,SCM)的新实体引入SCC中以便更好地控制SCC[15]。其中SCM主要负责管理SCeNB提供的计算和存储资源,并对SCC内的计算资源具有动态管理的功能。根据SCC的部署方式,SCM可以集中式部署或分布式部署。如图3所示,SCM集中式地部署在RAN内,位于靠近SCeNB的集群中,也可作为对MME的扩展部署在核心网[16]。当SCM采用分布式的部署方案时,如图4所示,附近的SCeNB集群的计算和存储资源由本地小基站管理器(Local Small Cell Manager,L-SCM)和虚拟本地小基站管理器(Virtual Local Small Cell Manager,VL-SCM)进行管理,而位于核心网的远程SCM(Remote Small Cell Manager,R-SCM)通过集成至MME功能中,管理连接到核心网的所有SCeNB的资源。
图2 MEC部署方案
图3 集中式SCM部署方案
图4 分布式SCM部署方案
(3)Fast Moving Personal Cloud(FMPC):FMPC架构通过软件定义网络(Software Defined Network,SDN)和NFV技术以向后兼容的方式将云服务集成到移动网络中[17]。如图5所示,FMPC中的云服务资源部署在RAN内或RAN附近的运营商云层上。并且引入了一种新的控制实体MC(Mobiscud Control),能够与移动网络、SDN交换机和运营商的云进行交互。MC通过监控移动网络元素间的控制平面信令交换和SDN网络中编排情况,随时掌握用户的动态信息,保证用户在网络移动过程中,方便进行应用程序的卸载和迁移。
图5 FMPC部署方案
(4)Follow Me Cloud(FMC):FMC的关键思想是在分布式数据中心(Data Center,DC)上部署云服务器以提供边缘服务[18-19]。如图6所示,FMC的计算存储资源部署在中心网络上,其计算和存储能力距离用户更远。FMC在网络体系结构中引入了新的实体,DC/GW映射实体和FMC控制实体(FMC Control,FMCC)。FMCC主要管理DCs的计算和存储资源、运行在这些资源上的云服务,并且决定哪个DC应该使用云服务与用户进行关联。
图6 FMC部署方案
(5)CONCERT:在CONCERT部署方案中[20],如图7所示,控制平面是由conductor组成的控制实体,主要来管理协调体系结构的计算、通信和存储资源。conductor可以集中式部署或分层部署。数据平面主要是由eNodeB、本地服务器、中心服务器、SDN交换机组成。CONCERT通过将网络中的资源以分层式的方式进行分配,以便灵活管理网络和云服务。
图7 CONCERT部署方案
MEC部署方案取决于多种因素的选择,其中包括云服务的可扩展性、性能指标和部署位置的约束等。当前MEC部署方案SCC、MCC和FMPC的部署位置靠近网络的边缘以有效减小移动终端时延,但这些部署方案会引入认证安全等问题。此外,FMC方案以集中式的方式部署在分布式CN后,并且网络接入的认证安全问题得以解决。而CONCERT中的控制实体conductor既可集中式部署也可以分层式部署,因此能够有效实现负载均衡。
3 MEC环境下的计算卸载技术
计算卸载技术是MEC的一个重要应用,通过将用户设备请求的海量计算数据卸载到资源充足的网络边缘处,即代理服务器(基站、无线接入点)上进行处理,再把处理好的计算结果从代理服务器中返回至指定终端设备的过程[21-22]。通过计算卸载技术,超密集型网络上的应用资源受限的问题得以解决,提升了计算速度,降低了请求数据的传输时延和能耗,缓解了云中心高负载的压力。
其中,计算卸载的另外一个重要方面是应用的类型,因为它决定了计算任务是完全卸载还是部分卸载以及什么可以卸载。为此,根据应用的类型进行分类。
(1)可卸载性:根据部分卸载的应用程序的特征,大致可以分为两种类型。第一种类型是计算任务可以被分为N个都可被卸载部分的应用型APP,根据每个可卸载部分的数据量和所需的计算量确定应该将哪部分卸载至MEC。第二类应用程序由不可卸载的部分和M个可卸载的部分组成并将可卸载的部分卸载到MEC上。
(2)需要处理的数据量:根据所要处理的数据量,对应用程序进行分类。第一类应用程序是需要处理的数据是预先知道的,如人脸识别、信息扫描等。对于第二类应用程序,由于这些应用程序中的计算数据是连续执行的,故无法估计所要处理的数据量和运行时间。
(3)可卸载部分的依赖性:应用程序中能够卸载部分之间的关系既可以是相互独立的,也可以相互依赖。在相互独立的前提下,应用程序中的各部分数据可以同时并行卸载进行计算处理,然而在相互依赖的前提下,应用程序中的数据由一些其他输入部分组成,这时候并行卸载就不太适应于此情况。
计算卸载的一个关键部分——卸载决策,即决定是否将程序进行卸载,在决定卸载时还需要考虑哪部分卸载至计算节点上以及卸载什么的问题[23]。目前计算卸载决策通常是以卸载时延和所消耗的能量作为衡量的标准。本文将从优化目标的角度来分析当前卸载决策方案,表1为近年来有关卸载决策的部分研究进展。
3.1 最小化时延的卸载决策方法
在不进行计算卸载时,卸载时延指的是在移动终端处执行本地任务所消耗的时间;在进行计算卸载时,卸载时延指的是终端设备请求的计算卸载数据到MEC节点上的传输时间、卸载数据在MEC节点处的处理时间、MEC节点返回已处理好的卸载数据结果的传输时间三者之和。
多源数据融合支持的智能交通系统是移动边缘计算提供的一种很有前途的服务,融合结果以接近实时的方式进行传递,驾驶员或自动驾驶车辆可以在拐角处扩展感知范围,增强和验证局部观察结果,从而做出更加安全智能的驾驶策略。故在文献[24]中,为了加强和验证实时观察结果,扩大驾驶员或自动驾驶汽车的感应范围,从融合多源数据支持的智能交通系统的角度出发,制定了更加安全、反应更加迅速的驾驶决策,通过分析车辆的最优计算卸载决策,使用分层博弈来制定MEC与车辆之间的交集。将汽车用户(Vehicle Users,VUs)需要检测的关键对象定义为O={1,2,…,M}(V⊆O),将V={1 ,2,…,N },定义为VUs集。 xi(j)为VU-i从Oj中下载的数据大小,x={xi}i∈V表示VUs的下载数据大小的向量。
表1 MEC卸载决策方案总结归类
通过建立相互耦合的上层MEC服务器和下层VU-i的优化问题,文献[24]提出了一种基于MPEC的等级博弈,并将MPEC问题转化为一个可解的单层优化问题。
基于MPEC的等级博弈的驾驶决策提供了一种简单而有效的方式来影响VUs的卸载策略。在此,又通过对比集中式策略,建立一种集中式的方法来控制整个系统的卸载策略,使MEC服务器能够直接决定VUs的卸载策略。将该集中式策略的效用函数和优化问题形式化为:
通过对比此次的两个策略,仿真结果表明该策略的卸载服务时延更小,系统效用损失较小。
文献[25]利用计算复制来减少任务转移的通信时间,计算复制的主要思想是允许终端设备将计算任务卸载给多个边缘计算节点上并重复执行卸载任务,使多个边缘计算节点在下行链路中协同计算结果返回至终端设备。该方案首先通过引入计算复制和通信延时之间的权衡,提出了一种任务卸载分配方案。然后针对给定的计算负载,通过开发可实现的通信延时对。提出的传输协作模式能够消除多用户间的信道干扰,明显降低多用户多服务器在MEC网络中的通信延时。
无线网状网络具备分散性、可扩展性和自组织等特点,因此具有更好的应用前景,能够应用于战场监视、灾害事件的实时数据监测以及紧急情况等特殊环境。文献[26]使用Ns-3网络模拟器构建移动边缘网络计算系统。根据该系统以研究MEC辅助无线网状网络上的计算卸载。提出了一个基于区域的卸载策略(ABOP)算法,从而能够在低延时和高完成率的情况下,在不同区域尽可能多地卸载任务,进而提高MEC的服务性能。
文献[27]针对时延敏感型应用,研究了多用户计算卸载和传输调度的移动边缘计算框架。通过考虑移动用户的局部计算和边缘计算、无线特性和非合作博弈行为之间的权衡,提出了一种新的MOTM机制,共同确定计算卸载方案、传输调度规则和定价规则。
文献[28]采用了绿色能源与电网能源双向支持的边缘计算系统,提出了基于Lyapunov优化技术的在线卸载算法,通过权衡平均响应时间与平均能耗成本,生成最优卸载方案。
3.2 最小化能耗的卸载决策方法
在不进行计算卸载时,能量消耗指的是在终端设备处执行本地任务所消耗的能量;在进行计算卸载时,能量消耗指的是数据卸载至MEC计算节点上所消耗的能量、终端设备接收来自MEC计算节点返回的卸载数据结果的传输能耗二者之和。
MEC不仅允许将部分任务分配至计算节点上来降低服务器能量的消耗,而且能够将计算密集型任务分配到终端设备上,以充分利用终端设备的存储和计算能力。设备间通信(Device-to-Device,D2D)被认为是5G系统中的一个重要范式[29]。资源不足的设备可以与资源丰富的设备建立D2D连接,以减轻该设备上计算任务的负担。然而,由于现实移动设备之间的无线信道状态变化极快,很难预测并确定计算卸载策略和最优功率。文献[30]通过研究D2D通信中的计算卸载问题,将强化学习与匹配理论相结合,提出了一种基于强化学习的计算卸载(Reinforcement Learning Based Computation Offloading,RLCO)方案,使卸载节点能够基于历史信道状态分布式学习计算卸载策略。考虑了一个基于D2D的计算卸载场景模型,包括N个卸载节点(Offloading Nodes,ONs)和 M 个协作节点(Cooperative Nodes,CNs)。为了使平均能耗最小化,将卸载策略和功率分配的优化问题P1形式化为:
如果ON在时间段t内知道任务卸载前的信道状态信息(Channel State Information,CSI),则只需要通过遍历所有的功率和卸载决策来计算总能耗。而在实际情况中,由于无法预测CSI来确定卸载策略和最优功率。因此,文献[30]提出了基于强化学习的计算卸载算法RLCO,使卸载节点能够基于历史信道状态分布式学习计算卸载策略以解决问题P1。其中RLCO的主要步骤描述为:
(1)使用内点法求解统计CSI下的功率分配问题。
(2)通过对卸载节点进行独立训练得到每个节点的Q-value,并对其列表进行匹配。Q-value值越高,在列表中设置的优先级越高,越有可能实现更低的能耗。
(3)通过分布式匹配算法构造协作计算对来获取卸载决策。
文献[31]指出了更为有效的方法是部分卸载,设计了一种基于细粒度局部卸载框架的新型方案。首先提出了一种基于深度学习的高效节能卸载方案(EEDOS),该算法根据移动终端的剩余能量、应用程序组件所消耗的能耗、网络状况等来选择一组最优应用组件并卸载到云上。EEDOS首先通过建立的数学模型来生成各种局部和网络条件下的数据集,计算所有可能的策略的成本。然后对该数据集进行深度神经网络训练,经过训练的深度神经网络来计算能耗最低的卸载方案。
文献[32]将整个应用程序划分为多个基于DAG的子任务,然后在每个子任务的卸载决策中寻找最小解。提出了快速的启发式算法来寻找满足约束条件的解,在可靠性和延时约束下最小化用户总能耗。
文献[33]采用TDMA系统划分时隙的概念,在每个时隙内,用户设备根据信道质量、本地计算能耗以及用户设备之间的公平性将其数据卸载到MEC。为不满足应用时延约束的用户设备提供更高的优先级,将计算任务在本地执行,提出了基于阈值的最优资源分配策略。由于通信和计算资源的联合优化具有较高的复杂度,提出了一种次优分配算法,该算法将通信和计算资源分配分离。仿真结果表明,与最优分配相比,次优化算法的能耗增加了20%,但降低了算法复杂度。
文献[34]对文献[33]的卸载方案进行了拓展,提出了基于OFDMA系统的卸载方案,比在TDMA里实现的方案在能耗方面降低了90%。
3.3 基于高效节能和时延感知的卸载决策方法
在执行复杂的卸载任务时,如图像处理系统、车联网和实时全息投影技术等,卸载任务的时延和能耗都会直接影响用户的体验质量,故在执行任务过程中,综合考虑时延和能耗是确定卸载策略的重要参考因素。
文献[35]以优化卸载时延和能耗为目标,研究了双用户MEC网络中用户间的依赖关系对卸载策略和资源分配的影响。根据用户间任务的依赖关系对任务决策和资源分配的影响,提出了一个混合型整数优化问题,分别通过二分搜索方法和降低复杂度的吉布斯采样算法共同优化每个移动无线设备的卸载决策和资源分配以最小化无线设备能耗及卸载计算的执行时间。
文献[36]以联合优化分配CPU周期、传输功率和计算卸载决策为目标,最小化卸载任务时延和能耗的加权和进行权衡。提出了一种最小化卸载时延和能耗的分布式算法,然后利用精准线搜索算法将问题分解为两阶段优化问题,获得处理任务的最优资源分配和卸载决策。
文献[37]提供了一个利用能耗和延时之间的权衡来联合优化无线电和计算资源分配的框架,允许用户根据任务的计算队列和无线信道状态进行卸载决策。并建立了总卸载和无卸载情况下的最优条件,通过确定应用程序执行过程中可承受的最小延时,分析无延时约束下的最小化总能耗。
文献[38]讨论了高斯方法在无线传输中的信道分配问题,并使用Lyapunov优化算法求解计算卸载过程中计算资源和能量的分配问题。该算法的缺点是没有考虑节点间数据通信的干扰和数据传输时间对总耗时的影响。
文献[39]提出了一种具有计算接入点的多用户数据卸载算法。该算法的目标是联合优化计算时延、能耗和计算总成本。针对多目标优化问题,提出了一种基于半正定松弛的优化方法。采用固定参数法得到局部最优结果。其优点是基于半正定松弛的优化方法比基本的半正定松弛法更有效地节约能源。但联合优化结果没有考虑运行时间成本。
3.4 最大化收益的卸载决策方法
由于无线网络中的基站大多数采用的是多信道设置,无线访问效率也是影响计算卸载性能和用户总效益的一个关键因素。如何在多个移动设备之间通过无线接入协调以实现计算卸载是一个关键挑战。文献[40]通过分析移动设备计算卸载决策的结构性,研究了多通道无线干扰环境下MEC的多移动设备的计算卸载问题。提出了多移动设备卸载的博弈策略,设计了一种能够实现Nash均衡的分布式计算卸载算法,并将称量参数作为是否进行卸载任务的指标,同时将其作为卸载任务判断是降低能耗还是增加能耗的指标,以实现用户收益的最大化。
由于终端设备有限的存储和计算能力,很难在本地运行区块链应用程序,故将区块链应用程序卸载到边缘服务器上,提高拍卖参与者的最大化收益和服务质量[41]。文献[42]研究了移动区块链应用的计算卸载问题,以提高拍卖参与者的总效用为目标。将需要执行挖掘任务的用户表示为买方,移动边缘服务器表示为卖方,具有计算能力的基站充当为拍卖商。在移动区块链网络中的整个拍卖过程中,买方报价的总额越高,买方提供的补偿越多,就会吸引更多的卖方共享计算资源。故作者提出了NP-hard的多项选择问题,制定了一种名为POEM+的拍卖机制来解决上述配问题。从而使拍卖参与者的利益最大化。
文献[43]联合优化用户的卸载决策、通信和资源分配以最小化用户的计算成本,该优化函数可表示为非凸二次约束规划问题。并提出了有效的启发式算法和随机映射方法,有效减少用户在时延和能耗上的总开销。
文献[44]利用二分法寻找需要计算卸载的用户设备的最优发送功率,匹配计算资源,在所提框架下提高用户的任务卸载量,相比现有计算卸载方案能够有效降低系统的总开销。
文献[45]提出了资源分配的优化问题,并使用博弈算法和匈牙利算法的相互迭代解决此优化问题,该方案能够降低卸载能耗及时延,最小化系统的总开销。
从以上四个优化目标的角度出发,通过对目前MEC计算卸载决策的分析和对比可知,将计算任务卸载至网络边缘处能够明显降低计算卸载时延和所消耗的能耗。而对时延和能耗都直接影响QoS的应用,执行复杂的计算卸载任务时,权衡卸载时延和能耗是确定卸载策略的重要参考因素。最大化收益的卸载策略本质是上在权衡时延和能耗的条件下,通过分析这两个指标对计算卸载总消耗的影响,寻找合适的平衡点以达到最大化收益的目的。这些研究根据具体的实际计算卸载应用场景,如智慧城市、车联网等抽象出具体的数学模型,采用不同的卸载决策,确保计算卸载过程中的稳定性以保障MEC的服务质量。
表2 IIoT的主流MEC架构与基于IIoT-MEC的新型IIoT体系架构的对比
4 面向5G环境下MEC计算卸载技术的发展趋势
第2章和3章所阐述的MEC架构、部署方案以及计算卸载决策方法,主要都是应用在4G网络。然而,未来5G网络从基础架构上做出了革新[46-48]。5G网络服务的引入,提供了更高的网络运行速度和更低的计算时延,同时为基站的运营带来了新的架构,增加了分布式基础设施的灵活性。然而现有的4G终端设备的处理能力很难满足低时延和高灵活性等应用需求,因此并不适用于未来边缘环境下MEC计算密集型应用的卸载技术。本章将对5G环境下MEC计算卸载技术的发展趋势进行展望。分析了5G环境下IIoT-MEC网络部署架构和面向5G环境下MEC计算密集型应用的卸载方法。
4.1 面向5G环境的IIoT-MEC网络部署架构
随着对MEC的深入研究,越来越多的研究人员正在考虑通过利用MEC技术支持更多的工业物联网(Industrial Internet of Things,IIoT)功能[49-50]。工业物联网作为物联网在工业领域的重要应用,已经成为当前热门话题之一。如应用程序的开发、数据的预处理和访问设备的管理等。然而,现有基于云的IIoT架构很难处理当前工业物联网所需的大规模连接设备和更高的业务要求。因此,随着5G时代的到来,利用MEC来增强5G对IIoT的支撑能力已成为学术界和工业界的共识。表2展示了用于IIoT的现有主流MEC架构和基于IIoTMEC的新型IIoT体系架构区别[51]。
4.1.1 基于IIoT-MEC的IIoT体系架构
针对当前IIoT架构的主要问题,一种IIoT的新颖MEC框架——IIoT-MEC[52]应运而生。如图8所示,该体系架构分为三层,包括设备层、IIoT-MEC层和云计算层。
图8 基于IIoT-MEC的IIoT体系架构
(1)设备层:设备层由许多IIoT设备组成,主要负责物理端和数字端的连接,具有收集数据并将其传输到上层及执行从上层返回的命令的功能。
(2)IIoT-MEC层:IIoT-MEC层主要由宏基站、微基站和IIoT-MEC服务器组成,这一层集成了通信、计算和存储功能。如设备的访问、设备功能虚拟化、资源协调与管理等功能。
(3)云计算层:云计算层由高性能的服务器组成,具有强大的计算和存储能力。最重要的作用是作为设备功能虚拟化(Device Function Virtualization,DFV)映像存储库。每个新设备只需被开发一次,然后开发的内容由Docker自动包装成一个DFV映像并上传至云端。
4.1.2 基于IIoT-MEC的服务器框架
通过构建支持5G环境下的IIoT-MEC网络部署架构,开发人员无需关注任何硬件和软件细节等,就可以直接操作虚拟设备来构建IIoT应用程序。如图9所示,该IIoT-MEC服务器架构主要由网络层、资源虚拟化层、资源管理层和应用程序层组成。
图9 基于IIoT-MEC的服务器框架
(1)网络层:网络层主要负责所有通信功能,能够充当数据传输的接口。能够连接所有与IIoT-MEC配对的基站所覆盖的设备,并且能够与其他IIoT-MEC服务器在一定域内进行交互以分布式的支持IIoT的服务。
(2)资源虚拟化层:在资源虚拟化层,通过使用Docker容器将MEC服务器中的计算和存储资源分割成多个资源块(Resource Blocks,RBs),其中RBs的容量可以实时地进行动态调整。其中一部分RBs用于“设备功能虚拟化”,用于消除IIoT设备之间的硬件差异,然后将现实中的物理设备映射到虚拟设备中。而另外一些具有计算资源的RBs则被应用来支持IIoT服务的操作。
(3)资源管理层:资源管理层负责服务和虚拟资源之间的协调。
(4)应用程序层:应用层负责IIoT应用程序的开发、部署和操作。根据业务需求,可以将其放置在云服务器、IIoT-MEC服务器甚至用户设备上。
4.2 面向5G环境的MEC卸载方案优化
4.2.1 基于深度强化学习的轻量级任务卸载策略
MEC要想满足5G所需的超低延时和高能效等业务需求,在多变的无线环境下保证服务的可靠性和任务卸载效率,关键一点是根据任务卸载类型确定有效的卸载决策以达到节省卸载时延和能耗的目的,在边缘服务器集群上具有更高的资源利用率。
当前基于强化学习的MEC卸载方案已得到广泛的研究,虽然强化学习有许多优点,但由于缺乏可伸缩性,本质上局限于低维问题。为了解决强化学习中的决策难题,将深度学习的感知能力与强化学习的决策能力相融合,依靠函数逼近和深度神经网络的表达学习特性来解决高维状态空间和行为空间的环境问题[53]。提出了一种基于深度强化学习的MEC轻量级任务卸载方案优化(IDRQN)[54]。该方案利用LSTM网络和候选网络对DQN算法进行优化。
(1)基于LSTM网络的优化。考虑到MEC中资源随时间逐渐变化以及LSTM网络长期状态下的存储能力,对LSTM网络进行优化。提出了将LSTM和DQN相结合的方法处理任务卸载问题。DQN是一种基于值迭代的深度强化学习算法,其目标是估计最优决策的Q值。其中,递归结构通过将DQN网络的最后一个全连接层替换为LSTM层以用于集成任何长期历史数据,从而更准确地估计当前状态。DRQN算法通过当前时间步长的观测状态和之前时间步长的动作组成状态动作对,并将其与LSTM中的输出值集成,得到真实的环境状态,然后将其导入深度神经网络进行训练。
(2)基于候选网络的优化。DQN算法通过延时更新来保证当前网络与目标网络的参数差以增加训练过程的稳定性。但由于DQN算法在动作评价和动作选择上使用了相同的网络。当训练过程中某个动作的值被高估时,相应动作的值在后续参数更新时不可避免地会被高估进而会影响算法的稳定性,导致生成的不是最优卸载决策。因此可以考虑将动作选择和动作评估解耦,以保证获取最优学习策略。
由于DQN算法的训练过程采用随机抽样的方法来训练神经网络,不同的样本会形成不同的目标网络,每个目标网络都有自己的优势。为了充分利用每个目标网络基于不同样本和迭代的状态优势,在此将候选网络集划分为两个网络集,Net1根据迭代次数进行更新,Net2更具奖励值进行更新。最后选择当前状态动作对奖励值最大的网络参数作为目标网络的参数。
为了反应不同时间段内移动应用程序的资源利用率,使用谷歌集群跟踪数据集模拟每个模块的利用率随时间的变化。在参数相同的情况下,通过比较不同算法的损失函数值,损失函数值越小,网络模型的结果越好,对解决短周期训练问题有很大优势。实验结果表明,IDQRN和DQRN算法的损失函数值相似,但随着迭代次数的增加,IDQRN算法的损失函数值下降幅度大于DQRN算法,因此当迭代次数相同时,IDQRN更容易得到问题的最优解。随着应用程序数量的增加,DQN算法生成的卸载决策在负载均衡方面表现较差,DQRN算法在能耗和时延方面有很好的效果,IDQRN算法生成的决策在成本和延时方面效果较好,但在网络使用方面效果较差。在使用高效益功率比的边缘服务器时,IDQN算法在成本、延时和网络使用情况效果一般,而在平均执行时延方面相对较差。根据各算法多方面的结果,基于LSTM网络优化和候选网络优化的IDQRN算法在很大程度上满足延时感知应用,能够以有效解决任务卸载MEC问题。
4.2.2 基于D2D协作的MEC卸载策略
D2D通信和MEC技术是未来边缘网络环境下通信技术的两大发展趋势[55]。由于缺乏集成D2D和MEC框架,解决高能和高时延等问题面临着严重的挑战。在此基础上,5G环境下基于D2D协作的MEC卸载方案[56]应运而生。
该方案通过在MEC服务器上接收任务执行和卸载请求,根据最后任务期限和能耗约束对卸载请求进行分类以联合解决时延和能耗成本。利用最小代价和最大匹配法来寻找合适的卸载目的地,并将寻找合适的卸载目的地的算法分为两个阶段:第一个阶段是针对延时敏感型任务,需要分配更高的优先级以满足最后任务期限,用最小代价和最大匹配法求解。根据结果,MEC可以选择并保留自己的资源,也可以选择附近的设备进行D2D协作,然后MEC将结果报告给请求设备,这些设备可以通过D2D通信卸载任务或将其发送至MEC;第二个阶段是针对能量需求型任务,同样,用最小代价和最大匹配法求解,请求设备将任务卸载至邻近的节点或MEC上。图10为基于D2D协作的MEC卸载策略流程图。
图10 基于D2D协作的MEC卸载策略流程图
实验结果表明,在启用D2D协作式方案时,边缘服务器超载的情况下,附近的空闲设备可以处理卸载任务;当设备数量增加时,附近的空闲设备数量也会增加,当任务分配率增加时,邻近的空闲设备数量就会减少,该方案可以使用MEC的资源运行卸载任务。在这两种情况下,该方案都能表现出较高的节能稳定性。随着请求设备数量的增加,更多的空闲节点参与协作,因此在该方案中,平均执行时延有所降低,更优于现有研究。
5 问题与挑战
MEC因其数据的计算和存储等资源更接近于终端设备而广受关注。并且,由于计算资源更靠近终端设备或用户,故能够支持具有实时性的计算卸载任务。尽管如此,MEC技术在某些方面仍然不太成熟,在将其应用至5G网络之前仍有许多问题和挑战需要解决[57-58]。本章将讨论在当前MEC领域中未能解决的几个挑战性问题。
5.1 计算卸载决策
卸载决策方法在卸载技术中起着关键性作用,因为它决定了终端设备或用户所提交的请求是卸载至本地设备还是云端上并进行相应的处理。在上述所讨论的以降低能耗为目标的卸载决策中,几乎所有的关注点都考虑的是降低用户所消耗的能耗而非MEC能耗(包括计算和相关通信),为了符合未来绿色网络的发展,以降低MEC能耗为目标的卸载决策应有显著的研究点。此外,所有与卸载决策相关研究都是假定的静态场景,也就是说终端设备或是用户在卸载前后的过程中都是假定没有移动的。即使这些假定成立,在卸载过程中也会由于低移动性导致信道质量下降,故也会卸载任务的能耗也会增加。因此,有必要提出更新颖的卸载决策方法,更加关注5G环境中移动边缘计算动态卸载的解决方案[59]。为此,关于动态卸载问题的研究陆续展开[60-63],例如,利用卸载过程中对用户迁移率和信道质量的各种预测技术[60-61];将移动用户在动态环境下的卸载决策过程描述为随机博弈并提出了全分布式算法[62],该算法在动态环境下具有一定的收敛速度;利用基于逻辑的弯管分解技术研究了动态任务卸载和调度问题[63]。因此,动态卸载方案能够很好地解决MEC环境下计算卸载问题,更好地估计不同条件下卸载成本。
5.2 干扰管理
如果多个用户设备同时将任务卸载至MEC节点上,将会产生严重的干扰问题。如何在保证用户服务质量的前提下解决干扰问题是MEC计算卸载技术所面临的严峻挑战之一。由于干扰管理的本质是资源的冲突利用,网络资源的不合理分配是产生干扰的根本原因。因此,有效的资源分配是解决干扰问题的重要手段,即通过合理的网络资源分配和修正的资源分配决策增加网络容量。尽管如此,干扰管理仍然面临着MEC部署方式和资源分配引发的问题挑战。
由于MEC服务器随机部署在网络边缘处,并且覆盖范围方式无法预测,从而导致不同区域下的干扰分布情况不同。当干扰信号达到一定的程度时,会出现淹没有用信号的可能性,对边缘系统的吞吐量产生一定的影响,并且,众多终端设备的卸载请求以及复杂的网络环境将会导致资源分配率的降低。故结合MEC服务器的位置信息和用户设备的卸载请求预测智能处理干扰问题是未来边缘网络中计算卸载干扰管理的有效技术之一。
其次,计算资源和网络资源的合理分配也是解决干扰问题的重点,如何根据用户设备的卸载请求进行合理的资源分配是解决干扰问题的途径之一。目前解决资源分配的方法有很多[64-67]。例如,考虑干扰情况下的计算资源分配方案,通过联合优化子信道分配和功率分配,以最大限度地提高下行NOMA网络的能源效率,解决NOMA中资源配置的问题[64];以最小化二次干扰功率为目标,提出了一种基于能耗效率和频谱效率权衡的资源分配方案[65];通过计算任务的数据量和MEC服务器的服务能力等制定卸载决策,以优化卸载决策、计算资源分配和物理资源块(Physical Resource Block,PRB)为目标,采用改进的图着色方法为用户设备分配PRB,通过最小化时延对计算资源进行分配,在保证QoS的前提下对资源进行合理的分配[66];基于多输入、多输出的全双工D2D网络中的多对多通道(MPMC)分配方案[67],通过对资源的优化配置和对蜂窝用户保持一个期望的阈值率,以最大限度地提高D2D网络的聚合和数据率,通过信道分配和功率分配处理层间干扰。由于MEC的分布式部署方式和庞大的卸载数据,故计算卸载技术解决干扰问题的方式区别于传统网络。因此,合理的资源分配方案成为解决干扰问题的有效手段。
5.3 网络控制协议和算法
为了构建智能MEC系统,对新的网络控制协议和算法设计提出了严峻的挑战。其中包括:如何快速有效地进行路由请求,将流量引导到网络中以提供服务;如何无缝处理用户的移动性管理和相应的服务,以及动态缩放切片,使计算功能和相关数据在移动用户附近进行自适应分配;如何将服务从一个虚拟网络无缝迁移到另一个虚拟网络,并在迁移过程中保持畅通状态,以避免服务中断;如何实现高效的分布式服务控制。目前常用的网络控制协议与算法也有很多[68-69],例如:对Ad Hoc网络中一种隐式逐跳的跨层拥塞控制协议做了改进[68],通过路由层、MAC层与传输层合作,使得隐式逐跳的传输控制协议在无线传感器网络中能够适用。采用多跳的低能耗不等聚类协议[69],该协议将能耗和距离因素引入适应度函数中以选择簇头和子簇头,簇头通过子簇头与基站通信,同时利用代价函数形成簇头与基站之间的最优路径。
5.4 移动性管理
当用户在不同基站之间移动时,如果将用户的计算任务卸载至MEC,如何保证MEC服务的连续性是MEC计算卸载的重大挑战之一。VM迁移能够有效解决用户设备移动性管理的各种问题与挑战。分布式移动性管理[70]克服了集中式移动性管理的缺陷,是解决用户设备移动性问题的有效方案之一。然而,考虑MEC服务器需频繁地迁移MEC服务并将其放置在距离用户设备更近的位置,那么,将用户的任务请求重定向到托管服务的远程MEC服务器并不是最佳解决方案。除此之外,在跨边缘网络环境中,MEC服务迁移需要将虚拟应用实例传输到目标位置上,但此方案的传输代价会更高。近年来,研究人员也提出了一系列方案[71-74]。例如,利用IP移动性服务的解决方案解决在广域网上执行具有IP连续性的迁移问题[71],但由于更改IP地址而导致服务中断,再重新建立新的IP地址连接时,会对用户的服务质量造成影响;为了解决IP服务移动性管理问题,提出了Follow-Me-Cloud的概念[72],介绍了一种跟随用户移动的云服务框架,该方案通过服务/数据识别的方式转换IP寻址,通过将该框架的第二层和第三层与服务移动性分离,确保无缝迁移和服务的连续性;通过在架构中引入SDN方法[73],并融合了分布式弹性控制器来进一步完善Follow-Me-Cloud的解决方案;通过引入基于位置/ID分离协议的方法以减少VM迁移的服务中断时间[74],研究了VM的迁移和用户设备的移动性,对于边缘计算的网络环境,通过利用SDN控制器,使用监控服务做出策略调整,保证有效的QoE管理。
为了完成用户设备的任务迁移,移动性管理技术要满足对时延和安全等方面的需求,因此,需要对低时延、路径预测技术等进行考量。对于低延时的移动性管理技术,当用户设备从MEC区域移动到另外一个区域时,需要对VM和任务数据进行迁移,这时可以考虑在回程链路上选用高速通路,对传输数据进行压缩处理,以简化VM复原流程等。与此同时,路径预测技术对移动性管理同样起着支撑作用。路径预测技术统计并利用用户设备轨迹的信息预测用户设备下一个将要到达的MEC区域,从而能够将数据提前传输至下一个节点。但是这一技术面临着两个严峻挑战:第一个是轨迹预测。要想获取准确的用户设备的轨迹预测,需要精确的建模以及高复杂度的机器学习技术,以完成用户设备的任务迁移;第二个是如何选择预先进行传输的计算数据。由于用户设备的轨迹预测不一定准确,这时将用户设备的所有数据传输到预测的节点上可能会造成资源浪费。
用户设备的移动性管理是边缘计算中的关键挑战,对迁移决策有着重要影响。因此,针对这两个挑战,需要研究学者们进行深入探索,寻找解决未来边缘网络中的移动性管理策略。
6 结束语
MEC通过移动网络融合传统的集中式数据中心的云计算服务平台,将原本位于云计算中心的服务和计算及存储等功能“发散”到移动网络的边缘处,通过在网络边缘处部署具有计算和存储能力的边缘节点,使其能够满足移动互联网行业并提供快速连接、实时数据操作、安全和隐私保护等方面的需求。本文重点对MEC的网络架构及其部署方案做了相关描述,并对近年来的计算卸载决策进行了分析和总结。通过对比不同MEC计算卸载方案,对面向5G环境下MEC计算卸载技术的发展趋势进行展望,分析了5G环境下IIoT-MEC网络部署架构和面向5G环境下MEC计算密集型应用的卸载方法。根据本文所调查的卸载方案,总结出了MEC所面临的问题及挑战。目前MEC的研究的重点是如何在高度动态的网络环境中保证服务的连续性,然而这一方面正是阻滞MEC快速发展的原因之一。通过该综述研究的领域和方法,总结出该领域的研究思路,从而为相关领域的研究人员提供参考和帮助。