边缘计算:新型计算范式综述与应用研究*
2020-04-15郑逢斌朱东伟臧文乾杨劲林朱光辉
郑逢斌,朱东伟,2,臧文乾,杨劲林,朱光辉
1.河南大学 计算机与信息工程学院,河南 开封 475000
2.中科空间信息(廊坊)研究院,河北 廊坊 065000
3.中国科学院 空天信息创新研究院,北京 100094
4.北京航天泰坦科技股份有限公司,北京 100071
5.无锡航天江南数据系统科技有限公司,江苏 无锡 214122
1 引言
随着物联网、5G 通信和无线网络等技术的飞速发展,网络边缘接入的设备数量快速增长,网络边缘设备产生的数据也呈现出爆炸式增长的趋势。据思科预测[1],2020 年连接到网络的无线设备数量将超过500 亿台。据IDC(Internet Data Center)预测[2],2020年全球数据总量也将超过40 ZB。在这种情形下,以云计算模型为核心的集中式处理方式将无法适应边缘数据爆炸式增长的趋势。集中式处理模型的工作方式是,将设备产生、收集到的所有数据通过网络传输到云计算中心,借助云计算中心超强的计算能力来集中式解决存储、处理和分析等问题。这种工作方式对延迟和网络抖动不敏感的大规模批处理业务适用,这也是云计算服务能够在近几年创造出高经济效益的原因。然而,在未来万物互联的环境下,随着无人驾驶、增强现实技术/虚拟现实技术(AR/VR)、智能交通等新兴应用的出现,传统云计算已无法满足这些应用对于网络延迟、抖动、安全性等问题的需求。
边缘计算思想的出现,打破了传统云计算集中式处理数据的工作方式。如何解决当前新兴应用及万物互联情形下云计算无法满足和实现的需求是边缘计算研究工作者关注的重点。从仿生学角度理解边缘计算[3],可以做以下类比:云计算架构中,具有超强计算能力的云服务中心相当于人的大脑,更贴近人类的边缘计算服务相当于人的神经末梢。手受到伤害时会快速收回,这一过程未经过大脑处理,而是由分布在手上的神经末梢处理的,这一非条件反射的存在能够让人们在受到伤害时及时脱离危险,同时也能让大脑专注于处理更高级别的事务。万物互联的时代里,数以亿计的边缘设备仅仅依靠云计算这个单一大脑是远远不够的,边缘计算就是让设备拥有自己的大脑,为人们提供更优质的服务。
与传统的云计算相比,边缘计算模型具有4 个明显优势:
(1)网络边缘设备产生的数据不再全部上传至云中心,而是先在边缘服务器节点上对数据进行预处理,然后将经过预处理后的少量有价值数据上传,极大减轻海量边缘设备产生的数据给网络带宽造成的压力。
(2)数据处理在边缘设备上进行,不再全部依靠云计算中心,借助于部署在靠近用户的边缘节点上的处理器对采集到的数据进行处理,省去了数据上传环节以及与云中心的交互环节,提高了系统的响应能力。
(3)用户产生的敏感数据存储在边缘设备上,而不是在云数据中心存储,降低了敏感数据在上传云数据中心过程中被不法分子窃取的风险,用户隐私数据安全问题得到保障。
(4)在边缘计算模型中,边缘数据无需上传到云计算中心进行处理,不仅减少了网络边缘设备传输数据到云计算中心的能耗,同时也大大降低了云计算中心的能耗。
得益于边缘计算的以上优势,近年来,以智能交通、智慧家居为代表的新型应用得以快速发展。这些应用对网络延时和抖动敏感、需要实时交互、数据隐私和安全性方面要求较高[4],运用边缘计算架构能够很好地满足以上要求,因此越来越多基于边缘计算的应用实例和实现平台被相继提出。
2 边缘计算与云计算
2.1 云计算
2.1.1 云计算概述
“云计算”起源于1988 年约翰·盖奇首次提出的“网络就是计算机”,最早作为一个概念在20 世纪90年代末被亚马逊(Amazon)提出,当初该理念只是被认为能够在超级计算机上使用。随着因特网发展壮大,尤其是Google 为代表的搜索巨头的出现,云计算展现出强大活力。2006 年3 月,亚马逊公司首次推出弹性计算云(elastic compute cloud,EC2)服务,推动了互联网的第三次革命。早期云计算仅仅是指简单的分布式计算,能够解决任务分发、计算结果的合并等问题,通过这种技术,可以在几秒内完成数以万计的数据处理任务。发展至今,云计算已成为集分布式计算、效用计算、负载均衡、并行计算、网络存储、热备份冗杂和虚拟化等计算机技术的一种强大的网络服务平台,为用户提供服务。云计算模型如图1。
2.1.2 云计算存在的不足
随着物联网技术的兴起和众多对延时、网络带宽、隐私安全等敏感的新型应用的出现,采用集中式管理方式的云计算服务越来越表现乏力。具体如下:
(1)网络带宽不足。物联网环境下,海量边缘设备的接入,使得边缘数据量呈现出爆炸式增长的趋势,如果将边缘设备产生的大量实时数据全部传输至云计算中心处理,将给网络带宽造成巨大压力。例如,高校门口的行人监测和行为分析系统会采集到大量的实时视频数据,如果将这些视频数据全部上传到云中心,将占用巨大的网络带宽资源,导致带宽资源不足。
Fig.1 Cloud computing model图1 云计算模型
(2)难以支持实时性要求。云计算架构中,要求全部数据上传至云中心进行处理,其处理速度不仅受到网络带宽的影响,同时还受到云计算中心计算能力、总计算任务量等多重因素的影响[5]。另外,请求应答机制的过长链路,同样会带来较长的时延问题,无法满足无人驾驶、虚拟现实等新兴应用在实时性方面的要求。例如,波音787 每秒产生的数据都超过5 GB[6],由于数据量庞大加之传输链路过长,传统云计算环境下很难满足实时交互需求。
(3)难以保证用户隐私数据安全。智能家居设备产生的数据与用户生活联系极为紧密,如果将安装在用户家庭中的智能网络摄像头产生的视频数据传输到云端,必然会给不法分子可乘之机,用户敏感数据安全性问题得不到保障。例如,不法分子通过网络爬虫方式就能轻易盗取用户家中智能摄像头上传到云数据中心的视频数据,通过分析得出某个时间段用户家中是否有人的信息,进而在用户家中无人时进行盗窃。
(4)能耗和资源开销较大。2016 年我国数据中心消耗的电量超过1 200 亿千瓦时,超过了同年三峡大坝全年的总发电量(约1 000 亿千瓦时),同时也已经超过匈牙利和希腊两国用电总和[7]。据Sverdlik 的研究[8],预计2020 年美国所有数据中心能耗也将达到730 亿千瓦时,占整个国家总耗电量的10%。随着数据量的爆炸式增长,数据中心的存储、处理能力也将面临巨大压力,然而有些资源开销并不是完全必要的。例如,云计算系统中很多采集到的监控图像和视频中并未包含有价值的信息,但这些数据仍然会被上传到数据中心进行分析、处理和存储,不仅造成了数据上传过程中不必要的能源消耗,还会造成云服务器计算资源和存储资源的浪费。
边缘计算模型的出现,较好地解决了以上问题。边缘计算场景下,智能摄像头产生的实时视频数据不再上传至云中心,而是由部署在摄像头附近的边缘服务器存储、处理和分析,缓解了网络带宽资源压力,满足了用户对于实时交互方面的需求,用户的隐私数据能够得到保障,同时还解决了不必要的能源消耗和资源浪费问题。边缘计算是在贴近用户侧的网络边缘执行计算的一种集网络、计算、存储为一体的新型分布式计算模型,该模型将具有计算能力的设备和微型数据中心部署在更贴近用户移动设备、数据采集器、传感器等的网络边缘,主要处理边缘设备所产生的海量边缘数据,在靠近物或者数据源头的网络边缘为用户提供边缘智能服务[9]。经过边缘设备的预处理,无价值图像不再被上传到云计算中心,筛选出的有价值图像才会被上传到云中心进行存储和备份。
2.2 边缘计算
2.2.1 边缘计算概述
边缘计算起源于传媒领域,由于边缘计算模型的就近端服务特点能够切合该领域在实时、智能和隐私保护等方面的需求,一经提出就很快成为学术界和商业界关注的焦点。美国韦恩州立大学的施巍松团队[10-11]将边缘计算定义为:“边缘计算是指在网络边缘执行计算的一种新型计算模式,边缘计算中边缘的下行数据表示云服务,上行数据表示万物互联服务,而边缘计算的边缘是指从数据源到云计算中心路径之间的任意计算和网络资源。”其中该团队提出的基于双向计算流的边缘计算模型如图2。在该模型中,用户设备产生的数据能够上传到云中心,用户不再仅仅充当数据消费者身份,而是集数据消费者和数据生产者双重身份于一身。
2.2.2 边缘计算的优势
Fig.2 Edge computing model图2 边缘计算模型
边缘计算架构中,在靠近数据源头位置部署海量的智能节点,这些智能节点具有存储能力并且能够处理轻量级别的任务,类似“微云”,在靠近用户的“低云端”为人们提供智能服务。由于它无论在物理层面还是网络层面都更加靠近用户,因此在响应速度方面远远超过传统云计算。云计算架构中,待处理的数据需全部上传到云计算中心,庞大的数据量给网络带宽造成了无法忽视的压力,这也成为了云计算发展的瓶颈[12]。边缘计算的出现解决了这一问题,边缘计算架构中,用户待处理的数据不再全部上传到云计算中心,通过部署在网络边缘的智能节点,用户的问题得以快速解决的同时大大减轻了网络带宽的压力,并且大幅度降低了网络边缘端智能设备的能耗。
2.3 边缘计算与云计算的关系
以高度中心化为最初设计思想的计算模式云计算看似与本质上去中心化的新型计算模式边缘计算水火不容,但云计算与边缘计算并不是非此即彼、完全对立的关系。边缘计算的出现并不是为了取代云计算,而是对云计算服务的延伸和补充。边缘计算可以给用户提供多种快响应服务,与传统云计算相比,无论在响应速度方面还是在能源节省方面,边缘计算都占据优势。然而,并非所有互联网服务都适合在网络边缘部署,例如目前普遍使用的网上购物应用,由于需要全局数据的支持,类似于商品个性化推荐、购买热度较高产品展示等服务依然需要放在云端。针对用户购物车的服务则更适合放在边缘节点上,用户可以享受边缘节点提供的快响应服务,快速刷新购物车视图,给用户带来更流畅的操作体验,而边缘节点与云端数据的同步问题则放在后台处理。故而,云计算与边缘计算各有所长,未来万物互联网络环境下,必定是两者协同工作、各展所长。云计算与边缘计算属性对比如表1。
Table 1 Comparison of attributes between edge computing and cloud computing表1 边缘计算与云计算属性对比
3 边缘计算架构
3.1 边缘计算架构
现阶段,移动边缘计算(mobile edge computing,MEC)、雾计算、微云、边缘云等方面是边缘计算研究的热点,得益于物联网行业和5G 的发展,移动边缘计算越来越成为众多行业关注的重点。移动边缘计算不仅是一种针对大规模物联网应用的新型编程模型[13],发展至今,移动边缘计算更是成为了推动移动宽带网络的关键技术,与软件定义网络(software defined network,SDN)、网络功能虚拟化(network functions virtualization,NFV)具有同样的重要性,是下一代移动通信网络的关键技术之一[9]。MEC 作为物联网及低时延、高可靠等垂直行业通信的关键使能者,在多个行业都有着众多应用场景[14]。欧洲电信标准协会(European Telecommunications Standards Institute,ETSI)定义了MEC 的计算架构,该架构共分为三层:MEC 系统层、MEC 主机层、网络层,如图3。MEC 系统层包括用户应用程序生命周期代理、移动边缘编排器和运行支持系统(operation support systems,OSS)。MEC 能够直接由移动设备(mobile device,MD)中的应用程序使用或者通过面向客户的服务(customer facing services,CFS)端口完成与第三方客户的交互。MEC 主机层由移动边缘平台和虚拟化平台构成,移动边缘平台负责管理应用程序规则、程序的生命周期、服务授权和流量规则等;虚拟化平台完成分配、管理和释放位于MEC 服务器内的虚拟化基础设施提供的虚拟化资源(包括计算资源和存储资源),该层与MEC 系统层相连。网络层则提供了与各种访问的连接,包括3GPP 移动网络、本地网络和其他外部网络访问。架构中展示了MEC 的主要功能要素及各个功能要素之间的参考节点信息。
Fig.3 Mobile edge computing architecture图3 移动边缘计算架构
3.2 边缘计算平台
Fig.4 MEC server deployment scenario图4 MEC 服务器部署场景
MEC 标准计算架构的出现推动了MEC 服务平台标准化进程,边缘计算参考架构白皮书[15]及吕华章等人[16]对MEC 服务平台进行了详细阐述。平台分为移动边缘主机、移动边缘平台管理、移动边缘设备部署、虚拟基础设施管理等功能模块。移动边缘主机模块主要负责移动边缘平台服务能力的提供和开放、虚拟基础设施的数据面转发能力开放和移动边缘应用的部署等;移动边缘平台管理模块主要负责移动边缘应用全生命周期管理、移动边缘平台网元(network element,NE)管理、移动边缘应用规则和需求管理等;移动边缘设备部署模块完成了移动边缘应用在全局范围内的部署、实例化和标准化工作;虚拟基础设施管理模块实现了基础设施的虚拟资源合理分配、管理、配置和虚拟资源性能、故障信息收集与上报等功能。白皮书中还给出了边缘计算服务的几种部署场景建议,如图4。现阶段,边缘计算服务器是作为独立设备部署的。MEC 服务器可以在靠近LTE 宏基站(eNode B)的无线接入网(radio access network,RAN)侧部署(图4 中的第一种模型),这种方案的优势在于可以更方便地通过监听、解析S1 接口(基站与分组核心网之间的通讯接口)的信令来获取基站侧无线相关信息,时延最小,能够为学校、商业街、小区等附近的用户提供快响应服务。缺点在于覆盖的基站数相对较少(适用于本地分流场景),涉及到的计费和合法监听等安全性问题较为复杂。也可以部署在核心网络(core network,CN)中(图4 中的第二种模型),作为云计算的“下层云”为用户提供服务,该方案的优点在于MEC 服务器能够与PDN 网关(PDN gateway,P-GW)集成在一起,无需考虑RAN部署方案下的计费和安全性等问题,用户终端发起的数据业务经过eNode B、汇聚节点、S-GW、P-GW+MEC 服务器,然后到互联网。但该方案存在距离用户较远、时延相对较大和占用核心网资源等问题。由于设备的独立性,边缘计算服务的部署位置相当灵活,可以根据具体业务需求、应用场景等来决定具体部署位置。
3.3 Cloudlet、PCloud、ParaDrop
早在2009 年,卡耐基梅隆大学(Carnegie Mellon University,CMU)就提出了Cloudlet[17]概念,它的架构和设计思想都与边缘计算类似。Cloudlet 是部署在网络边缘、与互联网连接且可以给移动设备提供海量服务的可信主机或机群。通过Cloudlet 资源发现(cloudlet discovery)、虚拟机配置(VM provisioning)[18]、资源切换(VM handoff)[19]等关键技术,Cloudlet 做到了对边缘应用移动性的支持。PCloud[20]是另一个目前较成熟的边缘计算平台,该平台由佐治亚理工学院(Georgia Institute of Technology,Georgia Tech)的Korovo 研究组提出。PCloud 能够整合数据源附近的计算、存储、输入输出设备和云计算资源,实现资源间交互、协同工作,为网络边缘移动设备提供支持。PCloud 依靠一种特殊的虚拟化层STRATUS[21]对资源进行虚拟化操作,形成虚拟化资源池,系统工作时,根据需求从资源池中选取资源。PCloud 虚拟资源池依靠系统运行机制对资源进行统一申请和分配,并向外界提供资源描述接口。PCloud 内部结构看似复杂,但是对用户来说,仅相当于一种智能化的计算设备。PCloud实现了边缘计算与云计算的有机结合,充分利用了两者的优势。威斯康星大学麦迪逊分校(University of Wisconsin-Madison,UW-Madison)WiNGS 实验室提出的ParaDrop[22-23]是一种适用于物联网应用的边缘计算平台。他们在ParaDrop 的支持下成功将WiFi 接入点扩展成了边缘计算平台,在该平台上能够运行各种各样的应用,达到了一般服务器运行应用的能力。ParaDrop 依靠植入的单片机使普通网关具有通用计算能力;通过软件技术将云端应用与服务迁移至WiFi 接入点;并借助容器技术对不同应用的运行环境进行隔离,使开发者拥有了在网关上动态定制和管理应用的能力。表2 对上述三种边缘计算平台在服务器状态、移动支持、虚拟化技术和适用领域四方面进行了详细对比。
Table 2 Comparison of attributes among Cloudlet,PCloud and ParaDrop表2 Cloudlet、PCloud、ParaDrop 属性对比
表2 中服务状态的软硬是根据服务状态存在的形式区分的,软状态(soft-state)可以理解为无状态(stateless)的一种特殊情况(如Cloudlet 上部署的移动应用服务,该类服务的状态信息不会被Cloudlet 长久保存,应用离开Cloudlet 服务范围的同时,这些数据就会从云端清除),而硬状态(hard-state)则对应的是有状态(stateful),这种情况下的传感器原始数据、连接信息等都是在本地保存和获取。Cloudlet 能够给移动应用的后台服务提供临时的部署点,通过资源发现、虚拟技术、资源切换技术实现对移动性的支持。PCloud 能够实现用户设备与云的智能结合,支持边缘设备动态加入和退出(退出时不允许有正在运行的任务)。面向物联网的ParaDrop 中,传感器采集的数据在无线网关处汇集和初步处理,传感器和无线网关的连接状态保持不变,因此无需考虑服务移动性的问题。在虚拟化技术方面,Cloudlet 和PCloud 使用虚拟机,ParaDrop 则使用容器,原因是物联网应用的服务对执行环境的灵活性要求不高,使用容器还能达到占用资源少和启动快的优点。由于以上特点,使得Cloudlet 适用于计算密集型的移动应用领域,ParaDrop 更适用于数据密集型的物联网领域,PCloud 则可以根据场景需要在移动应用领域中灵活应用。
4 边缘计算应用场景
新技术的产生必将伴随着新型应用的产生,应用是衡量新技术是否可行、有价值的重要标准,发展边缘计算将面临的各种挑战和机遇都能通过应用凸显出来。随着边缘计算在理论上的逐渐成熟,越来越多的基于边缘计算的应用相继出现在人们的视野中。本章将通过边缘计算在网站性能优化、智能工厂、智能家居、边缘视频缓存、购物车视图优化、梅赛德斯-奔驰文化中心视频直播六个场景中的应用对边缘计算深入理解。
4.1 网站性能优化
网站性能优化是一种提高用户网站资源加载速度和显示速度的技术,流畅的加载和响应速度往往能给用户带来良好的上网体验。网页在用户设备上加载的过程中,超过85%的响应时间都发生在前端,包括下载必要的组件资源、页面渲染工作等。因此,提高网站性能的关键是在网络边缘侧。EAWP(edge accelerated Web platform)[24]是日本电话电报公司(Nippon Telegraph and Telephone Corp,NTT)设计的一种基于边缘计算的网站性能优化平台,能够为从事Web开发的工作者提供有效的网站性能优化工具和服务。EAWP 利用边缘服务器和网关接入点、基站等通信设施的结合来获取用户接入网的状态信息,进而对网站进行优化。例如,当收集到用户网络不佳或者拥塞信息时,边缘服务器能够智能调整页面质量(降低分辨率等)来降低响应时长,当网络情况好转以后,重新对页面质量进行调整。
4.2 智能工厂
智能工厂是边缘计算在物联网中较为典型的应用实例,边缘计算的参与使得IT(internet technology)和OT(operational technology)系统深度融合成为可能。工业智能机器人是实现智能制造的基础,它们往往需要具备对复杂的工作环境以及当前工作进程综合分析和判断的能力以及与其他机器人协作完成复杂工作任务的能力。因此,每个机器人都需要配备智能控制器才能执行复杂的计算任务,这会大幅度增加制造成本。借助边缘计算思想,将所有机器人的智能控制器功能集中部署在生产车间的边缘服务器上,在满足工业生产时延要求的同时还能实现集中控制机器人之间的联动协同,大大降低了工业生产的成本。
4.3 智能家居
人们对于“宜居、舒适、便利、安全”的生活环境的追求从未停止,借助新兴技术往往能够使人们更快速地实现目标。现阶段,智能家电基本上都是单一智能化的,比如智能照明、智能空调、智能安防、智能卫浴等,它们借助于云平台实现远程控制,一旦网络出现故障,用户将无法进行控制,并且智能单品并未实现多个智能设备之间的联动协调工作。使用边缘计算技术和无线传感器技术将使智能家具之间的智能联动和稳定运行成为可能,部署在用户家中的边缘服务器节点通过有线/无线传感器收集到的信息,包括室内温度、亮度、空气湿度及室外摄像头采集的影像信息等进行综合分析,然后对智能家电发出具体指令,完成对用户家中照明控制、温度调节、报警机制等的智能联动调控。
4.4 边缘计算视频缓存
新兴互联网应用的快速发展,造成互联网流量持续增长。据预测[25],全球IP 总流量将在2016—2021年间增长3 倍,从2016 年的年均1.2 ZB(96 EB/月)增长到2021 年的3.3 ZB(278 EB/月)。图5 是全球互联网总流量年度月均值统计及预测。其中,互联网流量中视频占比将从2016 年的73%提升至82%,并且这一比例将会逐年增大。
Fig.5 Annual average monthly statistics/forecast of global Internet traffic图5 全球互联网总流量年度月均值统计/预测
庞大的视频数据流量将会占用非常多的网络带宽资源,在带宽资源有限的情况下,利用边缘计算平台进行本地视频缓存无疑是切实可行的方案。将具有视频分析、缓存功能的MEC 平台部署在大学城、居民区、商业街等人流密集、对视频播放请求频繁的区域,利用边缘计算智能分析功能(根据搜索热度)[26]将热播电视剧、电影等下载频繁的视频资源缓存到附近MEC 服务器上。当用户请求视频播放时,该视频资源就相当于从本地加载,节省带宽的同时也大大降低了用户的响应时长。另外,MEC 平台中基于RAN 侧感知的内容优化方案,可以根据网络实时信息(网络负载、链路质量、数据吞吐率等)对内容进行动态优化,大幅度提升体验质量(quality of experience,QoE)和网络效率。
4.5 边缘计算购物车视图刷新
随着网络信息技术和智能设备的不断发展,电子商务慢慢融入人们的生活,网上购物越来越成为人们生活中不可或缺的新兴购物方式,带来的便利不言而喻。消费者在进行线上购物时,选取的商品暂存在购物车中,当购物车中的商品变动时,现行购物应用的解决方案是,先请求云数据中心进行数据同步,得到返回信息后,对消费者购物车视图进行刷新。这样,消费者购物车更新速度完全依赖网络环境和云中心的负载情况,由于移动网络带宽较低以及云中心任务负载大,移动端购物车的更新时延普遍较长,用户体验差。如果把更新消费者购物车视图的服务从云中心卸载到边缘节点上,以上问题就能得到解决。在边缘计算方案中,购物车数据在边缘节点缓存,用户在频繁操作购物车时,不需要经过中心网络和云服务器,购物车视图在本地刷新,延时低,系统流畅度高,用户体验好。当用户操作完成后,边缘节点数据与云中心数据在后台执行同步操作,如图6。
4.6 边缘计算网络视频直播
Fig.6 Edge computing mobile shopping cart view refresh图6 边缘计算移动端购物车视图刷新
网络视频直播系统是一种多媒体网络平台,旨在将正在进行的赛事、会议、演出、教学等现场音视频实况通过网络实时传递给远端观众。传统视频直播系统服务器端口尽管普遍采用的是百兆或者千兆网络,但是由于音视频文件过大,整个过程延时问题依然不容忽视。
为解决以上问题,上海梅赛德斯-奔驰文化中心引入了多接入边缘计算技术。采用中国联通边缘视频编排网络技术方案部署边缘节点,如图7。场内拍摄的视频存储在专用的边缘云中,场内观众可以通过移动设备访问边缘云中存储的视频信息,避免了连接中央云带来的时延。采用EVO(edge video orchestration)解决方案能够将网络视频直播时延控制在毫秒级别,是普通网络视频直播平均时延的1.6%,并且可以同时支持亿级别的场外互联网观众观看高清直播。
Fig.7 Mercedes-Benz cultural center edge computing application model图7 梅赛德斯-奔驰文化中心边缘计算应用模型
除了以上应用场景外,边缘计算在增强现实和虚拟现实[27]、动态内容交付[28]、车联网[29]、其他物联网场景[30-36]、预测性维护[37]、安防监控[38]场景中同样表现出蓬勃发展的趋势,本文不再赘述。
5 发展边缘计算面临的挑战
随着物联网和5G 通信技术的快速发展,边缘计算越来越成为科研人员研究的热点,各种有关边缘计算的理论[39]和新型边缘计算应用[40]涌现出来的同时,发展边缘计算亟待解决的问题也相应凸显出来。本章从服务管理、应用管理、计算资源管理、数据管理四方面讨论发展边缘计算面临的研究挑战。
5.1 服务管理
与云计算服务管理不同,边缘计算服务管理涉及多方面的问题。云计算中向用户提供的服务集中于云计算中心,用户无需关心服务内部结构和管理问题,通过服务提供商提供的接口,用户以付费方式使用云中心的各种服务和计算资源。边缘计算服务则较为复杂,服务商需要面对以下三个问题:
(1)异构问题。边缘计算架构中,各个边缘计算节点的网络环境、信道和基础设施等均存在明显的差异性和异构性特点。一般而言,MEC 服务器也不具有相同的计算资源、存储环境。引入虚拟化技术,或许能够成为解决该问题的一种途径,虚拟化技术不仅要做到对应用程序的最小化运行环境约束,更需要满足边缘节点资源最大化利用率的要求,并且在具体实施过程中还会遇到不少未预见的难题。在这种情况下,如何处理好异构性问题成为发展边缘计算亟待解决的问题之一。
(2)移动问题。边缘计算中,伴随着用户的移动,计算任务迁移工作会在不同的边缘节点、甚至是MEC 服务器之间频繁发生。这种情况必然导致节点与节点之间、节点与服务器之间、服务器与服务器之间的大量数据交换,需要占用较多带宽资源,然而在移动带宽资源有限的情况下,这种做法显然是不可取的。如何处理用户在移动过程中移动设备MD 与MEC 服务器之间的无缝衔接问题,也是发展边缘计算亟待解决的问题。
(3)扩展问题。近年来,随着物联网技术的快速发展,接入互联网中的边缘设备数量剧增,这要求边缘计算服务必须具备灵活的扩展性。引入云计算中的编排器概念也许可以提高网络的可扩展性[41],但是这一理论并不完全适用于边缘计算复杂的网络环境。因此,设计出具有灵活扩展性的边缘计算服务仍然是一个亟待解决的问题。
5.2 应用移动性管理
边缘计算场景中,不同的MEC 服务器上安装的服务不尽相同,计算资源也存在很大的差别。用户在移动过程中,连接的MEC 服务器在频繁变化,如果用户正在使用某个MEC 服务上的服务,当服务器切换到一个未安装该服务的服务器上时,或者新的服务器缺乏必要的计算资源时,都可能导致服务中断,影响用户体验。以上共涉及两方面的问题:一是资源快速发现问题;二是资源快速迁移问题。当前有很多较成熟的资源发现技术被广泛应用于云监控中[42],这些技术或许能够引入边缘计算,但是要注意边缘计算中的异构资源环境问题,并且要保证资源发现的速度。如何让周围可用的服务、计算资源等被移动过程中的应用快速发现以及如何在周围无可用服务和资源时实现服务和资源在整个边缘生态系统中的灵活调度也是一个急需解决的问题。
5.3 计算资源管理
边缘计算中的资源管理问题是另一个发展边缘计算的关键性问题。云计算中的资源是统一放在云计算中心的,由服务管控机制统一调度与分配,管理起来较为方便。然而,边缘计算中的计算资源分散在整个数据的传输路径上,可能受到不同主题的管理与控制。计算资源的分散分布状态及多种管理机制的参与使得目前云计算中使用的计算资源管理机制无法很好地在边缘计算中应用。针对该问题,一种较为简单的解决思路是各个管理机制独立自我管理资源,通过添加中间服务[43]的方式进行资源供给,但是该方式只能提供最基本的功能,无法满足用户的较高级别的需求。例如,自动供给、自动选择合适的资源等。另外,边缘计算中各个计算节点的网络状况、计算能力各不相同。相比云计算,边缘计算中的计算资源又非常有限,因此设计出一种适用于边缘计算的管控与调配机制,使边缘计算中的计算资源达到最大化利用率和整个系统最小化延迟的平衡,同样是发展边缘计算急迫解决的问题。
5.4 数据管理
数据管理在边缘计算中同样占有非常重要的地位,包括两方面的内容:数据分析、数据隐私保护和安全。
(1)数据分析。随着边缘设备的海量增加,边缘数据量也随之爆炸式增长。一般而言,数据量越大,能提取和利用的信息量就越大,但信息往往具有时效性,人们不会对昨天的路况信息感兴趣。由于边缘计算架构对数据处理的特殊性(数据处理能够在数据收集到数据汇聚的整个过程中发生),如果数据被过早地分析和处理,可能会造成有价值信息的丢失,通过大数据分析技术和深度学习框架TensorFlow等对某一领域的数据进行综合分析得出数据特点,进而找到该类数据最佳提取有用信息的时间点或许能够突破该问题,但是目前还没出现较成熟的模型。因此在不同的边缘计算场景下,找到提取有用信息的时间点与信息时效性的平衡点仍是一个需要解决的问题。
(2)数据隐私保护和安全。在未来万物互联的场景下,数据隐私保护和安全问题尤为重要。用户家庭中部署的边缘智能系统中的智能传感器可以捕获大量的用户隐私信息,如房间布局、家中人员的动态活动信息等。如果这些信息被不法分子获取到,用户的生命、财产将受到威胁。虽然边缘计算模型具有在网络边缘处理数据的能力,减少了用户隐私信息在过长的传输链路上被窃取的风险,但大量终端设备的接入给边缘计算中数据的隐私和安全问题带来了新的挑战[44-45]。
6 结束语
作为云计算概念的延伸,边缘计算以有线/无线网络资源为传输途径,以智能数据采集终端为感知前端,在整个数据汇聚过程中实现对数据的智能分析和处理,集云、网、端、智为一体,成为一种继云计算之后的又一新型计算模型。本文分析了云计算在新型物联网环境下存在的不足以及边缘计算的优势并对比分析了两者的关系,接着以ETSI 定义的MEC计算架构为基础详细分析了MEC 标准化平台和Cloudlet、PCloud、ParaDrop 平台,并对它们在服务器状态、移动支持、虚拟化技术和适用领域方面进行了对比分析,然后给出了几种边缘计算具体应用场景,帮助读者进一步理解边缘计算。最后,总结了发展边缘计算亟待解决的几类关键性问题,给科研工作者指出了研究方向。