基于5G边缘计算的深度学习架构与应用

2021-05-07李晓民

信息通信技术与政策 2021年4期

李晓民

(中国移动(成都)产业研究院，成都 610064)

0 引言

随着行业数字化转型和智能设备的急剧增长，在网络边缘产生了海量的数据。而新兴的行业应用，尤其是与深度学习相关的智能应用对数据的处理能力、响应时间和安全性等均提出了苛刻要求。但由于边缘设备的计算和数据存储能力有限，难以在这些设备上部署当前流行的深度学习算法。传统方式是将数据通过网络加载到远程计算基础设施(通常是远程的云服务器)进行处理和计算，再将计算结果通过网络返回前端设备。这种方式虽然降低了前端压力，但是极大地增加了通信代价，恶化了应用的响应时间，也增加了数据的安全隐患。为了解决上述问题，边缘计算技术应运而生。边缘计算将计算资源部署到临近数据生成侧，在靠近数据源的位置进行数据的处理和计算。由于边缘计算已经进行了部分数据处理，因此需要传到云端的数据量大幅减少；边缘设备的位置靠近数据源，可以显著降低数据处理的响应时间，增强应用的实时性；对敏感数据，如果必须通过远端对数据处理，也可利用边缘计算设备对敏感信息进行清理或加密后，再进行数据传输，保障信息的安全性[1]。目前，边缘计算已经成为物联网系统的一种重要范式。例如：Floyer等[2]对比了云系统和边缘-云组合系统在风电场的数据管理和处理成本。边缘-云组合系统相比纯云系统在成本上降低了36%，传输数据量减少了96%。

而第五代移动通信技术(简称5G技术)的出现和迅猛发展为边缘计算落地部署提供了良好的网络基础。5G的增强移动带宽(Enhanced Mobile Broadband，eMBB)、超高可靠低时延通信(Ultra Reliable Low Latency Communications，uRLLC)和海量机器类通信(massive Machine Type Communications，mMTC)3大应用场景将显著改善边缘设备接入的数据速率、延迟、用户密度和容量，5G与4G技术的重要指标对比如表1所示[3]。因此，5G 和边缘计算也被认为是两个天然紧密联系的技术，都能显著提升海量数据的实时处理能力和应用的性能。

将人工智能推向网络边缘将极大释放智能应用在各个行业的巨大潜力，提供大量分布式、低时延和可靠的智能服务，例如：目标识别、实时视频分析、自动驾驶等。但是大多数的深度学习算法(尤其是模型训练)

表1 5G与4G的重要指标对比

图2 本文基于5G的边缘深度学习架构

需要大量的输入数据和巨大的计算能力才能产生有效结果[4]。人工智能与5G、边缘计算的紧密结合使得这一想法成为可能，也诞生了边缘智能(Edge Intelligence)这一全新概念[5]。本文将探讨深度学习模型在网络边缘训练的计算模式，并构建基于5G边缘计算的深度学习架构和应用。

1 网络边缘的深度学习模式

数据是深度学习的核心要素之一，结合数据在网络边缘分布和计算的特点，深度神经网络的分布式边缘训练架构可分为三种典型模式：中心模式、分散模式和混合模式[6](见图1)。

其中，中心模式的深度神经网络训练是通过网络收集分布式传感器产生的数据，在边缘云上集中进行模型训练；分散模式则是各边缘节点利用本地数据对本地深度神经网络进行训练，边缘节点间通过网络互联共享神经网络参数，进行模型的权重更新，这种模式可以将数据隐私限制在本地设备；混合模式结合了中心和分散两种模式，由边缘服务器通过不同的路由决定当前的神经网络训练是通过分散模式对神经网络模型进行更新，还是在边缘云上利用中心模式对神经网络模型进行训练和更新。

2 基于5G的边缘深度学习架构

在网络边缘进行深度神经网络的分布式模型训练

图1 网络边缘的深度学习模式

是一项极大的挑战，目前最常见的两种方式是数据并行和模型并行。从运营商的角度，结合垂直行业应用业务特征相似但用户样本不同的特点，本文提出了一种以数据并行为主的5G边缘深度学习架构(见图2)。

边缘设备(例如各类手持联网设备、传感器等)通过5G网络接入边缘计算层，即5G的多接入边缘计算(Multi-Access Edge Computing，MEC)[7]。5G的MEC技术最早由卡内基梅隆大学提出，于2014年欧洲电信标准协会(ETSI)正式定义并成立MEC规范小组，启动相关标准化工作。MEC为运营商在网络边缘向用户提供端到端低时延、高带宽和低成本服务提供了整体解决方案。在ESTI、3GPP和中国通信标准化协会等组织推动下，MEC已经发展成为5G移动通信的重要技术之一。本文架构的模型训练过程如下。

图3 5G医疗边缘云原型系统

步骤1：MEC的各计算节点从服务器下载神经网络模型(第一次循环)或更新自身的网络模型(非第一次循环)。

步骤2：计算节点利用边缘设备的本地数据进行网络模型训练。

步骤3：上传加密梯度给服务器。

步骤4：服务器聚合各计算节点的梯度更新网络模型参数。

循环以上步骤，直至训练结束。

上述的网络模型训练过程可以看作是基于样本的分布式训练。每个计算节点从服务器下载网络模型，利用本地数据进行模型训练，并将需要更新的网络参数返回给服务器，服务器综合各计算节点上的返回参数，进行模型更新，再将最新的模型参数反馈给计算节点。在整个训练过程中，每个计算节点下载的都是相同且完整的神经网络模型，网络仅进行加密的参数传递，既减少了网络压力，又保障了本地数据安全。

3 垂直行业应用

乳腺癌、宫颈癌在我国居于恶性肿瘤发病率和死亡率的前列，通过前期筛查可以大幅降低病人的发病率和死亡率[8]。然而由于缺乏便捷有效的检查手段，且我国医疗资源分布不均，医生的诊断技术水平参差不齐，大量基层医生甚至不具备阅片能力，癌筛的阅片工作只能依赖中心医院的医生。利用5G边缘计算融合人工智能的计算机辅助癌症筛查系统有望打破这一困境。

利用本文的5G边缘深度学习架构，可以构建以两癌筛查为目标的5G医疗边缘云原型系统(见图3)。

5G医疗边缘云(MEC)可部署于医院的互联网数据中心(Internet Data Center，IDC)机房，通过院内5G医疗专网连接CT、B超、磁共振等院内固定或移动设备。5G两癌筛查云可部署于区域中心节点，借助5G切片专网汇集多家诊疗机构的病例信息。两癌影像学等病例信息可以通过院内5G医疗边缘云进行快速训练，并保证了影像资料和病例信息的安全，做到数据不出院。癌筛深度神经网络通过5G切片网络进行院间的模型参数共享，既保障了原始数据安全和降低网络传输压力，又极大丰富了癌筛模型的数据集，有助于显著提高模型的准确度和泛化能力。

此外，借助5G医疗边缘云的无线连接、低时延、高带宽能力，还可为院内提供众多的智慧服务，形成医院数字大脑，例如智慧导诊、VR探视、移动医护等。

4 结束语

深度学习是人工智能的核心技术之一，5G和边缘计算使深度学习得以在网络边缘实现。5G、边缘计算和人工智能的深度融合，满足了行业用户对大量设备连接、海量数据快速处理、智能应用实时响应、安全与隐私保护等关键需求，将催生众多的垂直行业应用，是5G应用是否成功的一个重要标志，也是运营商助力和进入垂直行业的新模式。本文通过分析5G、边缘计算和深度学习的特点，构建了一种基于5G边缘计算的深度学习模型训练架构，阐述了其工作原理，并例举了其在医疗垂直行业的应用场景。本文的深度学习模型训练架构既能保证模型训练的数据集多样性，又可减少原始数据的网络传输压力，保障本地数据的安全和隐私，是一种非常具有潜力、值得推广的深度学习边缘计算架构。