APP下载

面向能量受限工业物联网设备的联邦学习资源管理

2022-09-03范绍帅吴剑波田辉

通信学报 2022年8期
关键词:资源分配全局时延

范绍帅,吴剑波,田辉

(北京邮电大学网络与交换技术国家重点实验室,北京 100876)

0 引言

随着5G 技术在全球范围内的广泛部署,工业界和学术界开始探索6G 网络[1]。6G 网络将集成通信和计算功能,采用先进的人工智能技术,向自动驾驶、虚拟现实、智能工厂、智慧城市等典型应用场景[2]提供万物智联服务。传统的资源管理机制难以满足6G 网络的复杂需求,因此,基于智慧内生和至简网络的下一代网络成为广泛研究的热点。随着物联网的普及,各种服务对通信技术提出了更多更高的要求,这是目前5G 网络无法支持的,而6G网络有望推动工业革命,支持物联网新要求,其中无线分布式计算是6G 的使能技术[3]。联邦学习作为一种分布式机器学习方法,能够满足6G 网络的隐私保护和低时延需求[4],是构建6G 物联网系统的关键技术[5]。由于工业物联网(IIoT,industrial Internet of things)的数据安全和快速数据分析及决策需求,联邦学习有望应用于工业物联网场景中来训练机器学习模型[6]。然而,工业物联网场景中存在资源可用性低的问题[7],如较低的计算能力、有限的带宽和电池寿命,设备能力的异构属性[8]也加大了设备间的性能差距。但现有关于工业物联网联邦学习的研究大多未考虑电池能量有限等问题,导致可应用场景有限。

工业物联网场景下,当设备数量庞大且分布密集时,采用充电模式供电会导致布线复杂且降低工业节点的灵活性与可扩展性,特别对于移动工业设备而言,充电线无法满足设备的移动需求并且可能造成安全隐患,如工业机器人等[9]。因此,大量工业物联网设备常常由有限尺寸的电池供电,与可充电模式不同,这严重限制了工业设备可用的能源供应和使用寿命[10]。

关于联邦学习的研究大多基于充电设备[11],不需要考虑设备的使用寿命。而基于电池供电设备进行联邦学习时[12],设备在训练中可能由于电池能量耗尽而离线,降低系统性能[13]。因此电池的长期能量调度和节能技术是电池供电工业物联网高效联邦学习的关键。现有关于基于电池供电设备的联邦学习的研究主要将电池寿命作为设备选择指标[7]或者调整部分训练参数以提高电池寿命[12,14-15],如训练批量大小、CPU 频率等,较少对电池能量进行整体调度与分配,缺少长期视角下对电池寿命的控制。关于能量调度的研究适用场景有限,例如文献[16]根据电池电量和训练轮次分配能量,其中训练轮次为定值,忽略了实际场景下的总运行时间限制,而训练时间为定值时难以在训练前确定训练轮次[6,17],难以将其有效扩展至时间预算既定的工业物联网场景中。因此基于电池供电设备的工业物联网联邦学习缺少整体性与系统性的能量调度与节能技术研究。

联邦学习的多个优化方向,如时间、成本和精度等难以兼顾[18],因此优化目标需要对此进行权衡[19-26]。已有工作研究固定训练时间达到最大学习精度[22-25]的问题,但多数未考虑电池供电和无线传输对系统性能的影响。由于长期优化求解复杂度随时间增长呈指数级增大[26],因此可采用独立迭代优化的方法[27]简化问题。同时,为权衡训练时间和精度目标,加快学习速度,可引入学习效率[28-29]作为优化目标进行资源管理。文献[28]通过联合批量选择和通信资源分配以最大化学习效率;文献[29]提出最大化学习效率的通信资源分配和数据选择算法。

针对当前研究所面临的低资源可用环境下异构设备电池能量、通信资源分配等资源优化管理问题,本文提出一种针对电池供电工业物联网下联邦学习网络的资源管理算法。本文考虑电池供电和无线传输对联邦学习性能的影响,对设备资源、通信资源以及电池能量进行联合优化管理,以求解电池供电工业物联网设备固定训练时间达到最大学习精度的优化问题。

本文的主要贡献如下。

1)设计了一种针对电池供电工业物联网设备的联邦学习资源管理算法。该算法将长期优化转化为动态逐轮优化,考虑资源块数目受限、无线信道干扰以及电池能量有限,提出以学习效率优化为目标的数学模型。将原优化问题解耦为相互关联的电池能量分配、设备资源分配和通信资源分配这3 个子问题分别进行求解。

2)为解决学习效率优化问题,利用粒子群优化算法求解能耗预算下的最优设备传输和计算资源分配策略,并推导出单轮全局损失函数变化的表达式,基于此获得学习效率与通信资源分配的关系,进而设计了一种资源块迭代匹配算法以求解最优通信资源分配策略。

3)提出一种电池能量分配策略,在给定设备资源和通信资源分配的条件下,估计训练轮次、根据时延筛选设备并调整设备CPU 频率以进行能量分配,确保设备在训练时间内不会因电量耗尽而中断训练。

4)仿真结果表明,本文算法能在训练时间内使用电池供电设备获得较好的学习性能,与基准算法相比体现了本文算法的有效性。

1 系统模型

本文所考虑的工业物联网环境下的联邦学习系统模型如图1 所示,含有U个设备和一个服务器。设备与服务器间通过无线信道进行上下行通信。

图1 工业物联网环境下的联邦学习系统模型

1.1 无线通信模型

由于所有本地模型都是通过无线网络传输的,因此在无线网络上部署联邦学习模型时需要考虑无线因素对联邦学习性能的影响。下面,分别从发送时延、能量损耗、传输成功概率等方面构建无线模型。

1.1.1 发送时延

在所考虑的联邦学习系统下,上行链路传输采用正交多址接入(OFDMA,orthogonal frequency division multiple access)技术,OFDMA 技术在未来6G 无线网络仍具有重要参考价值[30-31]。假设上行链路中M个资源块组成了资源块集合Ω,设备i第t轮训练将其本地联邦学习模型参数通过资源块n传输到基站,其上行链路速率为[16-17]

其中,BUp为上行链路的单个资源块带宽,Pi,t为设备i第t轮的发送功率,In为信号在资源块n上所受的干扰,N0为噪声功率谱密度,hi为设备i到服务器的信道增益。

根据资源块匹配方案,设备i第t轮训练上行链路速率为

其中,ri,n,t∈{0,1},ri,n,t=1为设备i第t轮训练使用资源块n进行参数传输,ri,n,t=0则相反,不使用资源块n进行参数传输。假设模型参数大小均为D,对应设备i第t轮训练通过资源块n的上行链路传输时延为

同样地,设备i第t轮训练传输时延为

由于在上行链路中设备分配资源块传输,带宽资源紧张,而下行链路使用广播传输,带宽资源压力小,因此下行时延波动相对上行时延可忽略。定义cDown为下行链路速率,对应下行时延为

设备在本地使用其计算资源训练本地模型。设备i第t轮训练的计算时延为[17-19]

其中,εi、Ki和ϖi分别为设备i一个样本数据的大小、设备样本数量和处理每位数据所需CPU 周期数,fi,t为设备i第t轮训练时的CPU 频率。

结合3 种时延,设备i第t轮训练的时延为

联邦学习每轮训练时延取决于被选择设备的最大时延,因此第t轮训练的时延为

1.1.2 能量损耗

假设聚合服务器有充足供电,因此不考虑服务器上的能耗,仅关注设备能耗。设备能耗包括设备本地训练以及无线传输能耗两部分,因此设备i的能量损耗定义为[32]

1.1.3 传输成功概率

由于无线信道中存在干扰和噪声,因此可能发生传输错误。文献[33]中给出了准静态衰落信道上的数据包传输系统的平均分组错误率的表达式,给定瀑布阈值m,定义设备i第t轮训练在资源块n的分组错误率为

假设上行链路一个本地模型使用一个分组数据包进行传输,且传输失败不再重传,因此设备i第t轮在资源块n下传输本地模型的成功概率为

同时,设备i第t轮训练传输本地模型的成功概率为。根据传输成功概率定义参数上传是否成功的二元变量si,t为

其中,si,t=1代表上传成功,si,t=0代表上传失败。

1.2 联邦学习模型

定义设备集合υ={1,2,…,U},设备i在本地收集的数据为Di=,i∈υ。设备i的样本数量为Ki,设备训练样本数量和为

假设数据dik的输出为oik,设备i的输出向量为Oi={oi1,oi2,…,oi2},i∈υ,对应的本地联邦学习模型为wi,通过无线信道发送给服务器。本地模型发送到服务器后将被整合成全局模型gt,发送回工业物联网设备。因此考虑设备选择和发送失败的全局模型gt的更新表达式为

定义每个数据的损失函数为f(gt,d ik,oik),设备i的本地损失函数定义为本地数据损失的均值

而全部设备的整体损失函数为全部设备本地损失的均值,定义为

为简便起见,后文中将设备i第t轮训练的第k个数据的损失函数f(gt,dik,oik)简写为fi,k(gt)。

设备收到全局模型gt后,本地模型更新式为

其中,λ为学习率。进一步地,全局模型损失函数的更新式为

其中,vt为不考虑设备选择与传输失败时的理想全局梯度和实际全局梯度之差,定义为

其中,实际全局模型梯度 ∇F'(gt)为

1.3 问题模型

针对电量有限设备在固定训练时间τ内获得最大学习精度的优化问题,由于学习精度最大可转化为全局模型损失值最小,优化目标可表示为

P1 表示在给定能耗预算下训练时间内最小化全局损失函数。由于设备由电池供电,因此存在长期资源预算限制,如果设备能量耗尽将无法参与后续训练。为求解P1,需要知道训练时间内总训练轮次W,而在训练前难以确定[6,17],且P1 是一个非线性规划问题,求解复杂度随着轮次W的增大呈指数级增长[26]。此外,时延Ti,t和发送状态si,t随着迭代轮次索引t不同而不同,且由于联邦学习的迭代性质,全局模型与过去所有轮次的训练有关[24]。综上,设备资源难以进行长时间优化。因此本文把长期电量预算划分为每轮可用电量预算,并将学习效率[28-29]作为每轮优化目标,旨在加速联邦学习训练,快速最小化全局损失函数。

学习效率被定义为每轮全局损失衰减与时延之比,代表全局损失衰减率,即模型的学习速率。其中,第t轮全局损失衰减定义为第t–1 轮训练全局模型gt−1损失值F(gt−1)与第t轮损失值F(gt)之差,可表示为

因此,根据学习效率的定义,第t轮训练学习效率At可表示为

其中,Tt为第t轮训练时延。

本文进行逐轮独立迭代优化,动态求解第t轮最大化学习效率At问题。结合训练的约束条件,优化问题P1 可转化为

为量化无线传输对联邦学习性能的影响,本文引入以下引理描述全局损失衰减有关传输成功率和设备调度的数学关系。

引理1在第t次训练中预期全局损失衰减ΔFt的下限为

其中,L是平滑参数,设置其为学习率的倒数,即[34-36];B是强凸参数;E(⋅)是关于发射成功率的期望。

证明见附录1。

2 资源分配算法

考虑多维联合变量求解的复杂性,本文将问题P2解耦为设备资源分配子问题、通信资源分配子问题、电池能量分配子问题,并采用变量迭代的方式[18-19,23]进行求解,提高求解效率。首先,求解在已知能耗预算下的最优CPU 频率和发送功率,得到设备资源分配策略。其次,在已知的设备资源分配策略下求解通信资源分配策略。再次,根据通信资源分配策略估计下一轮设备电池能量分配策略。最后,进行多次迭代优化直至训练时间τ结束。

2.1 设备资源分配

为求解优化问题P2,要权衡每轮设备能耗预算下设备的传输能量和计算能量分配,本文中传输能量与发送功率相关,计算能量与CPU 频率相关。给定通信资源分配矩阵Rt和能耗预算分配向量Et,优化设备发送功率向量Pt和CPU 频率向量ft以最大化学习效率At,上述问题为NP-hard 问题,难以获得最优解的闭式表达式,因此设计了一种近似求解算法,以逼近全局最优分配策略。

首先,基于引理1 中传输成功率与全局损失衰减的数学关系可知,传输成功率对全局损失衰减的影响呈非线性关系,即传输成功率越大,全局损失衰减的变化越平缓。其次,基于传输成功率的定义式(11)可知,由于传输成功率与CPU 频率无关,与发射成功概率的关系为负倒数的e 指数分布。在较理想信道条件下,传输成功概率在发送功率一般性取值范围内变化不明显。因此,在一般条件,发送功率变化所引起的全局损失衰减的变化不明显,而CPU 频率与全局损失衰减无关。同时,根据时延定义式(7)可知,设备时延与CPU 频率和发送功率均相关,且计算时延与CPU 频率倒数正相关。而基于式(23)可知,学习效率被定义为全局损失衰减与时延之比。

综合上述原因,学习效率中时延Tt比全局损失衰减ΔFt对CPU 频率和发送功率变化更敏感。为降低求解复杂度,将最大化学习效率问题转换为求解最小化时延问题,以获得发送功率向量近似解P*和CPU 频率向量近似解f*。同时,原设备资源分配子问题近似为最小化时延问题后,由于设备之间没有耦合关系,可将问题进一步解耦,降低求解难度,可使用多线程并行计算降低设备资源分配子问题的求解时间。具体地,设备资源分配问题P2.1 为

为求解问题P2.1,本文通过引入引理2 将原问题的求解退化为简单的一元函数最值问题。

引理2给定当前轮次能耗预算,如果能耗预算不支持设备以最大发送功率和CPU 频率运行,问题P2.1 最小化时延的设备发送功率和CPU 频率在不等式约束(24f)取等号时获得,即ei,t=Ei,t,因此发送功率Pi,t可由能耗预算Ei,t及CPU 频率fi,t表示。

证明见附录2。

基于引理2,本文使用粒子群优化算法计算一元函数最小值问题,以求解在第t轮能耗预算下所有设备和资源块组合的设备资源分配策略的近似解,即CPU 频率向量近似解和发送功率向量近似解。粒子群优化算法相比于其他一些群智能算法更擅长处理连续变化的变量,且具有良好的全局搜索能力,其固有的并行性可以方便地进行分布式计算,加快求解速度[37],可使用现成的智能优化算法库(例如scikit-opt)求解。粒子群优化算法复杂度为O(pq),其中,p为迭代次数,q为问题规模。设备资源分配算法的时间复杂度为O(UMpq),其中,U为设备数目,M为资源块数目,由于不同设备在不同资源块下的训练时延是不耦合的,因此可以分解为多线程并行计算。

2.2 通信资源分配

已知能耗预算和设备资源分配策略时,通信资源分配问题 P2.2 为

2.2.1 问题分析

将引理1 所述预期全局损失衰减下限代入式(23),可得学习效率At的下限为

联立式(30)与问题P2.2,则问题P2.2 更新为

由于电池能量限制,所有设备每轮均进行本地训练会对电池寿命造成巨大压力,因此每轮训练无法获得所有设备梯度范数,设备当前轮次的通信资源分配只能结合之前轮次训练数据来完成,因而式(31)中的参数B在每轮训练前未知。

本文基于历史数值对参数B进行估计。首先,初始化B=1,即设备数据之间没有差异。第t轮训练可用全局模型和本地模型梯度范数计算Bt,定义。第t轮训练中参数B使用指数平滑法估计为

其中,α是一个调整参数,用于调整估计值中的最近值和过去值的权重。

2.2.2 资源块迭代匹配算法

对于问题P3 的求解,本文提出一种资源块迭代匹配算法,首先在全部设备资源块组合下求解问题P2.1,根据获得的设备资源分配策略,使用穷举法列举所有可能的训练时延,然后采用Kuhn-Munkres 算法[38](以下简称为KM 算法)遍历求解每种训练时延下的最优通信资源分配策略,即设备每轮资源块匹配向量,直至可选设备数u少于资源块数目M,最后比较获得所有可能训练时延下最大化学习效率的最优解。

KM 算法是一种带权重的二分图匹配算法,根据式(31),设置设备和资源块二分图C=(υΩ,ε)每条边权重为

其中,Tmax为训练时延限制。根据二分图权重,可选设备数目为

其中,R(·)为0-1 指示函数。

上述过程的具体步骤如算法 1 所示。

KM 算法的时间复杂度为O(U2M)[39],因此本文所提出的资源块迭代匹配算法时间复杂度为O(U3M2),其中,U为设备数目,M为资源块数目,从表达式中可以看到,计算复杂度与关键变量(即U和M)之间不是呈指数增长关系的。此外,通信资源分配是在服务器端进行的,网络算力足够,并且不同时延限制下的资源块匹配方案可以分解为多线程并行计算任务[40]。

2.3 电池能量分配

由于长期的能耗预算限制,若设备在某轮能耗过高,则该设备未来可能无法参与聚合,因此为延长电池寿命,本文对电池能量进行分配管理。

同时,为充分利用设备能量,本文对每轮调度设备进行筛选。如果仅依据每轮学习效率进行通信资源分配,易造成某些数据量较少的设备长时间不参与聚合而无法充分利用设备能量。本文设置每轮未聚合设备的分配能量可积累使用,当设备电池能量较少时,可将上一轮时延最大设备从该轮可选设备中去除,由于未聚合设备能量可积累,后续训练中该设备将不再成为时延瓶颈,因此长期看有利于降低训练时延,提高学习效率。

综上所述,本文设计了一种在线电池能量分配策略。首先,动态估计训练轮次,并结合历史累计能量,为设备在线分配能耗预算。然后,通过上一轮设备时延获得候选设备集合,根据候选设备集合进行通信资源分配。最后,在给定通信资源分配策略下,调整CPU 频率以节约能耗。该策略具体描述如下。

首先,根据剩余训练时间以及单轮训练时延来估计剩余训练轮次。第t轮训练后,初始剩余训练轮次估计为

其中,Tt为算法1 输出的第t轮训练时延,Tsum为已训练时间。

为使不同轮次估计的剩余训练轮次保持相对稳定,本文结合历史值估计最终剩余训练轮次为

其中,β是平滑常数,表征了数值新鲜度的重要性,用于调整估计值中的最近值和过去值的权重。

根据剩余训练轮次估计值以及历史积累能量,可得设备i第t轮训练能耗预算为

其次,为充分利用设备能量,根据时延筛选每轮调度设备获得候选设备集合,进行通信资源分配。第t轮训练时,本文放弃选择第t–1 轮时延Ti,t−1最大的前N个设备,将剩余设备组成第t轮候选设备集合Πt,仅为集合Πt中设备分配通信资源块。其中,放弃设备数目N根据学习效率增大或减小的反馈情况进行在线调整。

第t轮训练时,不同放弃设备数目N下的学习效率均值为

其中,lN,t′为0-1 变量,lN,t′=1 表示第t′轮训练放弃数目为N,反之为lN,t′=0。

为获得合适的候选数据集,需动态调整放弃设备数目N。当电池能量不足时,即不支持设备以最大发送功率和CPU 频率训练,需要进行设备筛选操作。初始设置放弃设备数目N=1,每经过R轮训练后,根据学习效率变化动态调整放弃设备数目N。给定放弃设备数目N的跳变阈值ϕ,当学习效率均值增大量或减少量超过阈值ϕ时,放弃设备数目N对应增减。经过一段时间学习后,放弃设备数目N将趋于稳定或者动态稳定。

最后,调整CPU 频率以节约能耗。基于算法1求解第t轮训练通信资源块匹配向量及训练时延Tt,为将第t轮训练中参与聚合的设备时延对齐至训练时间Tt,以消除设备空闲时间降低能耗,根据式(6),设备i的CPU 频率调整为

上述过程的具体步骤如算法2 所示。

电池能量分配主要涉及能耗预算计算、可选设备集合获取以及CPU 频率调整等,每轮训练时间复杂度为O(U)。

3 性能测试与分析

为验证所提算法性能,本节在电池供电工业物联网的工厂场景下对不同联邦学习算法进行仿真对比分析。

3.1 仿真场景及参数设置

以图1 为例,考虑一个100 m×100 m 的工厂环境,该场景中分布多个工业设备,工厂中心有一个服务器进行模型聚合。设备数目U=15,资源块数目M=10,不同资源块受到的干扰不同,其他仿真参数设置如表1 所示。使用MNIST 数据集,将训练数据以独立同分布(IID,independent and identically distributed)方式划分为每份样本大小为100 个数字的切片数据集,不同设备随机分配不同数量切片。每个设备使用所划分的MNIST 数据集训练一个简单本地的三层网络,分别为一个由512 个神经元组成的隐藏层、一个由128 个神经元组成的隐藏层以及一个输出层,隐藏层使用ReLU 作为激活函数,每经过一轮本地训练进行一次全局聚合,损失函数采用交叉熵函数[34]。

表1 仿真参数设置

为了验证本文所提算法的效果,将本文算法与以下基准算法进行仿真对比。

1)随机调度算法[41]。在每一轮通信中,统一随机选择M个设备进行参数更新,每个选定的设备随机分配一个资源块来传输训练好的参数。设置设备使用最大功率和CPU 频率训练,能量耗尽时设备停止训练。

2)最大收敛精度算法[34]。文献[34]推导了预期收敛速度 E(F(gt+1)−F(g*))的闭式表达式,其中g*为在没有因无线干扰而造成参数发送错误的理想设置中基于所有本地模型生成的最佳联邦学习模型,基于最大化收敛精度为目标求解设备选择和资源块匹配方案。该方案需要选择设备有足够的能量在整个联邦学习迭代过程中传输和更新本地模型。设置设备使用最大功率和CPU 频率训练,能量耗尽时设备停止训练。

3)最小收敛时间算法[42]。文献[42]以最小化训练时延为优化目标,在每轮训练中基于本地模型梯度大小选择M个设备,对给定设备求解最小化时延的资源块匹配方案。本文方案不考虑能量限制,设置设备使用最大功率和CPU 频率训练,能量耗尽时设备停止训练。

本文设置总训练时间为50 s,从大到小依次设置设备电池的能耗预算[6,16,43]分别为50 J、3 J、2 J、1 J,其中50 J 代表电池电量充足,可支持所有设备始终以最大CPU 频率和最大发送功率进行训练。

3.2 结果分析

图2 为50 J 电量下所提算法与基准算法性能对比。当电池能量充足时,所提算法与基准算法均能以最大CPU 频率和最大发送功率持续运行。从图2可以看出,所提算法收敛速度快于其他3 种基准算法,训练时间足够长时,所提算法与最大收敛精度算法所获精度接近。由于所提算法以学习效率为优化目标,旨在提高训练速度,因此电池能量充足时,所提算法可以最快速度收敛到最高精度,在训练时间较小的场景下优势较明显。

图2 50 J 电量下所提算法与基准算法性能对比

图3~图5 分别为3 J、2 J、1 J 电池电量下所提算法与基准算法的性能对比。可以看出,所提算法在前期学习速度较慢,后期逐渐超过其他基准算法,最后收敛到最高精度。这是由于设置电池电量不能支持设备持续以最大CPU 频率和最大发送功率运行,3 种基准算法中设备初期以最大CPU频率和最大发送功率运行所以学习速度大,然而由于没有进行能量管理,后期设备电池能量提前耗尽而中断学习。与之相反,所提算法初期学习速度较慢,但由于对设备进行能量管理,设备能够持续训练,在训练时间结束时达到最大学习精度。比较图3~图5 则可以看出,电池能量越低,所提算法的性能优势更显著。电池能量越低,3 种基准算法中断学习越早,而所提算法由于进行能源管理电池能量对最终学习精度影响较小。

图3 3 J 电量下所提算法与基准算法性能对比

图4 2 J 电量下所提算法与基准算法性能对比

图5 1 J 电量下所提算法与基准算法性能对比

为进一步分析本文算法在不同电池能量预算下的性能,本文分析给定训练时间和能耗预算下不同算法的训练轮次和参与数据数目,即成功上传的本地模型所涉及数字样本总数。如图6 所示,所提算法的训练轮次在电池能量预算减少时对比3 个基准算法相对增加,因此所提算法可以提高设备存活期限。从图7 可以看出,在不同电池能量预算下,所提算法成功参与的样本数据数目均高于3 个基准算法,体现出所提算法在训练量上的提升。基于上述评估指标,由仿真结果可知,所提算法可以很好适应各种电池能量预算,尤其在电池能量预算较低时性能优势明显。

图6 不同算法的训练轮次对比

图7 不同能耗预算下算法参与数据数目对比

4 结束语

本文针对工业物联网下联邦学习网络电池能量和无线资源有限的问题,提出一种资源管理算法,有效提高固定训练时间下联邦学习的模型精度。将长期优化问题转化为动态优化问题,构建在线能量分配策略,权衡设备的传输和计算能量分配,引入学习效率概念,得到能耗预算下学习效率最大化的资源块匹配向量,并调整CPU 频率以节约能量。仿真结果表明,与基准算法相比,所提算法能提高模型学习精度,并且在能量短缺情况下学习性能优势显著。

附录1 引理1 的证明

对于联邦学习算法的理论分析,本文在分析中采用以下典型假设。

假设1假设F(g)满足L-平滑[21,23]

假设2假设IID 数据分布下局部梯度间不相似程度有界,局部梯度范数与全局梯度范数满足B-梯度不相似[13,44],局部梯度与全局梯度的不相似关系为

根据假设1 可得预期全局损失衰减满足

进一步联立式(18)和式(29),可得

根据式(19)和式(20),可得全局梯度与实际全局梯度之差的范数平方的均值为

其中,第t轮训练设备i是否被选中的0-1 变量ai,t以及是否发送成功的0-1 变量si,t由资源块匹配向量决定。

进一步地,将假设2 代入式(48),整理可得

联立式(45)和式(51),可得预期全局损失衰减下限为

证毕。

附录2 引理2 的证明

基于时延定义式(7)可知,随着设备发送功率或CPU 频率增大,时延单调递减。

为了证明引理2,只需证明能耗定义式(9)是关于发送功率以及CPU 频率的单调递增函数即可。

由于计算能耗部分与CPU 频率的平方成正比,因此能耗定义式(9)是关于CPU 频率的单调递增函数。而能耗关于发送功率的一阶导数为

由于x>0时,且f(0)=0,因此x>0时f(x)恒正,进一步地,能耗关于发送功率的一阶导数在发送功率Pi,t>0时恒正,即能耗关于发送功率Pi,t单调递增。证毕。

猜你喜欢

资源分配全局时延
新研究揭示新冠疫情对资源分配的影响 精读
5G承载网部署满足uRLLC业务时延要求的研究
基于GCC-nearest时延估计的室内声源定位
落子山东,意在全局
QoS驱动的电力通信网效用最大化资源分配机制①
基于动态规划理论的特种设备检验资源分配研究
基于动态规划理论的特种设备检验资源分配研究
记忆型非经典扩散方程在中的全局吸引子
云环境下公平性优化的资源分配方法
简化的基于时延线性拟合的宽带测向算法