APP下载

考虑竞争环境的联邦学习多维契约激励机制研究

2023-10-17杨扬殷红建王超

计算机应用研究 2023年10期
关键词:激励机制

杨扬 殷红建 王超

摘 要:针对现有激励机制无法满足竞争环境下联邦学习(FL)落地实施需要的现实问题,提出了一种适于竞争环境的多维契约激励机制。首先,引入了竞争强度描述数据拥有者和任务发布者之间的竞争关系;其次,创新性地设计了一种金钱和FL模型使用权相组合的MM(monetary-the FL model)组合激励;再次,在MM组合激励的基础上,分别在完全信息场景和不完全信息场景下,以任务发布者利润最大化为目标,构建了适于竞争环境的联邦学习多维契约激励机制设计优化问题;进一步,通过理论推导分析了契约可行性及契约最优性,并在此基础上给出了适于竞争环境的联邦学习最优契约设计算法;最后,实验结果表明,以MM组合激励为基础的多维契约激励机制提高了竞争环境下数据拥有者参与联邦学习的意愿。

关键词:竞争环境; 联邦学习; 契约理论; 激励机制

中图分类号:TP391 文献标志码:A 文章编号:1001-3695(2023)10-019-3007-09

doi:10.19734/j.issn.1001-3695.2023.02.0080

Incentive mechanism for federated learning in competitive environment:multidimensional contract approach

Yang Yanga, Yin Hongjiana, Wang Chaob

(a.School of Management Engineering & Business, b.School of Information & Electrical Engineering, Hebei University of Engineering, Handan Hebei 056038, China)

Abstract:Aiming at the existing incentive mechanisms cannot satisfy the demand of implementation for federated learning (FL) in competitive environment, this paper proposed a multi-dimensional contract-based incentive mechanism for FL in competitive environment. Firstly, this paper introduced the competition intensity to measure the competition relationship between the data owners and the task publisher. Secondly, this paper designed a novel incentive form named as MM (monetary-the FL model) combined incentive, which combined monetary with usufruct of FL model. Thirdly, based on MM combined incentive, this paper constructed optimization problems of the multi-dimensional contract-based incentive mechanism design for FL in competitive environment for the task publishers profit maximization under complete information scenario and incomplete information scenario respectively. Finally, experimental results show that the multi-dimensional contract-based incentive mechanism based on MM combined incentive improves the willingness of data owners to participate in FL in competitive environment.

Key words:competitive environment; federated learning(FL); contract theory; incentive mechanism

0 引言

大數据时代,企业数字化转型被视为占领价值链高端与构建竞争新优势的重要契机[1]。“十四五”规划中明确指出,要支持企业数字化转型,加快数字化发展,建设数字中国。在企业数字化转型过程中,企业间的数据共享有利于降低企业数据获取成本,提升企业竞争优势[2]。而随着数据共享程度的加深,数据隐私泄露的风险也逐步上升。因此,数据隐私保护成为企业数字化转型升级工作中的重点之一。

针对数据隐私泄露问题,联邦学习(FL)因其保护数据隐私的优势而受到关注[3]。而在实现FL过程中,数据拥有者需要先行承担在自身设备上训练模型和传输运算结果所导致的直接成本,这使得数据拥有者缺乏动力参与FL。此外,由于数据拥有者的直接成本属于私人信息,FL的任务发布者需要在信息不对称情况下,设计相应补偿以激励数据拥有者参与FL。而契约激励机制是应对信息不对称情况下激励问题的一种有效机制。因此,契约激励机制作为解决FL中数据拥有者参与动力不足问题的有效手段而广受关注[4~6]。

然而,现有FL契约激励机制无法有效激励竞争环境下的数据拥有者。在竞争环境下,任务发布者与某些数据拥有者之间存在竞争关系,这些数据拥有者参与FL除了承担相应的直接成本外,还可能因失去竞争优势而支付额外的间接成本[7]。如某银行希望通过FL利用其他银行(数据拥有者)提供的数据来优化自身产品模型。而FL训练后的产品模型仅由该银行持有,这可能使得参与FL的其他银行在未来竞争中因产品模型上的差距而处于竞争劣势,导致间接成本的产生。现有FL契约激励机制在设计激励时并未考虑这一间接成本,因而无法有效激励竞争环境下的数据拥有者参与FL。此外,现有FL契约激励机制研究中,金钱激励[8~11]和金钱—声誉组合激励[12, 13]是主要的激励方式,以上激励方式无法满足竞争环境下某些数据拥有者对FL训练后的产品模型需求。Mai等人[14]设计了一种双向拍卖FL激励机制,使得训练好的模型可以在设备(数据拥有者)和FL平台(任务发布者)之间自动交易。这种模型激励方式虽然对具有竞争关系的数据拥有者有较高吸引力,但对竞争环境下与任务发布者不存在竞争关系的数据拥有者缺乏吸引力,因此亟需一种能在竞争环境下激励所有数据拥有者的激励方式。

为了有效激励竞争环境下所有数据拥有者参与FL,本文提出了适于竞争环境的FL多维契约激励机制,主要贡献可概括如下:

a)构建了金钱与FL模型使用权结合的MM(monetary-the FL model)组合激励。与现有FL激励机制研究中所采用的其他激励方式不同,本文构建的MM组合激励考虑到了竞争环境下某些数据拥有者对FL训练后FL模型的需求,提高了竞争环境下各类型数据拥有者的参与意愿。

b)设计了竞争环境下的多维契约激励机制。与现有FL契约激励机制不同,本文所提出的多维契约激励机制不仅考虑了数据拥有者的数据质量,而且考量了竞争环境下数据拥有者和任务发布者之间的竞争关系。竞争关系的考量完善了任务发布者对于数据拥有者在竞争环境下参与FL成本的认识,并有效促进了FL在竞争环境下的实现。

1 相关工作

FL是一种分布式隐私保护机器学习技术[15~17]。FL激励机制的研究是当前联邦学习研究领域热点之一,根据数据拥有者贡献评估侧重点的不同,主要从数据质量优先、数据数量优先和数据均衡优先三个角度研究FL数据拥有者激励问题。

在数据质量优先的激励机制研究中,对于数据可信度和准确率要求更高,需要激励数据质量较高的数据拥有者参与,适用于医疗和教育等数据质量敏感度较高的企业。如Yuan等人[18]提出了一种基于拍卖的激励机制,该机制的设计考虑了数据拥有者数据、信道等信息的真实性,以激励拥有高质量数据的数据拥有者。Le等人[19]设计了一个基于拍卖的激励机制,通过在机制设计中考虑真实性来保证数据拥有者分配真实可靠的数据参与FL。Sun等人[20]分别设计了静态FL激励机制和动态FL激励机制,利用声誉识别并激励高质量的客户(数据拥有者)。Lin等人[21]设计了一种基于斯塔克尔伯格博弈的激励机制,以鼓励数据拥有者以诚实可信的高质量数据参与FL。

在数据数量优先的激励机制研究中,由于模型性能与数据量大小有关,需要激励足够多的数据拥有者参与,适用于工业等数据数量大的行业。如顾永跟等人[22]提出了一种不平衡数据下预算限制的FL激勵机制,该机制激励客户端(数据拥有者)数据量最优选择下参与FL。Lin等人[23]设计了一种基于斯塔克尔伯格博弈的激励机制,该机制对贡献更多数据量的数据拥有者给予更高的奖励。Wang等人[24]针对基于区块链的FL提出了一种联合资源分配的激励机制,该机制基于数据量设计FL训练阶段激励额度。

在数据均衡优先的激励机制研究中,需要在激励足够多的数据拥有者的同时保证一定的数据可信度和准确率,适用于数据可信度、数据质量和模型性能均衡的行业。如Kang等人[12]将声誉引入FL激励机制,以激励高声誉设备(数据拥有者)在一定数据量基础上提供高质量数据。Wang等人[25]提出了四种信息场景下基于契约的激励机制,这些机制根据Shapley值法评价数据拥有者的贡献(数据量、数据质量)并激励其参与FL。Wang等人[26]在分层FL中设计了一种基于区块链的激励机制,该机制确保了在模型训练过程中贡献的数据质量和数据量,以提高FL模型的性能。Li等人[27]设计了一种基于无限重复博弈的激励机制,该机制评价数据拥有者的贡献时综合考虑了数据量和数据质量。

目前,FL激励机制的研究并未考虑任务发布者与某些数据拥有者之间竞争关系导致的FL间接成本,无法有效激励竞争环境下的数据拥有者参与FL。鉴于此,本文考虑竞争环境的FL数据拥有者激励问题,提出金钱与模型使用权相结合的MM组合激励,并在此基础上设计一种多维契约激励机制。

2 系统模型

本章考虑一个竞争环境下的FL,它由一个任务发布者和一组数据拥有者N={1,2,…,N}组成,且任务发布者和数据拥有者之间存在竞争关系。首先,引入竞争强度参数来描述这种竞争关系;其次,根据引入的竞争强度辅助划分数据拥有者类型;最后,给出竞争环境下的任务发布者以及数据拥有者的利润函数,为下一节设计多维契约激励机制提供基础。

2.1 竞争强度

在大数据时代,企业各自拥有的数据作为优化企业自身产品以吸引更多市场渠道的重要资源而备受保护。而企业拥有它们的竞争对手所没有的市场渠道,便形成了竞争优势。当任务发布者与数据拥有者之间存在竞争关系时,数据拥有者参与FL可能会间接导致竞争优势的削弱,从而产生间接成本,影响了数据拥有者的参与意愿。而现有激励机制并未考虑到竞争关系带来的间接成本,难以有效激励竞争环境下的数据拥有者参与FL。

针对上述问题,引入竞争强度β(β∈[0,1])来量化竞争环境下数据拥有者和任务发布者之间的竞争关系。具体来说,竞争强度大小反映数据拥有者和任务发布者之间竞争关系的激烈程度,即竞争程度。竞争强度β=0表示数据拥有者和任务发布者之间不存在竞争关系,数据拥有者参与FL的成本仅为训练模型和传输运算结果所导致的直接成本;竞争强度β>0表示数据拥有者和任务发布者之间存在竞争关系,数据拥有者参与FL的成本为直接成本和因竞争优势削弱所导致的间接成本。随着竞争强度β增大,任务发布者与数据拥有者之间的竞争程度上升,数据拥有者参与FL所削弱的竞争优势更多,数据拥有者参与FL时所导致的间接成本也相应增加。

由于数据拥有者在竞争环境下参与FL时,因竞争关系导致的间接成本属于数据拥有者的私人信息,任务发布者无法获取,所以任务发布者需要在信息不对称的情况下设计激励机制。考虑到契约激励机制是应对信息不对称情况下激励问题的一种有效机制,拟设计针对竞争环境的FL契约激励机制。

2.2 数据拥有者类型

根据文献[12]可知,数据拥有者参与FL时所提供的数据质量Γ(Γ>0)决定局部模型的迭代次数,即Ω=θ/Γ,其中,Ω为全局模型允许误差固定时局部模型迭代次数上限,θ(θ>0)表示与数据质量相关的局部模型迭代次数转换系数。当数据拥有者与任务发布者不存在竞争关系时,数据拥有者参与FL所提供的数据质量Γ仅由真实数据质量h决定,即Ω=θ/h[12, 28];当数据拥有者与任务发布者存在竞争关系时,数据拥有者参与FL时所提供的数据质量Γ,由数据拥有者的真实数据质量h、竞争强度β和竞争敏感度δ共同决定,即

其中:竞争敏感度δ表示数据拥有者对竞争的敏感程度,δ∈[0,h/β)。当δ=0时,表明数据拥有者对竞争不敏感,即无论竞争强度β大小,数据拥有者所提供的数据质量Γ均为真实数据质量h;当δ>0时,表明数据拥有者对竞争敏感,也就是说,当数据拥有者与任务发布者存在竞争关系时,为避免在未来竞争中失去竞争优势,数据拥有者倾向于不提供真实数据质量h,即所提供的数据质量Γ小于其真实数据质量h,而真实数据质量h与所提供的数据质量Γ之间的差额由竞争强度β和竞争敏感度δ共同决定,竞争强度β越大或竞争敏感度δ越高,两者差额越大,反之,两者差额越小。

为便于分析,假设有I种真实数据质量H={hi,1≤i≤I},J种竞争强度B={βj,1≤j≤J},K种竞争敏感度D={δk,1≤k≤K}。将I种真实数据质量按递增顺序排列,即h1<……>βj>…>βJ,j∈{1,2,…,J},K种竞争敏感度按递减顺序排列,即δ1>…>δk>…>δK,k∈{1,2,…,K},依据每个数据拥有者的真实数据质量hi、竞争强度βj和竞争敏感度δk,对所有参与FL的数据拥有者进行类型划分,真实数据质量为hi、竞争强度为βj、竞争敏感度为δk的数据拥有者类型为(hi,βj,δk),简称为ijk类型数据拥有者或数据拥有者ijk。

数据拥有者ijk参与FL所提供的数据质量Γijk由真实数据质量hi、竞争强度βj和竞争敏感度δk共同决定,即Γijk=(hi-δkβj)。接下来,通过Γijk对不同的数据拥有者类型进行比较。

定义1 类型偏好。对于任意两个数据拥有者类型ijk和i′j′k′,数据拥有者i′j′k′不优于数据拥有者ijk,即i′j′k′ijk,当且仅当Γi′j′k′≤Γijk,其中i,i′∈{1,2,…,I},j,j′∈{1,2,…,J}和k,k′∈{1,2,…,K}。

将数据拥有者所提供的数据质量按非递减顺序排列:

其中:i∈{1,2,…,I},j∈{1,2,…,J}和k∈{1,2,…,K}。為便于分析,将ijk类型数据拥有者在数据拥有者类型排序中的前一项称为ijk类型的紧前项,表示为(ijk-1);将ijk类型数据拥有者在数据拥有者类型排序中的后一项称为ijk类型的紧后项,表示为(ijk+1),不难看出,Γijk-1≤Γijk≤Γijk+1。

2.3 利润函数

为在竞争环境下激励数据拥有者参与并实现FL,任务发布者需要为不同类型的数据拥有者设计相应的激励。契约理论是一种有效的工具,可以帮助任务发布者在分别构造任务发布者和数据拥有者的利润函数的基础上,设计合理的激励。基于此,分别给出任务发布者和数据拥有者的利润函数,以便于设计合理的激励。

2.3.1 任务发布者的利润函数

在FL中,任务发布者的利润是所有数据拥有者的贡献与支付给他们的报酬之间的差额。

当全局模型允许误差γ固定时,数据拥有者参与FL的总时长通常被认为是影响任务发布者收益的主要因素[12]。数据拥有者参与FL的总时长为局部模型训练时长与局部模型传输时长之和。局部模型训练时长由数据拥有者所提供的数据质量和计算资源共同决定,当数据拥有者提供更多的计算资源或更高质量的数据时,可以更快地完成和实现FL的全局迭代并达到预定义的允许误差。局部模型传输时长主要由数据拥有者的传输速率和传输模型数据量共同决定。

考虑数据拥有者ijk在局部模型训练中使用的数据量为zijk(zijk>0),数据拥有者ijk贡献的计算资源(即CPU周期频率)表示为fijk,单个数据样本局部迭代一次的CPU周期数为πijk(πijk>0),所有的数据样本数据规模(即字节数)相同,则数据拥有者ijk的局部模型迭代一次时长Tcmpijk为(πijkzijk)/fijk。全局模型允许误差γ固定时,数据拥有者ijk的局部模型训练迭代次数为θ/Γijk,因此,数据拥有者ijk的局部模型训练时长为

考虑所有数据拥有者的传输模型数据量σ(σ>0)相同,且为一个常数,数据拥有者ijk的传输速率为eijk,则数据拥有者ijk的局部模型传输时长Tcomijk为

其中:eijk=Bln(1+(αijkdijk)/N0);B(B>0)为传输带宽;αijk(αijk>0)为数据拥有者ijk的传输功率;dijk(dijk>0)为数据拥有者ijk与任务发布者之间点对点链路的信道增益;N0(N0>0)为背景噪声[12]。

为了在竞争环境下激励数据拥有者参与FL,任务发布者需要为各种类型的数据拥有者提供激励。在竞争环境下参与FL,对于任务发布者来说,FL全局模型能够带来竞争优势,对于数据拥有者来说,FL全局模型仅由与其具有竞争关系的任务发布者持有并使用,可能削弱数据拥有者在未来竞争中的竞争优势。而现有FL契约激励机制并没有为竞争环境下数据拥有者削弱的竞争优势提供补偿,这使得数据拥有者参与FL动力不足。

针对数据拥有者在竞争环境下参与FL动力不足问题,本文提出MM(monetary-the FL model)组合激励,即(R,Rmod),其中R(R>0)表示数据拥有者获得的MM组合激励中的金钱激励,Rmod(Rmod>0)表示数据拥有者获得的MM组合激励中的FL模型使用权激励。本文中FL模型使用权激励Rmod是指不同类型数据拥有者完成FL训练后可获得不同允许误差的全局模型使用权,数据拥有者可获得的全局模型允许误差越小,模型使用权激励Rmod越大。竞争环境下数据拥有者参与FL可能削弱竞争优势,而FL模型使用权激励Rmod旨在补偿数据拥有者因竞争优势削弱而产生的额外成本。在MM组合激励的基础上,提出竞争环境下多维契约Q(H,B,D)={Qijk,1≤i≤I,1≤j≤J,1≤k≤K},由I×J×K种契约项Qijk={(Rijk,Rmodijk),fijk}组成,其中Qijk表示数据拥有者ijk所对应的契约项,Rijk表示数据拥有者ijk所对应的金钱激励,Rmodijk表示数据拥有者ijk所对应的模型使用权激励,即数据拥有者ijk可获得的不同允许误差全局模型,且

其中:η为FL参与者(任务发布者和数据拥有者)能接受的全局模型最高允许误差,η>γ。当竞争强度βj为0时,代表数据拥有者与任务发布者之间不存在竞争关系,此时MM组合激励退化为单一金钱激励;当竞争强度βj大于0时,在全局模型允许误差γ固定条件下,不同类型数据拥有者获得的模型使用权激励由竞争强度决定,竞争强度βj越大,数据拥有者可获得的模型使用权激励Rmodijk越大。

当数据拥有者ijk签订契约Qijk时,任务发布者从数据拥有者ijk获得的利润WTPijk为:任务发布者从数据拥有者ijk贡献中获取的收益UTPijk与提供给数据拥有者ijk的报酬Rijk+λRmodijk之差,即

其中:l(l>0)为MM组合激励(Rijk,Rmodijk)所对应任务发布者的单位成本;λ(λ≥0)是FL模型使用权激励的单位收益。由于真实数据质量hi越高,则在局部模型训练中迭代时间Tijk越短,任务发布者能获得的利润WTPijk越高,所以

2.3.2 数据拥有者的利润函数

在FL中,数据拥有者的利润是任务发布者提供的报酬与数据拥有者参与FL总成本之间的差额。

数据拥有者ijk签订契约Qijk时获得的报酬为Rijk+λRmodijk。在非竞争环境下,数据拥有者参与FL总成本为局部模型训练成本和局部模型传输成本;在竞争环境下,除局部模型训练成本和局部模型传输成本等直接成本以外,数据拥有者参与FL总成本还包括竞争优势可能削弱的间接成本。如2.1节所述,竞争强度用于反映数据拥有者和任务发布者之间的竞争关系,随着竞争强度βj增大,数据拥有者参与FL可能削弱的竞争优势更多,进而导致数据拥有者参与FL时的间接成本也相应增加。为便于分析,假设数据拥有者ijk在竞争环境下参与FL的间接成本Vcmtijk为

激励机制设计旨在保证契约可行的条件下,确定最优契约Q(H,B,D)={Qijk,1≤i≤I,1≤j≤J,1≤k≤K},以最大化任务发布者的利润,接下来,在两种信息场景下构建激励机制设计优化模型,解决竞争环境下激励机制设计问题。

3 竞争环境下的多维契约激励机制设计

本章考虑在如下两种信息场景中设计竞争环境下联邦学习多维契约激励机制。

a)完全信息场景,假设任务发布者知道每个数据拥有者的类型。

b)不完全信息场景,假设任务发布者只知道数据拥有者的类型分布信息。

接下来,在完全信息场景和不完全信息场景中,分别推导多维契约的可行性以及最优性。

3.1 两种信息场景下契约设计

为了激励数据拥有者接受任务发布者所设计的契约且诚实可靠地参与FL,任务发布者所设计的契约需要确保数据拥有者参与FL时获得的利润高于其不参与FL时的保留收益,且数据拥有者选择对应其类型的契约时利润最高,即可行契约需要满足个体理性(individual rationality,IR)约束和激励相容(incentive compatibility,IC)约束。

定义2 个体理性。假定数据拥有者不参与FL的保留收益为0,为保证数据拥有者参与FL,任务发布者设计的契约要满足数据拥有者ijk(1≤i≤I,1≤j≤J,1≤k≤K)接受契约Qijk时可以获得非负利润,即

在完全信息场景下,即任务发布者可以获知每个数据拥有者类型时,研究竞争环境下联邦学习多维契约设计问题。在完全信息场景下,任务发布者利用了解的所有数据拥有者类型信息,为数据拥有者ijk仅提供不低于其保留效用的利润,以实现任务发布者利润最大化,此时,IC约束恒成立,因此,任务发布者仅需设计满足IR约束和式(24)的I×J×K项契约{(Rijk,Rmodijk),fijk},则完全信息场景下数据拥有者ijk的相应契约可通过式(27)优化问题得到。

将优化问题式(27)的最优解表示为{RCS*ijk,RmodCS*ijk,fCS*ijk},由该最优解得到完全信息场景下数据拥有者ijk的最优契约。如果参与FL的N个数据拥有者的最优契约满足式(26),则在激励预算上限Rmax下,N個数据拥有者的FL可以实施,否则,N个数据拥有者的FL无法实施。

在不完全信息场景下,即任务发布者仅获知数据拥有者类型分布而无法准确获知其具体类型时,研究竞争环境下联邦学习多维契约设计问题。在不完全信息场景下,任务发布者还需要确保每个数据拥有者会选择与其类型相对应的契约,因此,在不完全信息场景下契约设计问题,除了需要满足式(23)~(25)外,还需要满足式(26),考虑竞争环境的联邦学习多维契约设计问题可以表述为

将优化问题式(28)的最优解表示为{RIS*ijk,RmodIS*ijk,fIS*ijk},i∈{1,2,…,I},j∈{1,2,…,J},k∈{1,2,…,K},由该最优解得到不完全信息场景下适于竞争环境的FL最优契约。

接下来,通过推导可行契约IR约束和IC约束的充分条件,对优化问题式(27)和(28)中的约束条件式(23)和(24)进行化简转换完成求解。

3.2 契约可行性

在本节中,通过以下引理推导竞争环境的联邦学习多维契约可行的充分条件。

引理1 对于任意可行契约项Qijk,有fijk≥fi′j′k′,当且仅当Rijk+λRmodijk≥Ri′j′k′+λRmodi′j′k′,且i,i′∈{1,2,…,I},j,j′∈{1,2,…,J},k,k′∈{1,2,…,K}。

证明 上述引理的证明分为两部分:第一部分,如果高报酬,则有高贡献Rijk+λRmodijk≥Ri′j′k′+λRmodi′j′k′fijk≥fi′j′k′;第二部分,如果高贡献,则有高报酬fijk≥fi′j′k′Rijk+λRmodijk≥Ri′j′k′+λRmodi′j′k′。

引理1表明,当数据拥有者贡献更高的CPU周期频率时,任务发布者提供的报酬更高;反之,当任务发布者提供更高的报酬时,数据拥有者需要贡献的CPU周期频率也相对更高。

引理2 单调性。对于任意可行契约项Qijk,有fi′j′k′≤fijk,当且仅当(hi′,βj′,δk′)(hi,βj,δk),且i,i′∈{1,2,…,I},j,j′∈{1,2,…,J},k,k′∈{1,2,…,K}。

证明 对于数据拥有者ijk和i′j′k′,有IC约束:

引理2表明,当数据拥有者贡献更高的CPU周期频率时,在任务发布者划分的数据拥有者类型中该数据拥有者类型相对排序更高;反之,在任务发布者划分的数据拥有者类型中,如果某个数据拥有者类型排序更高,该数据拥有者需要贡献的CPU周期频率也相对更高。

引理3 简化IR约束。如果(h1,β1,δ1)类型数据拥有者所对应的契约Q111满足IR约束,那么其他类型数据拥有者所对应的契约项必然满足IR约束。

证明 根据IC约束有

优化问题式(63)的目标函数是关于CPU周期频率fIS*ijk二阶导恒小于0的凹函数,且约束条件均为关于CPU周期频率fIS*ijk的凸函数,因此,优化问题式(63)是凸优化问题。通过MATLAB凸优化问题工具包CVX求解优化问题式(63),得到不完全信息场景下的最优CPU周期频率fIS*ijk,在此基础上,根据式(8)和(62)分别得到不完全信息场景下的最优模型使用权激励和最优金钱激励,进而给出不完全信息场景下的最优契约{(RIS*ijk,RmodIS*ijk),fIS*ijk},i∈{1,2,…,I},j∈{1,2,…,J},k∈{1,2,…,K}。具体算法如下。

算法1 不完全信息场景下的最优契约设计

输入:类型信息(hi,βj,δk);类型概率pijk,i∈{1,2,…,I},j∈{1,2,…,J},k∈{1,2,…,K}。

输出:最优契约{(RIS*ijk,RmodIS*ijk),fIS*ijk}。

a) 初始化决策变量集{fISijk,1≤i≤I,1≤j≤J,1≤k≤K};

b) 调用CVX求解凸优化问题式(63),得到最优CPU周期频率fIS*ijk,i∈{1,2,…,I},j∈{1,2,…,J},k∈{1,2,…,K};

c) 根据式(8),得到每种类型相对应的最优模型使用权激励RmodIS*ijk;

d) 根据式(20)(62),得到(Rijk+λRmodijk)IS*;

e) 根据RmodIS*ijk和(Rijk+λRmodijk)IS*,得到最优金钱激励RIS*ijk;

f) 由fIS*ijk、RmodIS*ijk、RIS*ijk给出最优契约{(RIS*ijk,RmodIS*ijk),fIS*ijk}。

4 实验与结果分析

4.1 实验参数设置

为验证所提激励机制在竞争环境下的可行性和有效性,本文考虑了1个任务发布者和N=100个数据拥有者的FL。实验运行环境为联想ideapad,酷睿i5-6200U,16 GB RAM,Windows 10,MATLAB 2021a。考虑多维契约中数据拥有者类型服从均匀分布:真实数据质量设置为h∈[180,200],竞争强度设置为β∈[0.5,1],竞争敏感度设置为δ∈[50,55]。除非另有说明,仿真中使用的默认参数参考表1。

4.2 实验结果分析

为了验证本文提出的激励机制在竞争环境下的可行性,分析比较不同类型数据拥有者的最优MM组合激励和最优CPU周期频率。依据三维私有信息:真实数据质量h、竞争强度β和竞争敏感度δ,将数据拥有者初步划分为8(2×2×2)种类型(hi,βj,δk),i∈{1,2},j∈{1,2},k∈{1,2},数据拥有者属于某一类型的概率为1/8,其中h1=180

由图1(a)可知,当数据拥有者类型越高时,数据拥有者获得的最优MM组合激励越大;由图1(b)可知,當数据拥有者类型越高时,数据拥有者需要提供的最优CPU周期频率越大,这验证了引理2中当数据拥有者提供更高CPU周期频率时,数据拥有者类型越高。此外,以上实验结果表明,最优MM组合激励和最优CPU周期频率随着数据拥有者的类型变化时具有相同的变化趋势,验证了引理1中当数据拥有者提供更高的CPU周期频率时,数据拥有者所获得的激励报酬也相应更高。

为验证不同类型数据拥有者获得的利润满足IR约束和IC约束,分析比较所有类型数据拥有者选择不同契约项时的利润,实验结果见图2。

由图2可知,不同类型数据拥有者选择任务发布者为其设计相应类型的契约项时,其利润是非负的,因此,本文所设计的激励机制满足IR约束。此外,由图2可知,不同类型数据拥有者只有选择任务发布者为其设计相应类型的契约项时,才能获得最大的利润,因此本文所设计的激励机制满足IC约束。

为了探究本文提出的激励机制对数据拥有者三维私有信息的偏好,分析了真实数据质量、竞争强度以及竞争敏感度变化对最优MM组合激励和最优CPU周期频率的影响。将数据拥有者类型总数设置为27(3×3×3)种,并将三维私有信息按照非递减顺序排列:h1

由图3可知,随着竞争强度β或竞争敏感度δ上升,数据拥有者获得的最优MM组合激励和最优CPU周期频率均呈下降趋势;随着真实数据质量h上升,对应的最优MM组合激励和最优CPU周期频率上下限均呈上升趋势。原因在于拥有更高真实数据质量h的数据拥有者能为任务发布者带来更高的利润,反之,对于拥有更高竞争强度β或竞争敏感度δ的数据拥有者导致任务发布者的利润下降。因此,本文提出的竞争环境下多维契约激励机制可以在竞争环境中有效激励更高真实数据质量以及更低竞争强度或竞争敏感度的数据拥有者参与。

为了探究数据拥有者类型总数变化,对任务发布者利润的影响,分别将数据拥有者真实数据质量类型总数I、竞争强度类型总数J和竞争敏感度类型总数K由1增加到4,得到类型总数变化时的任务发布者利润,实验结果见图4。

由图4可知,随着任务发布者设计契约时考虑的数据拥有者私有信息类型总数上升,任務发布者利润相应增加,原因在于任务发布者设计契约项时考虑的数据拥有者私有信息类型越多,与数据拥有者之间的信息不对称程度越低,任务发布者提供的激励报酬总和相应下降,任务发布者利润则相应增加。

为探究信息对称与否对任务发布者利润的影响,将数据拥有者数量N分别设置为100、150和200,分别得到完全信息场景和不完全信息场景下任务发布者利润,实验结果见图5。

由图5可知,完全信息场景下任务发布者利润总是高于不完全信息场景,且随着数据拥有者数量增加,完全信息场景下任务发布者利润与不完全信息场景下任务发布者利润之间的差额逐步扩大,原因在于不完全信息场景下,任务发布者仅掌握数据拥有者类型分布信息,而完全信息场景下任务发布者掌握数据拥有者的类型信息,因此,不同于不完全信息场景,完全信息场景下任务发布者可为各类型数据拥有者提供零利润契约,从而实现任务发布者利润最大化。

最后,分析比较所提多维契约激励机制与现有契约激励机制[12]在竞争环境下实行时,不同竞争强度对所有数据拥有者总利润的影响。将数据拥有者类型总数设置为3(3×1×1)种,其中,真实数据质量分为3种:h1=180

由图6可知,当竞争强度为0时,应用本文所提多维契约激励机制与应用现有契约激励机制[12],所有数据拥有者获得的总利润相同,这意味着当竞争强度为0时,本文所提多维契约激励机制退化为现有契约激励机制,即其是现有契约激励机制的一种拓广。随着竞争强度增加,应用本文所提多维契约激励机制,所有数据拥有者获得的总利润上升,而应用现有契约激励机制,所有数据拥有者获得的总利润降低。此外,随着间接成本转换系数上升,应用现有契约激励机制,所有数据拥有者总利润快速下降甚至为负,原因在于本文所提多维契约激励机制中模型使用权激励随着竞争强度增加而增加,使得数据拥有者收益增加,有效弥补了数据拥有者在竞争环境下参与FL导致的间接成本,所有数据拥有者总利润得以保证,而现有契约激励机制并未考虑这部分间接成本,使得所有数据拥有者总利润降低甚至为负。综上所述,与现有契约激励机制相比,本文提出的多维契约激励机制考虑到了竞争关系对数据拥有者参与FL成本的影响,有效提高了数据拥有者的参与意愿,为竞争环境下FL的落地实施提供有效助力。

5 结束语

本文考虑了竞争环境下数据拥有者的真实数据质量、竞争敏感度和竞争强度三维私有信息,并创新性地设计了金钱与FL模型使用权组合的MM组合激励,提出了一个适于竞争环境FL的多维契约激励机制,解决了竞争环境下的FL数据拥有者参与动力不足问题。实验结果表明,竞争环境下多维契约激励机制更准确地考虑了竞争环境下数据拥有者参与FL的成本,能显著提高数据拥有者在竞争环境下的参与意愿,有助于FL在竞争环境的落地实施。

在竞争环境下FL实施过程中,除了任务发布者与数据拥有者之间存在竞争关系外,任务发布者之间或数据拥有者之间也可能存在竞争关系,对FL激励机制的设计造成不同程度的影响,在今后的工作中,将进一步研究考虑不同竞争关系的FL激励机制。

参考文献:

[1]李万利,潘文东,袁凯彬.企业数字化转型与中国实体经济发展[J].数量经济技术经济研究,2022,39(9):5-25.(Li Wanli, Pan Wendong, Yuan Kaibin. Enterprise digital transformation and the development of Chinas real economy[J].Journal of Quantitative & Technological Economics,2022,39(9):5-25.)

[2]孙璐,黄婕.信息交互能力对企业竞争优势的影响研究[J].商业经济研究,2022(16):135-141.(Sun Lu, Huang Jie. Research on the impact of information interaction capacity on firm competitive advantage[J].Journal of Commercial economics,2022(16):135-141.)

[3]McMahan B, Moore E, Ramage D, et al. Communication-efficient learning of deep networks from decentralized data[C]//Proc of the 20th International Conference on Artificial Intelligence and Statistics.New York:PMLR Press,2017:1273-1282.

[4]Saputra Y M, Nguyen D, Dinh H T, et al. Federated learning meets contract theory:economic-efficiency framework for electric vehicle networks[J].IEEE Trans on Mobile Computing,2020,21(8):2803-2817.

[5]Sun Peng, Che Haoxuan, Wang Zhibo, et al. Pain-FL:personalized privacy-preserving incentive for federated learning[J].IEEE Journal on Selected Areas in Communications,2021,39(12):3805-3820.

[6]王鑫,李美慶,王黎明,等.一种基于合同理论的可激励联邦学习模型[J].电子与信息学报,2023,45(3):874-883.(Wang Xin, Li Meiqing, Wang Liming, et al. An incentivized federated learning model based on contract theory[J].Journal of Electronics & Information Technology,2023,45(3):874-883.)

[7]Yu Han, Liu Zelei, Liu Yang, et al. A fairness-aware incentive scheme for federated learning[C]//Proc of AAAI/ACM Conference on AI, Ethics, and Society.New York:ACM Press,2020:393-399.

[8]Wu Maoqiang, Ye Dongdong, Ding Jiahao, et al. Incentivizing diffe-rentially private federated learning: a multidimensional contract app-roach[J].IEEE Internet of Things Journal,2021,8(13):10639-10651.

[9]Ding Ningning, Fang Zhixuan, Huang Jianwei. Optimal contract design for efficient federated learning with multi-dimensional private information[J].IEEE Journal on Selected Areas in Communications,2020,39(1):186-200.

[10]Lim W Y B, Xiong Zehui, Kang Jiawen, et al. When information freshness meets service latency in federated learning:a task-aware incentive scheme for smart industries[J].IEEE Trans on Industrial Informatics,2022,18(1):457-466.

[11]陈乔松,许文杰,何小阳,等.FedSharing:一种双区块链激励驱动的数据分享联邦学习框架[J].计算机应用研究,2023,40(1):33-41.(Chen Qiaosong, Xu Wenjie, He Xiaoyang, et al. FedSharing: federated learning framework for data sharing driven by dual blockchain incentives[J].Application Research of Computers,2023,40(1):33-41.)

[12]Kang Jiawen, Xiong Zehui, Niyato D, et al. Incentive mechanism for reliable federated learning: a joint optimization approach to combining reputation and contract theory[J].IEEE Internet of Things Journal,2019,6(6):10700-10714.

[13]Wang Yuntao, Su Zhou, Luan T H, et al. Federated learning with fair incentives and robust aggregation for UAV-aided crowdsensing[J].IEEE Trans on Network Science and Engineering,2021,9(5):3179-3196.

[14]Mai Tianle, Yao Haipeng, Xu Jiaqi, et al. Automatic double-auction mechanism for federated learning service market in Internet of Things[J].IEEE Trans on Network Science and Engineering,2022,9(5):3123-3135.

[15]Dayan I, Roth H R, Zhong Aoxiao, et al. Federated learning for predicting clinical outcomes in patients with COVID-19[J].Nature Medicine,2021,27(10):1735-1743.

[16]Bercea C, Wiestler B, Rueckert D, et al. Federated disentangled representation learning for unsupervised brain anomaly detection[J].Nature Machine Intelligence,2022,4(8):685-695.

[17]Wu Chuhan, Wu Fangzhao, Lyu Lingjuan, et al. Communication-efficient federated learning via knowledge distillation[J].Nature Communications,2022,13(1):article ID 2032.

[18]Yuan Yulan, Jiao Lei, Zhu Konglin, et al. Incentivizing federated learning under long-term energy constraint via online randomized auctions[J].IEEE Trans on Wireless Communications,2022,21(7):5129-5144.

[19]Le T H T, Tran N H, Tun Y K, et al. An incentive mechanism for federated learning in wireless cellular networks: an auction approach[J].IEEE Trans on Wireless Communications,2021,20(8):4874-4887.

[20]Sun Wen, Xu Ning, Wang Lu, et al. Dynamic digital twin and fede-rated learning with incentives for air-ground networks[J].IEEE Trans on Network Science and Engineering,2022,9(1):321-333.

[21]Lin Xi, Wu Jun, Li Jianhua, et al. Friend-as-learner:socially-driven trustworthy and efficient wireless federated edge learning[J].IEEE Trans on Mobile Computing,2023,22(1):269-283.

[22]顾永跟,钟浩天,吴小红,等.不平衡数据下预算限制的联邦学习激励机制[J].计算机应用研究,2022,39(11):3385-3389.(Gu Yonggen, Zhong Haotian, Wu Xiaohong, et al. Incentive mechanism for federated learning with budget constraints under unbalanced data[J].Application Research of Computers,2022,39(11):3385-3389.)

[23]Lin Wenting, Chen Guo, Huang Yuhan. Incentive edge-based fede-rated learning for false data injection attack detection on power grid state estimation: a novel mechanism design approach[J].Applied Energy,2022,314:118828.

[24]Wang Zhilin, Hu Qin, Li Ruinian, et al. Incentive mechanism design for joint resource allocation in blockchain-based federated lear-ning[J].IEEE Trans on Parallel and Distributed Systems,2023,34(5):1536-1547.

[25]Wang Quyuan, Guo Songtao, Liu Guiyan, et al. MotiLearn: contract-based incentive mechanism for heterogeneous edge collaborative training[J].IEEE Trans on Network Science and Engineering,2022,9(4):2895-2909.

[26]Wang Xiaofei, Zhao Yunfeng, Qiu Chao, et al. InFEDge:a blockchain-based incentive mechanism in hierarchical federated learning for end-edge-cloud communications[J].IEEE Journal on Selected Areas in Communications,2022,40(12):3325-3342.

[27]Li Ying, Wang Xingwei, Zeng Rongfei, et al. VARF: an incentive mechanism of cross-silo federated learning in MEC[J].IEEE Internet of Things Journal,2023,10(17):15115-15132.

[28]Tran N H, Bao Wei, Zomaya A, et al. Federated learning over wireless networks: optimization model design and analysis[C]//Proc of IEEE Conference on Computer Communications.Piscataway,NJ:IEEE Press,2019:1387-1395.

收稿日期:2023-02-11;修回日期:2023-04-27

基金項目:河北省高等学校人文社会科学研究项目(SQ2022085);河北省自然科学基金面上项目(A2020402013)

作者简介:杨扬(1986-),女(通信作者),河北满城人,副教授,硕导,博士,主要研究方向为机器学习和智能管理(yangyang2015@hebeu.edu.cn);殷红建(1996-),男,重庆人,硕士研究生,主要研究方向为智能管理;王超(1983-),男,河北徐水人,教授,硕导,博士,主要研究方向为机器学习.

猜你喜欢

激励机制
激励机制在企业人力资源管理中的应用
激励机制在中小学班级管理中的应用
激励机制在事业单位人力资源管理中的作用
健全少先队激励机制 助推队员们幸福成长
湿地恢复激励机制的国际立法及启示
激励机制助推节能减排
完善党校党建工作激励机制研究
山西票号的激励机制及其现代启示
浅议中小企业激励机制
大数据时代下的企业激励机制