移动群智感知中面向任务需求的用户选择激励机制
2019-10-23陈秀华刘慧熊金波马蓉
陈秀华 刘慧 熊金波 马蓉
摘 要:有的移動群智感知激励机制大多以平台为中心或是以用户为中心进行设计,缺乏对感知任务需求的多维考虑,从而无法切实地以任务为中心进行用户选择,导致无法满足任务需求的最大化和多样化。针对上述问题,提出一种面向任务需求的用户选择激励机制TRIM,这是一种以任务为中心的设计方法。首先,感知平台根据任务需求发布感知任务,并从任务类型、时空特性以及感知报酬等多维度构建任务向量以最大化满足任务需求,而感知用户则基于意愿偏好、个人贡献值以及期望报酬等属性构建用户向量,实现个性化选择感知任务参与响应;然后,通过引入高效且隐私保护的余弦相似度计算协议(PCSC),计算任务和用户的相似度并根据相似度高低进行用户匹配筛选得到目标用户集,更好地满足感知任务需求的同时保护用户隐私不泄露;最后,通过仿真实验表明,在感知任务和感知用户的匹配过程中,与采用Paillier加密协议的激励机制相比,TRIM缩短了指数级增量的计算时间开销,提高了计算效率;与采用直接余弦相似度计算协议的激励机制相比,TRIM保证了感知用户的隐私安全,达到了98%的匹配精确度。
关键词:移动群智感知;任务需求;余弦相似度;用户选择;激励机制
中图分类号: TP309
文献标志码:A
Task requirement-oriented user selection incentive mechanism in mobile crowdsensing
CHEN Xiuhua1, LIU Hui1, XIONG Jinbo1,2*, MA Rong1
1.College of Mathematics and Informatics, Fujian Normal University, Fuzhou Fujian 350117, China ;
2.Fujian Provincial Key Laboratory of Network Security and Cryptology (Fujian Normal University), Fuzhou Fujian 350007, China
Abstract: Most existing incentive mechanisms in mobile crowdsensing are platform-centered design or user-centered design without multidimensional consideration of sensing task requirements. Therefore, it is impossible to make user selection effectively based on sensing tasks and meet the maximization and diversification of the task requirements. To solve these problems, a Task Requirement-oriented user selection Incentive Mechanism (TRIM) was proposed, which is a task-centered design method. Firstly, sensing tasks were published by the sensing platform according to task requirements. Based on multiple dimensions such as task type, spatio-temperal characteristic and sensing reward, the task vectors were constructed to optimally meet the task requirements. To implement the personalized sensing participation, the user vectors were constructed based on the user preferences, individual contribution value, and expected reward by the sensing users. Then, by introducing Privacy-preserving Cosine Similarity Computation protocol (PCSC), the similarities between the sensing tasks and the sensing users were calculated. In order to obtain the target user set, the user selection based on the similarity comparison results was performed by the sensing platform. Therefore, the sensing task requirements were better met and the user privacy was protected. Finally, the simulation experiment indicates that TRIM shortens the computational time overhead of exponential increments and improves the computational efficiency compared with incentive mechanism using Paillier encryption protocol in the matching process between sensing tasks and sensing users; compared with the incentive mechanism using direct PCSC , the proposed TRIM guarantees the privacy of the sensing users and achieves 98% matching accuracy.
Key words: mobile crowdsensing; task requirement; cosine similarity; user selection; incentive mechanism
0 引言
移动群智感知服务将普通用户的移动终端(手机、平板电脑、智能可穿戴设备等)作为基本感知单元,通过移动互联网有意识或无意识的协作,实现感知任务的分配与感知数据的收集[1],然后经由云端对感知数据的提取和分析,最终广泛服务于各大应用领域,如环境监测[2-3]、智能交通[4-5]、移动社交[6-7]、公共服务[8-9]、智能医疗等。然而,移动群智感知应用的实现依赖于广大感知用户的积极参与,而用户在参与感知任务过程中会消耗大量移动设备的电池电量、数据流量等资源,且存在数据传输成本增加的问题[10]和个人隐私信息泄露的风险[11-12],因此用户往往不愿意无偿参与感知任务。为了激励感知用户积极参与任务并长期提供高质量的感知数据,需要设计合理的激励机制对感知用户的消耗代价进行补偿[13-14]。
在移动群智感知系统中,感知任务具有类型多、范围广、数量大等基本特性。面向不同的任务需求,任务发布者主要选择能够满足任务要求的移动终端作为执行者完成感知任务。因此,移动群智感知系统的工作核心在于用户激励机制的设计。目前,针对不同的研究内容和关注重点,用户激励机制大多以用户为中心或以平台为中心进行设计。以用户为中心的激励机制主要研究如何确定赢标集以及考虑用户特征和数据质量等问题。Sun等[15]提出了一种基于用户行为的激励机制,将用户行为能力进行形式化定义并作为衡量用户的指标,具有高行为能力的用户往往会提供更高的数据质量,因而在用户选择中,该用户将优先被选中参与感知任务并获得报酬奖励。
Feng等[16]基于逆向竞拍框架设计激励机制,考虑任务与位置的相关性进行用户选择,用户根据自身所在位置响应感知任务并上报竞价,感知平台通过赢标价决策算法决定赢标价以最小化预算成本。该机制的设计主要考虑用户和任务的位置关联,未考虑恶意用户故意上报错误位置信息的情形。
Xiao等[17]提出了一种离线任务分配算法,用户响应任务并等待感知平台招募,而感知平台以最小化平均完工时间为目的,优先选择花费时间较少的用户参与任务,该机制主要考虑用户的感知时间对任务完成周期的影响。
以平台为中心的激励机制则侧重于研究平台预算成本最小化以及平台效用最大化等问题。Koutsopoulos等[18]考虑平台的预算条件约束,以最小化平台预算成本为目的,基于逆向竞拍模型设计激励机制,该机制结合用户贡献的数据量以及数据质量进行用户选择与报酬支付。Yang等[19]针对以平台为中心的激励模型采用SG (Stackelberg Game)来最大化平台效用。首先,平台作为带头人公布支付报酬;然后,用户作为跟随者调整自己的感知时间来最大化个人收益。Luo等[20]为鼓励用户积极参与感知任务并达到服务器平台利益最大化的目的,提出一种全付拍卖的方式来激励用户参与,全付拍卖只对参与任务 中贡献最大的用户进行报酬支付,并且支付给用户的报酬不是一个固定的值,而是关于所有感知用户最大贡献的函数。因此,被平台选中的用户将获得较大的报酬金额,从而实现用户参与度的提高和平台效用的最大化。
所述激励机制主要以用户或平台为中心进行设计,虽然在一定的使用场景下均能产生相应的激励效果,但是缺乏对面向多维任务需求的用户选择方式的考虑,从而无法满足任务需求的最大化和多样化。针对不同的感知任务类型,不同的感知用户利用不同的感知设备进行感知,他们提交的感知数据质量也不尽相同。因此,如何构建一种有效的面向任务需求的激励机制,以任务为中心选择合适的用户参与任务感知以及最大化满足任务需求等問题有着重要的研究意义。针对以任务为中心的用户选择问题,本文提出一种面向任务需求的用户选择激励机制(Task Requirement-oriented user selection Incentive Mechanism, TRIM),主要工作如下:
1)属性形式化描述:基于任务的类型和报酬、用户和任务的时空关联以及任务的需求值和用户的质量贡献值,多维度考虑任务需求和用户特性并分别形式化构建任务向量和用户向量。感知平台以最大化满足任务需求为目的发布感知任务,而用户则根据意愿偏好和自身能力条件个性化选择任务参与响应。
2)安全且高效的任务与用户匹配:以任务为中心并通过高效且隐私保护的余弦相似度计算(Privacy-preserving Cosine Similarity Computation, PCSC)协议计算任务和用户的相似度,筛选和任务最具匹配的目标用户集,从而实现面向任务需求的用户选择。
3)仿真实验表明,TRIM激励机制在任务和用户匹配过程中具有可行性和高效性,同时保证了用户的隐私安全,从而激励更多的感知用户积极参与感知任务。
1 系统模型和问题描述
1.1 系统模型
移动群智感知系统包括参与最终数据交易的服务提供商、感知平台以及大量参与感知任务的感知用户,如图1所示。
服务提供商根据感知用户的不同服务请求向感知平台购买感知数据,感知平台则基于不同的任务需求向携带移动智能终端的感知用户发布感知任务,而感知用户可选择性地参与任务响应。感知平台通过计算任务和用户的相似度实现目标用户集选择,并收集感知用户上传的感知数据从而进行与服务提供商的数据买卖交易。感知平台根据数据买卖的交易金额对参与任务的目标用户进行报酬支付以激励感知用户积极参与下一次的感知任务。
1)服务提供商。对感知数据感兴趣或者有一定需求的组织或个人,并根据不同的应用需求向感知平台购买感知数据。服务提供商希望以合理的价格购买质量可靠的感知数据,并将获得的感知数据应用于数据分析、机器学习、数据挖掘等领域,为用户提供各种类型的应用服务,以最大化满足用户的应用需求。
2)感知平台。感知平台根据不同的任务需求向感知用户发布感知任务,任务需求包含任务的时间、地点以及愿意为获得感知数据所提供的支付报酬等信息,感知平台与参与任务响应的感知用户进行任务和用户的相似度计算从而选择合适的目标用户集。感知平台收集广大目标用户上传的感知数据,与服务提供商进行数据交易并获得相应质量的报酬。
3)感知用户。感知用户是使用手机、平板电脑、智能可穿戴设备以及高端感知设备等移动智能终端的普通用户,通过无线/有线网络与感知平台进行交互。用户可以根据个人意愿偏好和自身能力条件,个性化选择感兴趣的任务进行响应。和任务相匹配的感知用户执行感知任务,向感知平台上传感知数据并获得相应的报酬奖励。
1.2 问题描述
1.2.1 任务需求
不同的感知应用需求的感知数据不同,感知平台基于感知应用的多样性,发布不同类型的感知任务,意味着不同的任务需求。只有从任务需求的角度发布不同的感知任务,从而寻求和感知任务最具匹配的感知用户参与感知任务,才能最大限度上保证任务的完成率和感知数据的可用性,使得资源利用最大化。本文以感知任务为中心描述任务属性,不同的任务需求可形式化描述为一个任务五元组以进行感知任务的发布,同时构建以任务属性值为元素的任务向量。感知用户可根据个人意愿偏好和自身能力条件自主选择感兴趣的任务参与响应。本文同样对用户属性进行形式化描述,参与任务响应的用户以五元组形式进行标识,同时构建以用户属性值为元素的用户向量。面向不同的任务需求,本文通过计算任务和用户之间的余弦相似度来实现任务和用户的匹配。
1.2.2 隐私保护
本文将任务向量和用户向量二者之间的余弦相似度计算结果作为目标用户选择的指标,感知平台通过比较相似度阈值与任务和用户的相似度大小进行目标用户选择。参与任务响应的感知用户不希望自身的属性信息被公开,而用户向量包含了用户的属性信息,直接的余弦相似度计算可能导致用户隐私泄露的问题。为了保护感知用户的个人隐私,本文采用PCSC计算任务和用户之间的相似度,从而匹配和任务相似度高的用户作为目标用户。本文提出的TRIM激励机制不仅实现任务和用户之间有效的相似度匹配,同时保证了用户属性信息的隐私安全,从而激励更多的感知用户积极参与感知任务。
2 面向任务需求的用户选择激励机制
面向不同的感知任务需求,感知平台以任务为中心匹配最大化满足任务需求的用户参与感知任务,而感知用户根据自身兴趣自主选择性地参与任务响应。本文通过形式化描述任务向量和用户向量,并结合PCSC进行任务和用户的匹配分析,从而构建一种面向任务需求的用户选择激励机制TRIM。
2.1 属性描述
2.1.1 时空感知任务
每一个时空感知任务 t i可表示为一个五元组〈type, t i.bt, t i.et,prew,r〉,其中type表示任务类型,本文根据感知任务的语义要求将任务类型以树的形式进行表示。为了形式化描述一个任务类型,本文采取格雷编码对不同语义要求的组合结果进行编码,根据每个父类节点属性先前设定的子类节点属性取值数N,确定编码的位数n以包含其子类属性所有取值个数,然后依次串联从父节点遍历到子节点的一组取值编码,该编码串则为带有语义要求的任务类型的形式化表示。假设所有的任务可根据任务类型{环境E,交通T,医疗H,社交S,公共P}进行划分,进一步地,针对任务类型,本文根据时空感知任务对感知数据精度的要求进行条件约束。本文以环境类型的时空感知任务为例,根据任务类型的语义要求画出任务类型树,如图2所示。
假设一个环境类型的时空感知任务,可以具体划分为{空气00,水质01,土壤11,噪声10}四个子类型。根据感知任务对数据精度的要求,可将采集数据的感知设备具体划分为{低端设备00,中端设备10,高端設备11}三个子类型,相应的设备等级与其采集的感知数据精度等级几近匹配,如低端设备采集的数据主要为低精度数据,高端设备采集的数据主要为高精度数据。一个环境类型的所有感知任务可以用矩阵 E 进行描述:
E = E0000 E0010 E0011E0100 E0110 E0111E1100 E1110 E1111E1000 E1010 E1011
其中:E0011可表示为该时空感知任务 t i属于环境类型任务,需要收集空气测量方面的高精度数据,即任务类型type可表示为E0011,其他类型的时空感知任务则以此类推; t i.bt和 t i.et分别表示为时空感知任务 t i的开始时间和截止时间;prew为感知平台所提供的任务总报酬;r表示为任务需求值。感知平台希望获得的感知数据满足一定的质量要求,任务需求值则反映感知平台所期望的感知数据的质量水平均值。
2.1.2 感知用户
每一个感知用户 u i可以表示为一个五元组的形式〈pre, u i.bt, u i.et,rrew,c〉。其中:pre表示用户的意愿偏好,根据任务类型的形式化描述,感知用户可根据任务类型树以及自身所具备的能力条件选择意愿偏好值。假设感知用户 u i对环境类型的任务感兴趣,则感知用户 u i的意愿偏好的取值范围为矩阵 E 中的元素集合。 u i.bt和 u i.et分别表示为感知用户可接受的任务开始时间和最晚结束时间,rrew则为感知用户完成相应任务所期望获得的报酬,c表示为感知用户的质量贡献值。感知用户 u i的质量贡献值c取决于以下三个主要因素:
1)感知用户 u i的信誉度rep。信誉度rep可以衡量将一个感知任务分配给一个感知用户以后,感知用户 u i执行该任务并成功提交结果的可能性。一个信誉度高的感知用户提供满足任务要求的数据结果的概率通常会高于信誉度低的感知用户。感知用户完成任务并成功提交结果后,感知平台根据用户提交的数据进行满意度评分,评分取值范围为[1,5],信誉度rep的具体数值可以根据感知用户 u i的历史评分s进行计算。本文采用极差标准化的方式根据感知用户的历史评分计算用户的信誉度,计算公式如式(1)所示:
rep= 1 m ∑ m i=1 s(i)-min(i) max(i)-min(i)
(1)
其中:m表示感知用户 u i历史完成任务的总数量;s(i)为感知用户完成任务 t i所获得的评分;min(i)和max(i)分别表示感知平台对完成感知任务 t i的所有感知用户所给评分的最小值和最大值。假设感知用户 u i有两个已完成的感知任务 t 1和 t 2,对于任务 t 1和 t 2,感知平台给出的最大评分和最小评分分别为max(1)=5,min(1)=2和max(2)=4,min(2)=2;感知用户 u i获得的任务评分分别为s(1)=4,s(2)=3,则根据式(1)计算可得到感知用户 u i的信誉度rep= 1 2 × 4-2 5-2 + 3-2 4-2 =0.58。
2)感知用户 u i的距离匹配值ω(lui,lti)。感知用户的距离匹配值可以衡量感知用户与感知任务之间距离的远近程度。感知用户距离感知任务位置越近,感知用户花费在交通行程上的消耗则越少。感知平台希望选择距离感知任务位置较近的感知用户参与任务从而减少任务的预算开销,同样对于感知用户而言,感知用户通常会更倾向于选择距离自身位置较近的感知任务。感知用户的距离匹配值可根据式(2)[21]计算得出。
ω(lui,lti)=1-min[logDdis(lui,lti),1]
(2)
其中:dis(lui,lti)表示感知用户当前位置lui到感知任务位置lti的欧氏距离;D为感知平台设定的感知任务区域半径,感知平台希望在任务区域范围内的感知用户积极参与任务。ω(lui,lti)∈[0,1],若感知用户距离感知任务位置越近,ω(lui,lti)越接近于1;相反,距离感知任务位置越远或超出了任务区域半径,则ω(lui,lti)越接近于0。
3)感知用户 u i的时间差值θ。用户时间差值可以衡量感知用户和感知任务之间的时间差异程度。本文采用θ=f( u i.bt, u i.et, t i.bt, t i.et)表示时间差值计算函数,计算公式如式(3)所示。
θ=[f( u i.bt, t i.bt)+f( u i.et, t i.et)]/2
(3)
其中:f( u i.bt, t i.bt)表示感知用户 u i的开始时间 u i.bt和感知任务的开始时间 t i.bt的时间差异程度; f( u i.et, t i.et)表示感知用户 u i的最晚结束时间 u i.et和感知任务的截止时间 t i.et的时间差异程度。本文采用文献[22]中数值型属性的取值方式计算开始时间的差异程度f( u i.bt, t i.bt):首先,将感知任务的开始时间 t i.bt和各个感知用户的开始时间 u i.bt转换为时间戳;然后计算感知任务和不同感知用户之间开始时间的绝对差值‖d‖= | t i.bt- u i.bt | ,感知任务和不同感知用户之间开始时间的绝对差值的最小和最大差距为[λ1,λz],将这个区间平均划分为z-1个等距的小区间{[λ1,λ2],[λ2,λ3],…,[λz-1,λz];λ∈[0,+∞]},当感知用户和感知任务之间开始时间的绝对差值落在其中的某个小区间,对每个小区间依次给定差异程度值{0,1,…,z-1,z};最后,根据不同区间得到感知用户和感知任务开始时间的差异程度值。同理,采取相同的计算方式可以得到感知用户和感知任务截止时间的差异程度f( u i.et, t i.et),从而根据式(3)计算得到感知用户的时间差值θ。
本文采用c=f(rep,ω(lui,lti),θ)表示质量贡献值计算函数,计算公式如式(4)所示。
c=α·rep+ 1 2 ·β θ ω(lui,lti)+1
(4)
其中:α(0<α<1)和β(0<β<1)是两个随机因子,且α+β=1。
2.2 任务和用户的匹配分析
从感知任务需求角度出发,判断感知用户是否适合完成某项感知任务取决于任务和用户之间的相似度大小。任务和用户之间的相似度越大,表示任务和用户的匹配程度越高,即感知用户极大程度上适合完成此项感知任务。因此,本文采用余弦相似度的方法计算任务和用户之间的相似度,感知平台以感知任务为中心,基于任务的需求筛選与任务相似度高的感知用户,这些感知用户将作为目标用户参与本次的感知任务。
感知任务与感知用户之间的相似度计算过程如下:
步骤1
任务向量的构建。一个时空感知任务 t i可表示为一个五元组〈type, t i.bt, t i.et,prew,r〉。为了简化计算,本文以格雷编码的形式表示任务类型type,并设定任务类型type的基准值为1;将开始时间 t i.bt和截止时间 t i.et分别格式化转换为时间戳,同时设置开始时间和截止时间的基准值为2。感知平台为每一个时空感知任务提供任务报酬prew,在任务完成人数NUM的限制下,一个时空任务 t i的向量可表示为: t i=(ti1,ti2,ti3,ti4,ti5)=(1,2,2,prewave,r)。其中:prewave为感知平台提供的任务报酬prew与任务完成人数NUM的比值,即感知任务 t i的平均报酬;r为感知平台设定的任务需求值。
步骤2
用户向量的构建。感知用户 u i同样可表示为一个五元组〈pre, u i.bt, u i.et,rrew,c〉。意愿偏好pre与时空感知任务 t i的任务类型的取值范围一致。感知用户 u i可根据个人兴趣爱好和能力条件,选择其中一个带有格雷编码表示的任务类型作为意愿偏好,计算时空感知任务 t i的任务类型的格雷编码和感知用户 u i的意愿偏好的格雷编码的汉明距离dHM,dHM+1则作为感知用户的意愿偏好pre的属性值。感知用户的开始时间 u i.bt和最晚结束时间 u i.et分别转换格式为时间戳,根据2.1.2 节中时间差异程度的计算方法,得到感知用户开始时间和感知任务开始时间的差异程度f( u i.bt, t i.bt)以及感知用户最晚结束时间和感知任务截止时间的差异程度f( u i.et, t i.et)。在设置感知任务开始时间和截止时间的基准值的基础上,感知用户开始时间 u i.bt的属性值可表示为f( u i.bt, t i.bt)+2,最晚结束时间 u i.et的属性值可表示为f( u i.et, t i.et)+2。因此,用户 u i的向量可表示为 u i=(ui1,ui2, ui3, ui4, ui5)=(dHM+1, f( u i.bt, t i.bt)+2, f( u i.et, t i.et)+2, rrew, c),其中,rrew为感知用户完成相应感知任务所期望获得的报酬,感知用户的质量贡献值c可根据质量贡献值函数c=f(rep,ω(lui,lti),θ)计算得到。
步骤3
任务与用户的相似度计算。本文采用余弦相似度计算方法得到任务和用户的相似度,其计算公式如式(5)所示:
cos( t i, u i)=∑ q k=1 tik.uik / [ ∑ q k=1 t2ik ∑ q k=1 u2ik ]
(5)
用户向量包含着感知用户的相关属性信息,直接地计算任务向量和用户向量的余弦相似度可能造成感知用户的隐私泄露问题。为了实现隐私保护余弦相似度计算,本文引入文献[23]中提出的PCSC。PCSC的关键在于如何以隐私保护的方式计算 t i· u i,详细描述如图3所示。
本文通过PCSC进行任务和用户的相似度计算,并将计算结果cos( t i, u i)表示为sim u i以得到感知任务和各个感知用户之间的相似度集合 Sim={simu1,simu2,…,sim u i}。感知平台设置相似度阈值δ作为相似度高低的评定标准,感知平台根据δ进行用户筛选。若感知用户 u i和感知任务 t i的相似度sim u i≥δ,则感知用户 u i将加入目标用户集W,参与本次的感知任务。
2.3 面向任务需求的用户选择激励机制
根据上述的分析,本文提出的面向任务需求的用户选择激励机制TRIM流程如图4所示,具体设计步骤如下所示:
1)感知平台根据任务需求向感知用户发布感知任务,并构建任务向量 t i。
2)感知用户根据个人意愿偏好和自身能力条件选择性地参与任务响应,并构建用户向量 u i。
3)感知平台采用PCSC计算感知任务和各个感知用户的相似度sim u i,并实现任务和用户匹配过程中感知用户的隐私保护。
4)基于各感知用户与感知任务的相似度sim u i和相似度阈值δ,感知平台进行用户筛选得到目标用户集W,并将W反馈给感知用户以通知用户完成感知任务。
针对不同的任务需求,本文通过编码以及函数计算将带有不同语义的任务需求进行形式化表示。接受任务消息的感知用户根据个人意愿和自身能力条件进行个性化选择,选择合适的任务参与响应,而感知平台利用隐私保护余弦相似度协议计算任务和用户间的相似度,实现用户和任务的双向匹 配。感知平台在相似度阈值约束下选择和任务有高相似度的用户构成目标用户集以参与最终的感知任务,因此本文所提的TRIM激励机制既满足了感知任务的不同需求,又保证了感知用户的属性隐私安全。
3 性能评估
在感知任务和感知用户的匹配过程中,本文所提的TRIM激励机制采用隐私保护余弦相似度计算协议PCSC[23]进行余弦相似度计算,达到较好的用户属性隐私保护效果。为了验证TRIM激励机制在用户选择方面的可行性、高效性以及精确性,在相同实验环境下,将TRIM激励机制与采用直接余弦相似度计算(Direct Cosine Similarity Computation, DCSC)协议的激励机制和采用Pallier[24]加密协议的PE-based (Pallier Encryption)激励机制进行实验比较。
实验采用Java实现,在Intel Core i5-6200U CPU@2.30GHz处理器、8GB内存的Windows 7平台上运行。实验数据集均由伪随机数生成器产生并进行相应的数据预处理,每次随机生成一个任务向量 t i={ti1,ti2,ti3,ti4,ti5}和Q个用户向量 u i={ui1,ui2,ui3,ui4,ui5}。本文通过分析相似度计算时间开销time进行实验效果评估,具体的实验参数为k1=512,k2=200,k3=k4=128,δ=0.96,Q={100,300,500,700,900}。相同实验环境下,每次实验执行50次,并取其平均相似度计算时间开销作为最终实验结果,本文假设實验过程中的通信时间开销忽略不计。
3.1 可行性
为验证TRIM激励机制在用户选择方面的可行性,假设任务向量 t i={ti1,ti2,ti3,ti4,ti5}={10,20,20,8,8},并随机生成5个用户 u i(i=1,2,…,5),其用户向量 u i={ui1,ui2,ui3,ui4,ui5}取值如表1所示。
TRIM激励机制、采用DCSC协议的激励机制和采用PE-based协议的激励机制在任务和用户匹配过程中的余弦相似度计算结果如表2所示,可以发现针对同一个感知任务 t i,对于同一感知用户 u i使用不同的方法进行余弦相似度计算不仅可以得到相同的计算结果,而且结果表明若用户属性值与任务属性值越相近,则感知用户 u i相应具有较高的相似度,故感知平台可根据相似度阈值δ进行目标用户选择。因此,上述三者激励机制在任务和用户的匹配过程中均具有可行性,相比采用DCSC协议的激励机制,TRIM激励机制和采用PE-based协议的激励机制在相似度计算过程中还实现了感知用户的隐私保护。
3.2 高效性
在不同的实验参数Q下对TRIM激励机制、采用DCSC协议的激励机制和采用PE-based协议的激励机制的相似度计算时间开销进行对比,结果如图5所示。
图5表明随着用户量Q的增加,三种激励机制在计算时间开销方面均呈上升趋势。显然,随着用户数量Q的增加,采用PE-based协议的激励机制在时间开销方面呈现指数级的增量变化,其时间开销远大于采用DCSC协议的激励机制和TRIM激励机制。虽然PE-based激励机制采用加密方式实现了用户隐私保护,但相比同样具有用户隐私保护的TRIM激励机制,其计算时间开销增大导致计算效率降低。相比采用DCSC协议的激励机制,TRIM激励机制在相似度计算时间方面的开销缺乏明显优势,但TRIM激励机制在保证计算时间开销尽可能小的同时,实现了计算过程中感知用户的隐私保护,这样既使得感知用户免于担心隐私泄露问题而积极参与自身感兴趣的任务,又在一定程度上满足了任务需求最大化,提高了任务完成率。因此,TRIM激励机制在用户选择方面具有可行性与高效性,不仅实现了感知用户的隐私保护,而且具有相对较高的计算效率。
3.3 精确性
为了验证TRIM激励机制在任务与用户匹配过程中的精确性,在相同的相似度阈值δ和不同的用户数量Q下进行任务与用户的匹配精确度实验。感知平台基于任务与用户的余弦相似度和相似度阈值的大小比较关系进行目标用户选择,任务与用户的余弦相似度越大,则表明该用户与任务的属性值越匹配,即该用户在任务完成方面的优势越大。因此,本文以目标用户集与感知任务的余弦相似度的平均值作为任务与用户匹配精确度的衡量指标。图6表明随着用户数量Q的增大,三种激励机制在匹配精确度方面变化不大,这是因为相似度阈值大小影响目标用户集与任务相似度的整体情况;在相同的高相似度阈值下,用户数量的增加不会明显影响目标用户集与任务的匹配精确性。由于三种激励机制采用不同的计算方式得到相同的余弦相似度结果,因此基于相同的相似度阈值,三种激励机制选择的目标用户集相同,故图6中三条曲线具有一致的形态变化。随着用户数量Q的增大,TRIM激励机制的匹配精确度均达98%左右。TRIM激励机制相比采用PE-based的激励机制具有较高的计算效率,相比采用DCSC的激励机制具备隐私保护特性,因此,TRIM激励机制在用户选择方面具有较高的优势。
3.4 隐私性
在用户与感知平台交互过程中,若感知用户上传的属性信息被恶意公开或窃取,可能造成直接或间接的隐私泄露问题,比如,用户上传的属性信息包含用户的意愿偏好、能力贡献值等信息。能力贡献值的高低反映了用户的信誉值以及业务能力水平的优良情况,公开用户的能力贡献值意味着公开用户的声誉情况,容易造成用户间消极的攀比问题,进而影响用户参与积极性。意愿偏好值则可用于推测用户兴趣爱好等关联信息。恶意用户甚至还可以窃取其他用户的属性信息进行身份顶替以成为目标用户,从而导致感知数据质量下降,用户参与度降低。为了保护感知用户的个人隐私,本文采用PCSC计算任务和用户之间的相似度,从而匹配和任务相似度高的用户作为目标用户。在用户选择过程中,通过采用多方随机屏蔽和多项式聚合,感知用户可以在不泄露自身属性信息的前提下与感知平台共同完成任务与用户的相似度计算,且计算过程中不存在用户属性信息损失的问题。感知平台可以得到正确的余弦相似度计算结果,却无法根据计算过程中的任何中间值推测出用户的具体属性信息,防止用户属性信息泄露而被其他用户顶替身份,保证了用户的属性隐私安全。感知平台通过相似度阈值δ进行目标用户筛选,并对目标用户的任务完成情况进行评分,进一步更新用户的信誉度以防止不诚实用户虚报属性信息,从而提高用户质量水平和感知数据质量水平。
隐私性的实现关键在于采取不同的隐私保护技术,综合考虑方法的计算开销,从而达到不同强度的隐私保护效果,实现隐私安全性与数据可用性之间的均衡。在用户属性隐私保护方面,本文所提的TRIM激励机制采取非加密的形式进行用户属性隐私保护。为了体现TRIM激励机制的隐私保护效果,將TRIM激励机制与同样采取非加密方式的激励机制(Dou-l)-匿名[25]以及DPLK-means(Differential Privacy K-means)[26]方案进行对比。对比主要立足于隐私性的实现关键,综合性评估各个激励机制的隐私保护效果,包括技术、隐私保护强度、计算开销和数据可用性四个方面,结果如表3所示。
(Dou-l)-匿名基于k-anonymity匿名的思想,结合多维分桶技术进行用户属性的隐私保护[27],虽然具备较高的隐私保护强度,计算开销为O(n),但是数据的可用性受属性取值多样化程度和数据量大小的影响较大。
DPLK-means采取差分隐私的方法实现高强度的隐私保护效果,但添加噪声的方式在一定程度上影响了原始数据集,而相关的优化算法也只能保证最大限度地降低数据的损失率,而且其计算开销在三种激励机制中相对较高。
相比(Dou-l)-匿名和DPLK-means,本文所提的TRIM机制以高强度的隐私保护性和较小的计算开销,有效保护了用户的属性信息安全。在用户选择过程中,TRIM机制采用多方随机屏蔽和多项式聚合的方法进行任务与用户的相似度计算,而该过程不会造成用户属性信息的损失,保证了用户的原始属性信息的真实性和计算结果的正确性。因此,TRIM机制既实现了用户的属性隐私保护,又保证了较高的数据可用性。
4 结语
在移动群智感知的用户激励方面,大多数的激励机制以用户或平台为中心进行目标用户选择,由于未考虑任务的需求,导致目标用户与感知任务的匹配度较低,从而影响任务的完成效果和感知数据的质量。针对现有激励机制在用户选择上缺乏以任务为中心的方式多维度考虑任务需求,导致无法满足任务个性化需求的问题,本文提出了一种在移动群智感知中面向任务需求的用户选择激励机制TRIM。一方面,感知平台根据不同的任务需求发布感知任务,构建任务向量;而感知用户按照个人意愿偏好个性化选择感兴趣的任务参与响应,并构建用户向量。通过引入余弦相似度计算协议PCSC计算任务向量和用户向量间的相似度,本文方法能实现任务和用户的双边匹配。
另一方面,在任务和用户的匹配过程中,本文采用的PCSC保证了感知用户的隐私安全,能激励更多的感知用户积极参与感知任务,一定程度上提高了用户参与度和任务完成度。
仿真实验结果表明,在用户选择方面,TRIM激励机制相比采用DCSC协议的激励机制和采用PE-based协议的激励机制更具优势,不仅成功实现了感知平台的目标用户选择,而且能以较少的计算时间开销相对高效地完成任务和用户的匹配,且达到较高的匹配精确度,同时使得感知用户的隐私不被泄露,能保证用户的隐私安全。面向多样化的任务需求,如何评估用户选择标准以更好地适应任务的动态变化以及进一步考虑平台的任务预算以降低预算开销,将是下一步研究工作的重点。
参考文献
[1] 刘云浩.群智感知计算[J].中国计算机学会通讯, 2012, 8(10): 38-41. (LIU Y H. Crowd sensing computation [J]. Communications of the CCF, 2012, 8(10): 38-41.)
[2] HU Y, DAI G, FAN J, et al. BlueAer: a fine-grained urban PM2.5 3D monitoring system using mobile sensing [C]// Proceedings of the 35th IEEE International Conference on Computer Communications. Piscataway, NJ: IEEE, 2016: 1-9.
[3] HASENFRATZ D, SAUKH O, WALSE R C, et al. Deriving high-resolution urban air pollution maps using mobile sensor nodes [J]. Pervasive & Mobile Computing, 2015, 16(B): 268-285.
[4] LIU Z , JIANG S , ZHOU P , et al. A participatory urban traffic monitoring system: the power of bus riders [J]. IEEE Transactions on Intelligent Transportation Systems, 2017, 18(10): 2851-2864.
[5] MA S, ZHENG Y, WOLFSON O. T-share: a large-scale dynamic taxi ridesharing service [C]// Proceedings of the 29th IEEE International Conference on Data Engineering. Washington, DC:IEEE Computer Society, 2013: 410-421.
[6] GUO B, YU Z, ZHANG D, et al. Toward a group-aware smartphone sensing system [J]. IEEE Pervasive Computing, 2014, 13(4) : 80-88.
[7] YU Z, FENG Y, XU H, et al. Recommending travel packages based on mobile crowdsourced data [J]. IEEE Communications Magazine, 2014, 52(8):56-62.
[8] ZHOU P, ZHENG Y, LI M. How long to wait? Predicting bus arrival time with mobile phone based participatory sensing [J]. IEEE Transactions on Mobile Computing, 2014, 13(6): 1228-1241.
[9] SIMOENS P, XIAO Y, PILLAI P, et al. Scalable crowdsourcing of video from mobile devices [C]// Proceedings of the 11th Annual International Conference on Mobile Systems, Applications, and Services. New York: ACM, 2013:139-152.
[10] 徐哲,李卓,陳昕.面向移动群智感知的多任务分发算法[J].计算机应用,2017,37(1):18-23. (XU Z, LI Z, CHEN X. Multi-task assignment algorithm for mobile crowdsensing [J]. Journal of Computer Applications, 2017, 37(1): 18-23.)
[11] 马蓉,陈秀华,刘慧,等.移动群智感知中用户隐私度量与隐私保护研究[J].信息网络安全,2018,18(8):64-72. (MA R, CHEN X H, LIU H,et al. Research on user privacy measurement and privacy protection in mobile crowdsensing [J]. Netinfo Security, 2018, 18(8): 64-72.)
[12] MA R, XIONG J, LIN M, et al. Privacy protection-oriented mobile crowdsensing analysis based on game theory [C]// Proceeding of the 2017 IEEE International Conference on Trust, Security and Privacy in Computing and Communications/Big Data Science and Engineering/Embedded Software and Systems. Piscataway, NJ: IEEE, 2017: 990-995.
[13] 吴垚,曾菊儒,彭辉,等.群智感知激励机制研究综述[J].软件学报, 2016, 27(8):2025-2047. (WU Y, ZENG J R, PENG H, et al. Survey on incentive mechanisms for crowd sensing [J].Journal of Software, 2016, 27(8):2025-2047.)
[14] XIONG J, CHEN X, TIAN Y, et al. MAIM: a novel incentive mechanism based on multi-attribute user selection in mobile crowdsensing [J]. IEEE Access, 2018, 6:65384-65396.
[15] SUN J, MA H. Behavior-based online incentive mechanism for crowd sensing with budget constraints [J]. arXiv E-print, 2014: arXiv:1310.5485. [EB/OL]. [2018-09-12]. https://arxiv.org/pdf/1310.5485.pdf.
[16] FENG Z, ZHU Y, ZHANG Q, et al. TRAC: truthful auction for location-aware collaborative sensing in mobile crowdsourcing[C]// Proceedings of the 33rd IEEE Conference on Computer Communications. Piscataway, NJ: IEEE, 2014: 1231-1239.
[17] XIAO M, WU J, HUANG L, et al. Multi-task assignment for crowdsensing in mobile social networks [C]// Proceedings of the 34th IEEE Conference on Computer Communications. Piscataway, NJ: IEEE, 2015: 2227-2235.
[18] KOUTSOPOULOS I. Optimal incentive-driven design of participatory sensing systems [C]// Proceedings of the 32nd IEEE International Conference on Computer Communications. Piscataway, NJ: IEEE, 2013:1402-1410.
[19] YANG D, XUE G, FANG X, et al. Crowdsourcing to smartphones: incentive mechanism design for mobile phone sensing [C]// Proceedings of the 18th Annual International Conference on Mobile Computing and Networking. New York: ACM, 2012, 173-184.
[20] LUO T, TAN H P, XIA L. Profit-maximizing incentive for participatory sensing [C]// Proceedings of the 33rd IEEE International Conference on Computer Communications. Piscataway, NJ: IEEE, 2014: 127-135.
[21] 王青.質量和预算感知的移动众包任务分配方法研究[D]. 济南:山东大学,2017:17-18. (WANG Q. Research on quality and budget-aware task assignment for spatial crowdsourcing [D]. Jinan: Shandong University, 2017: 17-18.)
[22] 荣辉桂,火生旭,胡春华,等.基于用户相似度的协同过滤推荐算法[J]. 通信学报,2014,35(2):16-24. (RONG H G, HUO S X, HU C H, et al. User similarity-based collaborative filtering recommendation algorithm [J]. Journal on Communications, 2014,35(2):16-24.)
[23] LU R, ZHU H , LIU X , et al. Toward efficient and privacy-preserving computing in big data era [J]. IEEE Network, 2014, 28(4):46-50.
[24] PAILLIER P. Public-key cryptosystems based on composite degree residuosity classes [C]// Proceedings of the 17th International Conference on Theory and Application of Cryptographic Techniques, LNCS 1592. Berlin: Springer, 1999: 223-238.
[25] 王胜和,王佳俊,刘腾腾,等.多维敏感属性隐私保护数据发布方法[J].计算机工程与应用,2012,48(20):136-141. (WANG S H, WANG J J, LIU T T, et al. Privacy-preserving data publishing method for dataset with multi-dimensional sensitive attributes [J]. Journal of Computer Engineering and Applications, 2012, 48(20): 136-141.)
[26] REN J, XIONG J, YAO Z, et al. DPLK-means:a novel differential privacy k-means mechanism [C]// Proceedings of the 2nd IEEE International Conference on Data Science in Cyberspace. Piscataway, NJ: IEEE, 2017:133-139.
[27] 许力, 朱瑞, 曾雅丽. 认知无线电网络中基于SpaceTwist的位置隐私保护方案[J]. 信息网络安全, 2019, 19(2): 18-27. (XU L, ZHU R, ZENG Y L. Location privacy-preserving scheme based on SpaceTwist in cognitive radio network [J]. Netinfo Security, 2019, 19(2): 18-27.)