APP下载

一种高效的隐私保护群智感知真值发现机制

2018-09-21孙洪山陆雪徐嵘程孝泗吴佩敏

物联网技术 2018年7期
关键词:隐私保护高效

孙洪山 陆雪 徐嵘 程孝泗 吴佩敏

摘 要:随着移动设备的普及,群智感知真值发现应用蓬勃发展,同时也使得数据隐私问题日益突出。然而,现有的隐私保护群智感知真值发现机制都需要较大的计算开销和通信开销。因此提出一种采用对称加密算法的隐私保护群智感知真值发现方法,能够很好地保护隐私,同时开销较低,能够满足实际应用需求。

关键词:群智感知系统;真值发现;隐私保护;高效

中图分类号:TP39;TN79 文献标识码:A 文章编号:2095-1302(2018)07-00-02

0 引 言

随着科技的发展,传感器的应用越来越普遍,这使得通过汇聚传感器的感知数据挖掘真实信息变成可能,群智感知真值发现系统由此诞生。由于传感器质量的差异及周边噪音的不同,用户上传的感知数据与真值之间存在差别,因此需通过一定的算法得到真值。群智感知真值发现机制是利用移动设备所携带的传感器收集所处环境的感知数据,并将这些数据上传到云服务器,再由云服务器进行相关计算。由于移动设备的感知数据可能涉及用户隐私,因此用户并不希望上传自己的真实数据。为解决该矛盾,保护隐私的群智感知系统应运而生,该系统可在保护用户隐私的前提下发现真值。首个保护隐私的群智感知系统是由Miao 等人[1]设计的PPTD协议,但该协议采用了复杂的公钥加密算法[2],使得系统开销较大。

为解决现有隐私保护群智感知真值发现系统效率较低的问题,本文基于文献[3],采用对称加密算法提出了一种高效的隐私保护群智感知真值发现方法。实验结果表明,该方法比PPTD具有更高的计算效率和更低的通信开销。

1 问题描述

系统包含三个实体,即云服务器、用户及可信第三方。其中,用户是感知数据的拥有者,使用自己的移动设备执行感知任务;云服务器是收集用户数据并执行真值发现算法的平台;可信第三方是为所有参与方提供私钥的机构。此外,对象表示由云服务器分配的实体或问题,而观察值表示由用户提供的感知数据。

在该群智感知系统中,安全威胁来自云服务器和用户。例如,云服务器可能会尝试推断每个用户的观察值。另一方面,每个用户也可能尝试推断其他用户的观察值。因此,保护用户观察值的隐私至关重要。

假设系统有K个用户,一个云服务器和可信第三方TA,TA为每个用户Uk生成Kc份任意不同的秘密值s1,…,sKc。Sk表示用户Uk随机得到的一组秘密值,dk表示其观测值xk和初始化真值x*的距离,pk表示TA为每个用户生成的私钥,p0表示TA给云服务器的私钥,wk表示用户Uk的权重。真值发现算法的目标是让云服务器准确地计算真值x*。这个过程中,每个用户的观察值(如xk)不向任何一方公开。此外,私钥信息pk和权重信息wk也不应向系统中的任何一方透露。

2 算法构造

2.1 算法基本流程

在真值发现算法中,每个用户都有一个权重,所以算法流程包括权重更新过程和真值更新过程。本文采用文献[4]的权重计算公式,即:

真值发现算法的一般过程可用真值发现算法描述。该算法的输入是一个随机给定的初始化真值,不断更新用户权重和估计真值,直到满足所设定的收敛准则。例如,设定收敛准则为两个连续迭代中估计的基本真值变化范围在1%以内或重复次数超过1 000次。

真值发现算法:

输入:K个用户的观测值{xk}Kk=1。

输出:真值x*。

(1)生成随机初始化真值;

(2)基于初始化真值,对每一个用户Uk根据式(1)进行权重更新;

(3)基于当前的权重,云服务器根据式(2)进行真值更新;

(4)重复步骤(2)和(3),直到满足所设定的收敛准则;

(5)返回得到的真值x*。

2.2 高效的隐私保护真值发现算法

算法中常用系统参数的含义见表1所列:

首先可信第三方TA产生Kc份随机且不同的秘密值s1,…,sKc。TA将这些秘密值分成K份随机且不相交的子集,每个子集有c个秘密值。用S代表所有秘密值的集合,Sk代表第k个秘密值子集。显然,。TA将Sk发送给用户Uk,将S发送给云服务器。最后,云服务器和每个用户按照下列方法生成自己的私钥:云服务器計算,用户Uk计算。

由于云服务器并不知道用户和这些子集之间的映射关系,因此不知道任何用户的加密密钥,同时没有用户知道所有的数,所以云服务器的解密密钥也相对安全。

令m表示所要加密的信息,p是一个密钥,则本文的加密方式为:c=(m+p)mod N。

在权重更新阶段,首先每个用户Uk计算其观测值与上一轮真值(初始情况下是云服务器发送的随机真值)的距离,并用其加密密钥pk根据上述加密方式将数据加密,并把密文Ck传送给云服务器。当收到数据后,云服务器利用私钥p0解密求得所有用户距离之和:

下式表明,所以云服务器解密成功。

在真值更新阶段,云服务器首先将上述过程得到的值发给每个用户。用户分别计算其权重以及权重与观测值的乘积,再用上述方法将两值分别加密上传给云服务器。同样地,云服务器解密得到所有用户权重之和,以及用户权重和观测值乘积的总和,云服务器通过计算得到新的真值。

重复上述两阶段,直到满足收敛准则为止,最后云服务器输出真值。

3 效率分析

3.1 计算开销

在华硕A455L I5-5200U型号4 GB内存系统和CodeBlocks编译环境下,使用C++语言编写两种算法程序,并进行运行时间比较。在同样128 bit的安全参数下,对于PPTD算法,取大素数p=15 900 608 684 421 836 191和q=17 374 055 105 574 471 319,g=17 180 200 816 613 291 879,r=46 043 008 582 553 496 776 380 884 709 008 233 070,舍入参数L=107。对于秘密分片算法,将MD5作为哈希函数控制输入字符串的长度,rand()作为伪随机函数,产生安全私钥。

此外,随机函数rand()产生每个用户的观测值,并且假设用户传送的数据都是连续型整数。当连续两次真值更新的结果收敛程度在1%以内,即可认为该值为真值。

图1所示为使用time()函数得到的两种算法的运行时间比较。结果显示,本算法比PPTD具有更高的时间效率。

3.2 通信开销

假设每传送一份数据就是一个数据包,每份数据的大小都为1 k,则两个算法的具体通信开销如图2所示。结果表明,与PPTD协议相比,本算法具有较少的通信开销。

4 结 语

本文采用对称密码技术设计了一种高效的保护用户隐私的真值发现算法。该算法与已有算法相比,具有更少的计算开销和通信开销,更适用于群智感知真值发现系统。

参考文献

[1] MIAO C,JIANG W,SU L,et al. Cloud-Enabled privacy-preserving truth discovery in crowd sensing systems[C]//Proceedings of the 13th ACM Conference on Embedded Networked Sensor Systems. 2015:183-196.

[2] RONALD C,DAMGARD I,NIELSEN J B. Multiparty computation from threshold homomorphic encryption[C]//Proceedings of the International Conference on the Theory and Applications of Cryptographic Techniques(EUROCRYPT),2001:280-300.

[3] LI Q,CAO G. Efficient and privacy-preserving data aggregation in Mobile Sensing[C]// Proceedings of the 20th IEEE International Conference on Network Protocols(ICNP)2012:1-10.

[4] LI Q,LI Y,GAO J,et al. Resolving conicts in heterogeneous data by truth discovery and source reliability estimation[C]// Proceedings of the 2014 ACM SIGMOD International Conference on Management of Data(SIGMOD),2014:1187-1198.

[5]黃海辉,汪翔.无线体域网数据传输安全策略研究[J].物联网技术,2016,6(2):37-39.

[6]王卓伟.基于关联规则混合算法并行化的隐私保护方法研究[J].物联网技术,2016,6(7):97-98.

[7]谭磊.面向双向隐私保护的群智感知技术研究[D].合肥:中国科学技术大学,2017.

[8]陈朋飞.移动群智感知中基于弱安全网络编码的隐私保护机制[D].苏州:苏州大学,2016.

猜你喜欢

隐私保护高效
为小语课堂“瘦身”,为学生语文素养增“肥”
提高提问的有效性, 构筑高效的语文课堂
打造务实、创新、高效的语文课堂