基于互信息的云控制系统的最优隐私保护机制设计
2023-08-31张淇瑞李江荣夏元清
张淇瑞 刘 坤 李江荣 代 伟 夏元清
近年来,计算机技术、通信技术和控制技术迅猛发展,催生了信息物理系统(cyber-physical system,CPS)[1-2]这一概念.CPS 通过将3 种技术进行深度融合,实现了物理世界与信息世界之间的紧密相连.CPS 实现了感知、分析、估计与控制等多种功能,为了满足日益复杂、规模日益扩大的控制任务需求,需要采集和存储的数据越来越多,控制系统必须能够处理这些海量数据.云控制系统(cloud control system,CCS)[3-7]应运而生,其在传统控制系统中引入云计算、大数据处理技术以及人工智能算法,将各种传感器感知汇聚而成的海量数据,也即大数据,存储在云端;在云端利用人工智能算法实现系统的在线辨识与建模,应用任务的计划、规划、调度、预测、优化、决策和控制,结合自适应模型预测控制、数据驱动预测控制等先进控制方法,实现系统的自主智能控制,即形成云控制.由于云控制的优越性,其在智能交通[8]、智能电厂[9]、智能制造[10]等领域得到了广泛应用.
尽管使用云计算能够增强控制系统计算能力,但是用户将数据传输到云平台时可能会导致隐私信息被泄露,因此,用户往往对数据进行加密来保护隐私[11],同态加密是最典型的加密算法.文献[12]设计了同态加密算法保护系统状态的隐私,并用鲁棒模型预测控制策略补偿加密带来的量化误差,确保了系统的稳定性.文献[13]进一步考虑了有状态约束的系统,并讨论了同态加密下模型预测控制性能和隐私性能之间的权衡.文献[14]则针对云平台在求解二次优化问题时的隐私泄露问题设计了同态加密算法.当密钥未知时,窃听者完全无法获得隐私信息,因此,加密有良好的隐私保护效果.然而,基于加密的隐私保护方法会消耗大量的计算和通信资源,导致信息传输过程中处理时间及维护成本的增加.
另一方面,基于随机扰动的隐私保护方法具有计算量小、易于实施的优点.其核心思想是通过对传感器传输的数据添加特定的随机噪声信号,增加数据的随机性,从而达到保护隐私的目的.文献[15]采用互信息描述隐私泄露的程度,在控制性能损失不超过一定阈值的要求下,设计了高斯噪声保护系统隐私.文献[16]采用条件熵描述隐私泄露的程度,研究了隐私保护机制下的状态估计问题.文献[17] 采用费雪信息描述模型参数隐私的泄露程度,设计了最优的高斯噪声方差和对应的线性反馈控制律.
上述研究均针对单个系统,实际应用中云平台往往需要同时处理多个系统的任务需求,且系统用于保护隐私的能量是有限的.本文针对多个具有能量约束的系统,设计了基于随机扰动方法的最优隐私保护机制,且使得扰动造成的估计性能损失不超过给定阈值.
1 系统建模
如图1 所示,考虑N 个独立的离散线性时不变系统,系统i 的动态方程可描述为
图1 云控制系统的隐私保护Fig.1 Privacy protection for CCS
图2 不同εi 下系统的KL 散度及互信息Fig.2 Values of KL divergence and mutual information of the system for different εi
2 问题描述
本章主要介绍最优隐私机制优化问题的构建过程.介绍系统的能量与估计性能约束;描述隐私保护机制与隐私性能指标;构造一个同时具有整数约束和不等式约束的优化问题来描述系统的隐私保护目标.
2.1 能量与估计性能约束
因此,第m 个周期内的系统的能量约束可表示为
2.2 隐私机制
2.3 目标函数
综上所述,最优隐私机制设计可构建为下述优化问题
3 最优隐私机制求解
证明 注意到系统的初始状态、过程噪声以及量测噪声均服从高斯分布,由文献[19]可知,给定任意矩阵M1、M2、M3和M4,有
结合式(7)可得引理1.
引理2 xK和zK分别服从以下分布
其中,
结合引理1,可以得到xK和zK的分布.
引理3 yK服从以下分布
其中,
本文将选取《报告》中与China搭配的名词、形容词/副词以及动词这三类词作为量化统计范畴,参照出现频率及重要性,识别出每个范畴的主要词汇项目(见表2);通过《报告》中涉华话语的词汇分析,确立“China”在时间、空间和情态三个轴上的位置,分析和比较“China”在三份报告中的话语空间定位情况。
证明 考虑式(8),证明与引理1 类似,因此,省略.
根据定义2,高斯分布yK和zK之间的KL 散度为
进一步,目标函数J2可表示为
根据Schur 补引理[20],上述优化问题等价于以下形式
综上所述,去掉目标函数中的常数项,可得定理1 中的优化问题.
最后,求解最优的扰动添加策略.
定理2 在第m 个周期中,通过求解下述0-1规划问题
对于单个系统的隐私保护问题,仅需要求解随机扰动的分布[15-17].本文进一步考虑了多个具有能量约束的系统,通过将原优化问题分解为一个带有约束的凸优化问题和一个0-1 规划问题,不仅求解了扰动的分布,还得到了最优扰动添加策略.
4 数值仿真
本章以车辆跟踪问题验证主要结论.选取N=3,每个系统中有两个车辆,分别为跟踪车辆与目标车辆,均运行在二维坐标系下.对于系统i,i=1,2,3,定义状态为
系统相关参数给定为
表1 互信息的取值Table 1 Values of mutual information
表1 互信息的取值Table 1 Values of mutual information
进一步,以系统1 为例,分别选取ε1=2 和ε1=100,图3 中给出前10 个周期下对应的z12和py1的取值,其中,z12是添加扰动后传感器测量值的第2 个分量.可以看出,当ε1=2 时,z12的波动程度较小,即添加的扰动的方差相对于ε1=100 时的方差更小.
图3 ε1=2 和ε1=100 时的z12 和py1Fig.3 Values of z12 and py1 with ε1=2 and ε1=100
图4 不同 下系统的KL 散度及互信息Fig.4 Values of KL divergence and mutual information of the system for different
图5 =0.000 1 和=2 时的z12 和py1Fig.5 Values of z12 and py1 with =0.000 1 and =2
表2 系统参数Table 2 Parameters of the systems
图6 不同周期m 下的扰动添加策略Fig.6 Disturbance adding policy for different periods of m
图7 不同周期m 下其他策略与最优策略的目标函数之差J-J*Fig.7 The difference value of J-J* between the target functions of the other strategy and the optimal strategy for different periods of m
5 结论
本文针对具有能量约束的云控制系统,通过向系统输出信号添加随机噪声以保护隐私,给出了噪声最优方差的计算方法和最优添加策略.对车辆跟踪系统的仿真表明,所设计的方法能够有效保护系统隐私,并且造成的系统估计性能损失不超过给定阈值.