APP下载

信息管理系统中的隐私保护与信息安全问题研究

2024-12-06徐有芳

中国新技术新产品 2024年13期
关键词:隐私保护

摘要:跨系统协同过滤推荐算法与信息管理系统间存在紧密的关系。为了应对不良商家利用托攻击带来的挑战,并提高推荐的准确性,本文设计了一种跨系统协同过滤推荐算法,其结合安全多方计算理论与随机扰乱技术,可有效保证用户隐私不泄露给协同系统,并在此基础上,可以精确地计算用户间的相似度,降低预测误差。通过试验验证,该算法能够有效防止不良商家的托攻击行为,并显著提高推荐系统的准确性。

关键词:协同过滤算法;安全计算模型;隐私保护

中图分类号:TP309""""""""" 文献标志码:A

随着信息技术的发展和普及,信息管理系统在各个领域中得到广泛应用,信息管理系统中的隐私保护与信息安全成为了亟待解决的重要问题。跨系统协同过滤推荐算法是一种用于推荐系统的算法,通过整合多个独立的推荐系统,共同提供个性化的推荐结果。传统的协同过滤算法主要利用单一系统内的用户-项目评分矩阵来进行推荐操作,跨系统协同过滤推荐算法则扩展了这个概念,将多个系统中的用户和项目数据进行联合分析和推荐。信息管理系统提供数据源和数据共享机制,为跨系统协同过滤推荐算法提供支持和基础。

1传统的协同过滤算法的问题

传统的协同过滤算法在实际应用中存在以下问题。1)数据稀疏性:协同过滤算法利用用户-项目评分矩阵来进行推荐,但是大部分用户只对少数项目进行评分,这导致算法难以准确地预测用户对未评分项目的兴趣。2)冷启动问题:当新用户加入系统或推出新项目时,因为缺乏足够的评分数据进行准确推荐,所以协同过滤算法无法准确预测他们的兴趣。3)算法偏好:传统的协同过滤算法主要基于用户间的相似度或项目间的相似度来进行推荐。这种方法容易使推荐结果出现算法偏好,即推荐给用户的项目往往与他们喜欢的项目相似,缺乏多样性。4)灵活性差:传统的协同过滤算法通常只考虑用户-项目间的关系,忽略了其他因素的影响,例如时间、地点、社交关系等。这限制了算法在个性化推荐方面的灵活性和准确性。5)数据隐私问题:协同过滤算法需要收集和分析用户的个人数据,涉及用户隐私。如果不妥善保护,就可能引发数据泄露和滥用的风险。

2跨系统的隐私保持协同过滤算法

2.1提出问题

跨系统协同过滤是指在不同系统间共享个性化推荐服务,对系统间进行协作。在这种情况下,不同系统可以通过共享用户评分和模型来提高推荐的准确性和个性化程度。假设存在n个系统:S1,S2,…,Sn,则系统i的用户评分矩阵如公式(1)所示。

(1)

式中:(Ri)n,n为系统i中的用户对第n个项目的评分。

锁定了目标用户后,利用协同过滤推荐技术,使不同系统间能够携手合作。通过各个系统间的协作,结合各个系统中所有用户的评分数据,预测用户对某个特定项目的评分。

随机扰乱技术是一种保护用户隐私的方法,它通过对原始数据进行随机化噪声处理,来保护用户评分信息。在协同过滤推荐系统中,当需要计算用户相似度时,可以使用随机扰乱技术来保证评分信息不会泄露给其他协作系统。利用随机扰乱技术,当跨系统推荐时,协同过滤推荐系统能够保障用户隐私的安全。同时,这种方法也可以降低数据共享带来的用户隐私泄露风险,提高用户对推荐系统的信任度。

设想有两个均值均为0的向量,分别标记为A=(a1,a2,…,an)和B=(b1,b2,…,bn)。通过对向量A和B应用向量∈=(∈1,∈2,…,∈n)和向量δ=(δ1,δ2,…,δn)的随机扰动,可以得到新的向量A'=A+∈,B'=B+δ。在这个过程中,向量∈和δ的随机化数据是遵循高斯分布或均匀分布的,其数值为[-m,m]。根据这种形式,基于A'·B'可以有效地估算所需A·B的数值。如公式(2)所示。

(2)

因为向量A和δ均值均为0并且相互独立,因此能够得

出ai≈0。同理,能够得出bi≈0以及由

此可以得出公式(3)。

在随机扰乱处理前,标准化处理是一项重要的步骤,它有助于缩小推荐算法的误差。通过运用z-score标准化方法,可基于算术均值和标准差消除不同特征间量纲差异,完成原始数据转化,从而提高算法的稳定性和准确性。其计算过程如公式(4)所示。

(4)

式中:Rui为用户u对项目i的原始评分;Ru、σu、Iu分别为用户u的评分均值、标准差以及项目集合。标准差的计算过程如公式(5)所示。

2/Iu(5)

当采用随机扰乱技术时,需要注意的是扰乱过度可能会影响推荐算法的精确度。可以通过改进相似度度量标准来提高推荐的准确性。保护用户隐私的同时,也能提高推荐系统的准确性和用户满意度。

2.2安全计算模型

本文提出了一种基于安全多方计算的理论模型,这为跨系统的协同过滤提供了安全保障。在该模型中,用多个公共的第三方来保障原始数据的安全传递,从而避免了数据泄露给中间节点的风险。通过使用轻量

级分组密码系统LBlock和RSA加密算法,本文的安全计算模型能够有效地保护数据的机密性和完整性。LBlock有高效的数据加密和解密功能,用RSA保护密钥的安全性。这样即使在跨系统协同过滤过程中有潜在的安全风险和攻击威胁,也能够保障数据的安全传输。同时,引入混淆传输的概念,防止第三方恶意串通。通过混淆传输,使第三方无法获知真实的数据内容,提高数据的安全性和隐私保护。安全计算模型如图1所示。

该安全计算模型使用RSA密码系统生成公钥和私钥,利用LBlock密码系统生成密钥,并通过加密和解密操作安全传输数据。同时,使用茫然传输协议保护数据免受第三方的恶意串通。具体步骤如下[1]。所有系统都会创建一对RSA公钥PK和私钥SK。将公钥分享给其他系统,而将私钥则安全地传递给n个第三方机构。2)所有系统使用LBlock密码系统生成n个独立的密钥Ki。3)各系统会使用之前分享的RSA公钥对每个密钥进行加密,生成对应的密文K'i。将这些密文传送到LBlock密钥库中。4)第三方机构i从密钥库中检索到对应的密文K'i后,利用先前接收的RSA私钥进行解密操作,进而还原原始的密钥Ki。5)当需要发送数据时,所有系统会使用与其对应的密钥Ki,通过LBlock算法对数据进行加密,生成加密后的密文ci。6)基于茫然传输协议可将完成加密的密文ci安全无误地输送至中间节点。7)中间节点将在n个第三方机构所提供的密文组中挑选一组数据ci,且以安全的方式将其转交给目标系统。8)目标系统会使用与密文ci对应的密钥Ki,通过LBlock解密算法还原原始的数据mi。

通过这样的流程,可以保障数据的传输和存储过程都是安全的,同时保护了用户的隐私,并提高了系统的整体安全性。

2.3模型优化

2.4隐私保护推荐算法

可以将基于安全计算模型和随机扰动的跨系统协同过滤推荐算法描述为一种隐私保护的推荐算法。它通过安全计算模型和随机扰动技术,保证用户的个人信息在推荐过程中不会泄露。这种算法允许不同系统间进行协同过滤推荐,无须共享用户的真实数据。同时,通过引入随机扰动,推荐结果会有一定程度的变化,使攻击者无法准确了解用户的真实偏好。保护用户隐私的同时,提供个性化且准确的推荐结果。

以系统Alice和Bob为例,评分数据会对其进行z-score标准化处理,并得到数据rui。同时引入随机噪声进行扰动。这样即使在协同过滤推荐系统中,存在潜在的安全风险和攻击威胁,也能够保护用户的隐私和数据的安全性。同时,由于评分数据通常较小,因此加性加入噪声的方法能够有效地增强数据的隐私保护效果。为增强隐私保护效果,对处理后的数据rui添加随机扰动。具体做法:将rui加上一个随机数γui,得到扰动后的数据r'ui=rui+γui。这里的γui可以是服从高斯分布或均匀分布在一定范围内的随机数。

通过这样的处理,评分数据标准化,在每个系统中添加随机扰动,以保护用户的隐私协同过滤推荐计算中,使用处理后的评分数据r'ui来进行相似度计算、预测等操作,从而生成最终的推荐结果。

根据输入的描述,基于RSA密码系统和LBlock密码系统的跨系统协同过滤推荐算法的过程如下。1)Alice和Bob共同生成一对密钥,包括公钥PK和私钥SK,将公钥PK安全地发送给第三方。2)利用LBlock密码系统,Alice和Bob分别创建了n个密钥,KAi和KBi,并在LBlock密钥库中存放这些密钥加密后的密文。3)第三方机构提取密钥库中完成加密的密钥密文,通过私钥SK对其逐一进行解密操作,从而获取KAi、KBi。第三方使用KAi对数据RA、rA进行加密,生成R'A、r'A;同样,使用KBi对数据RB、rB进行加密,生成R'B、r'B。4)第三方将加密后的数据密文组(c1、c2、...、cn)传输至中间节点。中间节点在密文组中挑选对应数据ci,同时向Alice、Bob分别传输R'A和r'A、R'B和r'B。5)Alice与Bob接收到密文后各自运用相应密钥KAi、KBi进行解密,从而分别获取其原始数据RA、rA和RB、rB。6)Alice与Bob分别将其组合后的数据XA+RA与YB+RB发送给对方。7)Bob进一步处理数据,将X'YB+rB和|IB|发送给Alice。8)Alice利用接收到的数据计算差值X'YB+rB-Y'RA+rA,得到XA与YB的乘积。9)Alice基于XAYB和|IB|,通过相似度近似估计目标-Bob用户的相似度。10)Alice采用预测评分公式来计算特定项目的预测评分Pui。

通过以上步骤,基于RSA密码系统和LBlock密码系统的跨系统协同过滤推荐算法可对目标用户进行个性化推荐。

3试验及分析

3.1安全性能试验

为了研究不同密钥长度对RSA算法执行效率的影响,选择512位、1024位和2048位3种长度进行测试,并详细记录了密钥生成、加密及解密所需的时间。测试结果表明,随着RSA密钥长度增加,生成密钥所需的计算时间显著增长,而加密与解密操作所需的计算时间虽然也有所增加,但增长相对平缓。在RSA密钥生成过程中,需要生成两个大素数,并计算其乘积作为公钥模数。随着密钥长度增加,找到足够大的素数变得更加困难,因此密钥生成时间呈指数级增长。而在RSA加密和解密过程中,涉及对大数进行模幂运算。模幂运算的时间复杂度为指数级,由于使用了快速模幂算法等优化技术,因此加密和解密时间呈线性增长趋势。为保障RSA算法安全,应选择足够大的素数作为密钥,这样可以大大降低攻击者通过公钥推导出私钥的可能性。

3.2相似性度量比较

为比较跨系统协同过滤和单系统协同过滤的精度,本文进行对比试验。首先,为对比跨系统协作过滤与单系统协作过滤器的精度,本文进行比较试验。从数量相对稀少的资料表随机选择一百个用户打分向量作为系统A,从数量相对密集的资料表随机选择一百个用户打分向量作为系统B。因为有关系统A的信息极其稀少,所以系统A给系统B发送协同运算要求,接受到反馈后,两系统按PPCFSCM方法进行协同运算。对系统A、系统B以及系统A和系统B间的跨系统协作算法进行均方绝对误差(MAE)比较试验。研究结果表明,随着数据集的稀疏性增强,协同过滤的推荐精度呈现下降趋势。在跨系统协作计算中,数据经过加密和茫然传输等安全措施保护,第三方只能获取加密后的数据,无法获知真实的数据内容。因此,通过跨系统协作计算和基于安全计算模型的数据保护措施,可以在用户数据稀疏的情况下提高协同过滤推荐算法的精度,保障用户隐私的安全性。

4结语

本文对信息管理系统的隐私保护与信息安全问题进行深入研究。通过运用安全多方计算理论、轻量级分组密码算法和RSA密码系统等技术,提出了安全计算模型,该安全计算模型和算法可保护用户隐私,提高推荐算法的准确性和安全性,为信息管理系统的隐私保护和信息安全问题提供了有效的解决方案。因此,信息管理系统的隐私保护与信息安全问题的研究具有重要意义。

参考文献

[1]刘国丽,李昂,李艳萍,等. 跨系统协同过滤推荐算法的隐私保护技术研究[J]. 计算机应用研究,2017,34(9):4.

[2]张明磊,韩明,王震洲. 基于安全多方计算的系统间隐私保持推荐算法[J]. 河北工业大学学报,2012(4):5.

猜你喜欢

隐私保护
移动商务消费行为分析研究
适用于社交网络的隐私保护兴趣度匹配方案
可搜索加密在云计算移动学习中的应用
基于层次和节点功率控制的源位置隐私保护策略研究
关联规则隐藏算法综述
大数据环境下用户信息隐私泄露成因分析和保护对策
大数据安全与隐私保护的必要性及措施
大数据时代中美保护个人隐私的对比研究
社交网络中的隐私关注及隐私保护研究综述
大数据时代的隐私保护关键技术研究