基于AHP-模糊综合评价法的泄露数据价值评估模型
2020-09-17苏马婧
宋 栋,张 雷,苏马婧
(华北计算机系统工程研究所,北京100083)
0 引言
随着社会的高速发展,发达的科技使得信息流通更加便利,人们之间的交流越来越频繁。由于大数据的应用越来越广泛,大量数据带来巨大价值的同时也带来了数据被泄露的风险。
在日常生活和办工、上网购物、网络社交的过程中,不可避免需要用户提供个人信息或其他相关信息,在这过程中用户的个人隐私信息就不可避免地存在被泄露的风险。数据泄露一般由数据存储设备被盗窃、网络攻击泄露、个人疏忽或失误泄露、企业内部人员行为泄露以及通过勒索软件泄露等原因导致。重要数据的泄露对企业或个人带来的影响十分严重,而目前对泄露数据带来风险和危害的评估研究却比较少。本文以个人隐私信息数据为例通过层次分析法和模糊综合评价的方法对个人隐私信息泄露数据的价值进行评估,从而对评估不同种类泄露数据的价值提供参考。
1 层次分析法的基本原理
层 次 分 析 法(Analytic Hierarchy Process,AHP)是20世纪70年代初美国运筹学家SAATY T L提出的,是美国国防部研究“根据各个工业部门对国家福利的贡献大小进行电力分配”课题时,应用网络系统理论和多目标综合评价方法,提出的一种层次权重决策分析方法。它是一种将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础上进行定性和定量分析的决策方法。该方法将定量分析与定性分析结合起来,用求解判断矩阵特征向量的办法,求得每一层次的各元素对上一层次某元素的优先权重,然后再用加权和的方法递阶归并各备择方案对总目标的最终权重,最终权重最大者即为最优方案。
1.1 层次分析法的一般步骤[1-2]
(1)根据情况建立层次结构模型
根据实际问题,将影响最终结果的相关因素采用自上而下的方式进行分层,分别为目标层、准则层(或指标层)、对象层(或方案层),同一层之间的因素基本上相对独立,上层因素受下层因素的影响。形成层次分析法的分析结构模型。
(2)构造判断(成对比较)矩阵
根据1-9标度法和成对比较法,构造两两对比矩阵,用同等重要、稍微重要、重要、很重要以及非常重要等判断表示各层上的每一个因素两两对比的情况。
(3)层次单排序及进行一致性检验
对每一层两两比较矩阵计算最大特征根和特征向量,然后进行一致性检验,如果一致性检验结果正常,则可将特征向量作为该层的权向量。
(4)层次总排序及进行一致性检验
通过组合下层的权向量,对总层次进行排序并进行一致性检验,若通过,则说明按此排序符合要求。
1.2 层次分析法的特点
(1)系统性:可将评估的对象比作系统,按照分解、比较、判断、综合的思维方式进行分析与决策;
(2)实用性:通过对评估对象进行定性与定量相结合的方式进行评估,较传统的方法更易做出决策;同时,层次分析法的应用范围很广,可以应用于经济计划和管理、生产决策、交通运输等领域,可以处理决策、评价、分析和预测等类型的问题。
2 利用AHP对个人隐私信息泄露数据进行权重分析
2.1 建立泄露数据集
假设给定一个泄露数据集Ω,其中包含N条泄露数据,记为 d1,d2,…,dN,每条泄露数据包含 M 个信息元素,记为 e1,e2,…,eM。在泄露数据集 Ω 中抽取个人隐私信息作为一条泄露数据d1,包含个人身份证号码、电话号码、家庭住址、性别、付款记录信息、收货地址、健康数据信息、医疗记录、微信账号和密码、微博账号和密码等信息元素。信息元素越重要,包含这些信息元素的个人隐私信息泄露后对个人带来的危害就越高,即泄露数据的价值就越高。
2.2 确定个人隐私信息泄露数据价值的权重
(1)建立个人隐私信息泄露数据价值体系
本文将个人隐私信息的元素分为四个类别,分别为个人基本信息、个人购物及支付信息、个人医疗信息以及个人社交网络信息,从而建立如图1所示的个人隐私信息泄露数据价值体系。从图中可知,目标层A为个人隐私信息泄露数据价值,准则层B代表个人隐私信息的四个类别,子准则层C为个人隐私信息的具体元素。通过建立个人隐私信息泄露数据价值体系可以对个人隐私信息泄露数据价值进行评估。
(2)对第二层指标构建两两比较矩阵A-B[3]
对准则层的任意两个指标ai和aj进行重要性比较的赋值[4-5],如表 1所示。
图1 个人隐私信息泄露数据价值体系
表1 重要性结果赋值
采用1-9标度法对四类信息进行两两对比,形成目标层A对准则层B的两两比较情况,两两比较矩阵如表2所示。
表2 A-B比较情况
因此可知A-B的比较矩阵A为:
对矩阵A按列进行归一化可得:
对A1按行求和可得:
因此可求得A-B的权重为:
式中,n 为矩阵的阶数,i,j=1,2,…,n。
(3)进行一致性检验
计算一致性指标 CI[6]:
计算一致性率CR:
其中,RI为随机一致性指标[7],通过查表可知当矩阵的阶数为 4时,对应的RI=0.89。
通过一致性率CR=0.010 02<0.1可知,对比矩阵A的一致性是可以接受的。
直译是指一种常用的翻译方法--既忠实于原文内容,又忠实于原文形式。在某种颜色在英语和汉语中的语用意义相同的情况下,我们可以采取直译法。
通过同样的方法对子标准层各元素的权重进行计算,分别为:
CRc4=0.017 5<0.1,因此符合一致性检验。
由上述结果可知,个人隐私信息泄露数据价值体系权重如表3所示。
表3 个人隐私信息泄露数据价值体系权重表
2.3 使用模糊综合评价法对个人隐私信息泄露数据价值进行综合评估
利用层次分析法对个人隐私信息各元素进行了权重的分析,最后通过模糊综合评价方法对个人隐私信息泄露数据的价值进行评估。
(1)建立模糊评价矩阵
假设将个人隐私信息泄露数据的价值分为四个等级,即 V={非常高,高,一般,低}。对 20个人进行个人隐私信息泄露数据价值评价的问答,根据每个人对个人隐私信息包含的元素信息的不同评价可得到模糊评价矩阵,如针对个人基本信息包含的信息元素的模糊评价矩阵,归一化后为:
(2)计算个人隐私信息泄露数据评价矩阵
计算二级模糊综合评价矩阵Bc1为:
(3)评估结果
通过计算可知,对于以个人基本信息、个人医疗信息、社交网络信息以及购物及支付信息为信息元素的个人隐私泄露数据,70.6%的人认为价值为非常高,22.9%的人认为价值为高,12.7%的人认为价值为一般,只有2.2%的人认为价值为低。根据最大隶属度原则[8-9]可知,对此条个人隐私信息泄露数据价值的评价为非常高。
利用层次分析法和模糊综合评价的方法可以对包含不同信息元素的泄露数据的重要性进行评估,从而可对不同种类的泄露数据进行重要性排序并对泄露数据价值进行评估。
3 防止泄露数据事件发生及个人隐私保护的建议
随着网络技术的飞速发展,隐私安全成为了每个人生活中不可忽略的重要部分,怎样能够有效地保护个人的隐私信息不被泄露成为了当前非常重要的一个话题。本文针对防止泄露数据事件发生及个人隐私保护提出了一些建议,如下:
(1)为了减少泄露数据事件的发生,应当采取相应的技术防护措施,如对数据或文件进行加密处理,定期进行电脑漏洞检测并及时进行修复等。
(2)对于企业,加强企业员工内部管理是减少企业泄露数据事件发生的重要途经,如对员工的上网行为进行审计、监测和管控并对数据文件传输进行权限管理。
(3)对于个人隐私信息,首先,应在自我意识上提高重视程度,不要轻易将个人隐私信息告诉陌生人;其次,在浏览网页的时候,不要轻易将个人隐私信息暴露在网络环境中;再者,在使用智能手机时,不要轻易下载未知的APP进行使用;最后,在使用个人电脑时应当避免设备自动连接到公共网络。
4 结论
本文主要研究泄露数据价值的评估,以个人隐私信息为例,通过使用层次分析法和模糊综合评价的方法对个人隐私信息泄露数据进行了权重分析和价值评估,得出以个人基本信息、个人医疗信息、个人社交网络信息以及个人购物及支付信息为信息元素的个人隐私信息泄露数据的价值为非常高的结论。同理通过分析和计算可以对包含不同信息元素的泄露数据的重要性进行评价,进而对不同种类的泄露数据的价值进行评估。