大数据时代数据监管者与企业的演化博弈研究

2019-05-10叶阿真福建信息职业技术学院福建福州350003

数码世界 2019年4期

叶阿真福建信息职业技术学院福建福州 350003

1 引言

“十三五”时期，我国将大力实施国家大数据战略，大数据技术也应用到各行各业中。据中商产业研究院发布的《2018-2023年中国大数据产业市场前景及投资机会研究报告》，数据显示，2017年中国大数据产业规模达到4700亿元，同比增长30%；其中，大数据硬件产业的产值为234亿元，同比增长39%。随着大数据在各行业的融合应用不断深化，预计2018年中国大数据市场产值将突破6000亿元，达到6200亿元。

在大数据的背景下，一方面，信息技术的进步使得个人信息的来源和类型越来越广泛和多样化，信息处理能力得到显着提高；另一方面，信息的价值得到了不断的认可和重视，这使得个人信息资源成为各方竞争的战略高峰，为了获得更多的经济利益，许多不法分子或企业窃取，出售和滥用个人信息。据统计，我国2016年通过不同渠道泄露的个人信息达65亿条次，也就是说，平均每个人的个人信息被至少泄露了5次。个人隐私的泄露和信息滥用问题渐受重视，当我们看到大数据带来的好处时，也不能忽视大数据所引发的相关个人信息安全问题。国外有通过立法保护个人信息，欧盟通过了《个人数据保护指令》，要求各国制定或修改建立个人信息保护法。在后来的立法中，要求第三国的隐私法律必须通过欧盟的“充分性”保护标准的判定，才能向其进行跨境个人信息传输。

虽然国内外对于大数据时代下用户隐私保护进行了研究，但是基本集中在互联网企业与用户之间的博弈问题，对于数据监管者及企业间的关系研究主要从技术或者法律的角度进行的。如何通过在数据监管者监管的督促下，使得互联网企业及用户三者之间达到共赢，促进大数据的健康发展，是亟待解决的问题。因此本文运用演化博弈论,建立数据监管者与互联网企业的博弈模型,分析了不同的稳定平衡状态,给出相应的分析结论,寻求两个群体如何实现长期共赢的方法。

2 相关工作

大数据背景下的信息服务使生活更加高效便捷，但网络也给个人信息安全带来了新的挑战。Xuejie Zhao对网络环境下个人信息的法律保护进行了优化模式分析在，文章指出实践中，企业自律和技术标准在信息产业中的作用是有限的，它不能取代法律规范。随着个人信息在网络环境中变得特别敏感和重要，有必要加强法律保护。在此基础上，提出了相关建议，以完善个人信息保护法律制度。Zharova研究了通过法律和技术手段在互联网上识别个人的问题。Khokhar等提出商业企业不仅面临着保护私人数据的挑战，而且还面临着在交易特定于个人数据时合法合规遵守隐私规则的挑战。企业需要一种有效的隐私保护业务模式来应对新兴市场的挑战，并提出一个允许多个企业协作整合他们的数据的模型，对现实生活数据的实验表明，该方法可以识别不同隐私模型的数据混搭中的最佳价值，包括K-匿名，LKC-隐私和ε-差异隐私，以及各种匿名算法和隐私参数。Majeed等提出了一种新的匿名化方案，该方案考虑了PII的身份漏洞，有效地保护了用户隐私。Gao, Ensheng 通过分析个人信息安全法律保护中存在的问题，指出有必要完善我国个人信息安全的法律保护。同时，我们可以借鉴国外个人信息安全法律保护的经验，进而做出相应的改进。冯登国等研究者认为大数据正影响着人们日常生活方式、工作习惯及思考模式，作为新兴的科技技术，带来了新的安全问题，但它自身也是解决问题的重要手段。并从大数据的隐私保护、信任和访问控制的角度，梳理了当前大数据安全和隐私保护的关键技术。Y Li, L Xu,B Liu针对个性化服务带来的信息安全问题，提出基于网络公司与用户隐私保护的进化博弈模型，证明了各因素对博弈主体行为的影响，最后取得双赢的发展方向。李军伟研究在社交网络中,运用演化博弈方法构建用户与社交平台隐私行为策略的演化博弈模型,通过求得各自的复制动态方程和演化稳定策略并进行仿真分析。邵明构建了LBSNS用户隐私关注和隐私披露行为的影响因素模型，并构建了LBSNS用户与服务商之间的隐私行为进化博弈模型，通过调整双方收益矩阵和进化博弈模型,得到了双方在不同条件下的进化稳定策略,最后提出了相关的政策建议。丰米宁构建了用户与社交平台的隐私博弈模型，结果表明，用户信任度、社交平台影响力和奖励、第三方监管力度是影响用户和社交平台隐私策略演化的关键因素，并提出相应的社交网络隐私保护对策和建议。刘晓晓研究了在用户隐私偏好、网络评价、信息服务的有用性和信息服务的易用性这四种影响因素下的信息服务商和用户的动态演化博弈行为，提出保护用户隐私的对策建议。马媛将大数据时代个人信息领域的利益相关方抽象成数据生产者、数据收集者、数据使用者和数据监管者，并基于大数据时代个人信息的利用与保护的矛盾及核心利益相关方之间由各自追求自身效益最大化而产生的利益冲突问题，运用静态博弈理论建立模型并分析。

3 数据监管者和互联网企业的演化博弈模型假设和收益矩阵

演化博弈是以两个或两个以上的博弈群体为研究对象，并且研究对象的行为会随着时间的变化而变化。只要博弈主体满足上述两个条件，便可以用演化博弈理论研究群体的动态过程。互联网企业是否采取保护用户隐私，是否肆意获取挖掘用户信息，可以看作是数据监管者与企业博弈的结果。本文认为，由于信息的不对称及双方的有限理性，数据监管者和互联网企业在选择策略时很难一次就确认他们的选择是利益最大化，需要在博弈过程中不断调整自己的策略来找出最优策略，并获取最大的利益。我们对模型做如下假设：

(1）博弈主体的行为策略：数据监管者的行为策略集合是（监管，不监管），互联网企业的行为策略集合是（不获取分析用户信息并保护用户信息隐私，未经允许获取和挖掘分析用户信息）；

(2）数据监管者监管互联网企业的行为的概率为q，不监管的概率为1-q；（q＞0）

(3）互联网企业不获取分析用户信息并保护用户信息隐私的概率为p，选择获取挖掘用户信息的概率为1-p；（p＞0）

(4）数据监管者监管成本为CG；

(5）互联网企业不获取和挖掘用户个人信息并保护用户信息隐私时所投入的成本为CB1，获取和挖掘分析用户个人信息时所投入的成本为CB2；

(6）互联网企业不获取和挖掘用户个人信息并保护用户信息隐私时获取的收益为RB1，获取和挖掘分析用户个人信息数据时的收益为

(7）数据监管者在互联网企业完成个人信息保护目标的奖励金额为A，对于未经允许获取挖掘分析用户信息的互联网企业的处罚金额为W。

(8）互联网企业选择未经允许获取和挖掘用户信息、滥用泄露用户隐私时，数据监管者要付出治理费用UG；

设定完主要参数后，双方的收益矩阵如表1所示。

表1 博弈的收益矩阵

4 数据监管者和互联网企业演化博弈行为分析

4.1 数据监管者和互联网企业的个人信息保护演化博弈模型的构建

（1）根据表1博弈的收益矩阵，数据监管者选择“监管”的收益为：

（2）数据监管者选择不监管的收益为：

（3）数据监管者群体选择“监管”，“不监管”的平均收益为：

（4）企业选择“不挖掘用户个人信息”的收益为：

（5）企业选择“获取挖掘分析用户信息”的收益为：

（6）企业群体的平均收益为：

4.2 数据监管者监管部门“监管”比例的复制动态方程为：

若p=W-CG/W+A则F(q)≡0这表示所有水平都是稳定状态。

若p≠W-CG/W+A令F(q)=0求得q=0,q=1是q的两个平衡点。

对F(q)求导得dF(q)/dq=(2q-1)(pW+pA-W+CG)

根据演化稳定策略要求，dF(q)/dq<0,对W-CG参数大小分情形进行分析

情形1：若W-CG<0，即W-CG/W+A<0时，因为p＞0

所以恒有p＞ W-CG/W+A，则q=0 是演化稳定的平衡点。

情形2：0

当 p＞W-CG/W+A 时，dF(q)/dq|q=0<0，dF(q)/dq|q=1＞0 则q=0是稳定均衡点。

当p

数据监管者群体3种情形下的动态演化趋势及稳定性如图1所示：

图1 数据监管者群体复制动态相位图

4.3 互联网企业群体“不挖掘用户信息”比例的复制动态方程

若q =CB1+RB2-CB2-RB1/(A+W) ，则 F(p)≡ 0 这表示所有水平都是稳定状态。

若q ≠ CB1+RB2-CB2-RB1/ (A+W) ，令 F(p)= 0求得q=0,q=1是q的两个平衡点。

对F(p)求导得 dF(p)/dp=(1-2p)[RB1-CB1+CB2-RB2+q(A+W)]

根据演化稳定策略要求，d F(p) /dp<0,对CB1+RB2-CB2-RB1参数大小分情形进行分析

情形1：若CB1+RB2-CB2-RB1<0，即CB1+RB2-CB2-RB1/A+W<0时，因为p＞0

恒有q ＞CB1+RB2-CB2-RB1/A+W，则p=1是演化稳定的平衡点。

情形2：CB1+RB2-CB2-RB1＞A+W，则p=0 是演化稳定的平衡点。

情形 3：0

当q＞(CB1+RB2-CB2-RB1)/(A+W)时，(dF(p) / dp) | p=0 ＞0，dF(p) / dp | p=1<0则p=1是稳定均衡点。

当q<(CB1+RB2-CB2-RB1)/ ( A+W)时，(dF(p) / dp) | p=0<0，dF(p) / dp | p=1＞0则p=0是稳定均衡点。

企业群体3种情形下的动态演化趋势及稳定性如图2所示：

图2 企业群体复制动态相位图

4.4 数据监管者和互联网企业两群体的复制动态演化博弈趋势及稳定性

将数据监管者和企业两群体的复制动态演化博弈趋势及稳定性在同一坐标平面中标识，即如图3所示。

图3. 数据监管者和企业两群体的复制动态演化博弈轨迹

通过分析，我们可以得出不同的平衡状态：

（1）当初始状态在I区域时，该博弈收敛于稳定均衡点，q=1，p=0 即数据监管者群体所有参与者必然选择“监管”策略。企业群体所有参与者必然选择“挖掘用户信息”策略。

（2）当初始状态在II区域时，该博弈收敛于稳定均衡点，q=1，p=1即(监管，不挖掘用户信息)，数据监管者群里所有参与者必然选择“监管”策略。企业群体所有参与者必然选择“不挖掘用户信息”策略。

（3）当初始状态在III区域时，该博弈收敛于稳定均衡点，q=0，p=1 即(不监管，不挖掘用户信息)，数据监管者群里所有参与者必然选择“不监管”策略。企业群体所有参与者必然选择“不挖掘用户信息”策略。

（4）当初始状态在IV区域时，该博弈收敛于稳定均衡点，q=0，p=0即(不监管，挖掘用户信息)，数据监管者群里所有参与者必然选择“不监管”策略。企业群体所有参与者必然选择“挖掘用户信息”策略。

由图3分析可得 (q,p)=(1,0) ,(q,p)=(0,1),(q,p)=(1,1),(q,p)=(0,0) 都是没有鞍点，因此没有演化稳定策略。

5 数据监管者和互联网企业的博弈模型研究结论

本文建立了数据监管者数据监管群体与互联网企业群体间的演化博弈模型，比较不同的稳定均衡状态，可以得出以下结论。

（1）在这博弈过程中存在三个演化稳定策略

i.若W-CG<0 则q=0是演化稳定均衡策略，即数据监管者监管的成本大于对“挖掘用户信息”企业的罚金，最终数据监管者群体都会选择“不监管”

ii.若CB1+RB2-CB2-RB1<0则p=1 是演化稳定均衡策略，即企业“挖掘用户信息”的成本大于企业“挖掘用户信息”所增加的收益，最终企业都会选择不挖掘。

iii. 若 CB1+RB2-CB2-RB1＞A+W，即 RB2-RB1＞A+W-CB1+CB2则p=0 是演化稳定策略，企业“挖掘用户信息”的所增加收益大于企业“不挖掘用户信息”时数据监管者的补贴，企业“挖掘用户信息”的罚金，以及企业“挖掘用户信息”所增加的成本三者之和，则最终企业群体都会选择“挖掘用户信息”。

对于三个演化稳定策略可以得到以下启示：

i.如果数据监管者对互联网企业未经允许，不合理地获取分析个人信息进行挖掘分析的处罚金额较小，而数据监管者“监管”的成本偏高，则数据监管者最后都会采取不监管的策略。这明显不利于推动互联网企业选择“不获取挖掘用户信息”策略。为改变这一状况，数据监管者可以第三方检查机制或者建立“互联网+监管”模式。推进智监管，降低数据监管者监管的成本；同时采取不获取挖掘个人数据的企业数量达到一定程度，数据监管者可以相应地增加对“未经允许，随意获取并挖掘分析个人信息”。

ii.如果互联网企业不合理的获取并挖掘分析信息所增加的收益大于所增加投入的成本时，互联网企业会选择随意获取分析用户信息。因此数据监管者可以通过下达强制禁止互联网企业获取并挖掘分析用户敏感信息的规定，同时增大处罚金额，这样可以在一定程度上增加互联网企业挖掘和分析用户信息的成本，从而降低互联网企业未经允许不合理地获取挖掘用户信息的概率。

iii.如果互联网企业不合理的获取并挖掘分析信息所增加的收益很高，而相应增加的成本又不高，并且数据监管者“监管”是对“不获取用户信息”企业的奖金很小，而对“挖掘用户信息”企业的罚款不高，则最终所有的互联网企业都会选择“随意获取并挖掘分析个人信息”策略。为防止最终所有企业都选择“随意获取并挖掘分析个人信息”策略，数据监管者只有通过逐步加大奖惩力度，推动企业逐渐选择不肆意获取用户信息进行分析，达到保护用户个人信息。

（2）W-CG＞0，0

（3）双方博弈初始状态不同，会导致不同的均衡效果。双方最终会采取哪种策略取决于初始时两个群体策略的选择概率，而这种比例与选择该种策略带给博弈双方的收益大小有关系。数据监管者和互联网企业两个群体，都应该以长远利益为目标进行决策，这样才能使双方各自利益最大化。

6 仿真分析

为了更加直观的展示数据监管者与企业的演化博弈过程，检验构建的演化博弈模型是否正确，用Matlab对不同的参数进行演化仿真，分析双方在演化博弈过程中的三个稳定策略。

（1）当W-CG<0，CB1+RB2-CB2-RB1＞A+W 时，系统的演化稳定平衡点为（0,0）。设 CG=5，W=3，A=2，CB1=2，RB2=10，CB2=3，RB1=2，满足上述条件。为验证模型的有效性，设定监管者采取“监管”策略和企业采取“不肆意获取和挖掘用户信息”策略的初始比例区间为[90%,40%]，演化仿真结果如图5所示。随着演化步数增加，监管者“监管”所占比例和企业“不肆意获取和挖掘用户信息”所占比例自初始点开始迅速下降，进而共同趋向演化稳定点（0,0），即监管者的演化稳定策略为“不监管”，企业的演化稳定策略为“未经允许获取和挖掘用户信息”。

图5 稳定平衡点（0,0）的仿真结果

（2）当W-CG<0，CB1+RB2-CB2-RB1<0时，系统的演化稳定平衡点为（0,1）。设CG=5，W=3，A=2，CB1=2，RB2=5，CB2=6，RB1=3，满足上述条件。为验证模型的有效性，设定监管者采取“监管”策略和企业采取“不肆意获取和挖掘用户信息”策略的初始比例区间为[80%,20%]，演化仿真结果如6所示。随着演化步数增加，监管者“监管”所占比例自初始点开始迅速下降，企业“不肆意获取和挖掘用户信息”所占的比例上升，进而共同趋向演化稳定点（0,1），即监管者的演化稳定策略为“不监管”，企业的演化稳定策略为“不肆意获取和挖掘用户信息”。

图6 稳定平衡点为（0,1）的仿真结果

（3）当 W-CG＞0 ,CB1+RB2-CB2-RB1＞A+W，p<(W-CG)/(W+A)时，系统的演化稳定平衡点为（1,0）。设CG=3，W=5，A=5，CB1=1，RB2=20，CB2=2，RB1=5，监管者采取“监管”策略和企业采取“不肆意获取和挖掘用户信息”策略的初始比例区间为[10%,40%]，演化仿真结果如7所示。随着演化步数增加，监管者“监管”所占比例自初始点开始迅速上升，企业“不肆意获取和挖掘用户信息”所占的比例下降，进而共同趋向演化稳定点（1,0），即监管者的演化稳定策略为“监管”，企业的演化稳定策略为“肆意获取和挖掘用户信息”。

图7 稳定平衡点为（1,0）的仿真结果

7 结语

由于信息的不对称及双方的有限理性，数据监管者和互联网企业在选择策略时很难一次就确认他们的选择是利益最大化，需要在博弈过程中不断调整自己的策略来找出最优策略，并获取最大的利益。因此本文主要运用演化博弈理论研究大数据时代数据监管者和互联网企业双方的博弈关系，建立演化博弈模型，在此基础上运用Matlab对不同参数下的演化稳定策略进行数值仿真验证模型的有效性。博弈分析结果显示：互联网企业肆意获取挖掘用户数据的成本和收益、数据监管者对企业是否合理保护用户个人信息数据的奖惩力度，都直接影响博弈结果，数据监管者和互联网企业两个群体，在三种情况下存在演化稳定策略。但是个人信息安全保护问题还需要数据监管者，企业，个人长期在政策，法律法规，安全意识方面的配合，才能在有序安全的环境中到达三方共赢，创造更多的经济和社会利益。