APP下载

科研协同中数据安全共享的博弈分析及仿真研究

2020-07-14刘晓婷佟泽华薛晓娜

新世纪图书馆 2020年5期
关键词:数值仿真演化博弈

刘晓婷 佟泽华 薛晓娜

摘 要 文章在对科研协同环境、数据共享特性、数据共享行为影响因素分析的基础上引入演化博弈理论,通过复制动态方程求解得到不同情况下的演化稳定策略,并利用Matlab进行数值仿真,分析不同影响因素对博弈决策的影响。结果表明,数据共享的直接收益系数、协同收益系数、激励收益系数、数据共享度以及数据关联度、数据推断力是影响科研人员数据安全共享的最主要因素,由此提出“数据驱动策略-效益驱动策略-风险规避策略”三位一体的数据安全共享的策略体系,以期为促进科研协同中数据安全共享行为提供借鉴与参考。

关键词 科研协同 数据安全共享 演化博弈 数值仿真 策略体系

分类号 C250.2

DOI 10.16810/j.cnki.1672-514X.2020.05.008

Abstract Based on the analysis of S&T Collaboration environment, data sharing characteristics, data sharing factors, this paper introduces evolutionary game theory, solves the evolutionarily stable strategy under different conditions by replicated dynamic equation, anduses Matlab for numerical simulation, then analyzes the influence of different factors on decision-making.The results show that direct benefits coefficient, synergistic benefits coefficient, incentive benefits coefficient, data sharing degree, data relevance and data inference are the most important factors affecting researchers data security sharing.It proposes a three-in-one data security sharing strategy system of “data-driven strategy”“benefit-driven strategy” and “risk aversion strategy”, in order to providesuggestions for promoting data security sharing behavior in S&T Collaboration.

Keywords S&T Collaboration. Data security sharing. Evolutionary game. Numerical simulation. Strategy system.

0 引言

伴隨着全球数据爆炸式增长以及开放科学理念的不断深入,科学研究越来越呈现出数据密集性和研究协作性等特点。科研协同正是在共同的科研目标的基础上,由多个科研主体协同完成的科学研究或创新活动[1]。为避免科研数据的重复建设,提高科研的效率与质量,推动科学研究合作,通过数据共享的方式实现数据整合复用已成为科研协同活动的主流。然而,科研协同主体存在“竞合”的双重关系,一方面需要通过数据共享以促进科研协同进程,另一方面又需要通过数据保护以维持自身的竞争优势。因此,科研人员的数据共享意愿表现出了较为明显的“邻避效应”[2],具体担心数据的泄露与窃取、担心丧失竞争优势、担心数据被误用与滥用、担心得不到合理回报等。因此,在提高科研人员数据共享水平的同时如何降低数据共享过程中的安全隐患显得尤为重要。

1 问题的提出

如今,数据共享已成为国际性的发展趋势,大数据时代下,数据的价值更多的表现在数据共享后的“二次使用”,使静态数据转变成可以共享的动态流动数据,实现数据的共建共享与增值利用[3]。目前关于数据共享的研究主要围绕以下四类议题展开:

(1)第一类是数据共享的动力与障碍研究。数据共享的动力表现在支持科学质询[4]、进行研究再现与验证[5]、推动科研合作[6]、实现科研数据合理配置与再利用[7]等;数据共享的障碍包括时间和资金花费问题[8]、数据的所有权与控制权问题[9]、法律和保密问题[10]、潜在安全风险问题[11]等。这一类研究数量较多且多为定性研究,研究者在充分阐述数据共享过程中的动力与障碍后提出了相应的建议策略。

(2)第二类是数据共享的政策法规研究。科学数据共享政策的积极开放是大势所趋, 温和推进则是现实所需[12]。张晓青等对英美加等国所制定的科学数据开放共享政策内容进行了详细解读[13];唐源等在对比分析国外医学科学数据共享政策的基础上对我国数据共享政策的制定给予了政府与机构两个层面上的管理启示[14]。这一类研究主要对某国家的政策内容进行分析,或是围绕国内外政策的比较研究,以期为我国政策的制定提供借鉴参考。

(3) 第三类是数据共享的影响因素研究。宏观来讲,相关学者主要从个人因素、环境因素、技术因素、资源因素等方面对科研人员数据共享行为进行了分析[15-17]。如,张晋朝指出个人信念和主观规范对数据共享意愿存在显著性影响[18];陈欣指出经济补偿、节省成本、道德激励、数据回报、学术认可、政策驱动等为数据共享的驱动因素[19]。这一类研究数量较多且多为实证研究,在对数据共享行为影响因素分析的基础上提出了相应的建议策略。

(4) 第四类是数据共享的实现技术研究。目前,科学数据共享并没有达到较高的水平,其中元数据标准以及数据仓储技术在促进数据共享实践中发挥着重要作用。统一的元数据标准有利于数据交互以及数据操作,同时有利于避免同类数据的异质描述[20-21];数据仓储技术使得科研人员更加容易地对科学数据进行查询、下载、存储、分析、共享和重用[22-23]。这一类研究数量也较多,研究内容具有较高的深度和广度,但是在实际运用中仍存在具体的技术障碍因素。

综上所述,已有的研究围绕数据共享展开了较为深入的探讨,但是以科研协同为背景并重点考虑数据共享中安全问题的相关研究较少。因此,本研究从科研主体的数据安全共享行为出发,利用演化博弈理论构建科研协同中数据安全共享的演化博弈模型,并通过数值仿真验证各相关参数对博弈结果的影响,深入探讨科研人员数据安全共享的均衡实现条件及其影响因素,为提高数据共享水平并保障数据安全共享提出相应的建议策略。

2 科研协同中数据安全共享的影响因素及参数设定

2.1 科研协同中数据安全共享的影响因素分析

(1) 数据共享收益因素分析。数据共享收益因素是科研人员进行数据共享行为的动力源泉,主要包括三部分:①科研主体进行数据共享所获得的直接收益,指對数据吸收和转化所获得的收益[24],它主要与对方可共享的数据量、对方的数据共享程度以及自身的直接收益系数有关;②科研主体进行数据共享所获得的协同收益,指通过对共享数据的融合而获得1+1>2的收益[25],它主要与对方可共享的数据量、对方的数据共享程度以及直接收益系数和协同收益系数有关;③科研主体进行数据共享所获得的激励收益,指为促进数据共享行为而设定的激励水平,如物质激励、声誉激励等[26],它主要与自身的数据共享水平以及激励收益系数有关。

(2) 数据共享风险因素分析。数据共享风险因素是科研人员进行数据共享行为的阻力障碍,主要包括三部分:①数据泄漏风险指数据共享过程中“私有数据”被有意或无意地进行窃取、利用[27],从而给共享方带来不良影响的潜在风险行为;②数据共享成本,是进行数据共享时所付出的时间成本、经济成本等[28];③惩罚,指对“搭便车行为”或数据滥用、错用等不当行为所进行的惩罚[28],惩罚力度取决于共享方的数据共享水平。

2.2 博弈模型参数设定

假设科研协同合作中由科研主体1与科研主体2组成,双方具有相同的策略选择空间——共享或不共享,且二者都符合“经济人”假设,即追求利益最大化。设置如下模型参数:

(1)L1、L2表示科研主体未进行数据共享时各自数据所带来的原始收益。

(2)h1μ1、h2μ2表示科研主体的数据共享水平,即不同数据共享程度所对应的可共享的数据量。其中h1、h2表示可共享的数据量,即科研主体可进行共享的最大数据量;μ1、μ2(0<μ<1)表示数据共享度,即科研主体进行数据共享的程度。

(3)θ1、θ2表示直接收益系数,即获得直接收益的程度。通常,对方的数据共享水平h2μ2越高,本方通过对数据的吸收和转化所获得的收益就越高,直接收益系数也就越大。因此,双方数据共享的直接收益可分别用h2μ2θ1和h1μ1θ2表示。

(4)λ1、λ2表示协同收益系数,即获得协同收益的程度。通常,数据共享所获得的协同收益主要与对方的数据共享水平h2μ2以及自身的数据共享直接收益系数λ1和协同收益系数θ1正相关。因此,双方数据共享的协同收益可分别用h2μ2θ1λ1和h1μ1θ2λ2表示。

(5)α1、α2表示激励收益系数,即获得激励收益的程度。数据共享的激励收益受数据共享水平的影响,数据共享水平越高,得到的激励收益就越多。因此,双方数据共享的激励收益可分别用h1μ1θ1和h2μ2θ2表示。

(6)i1、i2表示数据关联度,j1、j2表示数据推断力,k1、k2表示数据泄漏风险系数。科研主体的数据泄漏风险与自身数据共享水平、数据关联度、数据推断力、数据泄漏风险系数正相关。因此,双方数据泄漏风险可分别用h1μ1i1j2k1和h2μ2i2j1k2表示。

(7)c1、c2表示数据共享成本,即科研主体在数据共享中付出的时间成本和经济成本。

(8)n1、n2表示惩罚系数,受对方数据共享水平的影响。因此,科研主体“搭便车行为”或“滥用、错用”行为所受到的的惩罚可分别用h2μ2n1和h1μ1n2表示。

3 科研协同中数据安全共享的博弈模型构建

假定博弈过程中科研主体1选择“共享”的概率为x(0

3.1 求解单个科研主体的演化稳定策略

3.1.1 科研主体1的演化稳定策略

对于科研主体1而言,其选择共享数据的期望收益U11、选择不共享数据的期望收益U12以及平均期望收益分别为:

3.2 求解两个科研主体的演化稳定策略

(1)当科研主体1与科研主体2分别处于情况一1与情况一2时,即且h2μ2θ1λ1-h2μ2θ1+h2μ2n1

(2)当科研主体1与科研主体2分别处于情况一1与情况二2时,即h2μ2θ1λ1-h2μ2θ1+h2μ2n1x*时,选择轨迹将趋于共享(D点),但x的逐渐变化会对科研主体2的选择产生一定影响,直到x

(3)当科研主体1与科研主体2分别处于情况二1与情况一2时,即当且时,对于任意的0y*时,科研主体1的选择轨迹将趋于共享(C点),当y的取值逐渐降低时,科研主体1选择共享数据的概率也逐渐降低,直到y

(4)当科研主体1与科研主体2分别处于情况二1与情况二2时,即当且 时,系统要经过一段时间才能达到稳定状态。如图4所示,系统的5个局部均衡点中,A点与C点为系统的演化稳定点,B点与D点为不稳定点,E点为鞍点。折线(D-E-B)可以看成是系统收敛于不同状态的临界线,当科研主体的初始状态位于折线左下方的区域时,系统将逐渐收敛于稳定点A(0,0),此时演化稳定策略ESS为(不共享,不共享);当科研主体的初始状态位于折线右上方的区域时,系统将收敛于稳定点C(1,1),此时演化稳定策略ESS为(共享,共享)。因此,博弈双方最终的演化稳定策略将取决于临界点E的位置,即E点的大小,当E,越小时,四边形BCDE的面积越大,科研主体选择数据共享的概率越大,反之越小。

3.3 演化博弈结果分析

基于演化博弈分析我们得出,科研协同中数据安全共享行为最终既可能稳定于策略(不共享,不共享),又可能稳定于策略(共享,共享),而只有科研主体1与科研主体2分别处于情况二1与情况二2时,才有可能实现(共享,共享)。从图4中可以发现,图形ABED的面积(用S1表示)代表博弈双方均选择不共享数据的概率,图形BCDE的面积(用S2表示)代表博弈双方均选择共享数据的概率,而鞍点,的位置将决定S1与S2的大小。因此为探讨博弈双方的策略选择概率以及相关参数值的变化对博弈双方选择的影响,需要对鞍点E中的相关参数进行数值仿真。

4 数值仿真

为进一步说明上述参数对科研协同中数据安全共享行为的影响,本文运用Matlab软件对相关参数进行数值仿真,定量分析参数对博弈均衡策略的影响。考虑到本文所涉及的博弈参与主体为对称的两名科研人员,因此参数赋值时保持博弈双方一致,如表2所示。

(1) 数据共享度对科研协同中数据安全共享行为的影响。保持其他参数不变,科研主体的数据共享度μ1、μ2取值从0.2增加至0.4时,x与y的复制动态曲线均明显向左偏移,即博弈收敛于(1,1)的稳定速度加快,说明μ1、μ2的取值越大,科研主体双方向数据共享策略演变的速率越大,如图5所示。由此我们得出科研主体的数据共享度显著正向影响科研协同中的数据安全共享行为。

(2)直接收益系数、协同收益系数、激励收益系数对科研协同中数据安全共享行为的影响。①保持其他参数不变,当数据共享的直接收益系数θ1、θ2的取值由初始值6增加至8时,x与y的复制动态曲线均明显向左偏移,博弈收敛于(1,1)的稳定速度加快,表明数据共享的直接收益系数增大后,博弈双方选择数据共享的概率增大(如图6);②当协同收益系数λ1、λ2的取值由初始值4增加至6时,x与y的复制动态曲线也明显左移(如图7);③当激励收益系数α1、α2的取值由初始值2增加至4时,x与y的复制动态曲线也明显左移(如图8)。模擬结果表明,直接收益系数、协同收益系数、激励收益系数越大,博弈收敛于(1,1)的速率越快,向共享策略转变的速率越快。因此,科研主体数据共享的直接收益系数、协同收益系数、激励收益系数正向推动博弈双方选择共享策略。

(3)数据关联度、数据推断力对科研协同中数据安全共享行为的影响。①数据关联度i1、i2由初始值0.3增加至0.38时,保持其他参数不变,博弈演化过程如图9所示。当i1、i2取值为0.3时,博弈结果逐渐向1推演,而当i1、i2小幅度增加至0.38时,曲线便逐渐向0推演,表明当博弈双方数据之间的关联度越大时,鞍点值越大,BCDE的面积就越小,博弈双方选择共享的概率就越小。②数据推断力j1、j2由初始值2增加至2.5时,博弈演化过程如图10所示。由此我们得出数据关联度、数据推断力显著负向影响数据共享行为。

5 科研协同中数据安全共享策略分析

通过数值仿真结果可知,数据共享的直接收益系数、协同收益系数、激励收益系数以及数据共享度、数据关联度、数据推断力是影响数据安全共享的关键因素。结合相关参数的变化仿真图,提出科研协同中数据安全共享的“三位一体”策略体系,即“数据驱动策略-效益驱动策略-风险规避策略”。

5.1 数据驱动策略

数据驱动策略主要通过提高数据共享度以促进科研主体进行数据共享方面展开:(1)定期开展数据对话,通过交互讨论的方式分享数据共享优势、交流数据共享经验、探讨数据安全共享知识,根据科研进程需要以及数据对话情况确定合理的数据共享水平,一方面缓解科研人员数据共享的“邻避效应”,另一方面在保护共享数据安全的基础上增进科研协同合作。(2)在科研协同实践中,科研人员的“隐性心理感受”对其数据共享意愿具有重要影响。因此,要增强团队意识,积极营造相互信任、相互支持的科研氛围,在数据交互的基础上建立长效性的科研沟通和数据交流机制,增强科研人员的团队认同感,减少机会主义行为,推动数据的安全共享利用。(3)通过合理的存储库、既定的操作标准以及相关技术支援等途径降低数据资源共享利用的门槛、提高数据共享利用过程中的安全指数,以减少技术因素对科研人员数据共享意愿的影响,实现数据资源共享利用的规范化与安全化。

5.2 效益驱动策略

效益驱动策略主要从数据共享收益角度展开,具体措施为:(1)提高数据共享的直接收益:①在科研协同过程中建立学习型团队,形成相互学习相互帮助的科研学习氛围,提高数据吸收能力和数据转化效率,促进数据之间的吸收转化;②科研人员应努力提高数据素养,加强数据资产管理、强化数据安全防范意识、培养以数据为基础的精确管理意识,加强对数据的分析与利用能力,以提高数据共享的直接收益。(2)提高数据共享的协同收益:①加强信息交流合作互动,避免追求短期利益和一次性交易,重视未来预期,通过合作伙伴的关系资本发挥合作的长期收益和潜在价值,达成长期合作的交易规范或价值观;②科研协同过程中应建设阶梯型团队,形成跨领域、跨学科、交叉融合的科研协同小组,以减少一味的“单方向学习”或“搭便车行为”,促进数据之间的共享与互补利用,从而增加协同收益产出。(3)提高数据共享的激励收益:完善激励机制与奖励机制是激励个体进行数据共享行为最普遍的方式。具体的数据共享激励方式包括提供获得引用、列入共同作者等的“数据资产反馈”,还可以包括个人影响度和知名度的提高、潜在合作者增多以及获得资质认定或晋升资格等的“形象资产反馈”;此外,根据对科研协同进程的贡献度、努力程度、风险分担度与支持力度等给与科研人员差异化的优惠政策与补贴,以保证利益分配的合理性和公平性,以提高数据共享的激励收益。

5.3 风险规避策略

风险规避策略主要从降低数据关联度以及数据推断力方面展开,具体措施为:(1) 加强数据安全意识,必要时将显性数据进行隐性化表达,如通过独立研发场地以及黑箱作业等方式减少数据的暴露程度,增加数据的隐性度和复杂度,一方面降低数据关联度,另一方面增加“私有数据”或“核心数据”被推断利用的难度。(2) 建立和完善开放共享数据中的监督机制、约束机制、问责机制以及救济制度,在双方达成一致的基础上通过签订数据安全保护协议的形式加强数据保护,对侵犯数据安全的行为进行监督与追责,以期从源头上降低数据泄漏风险。同时建立完善的惩罚机制,如设置举报制度,第三方监管等,针对数据共享过程中出现的数据盗用、错用、误用、滥用以及搭便车行为进行相应的惩罚,以此形成数据安全共享上的上下合力。(3)科研人员应根据服务对象和数据接收方的保密等级提供相应等级的科研数据,既要保证数据传输安全、数据存储安全,也要注重版权保护,降低自身数据泄漏的风险,以防止数据泄密,由此形成数据安全共享的长效机制。

参考文献:

严炜炜,张敏.科研协同中的数据共享与利用行为模式分析[J].情报理论与实践,2018,41(1):55-60.

张聪丛,郜颍颍,赵畅,等.开放政府数据共享与使用中的隐私保护问题研究:基于开放政府数据生命周期理论[J].电子政务,2018(9):24-36.

JIROTKA M, LEE CP, OL SON G M. Supporting scientific collaboration: methods, tools and concepts[J]. Computer Supported Cooperative Work, 2013,22(4-6):667-715.

NEUHAUSER D. Sharing research data[J]. Medical Care, 1986,24(10):879-880.

BORGMAN C L,青秀玲.科研数据共享的挑战[J].现代图书情报技术,2013(5):1-20.

吴丹,陈晶.我国医学从业者科学数据共享行为调查研究[J].图书情报工作,2015, 59(18): 30-39.

段美珍,顾立平,赵昆华.2015-2016年国际开放获取相关政策与实践进展[J].图书情报工作, 2017, 61(18):19-28.

STANLEY B, STANLEY M. Data sharing: the primary researchers perspective.[J]. Law & Human Behavior, 1988,12(2):173.

ESTABROOKS C A, ROMYN D M. Data sharing in nursing research: advantages and challenges[J]. The Canadian journal of nursing research = Revue canadienne de recherche en sciences infirmières, 1995,27(1):77.

CHOKSHI D A, PARKER M, KWIATKOWSKI D P. Data sharing and intellectual property in a genomic epidemiology network: policies for large-scale research collaboration.[J]. Bull World Health Organ, 2006, 84(5):382-387.

趙培云.大数据与图书馆数据安全共享[J].图书馆学研究,2014(9):39-41.

张丽丽,温亮明,石蕾,等.国内外科学数据管理与开放

共享的最新进展[J].中国科学院院刊,2018,33(8):774-782.

张晓青,盛小平.国外科学数据开放共享政策述评[J].图书馆论坛,2018,38(8):147-154.

唐源,吴丹.国外医学科学数据共享政策调查及对我国的启示[J].图书情报工作,2015,59(18):6-13.

KIM Y, ADLER M. Social scientists data sharing behaviors: investigating the roles of individual motivations, institutional pressures, and data repositories[J]. International Journal of Information Management, 2015,35(4):408-418.

KIM Y, STANTON J M. Institutional and individual factors affecting scientists data‐sharing behaviors: a multilevel analysis[J]. Journal of the Association for Information Science and Technology, 2016,67(4):776-799.

张静蓓,吕俊生,田野.国外数据共享行为影响因素研究综述[J].图书情报工作, 2014,58(4):136-142.

张晋朝.高校科研人员科学数据获取意愿研究[J].情报杂志, 2013,32(6):70-75.

陈欣,叶凤云,汪传雷.基于扎根理论的社会数据共享驱动因素研究[J].情报理论与实践,2016, 39(12):91-98.

MAGUIRE S, FRIEDBERG J, NGUYEN M H C, et al. A metadata-based architecture for user-centered data accountability [J]. Electronic Markets, 2015, 25(2):155-160.

KARASTI H, BAKER K S, MILLERAND F. Infrastructure time: long-term matters in collaborative development[J]. Computer Supported Cooperative Work, 2010,19(3-4):377-415.

HORSBURGH J S, TARBOTON D G, MAIDMENT D R, et al. Components of an environmental observatory information system[J]. Computers & Geosciences, 2011, 37(2):207-218.

SCHWARTZ A, PAPPAS C, SANDLOW L J. Data repositories for medical education research: issues and recommendations.[J]. Rivista Di Politica Economica, 2008, 98(85):837-843.

商淑秀,张再生.虚拟企业知识共享演化博弈分析[J].中国软科学,2015(3):150-157.

刘晓婷,佟泽华,师闻笛.大数据时代科研人员数据共享演化博弈研究:信任机制视角[J].情报理论与实践,2019,42(3):92-100.

冀鸿,霍明奎.高校教师团队知识共享的演化博弈分析[J].情报科学,2013,31(5):142-146.

史浩,李健.大數据背景下私有信息泄露对供应链

成员企业竞合关系影响的研究[J].情报学报,2015,34(1):53-65.

刁丽琳,朱桂龙,许治.R&D合作中知识窃取和知识

保护的博弈分析[J].科学学与科学技术管理,2012,33(4):80-88.

猜你喜欢

数值仿真演化博弈
多自由度本船操纵运动仿真
农民工转户行为的演化博弈分析
电子商务中客户评价策略选择的演化博弈分析
公平关切下处理商与回收商博弈模型研究
地方政府不当干预对产能过剩的影响分析
关于资产证券化中信用评级行为的分析
基于VOF方法小型赛车燃油晃动数值仿真
信息不对称下企业投机行为的演化博弈分析
民用飞机水上迫降数值仿真研究进展
分析,自适应控制一个有乘积项的混沌系统