合作博弈视角下科学数据引用主体间的关系探析*
2019-02-14史雅莉赵雪芹
史雅莉 赵雪芹
(湖北大学历史文化学院,武汉 430062)
2017年12月—2018年3月,国家相继出台了《信息技术科学数据引用》国家标准和《科学数据管理办法》,从职责、科学数据采集、汇交与保存、共享与利用、保密与安全等方面对科学数据管理与共享进行规范[1]。科学数据的引用与传播是一项需要多方利益主体共同参与的系统性工程。国家各项标准及管理办法的出台对于各引用主体的行为规范将产生直接影响,期间涉及不同利益主体的协作与分工,这些问题的合理解决对于科学数据的传播与共享至关重要。
基于此,本文全面分析科学数据各引用主体的角色定位及利益诉求,据此构建各引用主体间的合作博弈关系模型,进而给出我国科学数据引用标准化的若干建议,以期为我国科学数据引用管理实践提供借鉴和参考。
1 合作博弈理论概述及适用性分析
合作博弈又称联盟博弈,最初由VoNeumann和Morgenstern于1994年在著作《博弈理论与经济行为》中提出。它是指大家为了共同的目标而一起行动,即每个局中人都将其他局中人当作自己的合作伙伴,追求总体利益和单个利益的最大化,共享信息、签订协议、建立联盟,最终达到利益共赢[2-3]。历经多年演变发展,除政治学、经济学外,合作博弈模型逐渐在包括管理学在内的其他研究领域得到广泛应用。
数据引用过程中各方利益主体之间存在相互协作的关系,需要共同完成数据生命周期内相应环节的工作任务,才能实现科学数据资源的有效传播和共享。该过程符合合作博弈模型的理论建构规律:假设引用过程中各行为主体组成联盟S,特征函数v(S)即为集合S的行为人无须求助于其他行为人所能产生的效用总量。数据引用的目的则是各联盟成员(引用主体)秉承各自利益诉求的同时相互协作,使得特征函数v(S)达到帕累托最优(科学数据引用效益最大化)。基于此,本研究采用博弈论中求解多方合作博弈的方法,从效益最大化的角度分析数据引用利益相关主体之间的关系,确立各方利益诉求及其对v(S)的影响;从中得出合乎各引用主体个体理性和集体理性的效益分配方案,提出尽量合乎各方利益诉求的科学数据引用标准化实施建议。
2 科学数据引用主体的角色定位
2.1 科学数据引用主体的角色识别
科学数据引用工作的推进是一项系统化工程,期间涉及一系列工作流程。以我国科学数据引用国家标准《信息技术科学数据引用》的实施为例,从工作流设计的角度来看,应包括标准规范的发布、出版、宣传推广、实施细则制定、用户培训、技术维护、实施效果评估、标准版本更新等。各环节之间存在紧密联系,缺一不可,形成一个从发布出版、运行维护、修订与完善到发布出版的演进工作流(见图1)。
图1 我国科学数据引用标准实施流程图
根据上述工作流设计,结合已有研究成果,笔者将科学数据引用标准实施中的责任主体归纳为7类。
(1)终端用户。从广义上讲,科学数据引用标准的用户包括执行者和终端用户两种,在此主要探讨终端使用者[4]。笔者将终端用户界定为科学数据的直接使用者,如高校科研人员、智库团队、数据分析师等。终端用户既是科学数据的创建者,又是科学数据的引用者和传播者。就科研人员而言,其在科学数据引用标准实施过程中的主要责任为:标准使用的主要群体,在科研活动中收集或创造科学数据,对其进行描述、组织并上传至数据中心,进行传播与重用[5];同时,会对标准及其实施细则的实践效果进行反馈。
(2)科研教育机构。①高校图书馆,在我国科学数据引用标准的实施过程中扮演着重要角色。一是宣传推广阶段,可借助图书馆技术平台对用户进行标准规范的普及;二是实施细则制定阶段,可与其他机构协作制定本校科学数据引用细则,增强标准适用性;三是培训教育阶段,可培养用户数据引用意识、协助用户创建数据引文等。②数据档案馆,是科学数据引用标准的执行主体之一,所承担的责任与高校图书馆类似,具体包括标准的宣传推广、实施细则制定和发布,以及用户数据引用意识的培养等。③数字人文中心,是从事数字人文研究或教育的学术机构,其将数字技术、工具和平台等运用于社会人文问题的研究和解决。它是科学数据的生产者兼使用者,在科学数据引文创建和标准规范的宣传推广方面能够发挥重要作用。
(3)数据存储机构。①数据中心,是科学数据引用标准实施的主要责任主体之一,负责数据引用规范的执行、用户培训及引文格式的推荐等。②科研数据机构库及其联盟组织,该机构在科学数据引用标准推广实施中倾向于通过完善数据引用规则,规范数据引用和传播,实现机构库平台的有效运行;同时,借助平台优势进行系统开发,实现数据引文的自动化创建。
(4)出版及版权管理机构。①标准出版机构,依法享有我国国家标准、部分行业标准的专有出版权[6],在我国科学数据引用标准实施中主要负责标准及其更新版本的出版发行工作,以保证标准的质量及时效性。②数据出版机构,包括具有编目性质的科学数据库(GenBank),兼具数据论文出版的期刊出版社(Nature),期刊与数据中心联合互动的数据管理机构(Dryad),以及专门的数据出版机构(全球变化科学研究数据出版系统)[7]。该机构可根据实际情况制定引用细则,借助自身影响力及对用户的引导力和约束力直接促进引用标准的推广实施。③版权管理机构,对科学数据引用传播中的作者隐私保护等问题的解决发挥主导作用,为科学数据引用标准化工作的开展提供法律保障,保证标准的持续性和有效性。
(5)政府职能部门。①政府发布机构,国家及地方各级政府发布机构是标准的主要发布机构,应准确、实时地发布标准内容及相关倡议,推动标准贯彻落实。②公共资助机构,为科研活动提供经费支持的相关政府部门或机构,是科学数据生产的主要资助机构[8],其在科学数据引用标准的宣传推广、监督执行及实施效果评估等方面发挥重要作用。③标准评估组织,由政府职能部门牵头或主持,行业或科研实践团体组成,主要负责标准实施效果的评估和预判,以便调整工作重点,更好地规划标准实施工作。
(6)数据库商及商业咨询机构。①数据库运营商,致力于向机构或个人提供信息搜索的专业服务,主要提供各种统计数据、文献、书目和期刊数据等[9]。其主要参与标准及其实施细则的宣传推广、机构及个体用户的培训等。②数据库开发商,专门从事数据库管理系统和应用软件设计研发的机构或个人。参考文献管理软件及平台的设计、科学数据引用系统的开发将成为该机构的重要工作内容。③商业咨询机构,面向企业、社会公众等提供决策咨询服务,数据咨询是其核心业务。该机构可向客户普及操作规范,同时执行科学数据引用标准,创建数据引文,扩大标准适用范围。
(7)其他非营利性组织。①行业机构,介于政府与企业之间、商品生产者与经营者之间,并为其提供咨询、监督、公正、协调的社会中介组织[10]。行业机构及其协会组织是科学数据引用标准的践行者,其可在标准的宣传推广、用户培训、实施细则的制定等方面发挥重要作用。②民间调查组织,主要针对某一研究主题或社会现象开展调查研究工作并组织形成相关研究成果,如调研报告、评估手册等。在引用标准实施中可协调促进标准的宣传推广、科学数据引用格式的使用及实施效果的调查评估等。
2.2 不同主体间的责任分工
基于上述分析,笔者将各责任主体的权责关系嵌入我国科学数据引用标准实施流程,明确科学数据引用主体间的责任分工(见表1)。需指出的是,虽然不同机构或部门所承担的任务不同,但很多工作流程的完成需要不同部门协作参与,从而形成一种既有分工又有协作的合作关系。
表1 科学数据引用主体间的责任分工
3 各引用主体间的合作博弈关系分析
3.1 不同责任主体的利益诉求
通过对《信息技术科学数据引用》国家标准实施行为主体分析不难发现,科学数据引用中各行为主体既是科学数据引用与传播的责任主体,也是数据引用规范化的利益相关者。只有明确各责任主体的利益诉求及其之间的合作关系,才能更好地推进科学数据的引用和共享。笔者对科学数据引用过程中各责任主体及相关代表机构的利益诉求进行了总结和归纳(见表2)。需指出的是,笔者对科研人员和终端用户的区分是仅从科学数据创建与使用两个不同角度进行界定。在科学数据的实际创建和使用过程中,二者不作概念区分,科研人员和终端用户都是科学数据的创建者和使用者。
对于作为终端用户的科研人员而言,在现有科研评价体系下,其更看重数据成果的科研绩效转化问题,合理引用和对数据成果的版权保护显得更加重要。与此同时,科研人员也希望能够通过引用更加方便地获取所需要的数据资源。高校等科研教育机构更加注重本单位数据资源的保存和使用,发挥科学数据的学术研究和社会价值,更好地服务于教研工作。数据中心、科研数据机构库等数据存储机构期望通过完善的引用规则系统管理机构数据资源。出版及版权管理机构期望通过引用追踪数据使用轨迹,明确版权所有者,同时完善行业标准,规范传播数据。政府职能部门旨在推动科学数据引用的标准化,最大化地实现科学数据的社会效益。数据库商及商业咨询机构以数据商业价值的实现为目的,强调通过规范引用实现自身数据资源的有偿共享。行业机构、民间调查组织等非营利性组织则更多地关注数据的可获性,通过获得的数据解决实际问题。
表2 各责任主体及其代表机构的利益诉求
3.2 效益驱动下的合作博弈关系模型
科学数据引用的各责任主体及其代表机构在利益诉求方面既存在差异又存在共同之处。通过对各责任主体间的利益合作与博弈关系的分析发现,由四个博弈点组成六组利益博弈关系,这四个博弈点分别为科学数据的开放获取、公共资助数据成果效益的最大化、科学数据的产权保护、科学数据商业价值的实现。科学数据的开放获取与科学数据的产权保护、公共资助数据成果效益的最大化与科学数据商业价值的实现是六组利益博弈关系的主轴关系。科学数据开放获取与公共资助数据成果效益最大化、公共资助数据成果效益最大化与科学数据产权保护、科学数据产权保护与数据商业价值的实现、科学数据商业价值的实现与科学数据的开放获取为显著相关关系(见图2)。
具体而言,每组关系均对应不同的责任主体及其行为。科研教育机构、终端用户和数据存储机构更加倾向于科学数据的开放获取,而科研人员和数据出版及版权管理机构则更加关注科学数据的知识产权保护;政府职能部门和其他非营利性组织更加倾向于实现公共资助数据研究成果效益的最大化,而数据库商和商业咨询机构则更加追求科学数据商业价值的实现。除上述两组主轴利益博弈关系外,公共资助数据成果效益的最大化与科学数据知识产权保护、科学数据知识产权保护与科学数据商业价值的实现、科学数据商业价值的实现与科学数据的开放获取,以及科学数据的开放获取与公共资助数据成果效益的最大化之间也存在直接或间接的博弈关系。如公共资助数据研究成果效益的最大化应受版权保护法的约束,而科学数据版权保护的最终目的又是实现数据研究成果效益的最大化。这四组关系的协调与平衡对主轴关系具有直接或间接影响。因此,在我国科学数据引用与共享过程中,各责任主体间的既合作又竞争的关系形成一种合作博弈局面,进而对责任主体间的相互合作与协调分工提出了更高要求。
图2 责任主体间的利益合作博弈关系模型
4 对科学数据引用实践的若干建议
4.1 明确政府职能部门在数据引用中的主导地位
政府职能部门是科学数据共享效益最大化的主要推动者,对于社会发展而言,政府数据资源是社会数据资源的主体,很多项目都是依靠政府资助完成的。在我国,科学数据引用工作的持续推进离不开政府部门的支持。一方面,应借助政府职能部门发布并执行科学数据管理办法及引用标准,规范广大数据使用者的引用行为,促进科学数据的合理传播;另一方面,科学数据引用及共享工作的开展需获得来自政府公共资助机构(国家科学基金、教育部科技发展中心等)的持续经费支持,确保人力、物力、财力的有效投入。同时,政府评估组织对于科学数据引用实践成效的检验及评估也是必不可少的。因而,在这场由各引用主体组成的合作博弈中,政府职能部门始终应发挥全局性的主导作用。
4.2 兼顾商业机构数据产品经济效益的适时转化
当前大数据环境下数据库商、商业咨询机构等营利性组织在产品开发及服务运营过程中会产生大量有价值的数据资源。在数据引用及共享过程中,与政府职能部门不同的是,这部分责任主体在追求科学数据共享效益最大化的同时,也期望其数据产品的商业价值得到实现。因此,根据合作博弈理论中各方利益帕累托最优原则,要想充分实现全社会范围的科学数据共享,除了要发挥政府职能部门的主导作用外,还要兼顾商业机构数据产品经济效益的适时转化,激发其在科学数据引用过程中的主动性、积极性[11]。这样还可在一定程度上激励数据库商进行技术创新,为科学数据引文创建的自动化提供技术支撑。
4.3 注重数据研究成果在科研评价中的量化呈现
目前,虽然社会数据资源呈现爆炸式增长态势,但高质量的数据研究成果是科学数据引用与共享的核心,承认数据创建者的学术贡献并给予其相应激励是推动科学数据引用及共享的内在动力。科研教育机构及广大科研工作者在科学数据引用及共享过程中发挥至关重要的作用(如生产数据、执行数据引用标准、宣传培训等)。对于该部分责任主体,数据研究成果能否转化为本单位或个人在组织中的科研绩效显得尤为重要。只有将数据研究成果纳入现有科研评价体系,才能调动科研教育机构及科研工作者的工作热情;从源头上解决数据的产出和质量问题,才能进一步促进科研创新。因而,完善现有科研评价体系,量化数据研究成果的科研绩效是实现科学数据引用与共享的必要条件之一。
4.4 强化科学数据引用与传播中的版权保护意识
由于科学数据在引用与传播过程中其版权主体在很多情况下会发生转移,因而版权保护就成为一个涉及多方利益主体的复杂问题,该问题的解决对于数据有效共享具有重要意义。对于数据创建者而言,其在诉求数据获取便捷的同时又希望自身数据成果的版权得到保护。对于出版机构及数据库商而言,很多数据成果或作品在出版传播过程中,版权通常会是其竞相追逐的一项重要内容,大多情况下是以版权转让协议等方式从作者手里发生转移,从而确立这些机构在数据使用中的主动权。所以,在科学数据引用中我们强调的版权保护意识包含两个层面的含义:一是提倡广大用户在引用他人数据成果的过程中要明确数据来源,严格遵守相关标准,规范自身引用行为;二是数据创建者要增强自身版权保护意识,重新审视版权转让问题,妥善处理与出版机构及数据库商的版权关系。