APP下载

科研人员数据共享意愿的影响因素研究

2021-04-02郑琳

现代情报 2021年4期
关键词:数据共享Meta分析科研人员

收稿日期:2020-05-14

作者简介:郑琳(1990-),女,讲师,博士,研究方向:信息资源管理、信息法规与政策。

摘要:[目的/意义]对现有科研人员数据共享意愿影响因素研究进行系统评价,明确不同影响因素的具体作用,解决当前研究结果混杂、相悖的问题,根据研究结论探讨提升科研人员数据共享意愿的有力措施。同时,探索Meta分析方法在图情领域的应用,丰富本领域研究方法与视角。[方法/过程]梳理相关理论和研究,提出研究问题和假设,采用Meta分析方法,以科研人员数据共享意愿影响因素为因变量,从18篇纳入文献中提取具体效应值并进行整合分析,验证研究假设并对研究结论做出解释。[结果/结论]主观规范、感知收益和感知易用性正向影响科研人员数据共享意愿,年龄、感知成本、感知风险负向影响科研人员数据共享意愿。当前研究存在研究数量较少,对科研人员数据共享行为和意愿过程了解不够深入的问题。

关键词:科研人员;数据共享;开放数据;影响因素;Meta分析

DOI:10.3969/j.issn.1008-0821.2021.04.008

〔中图分类号〕G203〔文献标识码〕A〔文章编号〕1008-0821(2021)04-0069-10

Factors Influencing Researchers Intention of Data Sharing

——Based on Meta-analysis Method

Zheng Lin

(School of Social Development,Yangzhou University,Yangzhou 225008,China)

Abstract:[Purpose/Significance]This Paper evaluated existing research on factors of researchers data sharing intention systematically,in order make sure the specific role of different influencing factors and to solve the mixed and contradictory problems of current research results.Meanwhile,the paper explored the application and value in LIS,which aims to enrich methods and perspectives in LIS research.[Method/Process]By analyzing related theories and papers,the paper came up with research questions and hypotheses,then the paper extracted effect values from 18 including researches in order to carry out a comprehensive analysis,in order to verify research hypotheses and explain research conclusions.[Result/Conclusion]The study showed that subjective norms,perceived revenue and perceived usability had positive effect on researchers data sharing intention,age,perceived effort and perceived risk had negative effect on researchers data sharing intention.Currenthy,researches ignored the correct procedures of research data sharing.

Key words:researcher;data sharing;open data;influencing factors;Meta-analysis

科學研究已经进入到第四范式阶段。在互联网技术和信息技术的推动下,科学研究从自然到社会,从宏观到微观层面的观察、感知、计算、模拟等活动正不断产生海量的科研数据,这些数据不仅能够作为科学研究中新型的科学基础设施,更为科学研究带来了新的研究视角、方法和工具,从根本上重塑了科学研究的范式。与此同时,由于科研数据共享不仅在丰富科学研究的原材料方面具有重要意义,还能够在打通科研交流屏障、科研结果验证等方面发挥重要作用,因而,当前的科研人员开始变得不仅关注一项科学研究的最终成果,还关注该科学研究实施过程中应用的科研数据资源甚至是数据共享保障及行为研究。已有研究表明,多种因素可能影响科研人员的数据共享行为和意愿[1-3],但是由于不同研究在对象、平台、方法以及情景等方面有所区别,其最终的研究结论也会出现差异甚至相互矛盾的情况。Meta分析方法能够以定量的方式对现有研究成果进行再综合,是当前对二次数据进行系统分析、明确不同影响因子的影响方向与程度的较为常见的方法。鉴于此,本文采用Meta分析研究方法,通过对现有相关研究数据加以提取并整合,以探明本文的主要研究问题:现有科研人员数据共享意愿研究中所提出的不同影响因素的具体作用到底为何?围绕这一研究问题,本文围绕下述3个方面制定了研究思路。首先,系统梳理相关研究进展,探索性地提出科研人员数据共享意愿影响因素的研究假设;其次,应用Meta分析方法对现有研究结果进行定量、系统的整合,分析不同影响因素的合并效应值并开展讨论;最后,明确现有研究存在的问题及未来可供研究的方向,审视本文的创新和不足之处,为后续相关研究提供可供参考的借鉴。

1理论基础、相关研究与研究假设

纵观现有科研人员数据共享意愿及影响因素的研究,从研究类型上看,主要采取了实证研究,但是对于具有普适性解释效力的影响因素尚未达成一致。从研究方法上看,主要采用了截面数据研究的方式,通过问卷、访谈等方式测定被试科研人员的数据共享意愿及影响因素。从研究的理论基础上看,主要采用了计划行为理论(Theory of Planned Behavior,TPB)和制度理论(Institutional Theory,IT)。其中,计划行为理论的源头为1963年Fishbein和Ajzen联合提出的多属性态度理论,后经修正发展为理性行为理论(Theory of Reasoned Action,TRA),并最终于1991年完成对模型的进一步扩展,提出计划行为模型[4-5]。计划行为理论认为意愿会直接影响主体的行为选择,而主体的意愿又会受到主观规范、感知行为控制以及态度的共同影响。在计划行为理论基础之上,现有研究提出了一系列可能的科研人员数据共享意愿影响因素,包括感知收益、感知风险、感知易用性等[6-9]。制度理论由Scott W R于2007年提出[10],与计划行为理论主要关注行为个体层面的影响因素不同,制度理论扩大了研究视角,增加了外部制度和环境压力对行为主体意愿所产生的影响,因而被广泛应用到主体行为意愿的研究当中。基于制度理论,现有研究认为组织规范、制度规范等外部环境因素也会影响科研人员的数据共享意愿[11-13]。除上述理论模型外,还有研究从个体特征角度对科研人员的数据共享意愿进行探讨,指标涵盖年龄、性别甚至性格特征等[14-16]。基于上述梳理,结合科研人员对数据共享接受行为的内在作用机制,并借鉴现有研究提出的影响因素划分标准[7,17],本文将科研人员的数据共享意愿影响因素划分成6个维度:个体特征、主观规范、感知收益、感知成本、感知易用性以及感知风险。

1.1个体特征

科研人员个体特征层面的差异可能会影响其数据共享意愿,这些个体特征包括年龄、性别以及性格等。①年龄。科研人员的年龄反映其所处研究生涯的不同阶段,进而可能影响不同阶段下科研人员对于数据共享行为的接受意愿和心态。针对这一问题,2014年Eynden V V D等的研究认为,科研人员的年龄会正向影响其数据共享意愿[18],Linek S B等的研究也证实了这一观点[16]。而Ostaszewski M、Amos H等的研究则认为科研人员的年龄与其数据共享意愿呈负相关关系[15,19]。②性别。2011年,Tenopir C等的研究认为,相较于男性,女性对新事物的接受态度更为谨慎和保守,因此女性科研人员可能更不愿意共享其科研数据[20]。2015年,Mai H O等的研究采用定量的方式证实上述猜想,提出性别会显著影响科研人员的数据共享意愿[21]。③性格。科研人员的性格开放程度、乐观程度、冒险程度等特征可能会影响其数据共享意愿,鉴于此,2017年Stephanie等人的研究采用大五性格测试、黑暗三性格测试和社会期许量调查了受测者的科研数据共享意愿,发现科研人员的开放度、社会期许度与数据共享意愿呈正相關,而黑暗三性格得分则与数据共享意愿呈负相关。通过上述分析可知,科研人员的个体特征可能影响其数据共享意愿,因而本文将个体特征项纳入Meta分析效应值范畴,又由于Meta分析要求效应值个数大于或等于3,当前关于科研人员性别和性格对数据共享意愿研究的数量较少,不符合这一标准,故排除。基于此,本文仅将年龄纳入研究范畴,并提出如下假设:

H1:年龄对科研人员的数据共享意愿具有正向影响。

1.2主观规范

主观规范是行为主体就是否要采取某一行动而感受到的社会压力,是评估行为意愿最为重要的指标之一。现有研究认为主观规范对科研人员的数据共享意愿有正向影响,但是关于该指标的影响度及解释力并不统一[7,22]。关于主观规范的作用力到底如何,已有研究通过量化的方式证明,当主观规范对行为主体意愿呈正向影响时,其影响力最弱,而当其影响为负向时,主观规范的影响力则十分显著。鉴于此,为量化并明确主观规范对科研人员数据共享意愿的真正影响,本文提出如下假设:

H2:主观规范对科研人员的数据共享意愿具有正向影响。

科研数据共享浪潮下,许多机构与组织都出台政策以促进科研人员共享数据,包括科研人员所处学术机构、学术期刊以及学术委员会、基金会等,仅以主观规范对上述不同组织的规范效力进行笼统量化似乎过于局限。因此,部分研究选择在理性行为理论的基础上结合制度理论,将主观规范细化并拆解为不同的子因素进行衡量,包括来自期刊的规范压力,来自基金的规范压力以及科研人员所处组织内的规范压力[14,23]。鉴于此,本文将假设2进一步拆分,提出如下子假设:

H2-a:期刊规范对科研人员的数据共享意愿具有正向影响。

H2-b:基金规范对科研人员的数据共享意愿具有正向影响。

H2-c:组织规范对科研人员的数据共享意愿具有正向影响。

1.3感知收益

感知收益是行为主体根据已有信息,对采取行动后所能获得的回报做出的心理预期,这种回报可能来自直接的利益回馈,也可能来自社会声誉的提高,甚至还可能仅体现于自我满足感的层面。2016年,孙晓燕对社会科学研究人员的调研显示,感知收益对科研人员的数据共享意愿有显著的正向影响作用,并且可以减少来自感知风险层面的负面影响,促进科研数据共享[23],英国Wellcome基金会的调查报告也显示,论文被引量和学术声誉是科研人员愿意共享数据的主要原因[24],2019年,包秦雯等通过对地球科学领域科研人员进行调查,进一步支持了上述观点[22]。鉴于此,本文提出如下假设:

H3:感知收益对科研人员的数据共享意愿具有正向影响。

1.4感知成本

感知成本是行为主体对采取某一行为可能付出的时间、精力以及智力等成本的心理预期。近年来,随着科研数据共享的不断平台化,其共享过程也变得更加规范化,数据的共享不再局限于简单的分享或上传,而是涉及到不同学科和领域数据的细分、对数据类型及格式等进行标准化处理,甚至还需要对数据的获取、保存、处理以及共享方案进行详尽描述。即使是那些不经过平台的私人数据共享和交流行为,为了保证数据安全和隐私性,也需要对数据进行脱敏等一系列操作。上述对数据的处理势必需要科研人员付出大量的时间、精力和智力成本,而科研人员又是较为繁忙且珍视时间和精力成本的一个群体,因此,其所感知到的来自时间、精力等方面的压力很有可能对其科研数据共享的意愿产生负面效果,进而阻碍其数据共享行为。鉴于此,本文提出如下假设:

H4:感知成本对科研人员的数据共享意愿具有负向影响。

1.5感知易用性

感知易用性是行为主体所感受到的,使用一个系统的容易程度。科研数据共享的平台化使得科研数据的共享行为可以看作是科研人员与数据共享平台交互作用的一个结果,平台的友好程度、界面设计等都会直接影响用户体验,进而影响科研人员的数据共享意愿[25]。2013年,Ostaszewski M向超过24 000位波兰学者发放问卷,对回收的849份有效问卷进行分析发现,有21%的科研人员认为缺乏合理的存储库将抑制其数据共享意愿,另有20%的科研人员认为缺少既定的平台操作标准是其不愿共享科研数据的主要原因[26]。Knowledge Exchange于2014年的研究对22名来自不同学科的科研人员进行了调查,认为好的基础设施将提升科研人员的数据共享意愿[21]。2015年,Kim Y等综合采用计划行为理论和制度理论构建了理论模型,探索科研数据共享平台/数据仓储的可获得性和可用性对科研人员数据共享意愿的影响,发现二者相关性为0.309,影响作用非常显著[27]。鉴于此,本文提出如下假设:

H5:感知易用性对科研人员的数据共享意愿具有正向影响。

1.6感知风险

感知风险是行为主体对采取行动可能带来的负面结果的预判。与普通的知识共享或信息共享不同,科研数据的共享不仅带有非常明显的数据丧失和科研竞争色彩,还会涉及到数据的敏感性、数据被错误解读等问题。2011年,普渡大学图书馆对学校户外水质观测站的6名博士研究生的数据共享态度进行了调查,发现竞争成本对科研人员的数据共享意愿有着非常明显的负面影响[28],其于2011年的另一项针对3 000多名科研人员的调查研究结果显示,出于竞争的考虑,有25%的科研人员希望在项目结束后再共享科研数据,甚至有5%的科研人员希望在退休后再共享科研数据[28]。2012年,Enke N等以德国的生物多样性研究人员为对象,随机选取了超过250位和超过3 000位科研人员进行访谈和网络问卷调查。结果表明有多达53%的人担心在数据共享的过程中失去对科研数据的控制权,另有31%的人担心自己的科研数据被不当使用从而得出错误结论[29]。鉴于此,本文提出如下假设:

H6:感知易用性对科研人员的数据共享意愿具有负向影响。

2研究设计

2.1研究方法

本文采用Meta分析方法。Meta分析也称为荟萃分析,最早源自费舍尔于1920年提出的“合并P值”的思想。1976年,统计学家Glass进一步將之发展为“合并统计量”,并首次将这种分析方法命名为Meta分析[30]。Meta分析的工作原理是对不同的纳入研究赋予不同的权重,进而计算最终的合并效应值。所谓效应值,就是反映研究变量或指标之间的关系程度或重要性的数值。与传统的质性文献综述相比,Meta分析不仅可以对研究结论进行定量估计,还可以解决单个样本规模较小的问题,提升研究的统计学检验效能。更为可贵的是,Meta分析并不仅局限于回顾以往的研究,还可以帮助发现既往研究的不足之处,回答单个研究所无法回答出的问题。尽管曾有研究质疑Meta分析是一种试图将苹果和橙子混为一谈的方法[31],但是不同学科对Meta分析的引入和应用已经证明其是一种有效且高质的研究方法:20世纪70年代,Meta分析首先被引入医学研究当中并大放异彩,之后,药学、教育学、生态学等学科纷纷引入Meta分析方法,获得了可喜成果。相较之下,图情领域对Meta分析的关注较晚,最早见于20世纪90年代:1993年,Trahan E撰文介绍了Meta分析在图情领域的应用前景,试图在本领域推广Meta分析[32]。1996年,Salang M M C采用Meta分析方法分析了信息需求与信息检索之间的关系[33]。之后,图情领域有关Meta分析方法的研究成果有所增加,但仍然罕见,且多集中在探讨Meta分析对本领域重要意义与价值等理论层面,实际应用不多。因而,本文选用Meta分析方法,一方面希望明确科研人员数据共享意愿的影响因素与作用,一方面也希望借此研究探索Meta分析在图情领域的应用价值,为后续相关研究提供有益借鉴,起到抛砖引玉的作用。

2.2文献检索与筛选

充分的文献检索能够最大限度地降低发表偏倚,是开展Meta分析的重要基石。本文分别在中国知网(CNKI)、万方数据库、Web of Science等数据库中使用3组检索词进行组配检索,这3组检索词分别是:①“科研数据”“科学数据”“研究数据”“学术数据”;②“数据共享”“数据开放”“数据获取”“开放获取”;③“意愿”“态度”“影响因素”以及上述检索词的对应单词,分别为①“Research Data”“Scientific Data”“Academic Data”;②“Data Sharing”“Open Data”“Data Open Access”;③“Intent”“Intention”“Will”“Willingness”“Attitude”“Influencing Factor”“Influencing Effect”等。为进一步保障纳入文献的全面性,本文同时采用滚雪球方式从目标文献的引文中进一步获取相关文献,最终共得到相关主题中英文文献40余篇。经过文献筛选,最终获得符合Meta分析标准的纳入文献18篇。文献筛选的标准如下:①剔除单纯论述性的文献,因为这一类型文献中没有可供提取的数据;②剔除重复发表、采用相同研究对象或样本的不同文献,仅保留质量较高的一篇;③剔除主观性强或表述不清的文献,保证研究结论可靠、高质。

2.3数据提取与录入

通过对纳入文献的详细阅读,同时基于本研究的研究假设,笔者在提取纳入研究效应量的同时,也请1位博士研究生同时开展纳入研究的数据提取工作,以确保数据提取的可靠性,通过一致性计算,Kappa值为0.960,说明对数据的提取过程是具有高度一致性的。数据提取标准如下:①由于同一效应值提取自不同文献,不同文献对于该效应值的表述有所差异,因此提取数据的过程中应对相同内涵但是不同称谓的效应值进行反复对照和确认,确保将相同效应值正确归类;②如由于研究方法不同导致不同研究中的同一效应值对应不同的上下位类,则应按照逐层取平均的方式进行合并比较;③Meta分析方法规定,出于对合并效应值代表性与说服力的考量,纳入效应值的个数应该大于或等于3,因此,本研究中剔除了那些效应量总数小于3的影响因素指标。提取出的效应值就是反应不同因素对政务社交媒体采纳具体影响的数值,具体到本文,主要就是指二者之间的相关关系r值。经过对18篇纳入文献进行编码与详尽阅读,本文最终提取了18篇纳入文献的编码表,如表1所示。

3结果分析与讨论

3.1异质性分析

不同納入研究之间可能会存在差异,也就是所谓的异质性。异质性产生的原因可能是研究对象不同所引起的,也可能是研究方法的不同导致的,而只有将这些纳入研究之间的差异调节至统一假设前提之下才能对其效应值进行合并处理。根据Meta分析,效应模型的选择要根据纳入研究之间的异质性决定:异质性小,使用固定效应值模型;异质性大,则使用随机效应模型。两种模型之间的不同在于,固定效应值模型假设不同研究结论的不一致是由于抽样误差导致,因而在赋予权重的过程中会主要考虑研究样本量的差异,而随机效应模型则允许不同研究之间的真实效应不同,除样本外还会综合考虑其他因素对研究结论的影响。固定效应模型的关注点仅局限在纳入研究范围内,而随机效应模型则试图通过对纳入研究的分析将结论推广到其所代表的总体中去。

反映异质性的数值主要有Q值、自由度df值以及I2。在Meta分析中,Q值可以被看作是不同纳入研究之间的观测变异,而自由度df则是期望变异的大小,Q值与df的差值就是不同纳入研究之间超额变异的大小。通过衡量超额变异的大小,可以帮助判断纳入研究之间的异质性。为了进一步衡量异质性程度,还可以参考I2的取值。I2代表着效应量总变异中异质性所占比重,根据Meta分析要求,I2值超过40,研究之间存在异质性;超过50即存在较大异质性;超过75则存在不可忽略的异质性。具体到本文,可以看到除感知成本变量外,其他变量的异质性均较高,不仅Q值大于df值,I2取值也较高。因此,本文中除感知成本外的变量都采用随机效应模型进行合并,而由于感知成本变量的I2取值为44.403,处于Meta分析异质性分区的临界值范围,因此本文同时选用固定效应模型和随机效应模型对该变量的合并效应值进行计算。实际上,在异质性很低的时候,两种效应模型所得出的结论是基本一致的,这一点从表2中感知成本变量在不同效应模型下的取值也能看出来。

3.2发表偏倚分析

有研究证明,那些报告较高效应量的研究相较于报告低效应量的研究更容易被发表,因而也更容易被纳入到Meta分析中。除此外,文献的语言、可获得性等原因也可能导致对纳入文献无法全部获取,这就是所谓的发表偏倚[34]。事实上,发表偏倚并不仅局限于Meta分析,它广泛存在于所有基于文献的研究方法之中。为计算纳入研究的发表偏倚,本文分别绘制了不同影响因素的漏斗图。一般而言,在效应值个数较少的情况下,可直接对漏斗图进行观测,通过观察纳入研究在漏斗图中的分布情况判断发表偏倚状况。如代表纳入研究的点在漏斗图中分布较为对称,则发表偏倚情况理想,反之,研究受发表偏倚的影响较大,不宜做Meta分析。在本文分别绘制的漏斗图中,不同影响因素的漏斗图分布情况均较为理想,可初步判断本研究不受发表偏倚影响。与漏斗图相比,失安全系数能够通过具体数值更加精确地反映研究的发表偏倚情况。所谓失安全系数,就是需要找到的、能够使研究结论逆转且尚未被发现的研究数量。失安全系数越高,则Meta分析结论的稳定性也就越高。关于失安全系数的标准,现有研究普遍采用“5k+10”的计算方法,即失安全系数应至少等于效应值数量的5倍再加10。

具体到本文,除年龄变量的失安全系数与标准有较小差距之外,其余变量的失安全系数均超过要求的标准,因而可认为本研究不受发表偏倚的影响。

3.3敏感度分析

现有关于Meta分析研究的检验分析一般只包含异质性和发表偏倚两种类型。实际上,一个标准、完整的Meta分析过程还需要对整体研究的敏感度进行分析。敏感度分析的目的在于检验研究整体的稳健性。其思路是通过改变效应量类型或者调整纳入效应值数量等渠道,观测调整后与调整前结论之间的差异。如果调整后的结论与调整前差异不大,则表明研究整体具有较强的稳定性。鉴于本文的纳入文献中可供提取的数据类型有限,本文主要采取第二种方式,即调整纳入研究的数量来测定研究的敏感度。具体思路为:分多次计算合并效应值,每次按顺序剔除一个纳入效应值,比较剔除前后合并效应值的变化情况。也就是说,假设效应值个数为k,则每次剔除1个效应值,用剩下的k-1个效应值计算合并效应值,并得出k个剔除后的合并效应值,与总合并效应值进行比对。在本文中,由于年龄一项只有3个效应值,剔除1个后不符合Meta分析关于纳入效应值最低数量的需求,因此年龄一项并未进行敏感度分析。其他影响因素的敏感度分析如表3所示。由表3可知,依次剔除单个效应值后的合并效应值与总合并效应值差距不大,敏感度分析达标。

3.4研究假设讨论

在表2中,点估计就是最终的合并效应值,而95%的区间估计则是效应值有可能的取值范围。根据Meta分析,如果置信区间经过无效线(取值范围内包括0),说明自变量对因变量的影响作用不仅可能取正、取负,也有可能取0,影响作用无法判断。具体到本文,年龄的合并效应值为-0.041,且95%的置信区间不经过无效线(-0.081~-0.002),P值等于0.039,说明年龄对科研人员数据共享意愿的影响会产生负面作用,年龄越大,数据共享意愿越低,且年龄对科研人员数据共享意愿的影响显著。这一结论与本研究最初的假设恰好相反,毕竟,本研究最初假设科研竞争会随着年龄的增加而减弱,进而对科研数据共享意愿产生正向影响。针对最终结果为负向影响,本文选择参考Amos H等的研究结论进行解释:与年长科研人员相比,年轻科研人员有可能会出于希望自己的研究方法、成果等被迅速认可,提升学术地位等原因,更愿意共享自己的科研数据[19]。与此同时,由于年龄一项的纳入效应值数量以及样本数量都较为有限,因此本研究建议这一结论仅做参考之用。

主观规范的合并效应值为0.424,且95%的置信区间不经过无效线(0.173~0.622),P值等于0.000,说明主观规范对科研人员的数据共享意愿具有正向影响,影响作用非常显著。这说明,通过内外部规范性压力的作用可以促进科研人员的数据共享行为。具体到主观规范下的3个子假设可知,期刊规范、基金规范和组织规范的合并效应值分别为0.152(95%置信区间0.051~0.250,P=0.003)、0.010(95%置信区间-0.040~0.0590,P=0.703)以及0.219(95%置信区间0.149~0.286,P=0.000***)。这说明,期刊的规定对科研人员的数据共享意愿有正向影响,影响作用显著。本文认为,这主要是因为在现有科研评估体制下,科研成果数量对科研人员的评价具有重要作用,而学术论文的发表带有强烈的买方市场色彩,这导致学术期刊具有很强的话语权,进而迫使科研人员共享出自己的科研数据。基金压力的置信区间经过了无效线,无法证明其对科研人员数据共享意愿的具体影响。在3个子假设中,组织规范对于科研人员的数据共享意愿影响最大,也最为显著,这说明要想促进科研人员的数据共享行为,最直接有效的渠道来自于科研人员所属机构内部。并且,现有研究也表明,科研人员在数据共享过程中会表现出较为明显的从众心理,看到自己周围的人都在共享科研数据,又或者感知到共享科研数据已经成为本机构、本领域内的一项约定俗成的习惯,都会提升科研人员的数据共享意愿[3,20]。

感知收益的合并效应值为0.232(95%置信区间0.145~0.315,P=0.000),说明科研人员对数据共享收益的预期对其共享意愿具有正向影响,影响作用非常显著。因此,可以通过给予科研人员一定回报的方式提升其数据共享意愿水平。这种回报既可以是经济方面的[20],也可以是社会声望方面的,还可以是数据引用、致谢以及数据获取权限方面的。尤其在数据获取权限方面,现有研究证明,科研人员在数据共享环节中往往伴随着数据需求[35]。因而,学术机构和数据共享平台可以考虑设立一个基于数据共享行为的数据获取权限制度,通过衡量不同科研人员的数据共享经历,评估其数据共享程度和质量,并为其赋予不同的数据获取级别,进而提升其数据共享意愿。

感知成本的合并效应值在不同效应模型下分别为-0.133(95%置信区间-0.155~-0.110,P=0.000)和-0.136(95%置信区间-0.170~-0.101,P=0.000),两者相差不大,说明感知成本对科研人员的数据共享意愿具有负向影响,影响作用非常显著。随着科研数据共享的规模化和标准化,共享过程中对数据的范化处理要求只会越来越高,因此,时间、精力以及智力上的成本付出不可能被消除,只可能被弱化。这就需要学术机构以及数据共享平台等方面尽量简化数据处理流程。结合感知易用性假设来看,其合并效应值为0.222(95%置信区间0.084~0.353,P=0.002),也说明数据共享过程中的操作以及数据共享平台的易用程度对科研人员的数据共享意愿具有非常显著的正向影响,简化数据共享标准、尽可能为科研人员提供充分的技术支援,都可以抵消来自感知成本层面的负向作用。

感知风险的合并效应值为-0.133(95%置信区间-0.208~-0.058,P=0.001),说明感知风险对于科研人员数据共享意愿具有负向影响,影响作用非常显著。鉴于此,可以通过降低科研数据共享的知识丧失和数据不当利用的风险来提升科研人员的数据共享意愿。可以考虑引入完善的数据共享时效机制,设置科研数据的禁锢期,同时通过对数据获取人身份以及数据用途的严格审核等方式来消除科研人员对数据不当利用可能带来的风险的顾虑。表4汇总了本文的研究假设验证结果。

4结论与讨论

本文利用Meta分析方法对科研人员数据共享意愿影响因素研究的结论进行了系统评价,发现主观规范、感知收益和感知易用性对于科研人员数据共享意愿呈正相关关系,年龄、感知成本、感知风险对于科研人员数据共享意愿呈负相关关系,从一定程度上解答了之前的独立研究所无法明确解答的问题。本文的另一个研究发现在于,在对纳入文献进行分析的过程中,发现现有研究对于影响科研人员数据共享意愿的因素认识仍不全面,造成这种不全面的原因在于现有研究的理论基础主要基于计划行为理论和制度理论,而上述两种理论更多关注于影响科研人员数据共享意愿的客观因素,对于主观因素,如科研人员的性格开放度、利他意愿程度等关注则相对较低。与此同时,现有研究倾向于将科研人员的数据共享行为和意愿看作是一个整体过程,却没有意识到科研人员的数据共享意愿可能受到先验经验的影响,其对初次数据共享效果的满意度将影响之后的持续数据共享意愿。因此,后续研究可以将上述两个共享阶段加以区分,探讨初次共享后对于不同影响因素的期望确认和满意度评估将如何作为调节变量去影响持续共享环节中不同影响因素的具体作用,并探索提升初次共享效果和满意度的有效方法。

本文的理论意义在于,本文从综合、系统、量化的角度对科研人员数据共享意愿进行再次评估,回答了独立研究无法回答的研究问题。与此同时,科研人员数据共享意愿及影响因素的研究本质上属于图、情报学科中信息行为领域的研究范畴,是数据时代下信息行为研究主题的新发展,具有重要的理论价值。本文的实践意义在于,明确不同影响因素的具体作用和程度能够为日后的科研数据管理和治理实践提供理论支撑,对不同影响因素的阐释可以为之后科研数据共享实践的推动提供有力的干预性手段。毕竟,科学研究的最终目的不仅在于解释真理,也应该回应现实需求的关切。本文也正是在意识到科研数据共享管理与治理任务纷繁与复杂性质的背景下,期望应用本领域知识与研究方法為现实实践提供理论支撑。

本文存在的一个研究不足在于纳入文献总量有待扩充,这主要是现有相关主题研究数量仍然较少的原因,并且,本文严格地纳入文献标准也进一步缩小了纳入文献的体量。不过,虽然Meta分析方法诞生距今已经数十年,但是Meta分析在不同学科的引入与应用仍处在进一步探索的阶段,在这一阶段下,关于Meta分析的纳入文献数量尚未有一个明确的观点,一般认为,研究问题的实际意义、样本量以及效应值个数等因素也可以部分抵消来自纳入文献数量方面的不足[36-37]。即使是应用Meta分析最为成熟的医学领域,对纳入文献数量的标准也尚未达成一致:2013年,我国学者马彬对国内外中医药Meta分析类研究进行评估发现,不同领域下发表的文章中,许多文章的纳入文献数量仅为十余篇甚至个位数[38]。因此,本文认为,严格的纳入标准、较为理想的样本量和研究问题的理论与现实意义将从一定程度上弥补纳入文献数量层面的不足。本文的另一个不足是年龄指标的纳入效应值数量较少,仅有3个。与此同时,由于相关研究数量较少,本研究仅解释了部分影响因素,诸如性别、地理位置、所在学科以及数据质量等因素都未被纳入研究范畴。后续研究可以在此层面进一步探索,构建影响科研人员数据共享意愿的全指标模型。

參考文献

[1]Oushy M H,Palacios R,Holden A E,et al.To Share or Not to Share?A Survey of Biomedical Researchers in the U.S.Southwest,an Ethnically Diverse Region[J].Plos One,2015,10(9):e0138239.

[2]Wicherts J M,Bakker M,Molenaar D.Willingness to Share Research Data Is Related to the Strength of the Evidence and the Quality of Reporting of Statistical Results[J].Plos One,2011,6(11):e26828.

[3]Ltd K P.Data Dimensions:Disciplinary Differences in Research Data Sharing,Reuse and Long Term Viability[J].Digital Curation Centre,2010.

[4]Ajzen I.From Intentions to Actions:A Theory of Planned Behavior[M].Action Control.Springer,Berlin,Heidelberg,1985:11-39.

[5]Ajzen I.The Theory of Planned Behavior[J].Organizational Behavior and Human Decision Processes,1991,50(2):179-211.

[6]Harper L M,Kim Y.Attitudinal,Normative,and Resource Factors Affecting Psychologists Intentions to Adopt an Open Data Badge:An Empirical Analysis[J].International Journal of Information Management,2018,41:23-32.

[7]Yuan H.Analysis of Main Influencing Factors of Scientific Data Sharing in Universities[J].Open Access Library Journal,2019,6(3):1.

[8]张晋朝.我国高校科研人员科学数据共享意愿研究[J].情报理论与实践,2013,36(10):25-30.

[9]余玲.科研人员科学数据共享意愿的影响因素研究[D].衡阳:南华大学,2016.

[10]Scott W R.Institutions and Organizations:Ideas and Interests[M].Sage,2008.

[11]Kim Y.Fostering Scientists Data Sharing Behaviors Via Data Repositories,Journal Supplements,and Personal Communication Methods[J].Information Processing & Management,2017,53(4):871-885.

[12]Kim Y,Stanton J M.Institutional and Individual Factors Affecting Scientists Data-sharing Behaviors:A Multilevel Analysis[J].Journal of the Association for Information Science and Technology,2016,67(4):776-799.

[13]Kim Y,Kim S.Institutional,Motivational,and Resource Factors Influencing Health Scientists Data-sharing Behaviours[J].Journal of Scholarly Publishing,2015,46(4):366-389.

[14]Sherline C P.Measuring the Norm of Reciprocity on Data Sharing Practices:A Carrot or Stick Approach?[J].2014.

[15]Ostaszewski M.Analysis of the Attitude Within Academic and Research Communities Towards Open Science-A Quantitative Survey[J].2014.

[16]Linek S B,Fecher B,Friesike S,et al.Data Sharing as Social Dilemma:Influence of the Researchers Personality[J].PloS One,2017,12(8):e0183216.

[17]刘桂锋,濮静蓉,钱锦琳.科研数据共享影响因素分析及作用阐释[J].图书馆论坛,2018,38(11):10-17,26.

[18]Eynden V V D,Bishop L.Sowing the Seed:Incentives and Motivations for Sharing Research Data,a Researchers Perspective[EB/OL].http://xueshu.baidu.com/s?wd=Sowing+the+se ed%3A+Incentives+and+motivations+for+sharing+research+data%2C+a+researcher%E2%80%99s+perspective&rsv_bp=0&tn=SE_baiduxueshu_c1gjeupa&rsv_spt=3&ie=utf-8&f=8&rsv_sug2=0&sc_f_para=sc_tasktype%3D%7BfirstSimpleSearch%7D&rsv_n=2,2017-09-09.

[19]Amos H,Frances M,Ruthven T.Rsquared:Researching the Researchers.A Study Into How the Researchers at the University of New South Wales Use and Share Research Data[C].2010.

[20]Tenopir C,Allard S,Douglass K,et al.Data Sharing by Scientists:Practices and Perceptions[J].Plos One,2011,6(6):e21101.

[21]Mai H O,Palacios R,Holden A E C,et al.To Share or Not to Share?A Survey of Biomedical Researchers in the U.S.Southwest,an Ethnically Diverse Region[J].Plos One,2015,10(9):e0138239.

猜你喜欢

数据共享Meta分析科研人员
科研人员破译黑猪肉特征风味物质
治疗艾滋病,中国科研人员有了新发现
广东公安科研人员风采
血小板与冷沉淀联合输注在大出血临床治疗中应用的Meta分析
中药熏洗治疗类风湿关节炎疗效的Meta分析
多索茶碱联合布地奈德治疗支气管哮喘的Meta分析及治疗策略