科研人员数据共享意愿研究*
2014-12-03常颖聪
何 琳 常颖聪
(南京农业大学信息科技学院 江苏南京 210095)
1 引言
在大数据、数字化的背景下,科学研究将越来越依赖于对大量可获取数据的分析,因此科学数据的采集、管理与分析越来越受到科学界的重视。科学数据共享指科研人员将支撑其研究的科学数据在互联网上进行公开,并支持免费获取的行为,允许任何用户以任何目的免费通过互联网进行下载、复制、分析及重新处理利用,不受资金、法律或其他技术壁垒的制约。联合国教科文组织(The United Nations Educational,Scientific and Cultural Organization,UNESCO)提出科学数据为三种开放存取信息资源(科学出版物、教育资源、科学数据)之一,得到了全世界的认同和重视。
科研人员作为科学数据的生产、使用和管理者,是否积极倡导并参与数据共享将直接影响到科学数据公开获取的促进和发展,因此发现能够影响其意愿的因素并给予改善能够在一定程度上促进数据共享的发展进程。相对于欧美国家较为积极的数据共享模式,国内仍处于发展阶段,还未从政府层面建立起科学数据共享的促进措施。为了解国内科研人员对科学数据共享的认知以及影响数据共享的因素,本文借鉴经典心理意向模型计划行为理论(Theory of Planned Behavior,TPB)和技术接受模型(Technology Accept Model,TAM),针对科学数据共享的特点,建立科学数据共享意愿模型,通过对国内300余名科研人员的调研,利用结果方程模型对科研人员数据共享意愿及影响因素进行研究。
2 科学数据共享意愿研究现状
2011年,Adrian Mulligan利用在线调查的方法对6344名科研人员进行访问,发现有75%的科研人员希望使用其他研究者的数据但不愿意共享自己的数据,主要原因是科研人员不了解数据共享对学术交流的影响,不清楚数据共享能否获益;只有52%的表示愿意向他人提供科学数据,同年Christine L.Borgman 对 1700 名研究人员进行调查,结果表明53%的科学家愿意通过邮件向有数据需求的人员分享数据,55%的科学家选择在自己的博客上公开数据,而75%的科学家因为耗费时间而不愿进行数据共享。1329名研究人员参与了Carol Tenopir等针对数据共享意愿的调查问卷,其中32.3%有与他人共享数据的经历,但只有11.6%支持无条件的公开数据,以学科归类结果显示,气象科学的科研人员态度最积极,占49%;医学类则只有13%的科学家愿意共享自己的数据。Philippa Broadley等则发现科研人员拒绝数据共享主要是担心数据的恶意使用、篡改、知识产权等问题。同样,在针对生物多样性领域专家科学数据共享态度调查中Neela Enka发现研究者愿意参与数据共享,但对时间花费、缺乏统一标准、数据错用、数据保密等方面的担忧阻碍其实施数据共享。Heather A.Piwowar利用文献计量的方法对11603篇文献进行分析发现,首先有数据共享或数据使用经验的科研人员更愿意共享科学数据;其次期刊支持公开获取、要求数据共享强烈程度以及科学数据是否受重大科研项目基金支持同样影响科研人员数据共享行为。张晋朝在我国高校科研人员科学数据共享意愿研究中发现科研人员的自我价值感知、互惠预期、人际信任、形象是形成共享信念的重要维度,信念对科学数据共享意愿存在间接显著性影响,主观规范对科学数据共享意愿存在直接显著性影响。
综上所述,可见国内外学者对科学数据共享影响因素开展了不同程度的研究,大多数研究集中于对欧美国家科学研究人员进行调研,国内虽然也进行了类似的研究,但调研尚不全面,未考虑到科研人员的感知风险和感知成本。因此本文对国内外研究成果加以整合,针对我国科研人员对科学数据共享的态度进行调研,将科研人员对数据共享的态度、疑虑等内容加入调查问卷中,利用结构方程模型,以更加全面的角度调查影响国内科研人员数据共享意愿的因素,以期为我国科研数据共享的促进提供些许建议。
3 模型构建
3.1 理论基础
本文针对科学数据共享的特点拟引入经典行为预测理论TPB及技术接受模型TAM建立科学数据共享意愿模型来研究影响我国科研人员数据共享行为的影响因素。
TPB由理性行为理论(Theory of Reasoned Action,TRA)发展而来。TRA认为行为意向受态度和主体规范影响。由于TRA并不能完全解释或预测某些实际行为,1985年Ajzen在TRA的基础上增加了感知行为控制力——TPB。TPB是目前社会心理学中最著名的态度行为关系理论,该理论认为行为意向是影响行为最直接的因素,受态度、主观规范和感知行为控制,一个人的态度越积极、主体规范和感知行为控制越强,则执行某种行为的意向越强,也就越可能最终执行某种行为。1989年,Davis将TRA和TPB应用到信息系统领域用以解释用户对信息技术的接受行为,提出了技术接受模型(Technology Accept Model,TAM),该模型认为使用行为意愿由使用态度和感知有用性决定,使用态度是由感知有用性和感知易用性决定的,而感知有用性受感知易用性和外部变量的影响。
近年来,TPB、TAM被广泛应用于对各种新事物的解释和预测行为之中,如网络购物意愿、知识共享因素、数字图书馆、ERP使用等。大量研究表明TPB、TAM在解释和预测行为意向方面十分有效。
3.2 模型构建
本文基于TPB、TAM理论构建了科研人员数据共享意愿模型,如图1所示。
图1 科研人员数据共享意愿模型
纵观国内外学者对科学数据共享影响因素研究,虽然多数学者采用问卷调查采集数据,而研究方法主要采用定性分析,且每次研究均集中在一个方向,对数据共享影响因素并没有全面的研究。本文对已有研究成果进行整理改进,总结为主观规范、感知行为控制、感知成本消耗、感知风险、感知有用性、数据共享态度六个方面,采用结构方程模型的方法,定量研究数据共享意愿影响因素。
模型综合了TPB、TAM的影响因素变量,并做出改进:首先根据科研人员对数据共享带来风险的担忧,增加感知风险因素,更加科学的测量数据恶意使用、核心内容泄露等风险因素对数据共享的影响;其次,国内还未从政府层面建立科学数据共享的促进措施,促进数据共享的条件仍然不具有广泛的影响力,也未得到大力宣传,因此增加感知行为控制对数据态度影响路径会更加全面的测量感知行为控制对数据共享行为的影响。
4 模型假设
数据共享意愿是理论模型的因变量,指科研人员将科学数据进行共享的主观意愿强烈程度。在TPB和TAM中,意愿是行为的直接决定因素,个人的意愿越强,实施行为的可能性越大。行为意愿的强弱受个人因素的影响,即一个人对执行某种行为的态度的影响。行为态度是个体对执行某特定行为喜爱或不喜爱程度的评估。因此假设:
H1:数据共享态度对数据共享意愿有正向影响,即科研人员对数据共享态度越积极,数据共享意愿便会越强烈。
主观规范是指个体在决策是否执行某特定行为时感知到的社会压力,它反映的是重要他人或团体对个体行为决策的影响。Karahanna等研究发现主观规范对用户接受新信息系统的意愿有正向影响。由于科研界社会群体的特殊性,科研人员所感知的社会压力主要来自于同事,同学科的专家学者等。因此假设:
H2:主观规范对数据共享意愿有正向影响,即感知的社会压力越大,数据共享意愿便会越强烈。
感知行为控制是指个体感知到执行某特定行为容易或困难的程度,它反映的是个体对促进或阻碍执行行为因素的知觉。本研究将感知行为控制测度项集中在科研人员对数据共享促进因素的感知。因此假设:
H3:感知行为控制对数据共享态度有正向影响,即感知的促进因素越有利,数据共享态度便会越积极。
H4:感知行为控制对数据共享意愿有正向影响,即感知的促进因素越有利,数据共享意愿便会越强烈。
感知易用性是TAM模型中非常重要的变量,是用户主观上认为使用某一特定系统所付出努力的程度。数据共享不仅包括技术的阻碍,更多的是社会因素。Carol等在调查中发现有53.6%的科研人员认为数据共享花费不必要的时间,39.6%的表示缺乏资金支持。所以本研究中将感知易用性的测度内容集中在科研人员对数据共享所付成本的估计,如时间、资金的消耗,因此调整为感知成本消耗。因此假设:
H5:感知成本消耗对采纳行为态度有负向影响,即感知成本消耗越高,数据共享态度越消极。
感知风险是指科研人员对数据共享可能造成的风险的感知。在Neela Enke对生物学科领域专家对科学数据共享态度调查中发现,科研人员担心数据共享会引起数据错用、保密问题等方面的担忧。Jelte M.Wicherts等调查显示科研人员担心数据共享之后可能会揭示研究中的错误或者其他学者再分析会生成与原结果相反的结论。由此可见科研人员担心数据共享后会带来数据错用、篡改、剽窃等风险。因此假设:
H6:感知风险对数据共享态度有负向影响,即感知风险越高,数据共享态度越消极。
感知有用性是TAM主要的衡量指标,指用户主观上认为某一特定系统能够所提升的工作绩效程度。对于科研人员而言,数据共享可以提高相关科学论文的可信度、被引率,同时能够提高在同行中的知名度。Heather A.Piwowar研究发现公开分享的数据对期刊的引用率有69%影响,且期刊的影响因子与数据共享的程度呈正比。Carol在调查中发现68.6%的科研人员认为数据使用时标注引用是非常重要的。因此假设:
H7:感知有用性对数据共享态度有正向影响,即科研人员感知有用性越高,则数据共享态度越积极。
H8:感知有用性对数据共享意愿有正向影响,即科研人员感知有用性越高,数据共享意愿越强烈。
5 研究方法
5.1 调查问卷设计
问卷设计基于上文的理论模型和研究假设,由三部分组成,第一部分为引言,对数据共享的概念、意义进行了阐述;第二部分为个人基本信息的测量,主要了解科研人员的基本统计学信息;第三部分为问卷的主体部分,主要是对数据共享行为影响因素的测量,该部分所有测度项均采用5等级李克特量表形式进行测量,其中:1=“非常不同意”;2=“不同意”;3=“不确定”;4=“同意”;5=“非常同意”。
5.2 调查问卷的发放与回收
本研究的调查对象为国内研究所、高校的科研人员。在初步完成问卷设计后邀请了30位博士生、讲师及副教授、教授等进行了预调研,根据反馈对问卷中模糊题项进行了修正。正式问卷通过问卷星进行发放,调查持续3周,回收问卷330份,剔除无效问卷2份,最终有效问卷328份。
6 研究结果
6.1 调查对象信息统计
本次研究对象男女比例基本持平,年龄主要集中在26~45岁之间,中级职称以上占64.32%,且72.25%的调查对象来自985、211高校及研究所。参与本次调研的科研人员理工学科的较多,99.7%的有参与科研项目经历(见表1、表2)。
表1 调查对象基本统计学信息
6.2 问卷信度与效度
信度(Reliability)主要衡量的是测量结果的一致性、稳定性和可靠性,一般通过内部一致性系数(Cronbach'a)来描述测量。大多数学者认为0.7是一个合适的标准阈值,而对于尚未验证过的变量,达到0.6便可接受。量表的信度主要反映测量值与真实值的接近程度。因素负荷量值介于0.5至0.95之间,表示模型的基本适配度良好。潜在变量的组合信度CR(Composite Reliability)是模型内在质量的判别准则之一,可作为检验潜在变量的信度指标,若潜在变量的组合信度大于0.6,则模型内在质量理性。表3数据显示本研究调查问卷的Cronbach'a值,因素负荷量,CR均满足标准,因此问卷具有较好的信度和效度。
表2 调查对象科研背景信息
6.3 模型检验
本研究利用AMOS17.0对模型假设进行了检验,模型检验标准及检验结果数据见表4。
表4数据显示模型拟合指标均符合规定适配值,因此构建的假设模型成立。大部分学者认为,解释的变异量R达到30%可认为模型达到了较好的解释性,吴明隆认为R高于0.5表示模型的内在质量检验良好,本研究数据共享意愿被潜在变量解释的变异量为0.778,因此模型均具有较好的解释力。
6.4 假设检验
在模型成立的前提下检验研究假设是否成立,上文验证模型通过,假设检验结果见表5。
结构方程模型中,显著性指标p<0.05时则认为假设成立,表6显示本文提出的大部分假设成立,不成立的假设分别为H4、H5、H8,由此可以得出以下结果:
(1)科研人员对数据共享的态度直接影响其意愿。态度是TPB、ATM模型中的核心概念,也是本研究中的主要影响因素。即科研人员对数据共享的态度越积极,数据共享意愿更强烈。
(2)主观规范正向影响科研人员数据共享意愿。领导、同事或学科内其他科学家数据共享的行为导向对国内数据共享行为影响较大,即他人积极参与数据共享时,科研人员数据共享的意向更大。
(3)感知行为控制正向影响数据共享态度,对数据共享意愿影响不显著。Ajzen发现当态度或主体规范具有较大影响的情况下,感知行为控制对意向的预测力便较弱,
因此本研究模型假设模型中态度、主体规范对意愿的影响力较大,而感知行为控制即研究人员所在单位的奖励政策,课题资金支持机构对数据共享的要求强烈程度,期刊杂志社优先出版数据共享的论文等条件只能影响其数据共享的态度。
表3 问卷信息
表4 科研人员数据共享影响因素模型拟合指标值
表5 科研人员数据共享影响因素假设验证
(4)感知风险负向影响数据共享态度,感知成本消耗对态度影响不显著。这说明科研人员担心数据共享可能带来的风险,如数据篡改,恶意使用,泄露核心内容等,而时间、资金等成本问题并不影响其数据共享态度。其原因可能是时间、资金确实充裕,也可能是因为对数据共享的成本消耗并不了解。
(5)感知有用性正向影响数据共享态度,对数据共享意愿影响不显著。这说明数据共享能够带来的好处,如被引率的提升、学科内影响力的提高等只能影响科研人员对数据共享的态度,即感知到的好处越多越有益,科研人员对数据共享的态度越积极。
7 研究结论
本文基于TPB和TAM理论,结合科学数据共享的特点,构建了科研人员数据共享意愿模型,利用AMOS17.0对模型进行了验证,模型适配度均良好。研究结果表明直接影响科研人员科学数据共享意愿的因素包括数据共享态度、主观规范两个方面,感知行为控制、感知风险、感知有用性通过科学数据共享态度间接影响科研人员科学数据共享意愿。研究结果说明目前国内科研人员对数据共享仍处于初步认知阶段,表现为强烈的从众心理,同时科研人员虽然十分关注科学数据,但并不了解数据共享可能带来优势与风险。因此针对目前科研人员对科学数据共享的认知现状,本文对科学数据共享发展提供以下建议:
(1)利用社群影响力,广泛宣传科学数据共享理念。假设H1、H2结果表明科研人员数据共享意愿受其数据共享的态度以及主观规范的直接正向影响,因此利用领导、同事或同行专家学者等社群影响力加大科学数据共享宣传,消除科研人员对数据共享的消极态度,使其认识到数据共享的重要性、必要性和科研益处,增强数据共享的积极性,可以达到事半功倍的效果。因此可以采取:①“自上而下”方法,即针对高层领导宣传,通过领导决策层的行为导向影响科研人员的数据共享意愿;②“同行先进代表宣传”方法,即倡导学科内数据共享先进代表对数据共享的作用与意义进行宣传,尤其是提高论文被引频率,提高学科影响力等方面的影响,从而吸引科研人员的参与。
(2)科学数据共享政策化,强调数据共享必要性。假设H3结果证明感知行为控制正向影响数据共享态度,实际表现为如果课题资金支持机构对数据共享的要求越强烈,期刊杂志支持数据共享的科研论文优先出版的权限越高,单位对数据共享奖励政策越完善,科研人员数据共享的态度则会越积极。
在欧美国家有来自国家基金组织、科研机构、期刊出版界对数据共享的一系列强制性政策,如美国国家航空航天(NASA),英国研究理事(RCUK),美国国立卫生研究院(NIH)等,要求凡是受其基金资助的科研项目必须共享科学数据;美国科技政策办公室(OSTP)要求由联邦资金全部资助或部分资助产生的非保密性科学数据须存储并支持公开获取;Nature要求作者在投稿时必须提交公开科学数据的相关数据库。由于国内科学数据共享仍处于起步阶段,因此可以通过借鉴欧美国家较为成熟的模式,将数据共享制定为基金组织、杂志期刊的强制政策,同时用提高奖励政策的方法提高科研人员数据共享的积极性。
(3)建设科学数据共享管理方法法律体系,降低数据共享风险。假设H6证明感知风险负向影响数据共享态度,实际是科研人员担心数据共享后可能造成的恶意使用、篡改和泄露研究核心内容等数据知识产权保护问题。因此如何确保数据共享后的保密性,避免数据共享者损失等成为促进数据共享进程中需要解决的重要问题。
科学数据知识产权保护和科学数据共享是一对矛盾体,如果过分强调科学数据的知识产权保护将妨碍数据共享,但忽视数据知识产权保护将打击数据生产者的积极性。国外有如CC0等政策规定,数据共享默认放弃所有相关法律权利,数据再使用者可以自由复制、修改、使用和分发科学数据,也可以用作商业目的。而国内尚没有专门对科学数据共享活动加以规范的法律条例和管理办法。因此建立科学数据共享管理方法的法律体系,明确规定数据共享核心知识产权,数据恶意使用后果责任承担等是消除科研人员对数据共享风险认知的根本办法,也是健康健全数据共享环境的法律保障。
(4)完善科学数据引用评价机制,提高数据共享增值效益。假设H7结果显示感知有用性正向影响数据共享态度,即科研人员重视数据共享能够带来的利益,包括提高论文可信度、引用率,提高学科影响力等数据共享增值效益,且利益越高越好,科研人员数据共享的态度越积极。通过一系列措施增加数据共享增值效益,提高科研人员数据共享积极性,可以有效地促进科学数据共享发展。首先需要完善数据引用模式,理想的数据引用应与传统文献引用方式一样,在参考文献部分对数据进行引用标注;其次借鉴传统文献的计量方法,将数据引用排名纳入科学评价体系,规范化数据共享增值效益评价机制;最后定期推出数据引用排名,数据影响因子排名、科研人员数据质量排名等一系列正规文件,明确数据共享科研影响力。
[1] Panton Principles-Principles for Open Data in Science[EB/OL].[2014-07-01].http://pantonprinciples.org/.
[2] Open Access policy concerning UNESCO publications[EB/OL].[2014-06-24].http://www.unesco.org/new/file admin/MULTIMEDIA/HQ/ERI/pdf/oa_policy_rev2.pdf.
[3] Adrian Mulligan.The effect of the internet on researcher motivations behavior and attitudes [J].Emerald Group Publishing Limited,2011,67(2):290-311.
[4] Borgman C L.Big data, little data, no data:The contested landscape of data sharing and reuse [EB/OL].[2014-06-24].http://works.bepress.com/borgman/275/.
[5] Carol Tenopir, Suzie Allard, Kimberly Douglass, Arsev Umur Aydinoglu, Lei Wu, Eleanor Read, Maribeth Manoff, Mike Frame.Data Sharing by Scientists: Practices and Perceptions[J].PLOS ONE.2011,(6):1-21.
[6] Philippa Broadley, Kerry Raymond.Researcher Attitudes to Data Sharing:Cultural Change Requires Better Motivations [EB/OL].[2014-06-24].http://eprints.qut.edu.au/53403/.
[7] Neela Enka.The user’s view on biodiversity data sharing——investigating facts of acceptance and requirements to realize a sustainable use of research data[J].Ecological Informatics,2012,(11):25-33.
[8] Heather A.Piwowar.Who Shares Who Doesn’t Factors Associated with Openly Archiving Raw Research Data[J].PLOS ONE,2011,(7):1-13.
[9张晋朝.我国高校科研人员科学数据共享意愿研究[J].情报理论与实践,2013,36(10):25-30.
[10] Ajzen I.From intentions to actions: A theory of planned behavior[A].J.Kuhl&J.Beckmann(Eds.).Action control: From cognition to behavior[M].Heidelberg, Germany:Springer,1985:11-39.
[11] 段文婷,江光荣.计划行为理论述评[J].心理科学进展,2008,16(2):315-320.
[12] 余莉.计划行为理论的发展综述[J].科教文汇,2008,(2):170.
[13] Davis F.D.,Perceived usefulness, perceived ease of use and user acceptance of information technology [J].MIS Quarterly.1989,13(3):319-339.
[14] Ajzen I.The theory of planned behavior[J].Organizational behavior and human decision processes.1991,50: 179-211.
[15] Karahana E,Straub D W, Chervany N L.Information technology adoption across time:a cross-sectional comparison of pre-adoption andpost-adoption beliefs[J].MIS Quarterly,1999,23 (2):183-213.
[16] Wicherts J M, Bakker M, Molenaar D.Willingness to share research data is related to the strength of the evidence and the quality of reporting of statistical results[J].PLoS ONE,2011, 6(11): e26828.
[17] Piwowar H A, Day RS, Fridsma DB.Sharing Detailed Research Data Is Associated with Increased Citation Rate [J].PLoS ONE,2007,2 (3): e308.doi:10.1371/journal.pone.0000308.
[18] Heather A.Piwowar , Wendy W.Chapman.A Review of Journal Policies for Sharing Research Data[C].Proceedings ELPUB 2008 Conference on Electronic Publishing,2008.
[19] 袁顺波.科研人员采纳自存储的影响因素研究[J].图书情报知识,2014,(2):72-83.
[20] 吴明隆.结构方程模型—AMOS的操作与应用[M].重庆:重庆大学出版社,2013.
[21] Nature[EB/OL].[2014-07-28].http://www.nature.com/authors/policies/availability.html.
[22] 何琳,常颖聪.国内外科学数据出版研究进展[J].图书情报工作,2013,58(5):104-110.
[23] Creative Commons CC0[EB/OL].[2014-07-09].http://creativecommons.org/publicdomain/zero/1.0.
[24] 吴立宗,王亮绪,南卓铜,等.科学数据出版现状及其体系框架[J].遥感技术与应用, 2013,28(3):383-390.