科研人员持续自存储行为实证研究*
2020-05-12袁顺波
李 宾,袁顺波
随着自存储运动发展,越来越多的科研人员认同自存储是学术交流体系的有益补充,自存储发展能推动科学研究进步。但是,科研人员对自存储的认可与支持并没有充分转换为参与行为,自存储资源建设状况不够理想。科研人员是自存储发展过程中的主体力量与关键因素,科研人员是否愿意持续将研究成果提交给机构知识库/学科知识库等自存储平台,从根本上影响自存储资源建设成效。为此,本研究以信息技术/系统用户行为理论为基础,构建科研人员持续自存储行为的理论模型并开展实证研究,以期破解自存储资源建设难题,进而推动自存储运动的长远发展。
1 文献回顾
(1)自存储政策研究。管理政策是解决自存储运动中资源收集、管理、保存、利用等问题的方向和原则,研究内容主要包括管理政策内容、强制存储政策、出版商版权政策等。与自存储相关的管理政策包括资源收集、权利管理、长期保存、版权管理等方面[1-2];强制存储政策对提高资源存储率的作用明显,但少有学术机构制定强制性且带有激励措施的管理政策[3-4];至于期刊出版商版权政策,研究重点集中在版权政策内容、对自存储影响及解决策略等方面[5-6]。
(2)自存储质量管理研究。资源质量是影响自存储发展和科研人员参与行为的关键因素,研究集中在数字资源质量控制策略、评价指标体系的构建、OA知识库质量评价等方面。自存储资源质量受政策、科研评价、版权等多重因素影响,需要采取政策、技术、管理控制等质量保障手段[7]。Xia等从存储者信息、存储数量、全文可获得性等角度构建自存储评价体系[8]。刘静羽等提出中国科学院科技论文预发布平台(ChinaXiv)的常规审核与专家评审等质量控制机制[9]。
(3)科研人员自存储行为研究。自存储发展离不开科研人员的支持与参与,研究集中在科研人员对自存储的了解程度与认同情况、自存储行为影响因素等方面[10]。对自存储理念,多数科研人员较认可,个人主页、机构知识库、学科知识库是主要的存储途径[11-13];支持OA 理念的主观意愿、促进研究成果传播、提升科研绩效、环境因素等产生积极作用[14-15],版权困扰、知识产权保护担忧、对自存储缺乏足够认知、需要额外时间和精力等因素则是主要的不利因素[16-17],年龄、学科、人际关系等也是较为重要的影响因素[18]。
(4)自存储绩效评价研究。它主要包括自存储提升论文被引频次的实证研究、引用优势的成因分析等内容。与非自存储论文相比,自存储论文具有明显的引用优势[19-21]。自存储论文的引用优势,一般认为是免费开放、先见优势和质量偏爱等因素所致[22]。
2 理论基础
科研人员通过学术论坛/网站、机构知识库、学科知识库等途径开展自存储,这些途径均以信息技术/系统为基础。因此,开展科研人员持续自存储行为研究,可考虑以信息技术/系统用户行为理论和模型为基础。信息技术/系统用户行为可分为采纳前行为和采纳后行为,采纳后行为可分为推荐行为、抱怨行为和持续使用行为[23]。持续使用行为是最受关注的采纳后行为。信息技术/系统用户持续使用行为的理论基础主要分为两方面:基于用户接受等相关理论和基于期望确认模型(Expectation Confirmation Model, ECM)的 持续使用理论。
基于用户接受等理论的研究以扩展与改进技术接受模型(Technology Acceptance Model,TAM)、 计 划 行 为 理 论 (Theory of Planned Behavior,TPB)、任务技术匹配模型(Task-Technology Fit,TTF)、整合型技术采纳与使用理论(Unified Theory of Acceptance and Use of Technology,UTAUT)、信息系统成功模型(Information System Success Model,ISSM)等信息技术/系统接受模型为基础,进一步探索用户持续使用模型的相关研究。用户持续使用研究则突破用户接受相关理论的研究框架,引入期望确认理论(Expectation Confirmation Theory,ECT)等构建全新的用户持续使用理论的相关研究[24]。Bhattacherjee 认为信息技术/系统用户持续使用的行为规律与消费者的再次购买行为规律类似,同样受到满意度、感知有用性等因素的影响,他以ECT 为基础,并结合信息技术/系统用户持续使用的特征,提出ECM 模型,关注信息技术/系统采纳后用户行为,能进一步解释用户在初始采纳后持续使用的深层次原因,而这也是TAM等模型无法解释的现象[25]。因此,本研究以基于ECM 模型的持续使用理论为基础,结合自存储情况,构建科研人员的持续自存储行为模型。
3 理论模型的构建
持续自存储意愿(Continuance intention of self-archiving,CIS)是理论模型的因变量,指的是科研人员在未来持续通过自存储免费开放其研究成果的意愿。根据认知信念-行为意愿-实际行为的逻辑,行为意愿是实际行为的直接决定因素,同时考虑到实证研究的可操作性,本研究用持续自存储行为意愿代替实际的持续自存储行为作为因变量。
用户满意度(Satisfaction,SAT)是 ECM 模型中一个非常重要的变量,信息技术/系统用户满意度指的是用户对信息技术/系统使用过程及得到结果后的满足状态,包括过程满意与结果满意两个方面。同理,在科研人员持续自存储行为模型中,满意度指的是科研人员过往参与自存储的过程及对结果的满足状态。实证研究表明,满意度对用户的持续使用意愿及行为产生显著影响。Shang等调查发现满意度是影响手机购物用户持续使用的影响因素[26];皇甫青红证实满意度对我国人文社科科研人员持续使用外文数字资源的行为产生显著影响[27]。有鉴于此,本研究认为科研人员对过往自存储过程及结果的满意程度会对其将来是否愿意持续自存储产生显著影响,如果科研人员对过往自存储经历感到满意,将来继续参与的意愿将会更为明确,否则,科研人员持续自存储意愿会减弱甚至不再参与。据此,提出假设如下:
H1:科研人员自存储经历的满意度对其持续自存储意愿产生显著的正向影响。
自存储绩效(Perceived performance of self-archiving,PPS)指的是科研人员对自存储提升其工作绩效的认知。此变量与ECM 模型中的“感知有用性”和UTAUT 中的“绩效期望”有所不同,“感知有用性”和“绩效期望”均强调的是用户在使用之前对某个产品或服务对提升工作绩效的认知与期望,而本研究中“自存储绩效”关注的是用户在之前参与自存储的经历给其工作绩效所带来的影响,因此与ECM 扩展模型中“使用后的感知有用性”类似[28]。
自存储对科研人员工作绩效的影响主要体现在扩大传播范围、提升影响力以及加快公开速度等方面。首先,由于自存储取消价格和许可权限的限制,自存储平台中的学术资源可供任何网络用户合理使用,使得学术资源的传播突破了原有的时空限制,能在更为广阔的范围内传播[29]。其次,有助于提升研究成果影响力,学术传播范围扩大的直接效应是提升研究成果被引频次,实证研究发现自存储对研究成果被引频次的提升作用明显[30-31]。最后,自存储还可以加快研究成果公开速度,在传统学术交流体系下,研究成果从投递、同行评议到最终的公开出版,需要相当长的时间,通过自存储平台则可以省略诸多流程,使研究成果实现快速公开与传播[32]。同时,满意度是科研人员对过往参与自存储经历的总体评价,若自存储确实能提升科研人员绩效,有助于提升科研成果影响力,扩大科研人员知名度,则满意度将提升。有鉴于此,本研究假设如下:
H2:自存储绩效对持续自存储意愿产生显著的正向影响。
H3:自存储绩效对满意度产生显著的正向影响。
期望确认程度(Confirmation,CON)对信息技术/系统用户持续使用行为的影响得到证实。Bhattacherjee 认为期望确认程度通过影响感知有用性和满意度,进而影响用户的持续使用意愿,据此构建ECM模型[25]。Bhattacherjee等进一步证实期望确认程度对用户实际持续使用行为的影响,以满意度和持续使用意愿为中介,期望确认程度对用户的持续使用行为产生间接影响[28]。严安等发现期望确认程度通过满意度间接影响高校图书馆电子资源用户的持续使用意愿[33]。Hu等认为期望确认程度通过满意度影响移动阅读APP用户的持续使用意愿[34]。据此,本研究认为期望确认程度对科研人员的满意度和自存储绩效产生显著的影响,如果科研人员对自存储的期望能够得到更多的正向确认,那么其所感知的自存储绩效和满意度也将相应地得到提升。
H4:期望确认程度对满意度产生显著的正向影响。
H5:期望确认程度对自存储绩效产生显著的正向影响。
自存储理念(Standpoint of self-archiving,SSA)是指科研人员内心所持有的一种关于学术资源免费公开以及自由学术交流的理念。推动科技进步与社会发展是科研人员从事科学研究、公开学术成果的主要目的之一[35-37]。自存储正是一种推动学术信息资源自由交流与共享的传播机制,科研成果通过这一渠道可以被网络用户免费利用,因而获得科研人员认同。科研人员对自存储理念的认可是推动其参与自存储的内在动力[38]。因此,本研究假设如下:
H6:自存储理念对持续自存储意愿产生显著的正向影响。
平台质量(Platform quality,PFQ)指的是自存储平台满足科研人员在自存储、学术研究等方面明确/隐含需求的能力与特性的总和,在本研究中主要涉及到系统质量与资源质量两大方面,包括系统功能是否完善、界面是否友好、资源内容是否丰富、学术水平是否突出等具体内容。自存储的发展历程表明,平台是重要的影响因素,某个学科、某个机构是否建有功能完善、影响广泛的平台,对该学科或机构自存储事业的发展影响明显。自存储快速发展离不开平台增加和功能完善,arXiv.org、SSRN等传统自存储平台实现可持续发展,同时出现了BioRxiv、ChinaXiv 等新自存储平台。正是在平台数量和影响力不断扩大影响下,越来越多的科研人员了解自存储、参与自存储,通过自存储提高论文的传播范围和影响力,并最终形成持续自存储意愿。据此,本研究假设如下:
H7:平台质量对持续自存储意愿产生显著的正向影响。
H8:平台质量对自存储绩效产生显著的正向影响。
促成因素(Facilitating conditions,FAC)是科研人员认为现有技术和组织对其持续自存储意愿的支持程度。促成因素对信息技术/系统的使用意愿产生影响[33]。机构知识库、学科知识库等平台是科研人员进行自存储的必备基础,是否建有自存储平台、自存储平台在线帮助是否完善、学界对OA及自存储的宣传推广力度如何,能否有部门或专人协助科研人员自存储等配合条件,都有可能对科研人员持续自存储产生影响。与技术促成因素相比,管理方面的促成因素对科研人员持续自存储意愿的影响可能更明显,在现有学术评价体系下,发表期刊论文已经成为科研人员职称晋升、岗位聘任的重要依据,也是争取研究经费、科研奖励的重要筹码,因此,基金管理部门的管理政策、学术机构的科研管理规定与自存储激励措施等也将对科研人员的持续自存储意愿产生影响。本研究据此作出假设如下:
H9:促成因素对持续自存储意愿产生显著的正向影响。
感知风险(Perceived risk,PRS)指科研人员对持续自存储所面临风险的认知。在信息技术/系统用户持续使用行为研究中,感知风险被证实是一个不利于用户持续使用的因素,往往因为对网络安全、个人信息安全、资金安全、交易安全等方面的担忧而减弱持续使用意愿[39]。科研人员在自存储的过程中也会面临若干不确定性,不过与信息技术/系统用户重点关注账户及资金风险所不同的是,科研人员主要关注版权冲突、知识产权保护等方面的风险。对自存储后印本而言,科研人员由于担心与期刊社发生版权纠纷而有可能放弃自存储[40],而自存储预印本则有可能导致被期刊社拒稿[41]。此外,自存储有可能导致研究成果的知识产权受到侵犯,目前还存在科研管理制度不够完善、科研规范缺失等问题,科研人员担心自存储会加大科研成果被抄袭、剽窃的风险,自存储在方便科研人员获取、利用的同时可能为别有用心之徒的抄袭、剽窃打开便利之门。姜颖发现,担心研究成果被剽窃是阻碍科研人员向机构知识库提交资源的主要原因之一[42]。据此,本研究假设如下:
H10:感知风险对持续自存储意愿产生显著的负向影响。
根据上述假设,得到科研人员持续自存储行为理论模型框架,见图1。
图1 科研人员持续自存储行为理论模型
4 研究设计
4.1 问卷设计
调查问卷分为3部分:(1)问卷引言,主要介绍与调查相关的基本情况,如调查目的、内容、调查结果使用范围。(2)科研人员持续自存储行为的影响因素是主体内容,主要对“满意度”“自存储绩效”“期望确认程度”“自存储理念”“平台质量”“促成因素”“感知风险”“持续自存储意愿”等8个潜变量进行测度(见表1)。各测度项均在现有文献基础上根据自存储的实际情况进行适当调整而成,测量量表采用7等级李克特量表(Likert Scale)形式对各测度项进行测量。(3)科研人员个人信息的测量主要了解性别、年龄、所属学科等基本人口统计学信息。
表1 测度项、信度及效度检验结果
(续表1)
4.2 数据收集
以高校教师、研究机构成员、博士生等科研工作人员为调查对象,采用网络问卷与随机抽样调查法,在问卷星网站发布调查问卷。为增加调查针对性,从如下途径获取科研人员联系方式:(1)Web of Science数据库,该数据库提供通讯作者Email,通过地址字段限定为“China”的检索式并辅之以人工鉴别方法(Email 地址以“edu.cn”结尾),筛选出国内科研人员的联系方式;(2)从中国科技论文在线、arXiv.org、中国科学院机构知识库服务网格等知名学科知识库及机构知识库中搜集科研人员的联系方式。(3)在科学网、人大经济论坛等学术网站搜集科研人员联系方式。调查历时50天,共发送邀请邮件2000余封,回收问卷共339份,剔除无效问卷后得到有效问卷317份。
5 实证分析
5.1 样本特征
男性200 人,占63.1%;女性117 人,占36.9%。年龄分布,31~40 岁是最主要构成部分,其次是41~50岁,也即中青年是调研的最主要人群。中级、副高级和正高职称比例较高。地区分布,26个省份科研人员参与调查,北京(53人,16.7%)、浙江(30 人,9.5%)和江苏(27 人,8.5%)人数位列前三。学科方面,按照教育部学科目录进行归类整理,首先将学科分成“自然科学”“人文社会科学”,其中“自然科学”科研人员186人,占58.7%;“人文社会科学”科研人员131人,占41.3%;在此基础上进一步对学科分布进行整理,如将“信息管理”“图书馆学”“情报学”统一为“图书馆、情报与档案管理”,将“物理学”“高能物理学”“固体物理”“半导体物理学”“凝态物理学”统一为“物理学”,结果表明“图书馆、情报与档案管理”“物理学”“化学”“医学”“计算机科学与技术”等学科人数较多。
5.2 信度与效度检验
以 Cronbach’s α 系数作为信度检验指标,利用 SPSS 得出各变量的 Cronbach’s α 系数(见表 1)。结果表明,各变量 Cronbach’s α 系数全部大于0.80,且均因删除某个测度项而降低,表明测量量表具有良好的信度。效度检验包括收敛效度检验与区别效度检验,其中收敛效度检验指标包括因子载荷(Factor Loading)、组合信度(Composite Reliability,CR)和平均方差萃取量(Average Variance Extracted, AVE)[47]。 利 用AMOS得出因子载荷,据此计算出各变量的CR和AVE 值(见表1)。结果表明,各测度项标准化后的因子载荷均大于0.6,CR 值大于0.8,AVE值大于0.5,通过检验。良好的区别效度则要求各潜变量的AVE值大于该变量和其他变量相关系数平方值,利用AMOS 得到相关数值(见表2),结果表明测量量表的区别效度符合要求。
表2 区别效度检验结果
表3 模型拟合指标值
表4 路径系数与假设验证
5.3 模型检验
以AMOS 为统计分析软件进行结构方程建模与检验。结果表明,理论模型的适配度指标中,除NFI略低于临界值,其余指标均符合要求,表明模型适配度较优(见表3)。潜在变量之间的路径系数与假设验证结果(见表4)。具有良好模型要求因变量被前因变量解释的总变异量超过30%[48],本研究中因变量的被解释量76%,说明模型对科研人员的持续自存储行为具有较高的解释力(见图 2)。
6 讨论
图2 模型验证结果
初始采纳行为是自存储运动迈向成功的重要一步,持续自存储行为则是最终成功的关键驱动力,只有科研人员持续的支持及参与,自存储运动才可能得到长远发展。考虑到已有研究重点关注自存储运动中科研人员的初始采纳行为,本文以信息技术/系统用户行为的相关理论为基础,构建了科研人员持续自存储行为模型,深入分析其持续自存储行为的影响因素及作用路径,从理论上拓展了自存储研究的新视角,推动了自存储理论研究的丰富与发展,同时也可以为国内自存储的实践发展提供参考依据。
(1)以ECM为代表的信息技术/系统用户行为理论对解释科研人员的持续自存储行为是有价值的,满意度、期望确认程度等变量对科研人员的持续自存储行为有着显著的影响。因此,对于学术机构、政府部门等自存储平台建设者和管理政策制定者而言,进一步正视科研人员的需求,构建合理的政策体系,改善自存储的外在环境,提高科研人员对自存储的满意度,已是当务之急。
(2)自存储理念对科研人员的持续自存储行为产生显著影响(0.306,p<0.001)。科研人员发表研究成果的一个重要目的是希望尽可能广泛地传播研究成果,推动科学研究发展和社会进步[49]。自存储基于“自由、开放、共享”的理念与科研人员从事科学研究的目的相吻合,而这也正是推动其持续自存储的重要因素之一。因此,有关部门需要从宣传推广方法、手段及方式等方面入手,构建宣传推广机制,让更多科研人员了解自存储,加深对自存储的认知与认同。具体而言,可针对不同层次、不同学科背景的对象,通过发布OA倡导宣言、召开学术会议等方式,开展内容多样化、形式个性化的宣传推广。
(3)作为一种学术资源的自由传播机制,自存储可以加快科研成果的传播速度,其“用户免费获取”的运行模式使得研究成果能被更多用户更容易地获取。更为重要的是,科研人员引用文献时会受到可获得性的影响,科研人员引用文献一般以占有、方便为标准,自存储基于网络免费开放的特征有利于研究成果被引频次的提升和影响力的扩大[22]。本研究也证实,“自存储绩效”对“满意度”(0.361,p<0.001)和“持续自存储意愿”(0.183,p<0.001)产生显著的正向影响。因此,有必要构建多元化的协同发展机制,推进自存储与OA期刊、自存储与传统期刊、预印本与后印本之间的多元协同,实现自存储、期刊出版商、学术机构以及科研人员之间的多赢,进一步彰显自存储在扩大传播范围、提升学术影响力等方面的独特作用,真正推动科研人员的持续自存储。目前国内已有部分自存储平台、传统期刊采取相应措施,实现相互支持、共同发展。
(4)研究结果表明,“平台质量”对“持续自存储意愿”(0.259,p<0.001)和“自存储绩效”(0.368,p<0.001)有显著的直接影响。研究成果是科研人员辛勤研究的产物,科研人员不会希望将论文放在一个少有人问津的平台,只有自存储平台易于操作和使用,并在界内形成强大的影响力,才能吸引更多的科研人员参与其中。自存储之所以能在物理学领域得到广泛实践,arXiv.org功不可没,而arXiv.org的成功的一个原因是该平台从“上传者和作者的研究身份审核”“论文格式完整性审核”“论文内容学术性和真实性审核”等多个维度构建了资源质量控制机制[9]。有鉴于此,需切实构建自存储质量控制机制,为激发科研人员的持续参与热情、推动自存储有序健康发展提供有效保障。具体而言,首先,应构建行之有效的资源提交者认证机制,可在作者注册时要求以机构邮箱注册,并进行邮箱和手机验证,引导作者在注册时提交个人科研经历、已有研究成果等信息,从而保证对提交者的认证效果;其次,推行完善的资源评审机制,通过外在形式审核、内容常规审核、专家评审和后评议等方式,对自存储资源的外在形式、内容、学术价值等进行全方位的评审;最后,构建适当的约束机制,若所提交的资源存在剽窃、抄袭、造假等学术不端问题,研究内容缺乏科学性或存在违法违规内容等,自存储平台可撤销并发布相应通知,将作者列入黑名单,并在一定时间内不允许再提交资源。
(5)有研究表明管理政策是影响自存储发展的重要因素[50]。本研究也发现“促成因素”对“持续自存储意愿”(0.175,p<0.001)产生显著影响。因此,有必要建立政策保障机制,以促进国内自存储运动的良性发展:第一,优化基金管理政策,省部级、国家级等高层次基金资助机构应调整现有管理政策,引导科研人员进行自存储,可优先考虑承诺将项目研究成果进行免费开放的课题申请,同时尽快完善各自的成果数据库;第二,推行有效的自存储激励政策,学术机构应考虑构建将科研绩效考核与自存储相关联的管理制度,激发科研人员的自存储热情;第三,逐步推行强制存储政策,国内学术机构可适时推行强制存储政策,要求机构成员须根据相关规定将研究成果提交至自存储平台。
(6)实证结果表明,“感知风险”是不利于科研人员的持续自存储行为的因素之一,这一结果并不出人意料。科研人员在自存储其研究成果时,面临着版权纠纷、遭遇剽窃等多重风险。为有效解决上述问题,需要从版权管理、知识产权保护等方面采取具有针对性的措施:第一,建立恰当的、能让多个利益方均能接受的版权管理机制,妥善处理相关版权问题,解决科研人员的后顾之忧,激发科研人员持续自存储的热情;第二,与期刊社开展合作,在满足其合理要求的前提下再探讨可行的版权共享机制应是一个不错的选择,在满足期刊社“首发权”的前提下,争取减少传统出版体系对自存储的版权限定;第三,由国内相关学会、协会或引领自存储运动的学术机构(如中国图书馆学会、中国科学院)组建团队,采取分期建设的方法,及时搜集、更新国内外期刊出版商的版权政策,建立诸如导航网站等有关版权政策的网络平台,允许科研人员根据需要进行查询;第四,自存储平台应为每一篇文献提供诸如唯一编号等身份证明,以保证作者对文献的所有权。对预印本则可以考虑提供资源提交时间证明,以保护提交者的首发权。
7 研究局限与展望
本研究存在以下局限:(1)在模型构建方面,以用行为意愿代替实际的持续自存储行为作为因变量,同时没有将性别、年龄、经验和自愿性等调节变量纳入研究范围,使得理论模型还存在着进一步优化的空间。(2)在样本选择方面,本次调研主要通过发送Email邀请科研人员参与网络调查,Email主要取自于学科知识库、机构知识库以及Web of Science 数据库,这在一定程度上对调查对象进行了筛选,从而也有可能对调查结果的准确性产生一定的影响。(3)在数据采集方面,本研究采用截面调查的方法开展研究,但实际行为处于动态变化过程中,影响科研人员持续自存储的因素会随着时间及其他因素的变化而发生改变,因此,采用截面调查的研究方法有可能导致误差的产生。
展望未来,可从几方面开展工作:(1)关注国内自存储的实践发展状况,可以在全国范围内开展多轮次的调查,厘清国内自存储的实践发展状况,分析其动态发展变化,得出管理政策、平台质量等因素对自存储运动发展的实际影响效果,以便于提出更具有针对性的发展策略。(2)开展纵向追踪研究(Longitudinal Study),各因素对科研人员持续自存储行为的影响路径、影响强度处于动态变化过程中,因此,后续研究可采用纵向追踪研究的方法,在一段时间内取多个时间点,就各因素对科研人员持续自存储行为影响路径及强度进行更为全面、系统的分析,从而更好地揭示科研人员的持续自存储行为规律。(3)开展自存储参与人员流失行为研究,双因素理论指出,用户使用、持续使用的原因与用户离开、停止使用的原因来自于不同的维度[51]。因此后续研究有必要针对有自存储经历的科研人员开展流失行为及影响因素的相关研究,深入了解科研人员在参与自存储之后不再继续的原因,探讨相应的应对策略,以推动自存储运动可持续发展。