APP下载

高校图书馆数据素养服务与科研产出的关系研究*

2021-06-10卢祖丹

图书情报研究 2021年2期
关键词:讲座论文图书馆

卢祖丹

(河海大学图书馆 南京 210098)

1 引言

数据素养是大数据时代的教育衍生物,已成为科研人员提升科研创新能力的必备素养之一[1]。高校担负着将学生发展为数字公民的责任[2],高校师生必须提高科学数据素养才能熟稔运用科研数据,创新科技成果[3]。数据素养服条是指为有效开展科研、教学等相关工作,围绕提高受众数据意识与伦理,并提升其数据获取、加工处理、利用、交流与评价等能力而开展的一系列服条工作。现今,高校图书馆作为数据素养服条的倡导者和先行者[4],已开始转变服条职能,积极参与科学数据管理,开展多样化的数据素养服条。

学界围绕高校数据素养服条的重要性及作用影响开展了具体的研究,主要包括:(1)关于高校开展数据素养服条的必要性研究。如胡卉等[5]对中国科学院大学研究生进行问卷调查,发现研究生对数据管理与数据素养教育具有强烈需求。宋钧玉[6]认为图书馆作为学术资源的载体,最适合帮助科研人员学习数据的存取、重用和保存等技能,应由高校图书馆开展数据素养课程;张群等[7]基于问卷调查分析高校图书馆用户科学数据素养需求特征,指出科学数据素养服条是数据时代图书馆转型发展新方向。(2)数据素养及服条的作用影响研究。余维杰等[8]认为未来对数据素养的重视不仅存在于科研与教育,更应渗透在人们生活的各个方面,高校图书馆应在数据素养教育与服条中承担重要作用。Li等[9]基于931个研究生数据样本运用结构方程模型分析,发现数据素养对于研究生的数据驱动型研究选题决策有正向影响。(3)图书馆数据素养服条于科研教学实践的方式模式研究。李金建[10]指出为满足用户科研需求,高校图书馆应探索数据技术型服条与咨询型服条的融合发展,拓展数据素养服条内容。华翊[11]分析“双创”人才培养对高校图书馆服条的要求,提出围绕“双创”开展嵌入式数据素养教育模式。孙林[12]为解决体育教学问题构建了面向教学创新的体育教师数据素养培养机制。(4)关于图书馆员在数据素养服条中的角色研究。如Koltay等[13]认为图书馆员的数据素养有助于提高和培育科研人员的数据意识、开展数据密集型科学研究;Frank等[14]通过对Oslo大学气象专业的研究发现数据信息技能与气象专业学生的科研工作有关,学术馆员将在未来的数据素养教育中起到愈加重要的作用。

由上可知,图书馆学界皆认可高校数据素养服条的重要性并展开多角度探讨,其中一个基本认知逻辑是“图书馆提供数据素养服条,有助于提高高校师生的数据意识和数据能力,进而对高校科研水平产生重要影响[15]”。无可否认,这种认识具有直觉上的魅力,然而迄今为止关于数据素养服条的研究都遗漏了对这一基础性问题的探讨:“到底数据素养服条与高校科研产出是什么关系?高校图书馆数据素养服条真的有利于科研成果的创造吗?”这里旨在利用2015-2019年我国“双一流”高校的面板数据,通过构建计量模型对我国“双一流”高校图书馆数据素养服条与科研产出的关系进行实证研究,以期对现阶段我国高校图书馆开展相关工作的效用进行判断,并为今后有效开展数据素养服条提供理论借鉴。

2 数据素养服务与科研产出的关系建模、数据及相关检验

高校是我国数据素养教育与服条的先锋阵地,一流院校图书馆的服条水平代表着我国数据素养服条的先进水平[3],故以教育部公布的“双一流”建设高校名单为基础对数据素养服条进行网络调研。高校图书馆在开展数据素养服条时采用了多种方式,包括讲座培训、活动竞赛、在线教育、课程教学和嵌入式课堂等方式,但囿于网络数据收集的局限性,在探讨数据素养服条与高校科研产出的关系时,这里仅考察讲座培训、活动竞赛与在线教育这三种服条方式对高校科研产出的影响。

2.1 模型设计

为定量测度我国高校图书馆数据素养服条与科研产出的关系,现建立关系模型如下:

其中ROk为科研产出,分别选用论文发表总数(Pap)、国内论文发表数(Cnki)、国际论文发表数(WOS)、专利申请数(Pat)、国家课题立项数(Proj)、国家自然科学基金项目立项数(SP)与国家社会科学基金项目立项数(SSP)等7种形式。DLSj为数据素养服条,基于数据样本,选用培训讲座(TL)、活动竞赛(Com)、在线教育(OT)3种数据素养服条方式(以场次计)。βj为拟求的斜率系数,ε为误差项,j为不同的数据素养服条方式,i为高校,t为年份,k为不同的科研产出形式。C为常数项,反映未纳入模型的其他因素对科研产出的作用影响。

2.2 数据来源及处理

关于数据素养服条,以“双一流”建设高校名单为蓝本采用网络调研法,通过登录我国140所“双一流”建设高校图书馆网页,重点浏览其主页面、新闻动态、公告通知、服条/培训讲座等栏目,以调查历年来各高校图书馆数据素养服条的开展状况。囿于数据的可得性,最终共搜集到58所高校5年期(2015-2019年)的数据(共290个样本)、70所高校4年期样本、42所高校6年期样本及80所高校3年期样本。考虑到样本容量大小及代表性,这里以5年期数据(最大样本)为基础进行研究,并用其他样本来验证基础样本结论的鲁棒性。

关于科研产出,从学术论文发表量、专利申请数和科研项目立项数三个角度进行衡量。具体来说:(1)学术论文发表量分为国内、国际和总体论文发表数三个次级指标,这里国内论文数是基于中国知网收录的各高校在核心期刊发表的论文数,核心期刊依据北京大学出版社的《中文核心期刊要目总览》确定;国际论文数是基于ISI Web of Science网站中SCI-E和SSCI两个引文数据库的检索结果;总体论文数为二者加总。(2)各高校的专利申请数来源于国家知识产权局的专利数据库。(3)科研项目立项数主要考察国家级的科研项目立项,分为国家自然科学基金项目、国家社会科学基金项目和总体立项数,自科基金项目数据来自国家自科基金委编制的《国家自然科学基金资助项目统计资料》,社科基金项目来自《国家社科基金项目数据库》,总体立项数为二者加总。

此外,对数据做如下处理:

(1)为消除面板数据中存在的异方差现象并使变量趋势线性化,对数据素养服条、科研产出等的分项指标进行自然对数变换,此外,对数值为0的数据求自然对数时仍取值为0。

(2)对于四所异地建校的的“双一流”高校(中国矿业大学、中国地质大学、中国石油大学和华北电力大学),将各自两地的相关数据汇总至统一名下。

(3)为保障各高校间的可比性,国家自科基金项目选取面上和青年两类项目,国家社科基金选取一般和青年两类项目,这些项目属于两类基金中进入壁垒相对较低的科研项目。

2.3 变量的平稳性检验

为探讨数据素养服条与高校科研产出之间的关系,避免由于变量非平稳性导致“伪回归”现象,须进行变量的平稳性检验。这里采用Phillips-Perron test对各变量进行单位根检验,结果显示回归所涉及的各变量数据(对数形式)都是平稳的,故基于这些平稳变量所进行回归是真实有效的,可避免出现“伪回归”现象。

3 数据素养服务与科研产出关系的统计结果及分析

3.1 数据素养服务对科研产出的影响

数据素养服条旨在提高高校师生的基础能力和职业素养,在相当大程度上影响了高校师生从事科研工作的效率,进而影响论文、专利与项目等科研成果的产出进程。这里考察了高校图书馆三类数据素养服条对各类科研产出的具体影响,结果见表1。

首先,从学术论文发表(lnPap)角度来说,数据素养服条对其影响体现在:(1)培训讲座对学术论文发表数有显著的正向影响,斜率系数为0.45,这表明有关数据素养的培训及讲座开展得越多,越有利于提升高校师生的科研素养,进而增加高校的学术论文发表量,这也侧面印证了周志强有关“博士与硕士研究生最倾向于‘讲座’与‘线下课程’”的研究结论[15]。(2)活动竞赛对于学术论文发表数亦存在显著的正效应,斜率系数为0.41,表明各种数据素养竞赛与活动的开展,有利于调动学生数据学习的积极性,提升其科研能力并增加科研产出。(3)在线教育对学术论文发表有显著的负向影响(系数为-0.12)),究其原因,在线数据素养教育一般多由数据商提供,高校图书馆只充当被动的信息传递媒介,所以在数据素养服条方面有主动作为的高校图书馆一般并不倚重这种方式,此外,通过走访数据商的培训师获悉,在线培训这种方式约束力较差,经常出现参与人员较少、随意退线、缺乏互动等问题,其授课效果远不如现场培训讲座,故而过于倚重外部数据商提供在线数据库知识培训将不利于本校师生数据素养的提高,进而对科研产出(学术论文发表)造成消极影响。

这里又将该指标区分为国内论文发表数(lnCnki)与国际论文发表数(lnWOS),以观察数据素养服条对两类论文发表是否存在影响差异。由结果可知,三类数据素养服条变量的符号和显著性未发生变化,即上述结论在这里依然成立:培训讲座、活动竞赛对论文发表有显著正效应,而在线教育有显著的负效应。但是从斜率系数的大小来看,国际论文发表模型的斜率系数要明显大于国内模型与论文总数模型的斜率系数,这表明开展数据素养服条对于国际论文的发表有更为明显的推动作用。

其次,从专利申请(lnPat)角度来说,活动竞赛对高校专利申请数有显著的正向影响,活动竞赛增加1%将带来专利申请数0.86%的增加,而培训讲座和在线教育两类服条形式对专利申请不存在显著影响。

最后,从科研项目立项(lnProj)角度来说,其结论与学术论文模型类似,即培训讲座与活动竞赛对科研立项存在显著的正效应,但在线教育对科研立项有显著的负向作用。然后将科研项目区分为国家自科基金项目(lnSP)与国家社科基金项目(lnSSP)时,其结论亦没有明显变化。

表1 回归系数表

注:***、** 、*和[*]分别表示显著性水平为1%、5%、10%和15%;括号内为该项标准误。

综上所述,对于大多数科研产出指标来说,图书馆提供的数据素养服条对其有重要影响,其中有关数据素养的培训讲座和活动竞赛将有助于提升科研能力,增加高校科研产出;但若过于倚重在线教育这种服条方式将不利于科研产出的增加。

为验证上述结论的鲁棒性,后又采用4年期数据集、3年期数据集与6年期数据集,重复以上研究步骤,结果显示,除少数变量斜率系数的显著性发生变化外,斜率系数的符号和大多数系数的显著性并未发生明显变化,这表明上述研究结论在不同的数据集中依然成立。

3.2 数据素养服务对科研产出的滞后效应检验

图书馆提供数据素养服条后,需内化为服条受众自身的数据素养,进而提升其科研能力,最终外化为某种科研成果的产出,因而有理由相信该过程存在时滞。

为确定数据素养服条对科研产出产生效果的时间,在初始模型基础上依次引入各解释变量的滞后值,以判断其最佳滞后期。这里从较小的滞后阶(lag = 1)逐次增加直至估计结果不显著,然后依据赤池信息准则(AIC值)、舒瓦茨信息准则(SC值)和相应滞后变量系数的显著性来鉴别适合的滞后阶数(见表2)。从表2可知,除了专利申请数和国家自科基金项目立项数两类模型的最佳滞后期为0外,其余科研产出形式的最佳滞后期皆为1。这表明数据素养服条对科研产出的作用收效较快,一般在当年或次年就将对科研产出产生成效。

3.3 数据素养服务与科研产出的因果关系检验

数据素养服条的两种主要形式——培训讲座和活动竞赛,都对科研产出有积极影响,即数据素养服条的开展带来科研产出的增加;但从另一方面来说,也可能是科研成果的增多加大了对数据素养服条的需求,因此有必要对二者之间的因果关系进行判断。这里以讲座培训指标为例,运用Granger因果检验,探讨数据素养服条与各类科研产出之间的因果关系。

表2 各期滞后回归比较表

表3 Granger因果检验结果

由前可知,对于大多数科研产出指标来说最佳滞后期为1,故在进行Granger因果检验时参照其选取滞后期。从数据素养服条(以讲座培训为例)与科研产出之间的Granger因果检验结果(见表3)可知:(1)在数据素养服条和论文发表总数之间、数据素养服条与社科基金立项之间存在双向因果关系,即数据素养服条推动了论文发表总数和社科基金立项的增加,同时论文发表总数和社科基金立项的增加也推动了数据素养服条的进一步开展;(2)国内论文发表数、科研项目立项总数是数据素养服条的Granger原因,反向关系却不存在,即国内论文发表数和科研项目立项总数的增加推动了数据素养服条的供给,而不是数据素养服条的提供带来了国内论文发表数和科研立项总数的增加;(3)其他形式的科研产出与数据素养服条之间并不存在任何方向的因果关系,它们之间可能是由某种共同因素推动的相关关系,这从表1各模型中总是显著的常数项亦能侧面说明。

4 结论

基于2015-2019年我国“双一流”高校的面板数据,通过构建计量模型对高校图书馆数据素养服条与科研产出的关系进行探讨。研究发现,在数据素养服条的各种形式中,讲座培训与活动竞赛对各类科研产出均有正向效应,而在线教育却存在负向效应。这表明高校图书馆宜多开展数据素养方面的讲座培训,积极承办或组织学生参与这类活动竞赛,而不应过于倚重在线教育。研究还发现,数据素养服条对科研产出的最佳滞后期为1或0,这表明图书馆数据素养服条对科研产出的作用收效较快,一般在当年或次年就将对高校科研工作产生相应的成效。最后,通过Granger因果检验发现,在各类科研产出形式中,存在着数据素养服条与科研产出的双向因果关系、单向因果关系以及相关关系,这表明数据素养服条会对科研产出产生影响,同时二者之间又是相辅相成,互相促进的。在后续的研究中,可进一步扩大样本规模和扩展观察时段来验证夯实现有研究结论,也可探讨利于科研产出的数据素养服条方案,亦可研究数据素养服条质量或绩效的评价体系。

猜你喜欢

讲座论文图书馆
“快乐语文”公益讲座特别报道
本期论文英文摘要
“快乐语文”公益讲座特别报道
图书馆
本期论文英文摘要
他只做有“思享”的讲座,让小小微信装下一个“万人体育场”
本期论文英文摘要
去图书馆
2013年5—12月最佳论文