基于研究数据管理的高校图书馆学科服务模式再造
2018-04-12王强,牟萍
王 强,牟 萍
(大连大学 图书馆,辽宁 大连 116622)
信息技术的发展深刻地影响着科学研究,高校图书馆作为一所学校信息中心和学术资源的集散地,必然要随时而变。网络的提速与普及,云计算的横空出世,大数据的经年累积等等都将高校图书馆的服务层层推进。近年来科学研究“第四范式”的提出,研究数据的大量产生对高校图书馆学科服务提出了更深的挑战。
1 学科服务研究现状
1.1 学科服务的现状
高校图书馆构建并实施以学科服务主体的服务模式,已经成为其适应当今社会环境及满足用户深层次知识需求的典型范例。然而图书馆所开展的学科服务,目前来看理论的发展满足不了实践的发展。现有的研究多基于宏观应用层面进行探讨,针对高校图书馆用户个性化需求所设计的模式比较单一。
1998年清华大学率先在国内引入学科馆员制度。其成功的经验导致其他高校也陆续效仿设立了这一制度,目的是建立起通畅的“需求”与“保障”渠道,帮助教师、学生充分利用图书馆的资源[1]。中科院国家科学图书馆系统则根据其特点构建了不同的学科化服务。他们认为学科化服务是加快科学交流和信息传播的速度,帮助科研人员和研究生充分发现和利用中科院文献情报系统的学科信息资源,加强图书馆为科研一线研究、学习和教学过程的个性化、一站式学科信息服务[2]。中科院李春旺研究馆员认为高校图书馆学科服务是在按照文献工作流程来组织科技信息工作的同时,注重以科学研究为主线,使高校图书馆的信息服务学科化,不再简单地将文献实现检索和传递,更是使服务内容知识化,从而使图书馆所提供的信息服务更大程度上满足了用户需求[3]。
1.2 学科服务模式发展现状
笔者以“学科馆员”、“学科化服务”、“学科服务”等作为检索词进行组合匹配,在中国知网、万方、维普等三大数据库进行检索。通过统计2007年至2016年这10年间的数据(未扣除三者中相互重叠的收录论文),如表1,我们会发现学科服务的研究热度一直不减,这方面的研究文献数量一直平稳增加。
表1 中国知网、万方、维普2007~2016年间学科服务论文发表量统计表
根据被引量统计,知网、万方、维普数据库中论文排名如表2。
表2 中国知网、万方、维普学科服务论文被引量统计表
根据表2我们可以清晰地看出图书馆学科服务的研究逐年深化,从最初的介绍学科服务,一直演进到具体地图书馆学科服务案例,以及更深层次的知识服务。从学科服务研究的发展来看,文献的数量快速増加,且研究的主题不断趋于深层次和多元化,这既反映了我国高校图书馆学科服务的实践得到了长足的发展,也获得了业内学者相当程度的重视。但是从目前国内的研究文献内容总体来看,图书馆学科服务的理论研究方面占比还是偏高,少数涉及实践应用也多以某一个高校为例的案例分析或者以某个因素的定性调查研究,且这些案例中提及的高校往往集中在国内重点院校,虽具代表性,但在普适性上却是不足的。
根据笔者的现场调研及文献调查,目前国内高校图书馆开展的学科服务可总结为以下几种模式:一是联络馆员模式,依托参考咨询馆员,进行图书馆与院系之间的联系,利用传统的路径进行参考咨询、数字参考咨询服务,其优势在于以馆藏文献为根据,通过对个别读者问题的解答,以协助检索、解答咨询和专题文献报道等方式向读者提供事实、数据和文献线索,最主要的作用是使读者充分利用图书馆馆藏。这也是学科服务研究的源头。缺点在于服务方向为点,开展服务项目较少。二是嵌入模式,即目前大多数高校图书馆所实行的将学科服务嵌入教学、嵌入科研一线,这也是图书馆学科服务研究的重要部分。这种模式充分展现了学科馆员的作用,既包括了以联络人为主要特征的第一代学科馆员,又包括了融入一线、嵌入过程的第二代学科馆员[4],优势在于与活跃在教学、科研一线的用户联系密切,可以及时掌握师生的需求,及时反应。缺点在于对学科馆员的个人素养要求高,特别是学科馆员的专业背景,也导致目前嵌入方向较为单一。三是个性化模式,根据高校用户提出的要求,或基于用户的学科、专业、兴趣爱好、使用习惯等个人特征,对每一个用户的个性化信息需求进行单独的针对性服务,其优势在于迎合了网络时代用户需求呈现出差异化和个性化的发展趋势。四是自媒体群模式,即利用web2.0技术(包括博客,微信,微博,wiki,Facebook,Twitter等)及其他新兴的网络信息技术构建与用户交流的泛在平台群。这种模式最大的优势在于综合利用各个平台原生的交互性(传播时的互动;沟通时的互动;对文本解释的互动)组成全覆盖、立体的平台群,可以对用户需求进行即时的反应。
1.3 研究数据管理(Research Data Management,RDM)的兴起
学科服务的四种模式虽然为高校的教学、科研人员提供了较好的服务,但这些模式只是浅层的嵌入与联系,所利用资源皆是来自“外部”的研究成果或者书库,忽略了对本校科学研究使用、生产的数据、文献进行管理。
当以资源密集、量化计算、跨界合作、全域联通为特征的E-science和E-research为平台的科学研究出现后,预示着科学研究已经进入数据密集型的“第四范式”(“数据密集型”也就是现在我们所称的“科学大数据”),也预示着高校图书馆的学科服务也要将一部分重心向研究数据移动,构建新的服务模式。
大数据时代,强调“数据为王”,谁拥有了数据,谁就在未来的竞争中占有了极大的优势。基于E-science和E-research平台产生的数据即研究数据,也有学者将其称之为科学数据[5],但两者实质并无根本的差异。研究数据的定义大致有两种:广义的认为研究数据是指在科技活动中(实验、观测、探测、调查等)或通过其他方式所获取的反映客观世界的本质、特征、变化规律等的原始基本数据[6],以及根据不同科技活动需要进行系统加工整理的各类数据集。狭义的认为研究数据管理中的“数据”专指数字化的科学研究数据,即科学研究中通过测算、计量、观察、访谈、调查、建模等方法获得的数据[7],或者是为科研目的而搜集,观测或生产的信息,以产生原始研究[8]。
从定义上我们可以发现,国内外的研究围绕在“数”上加功夫,对“据”却没有投入关注。按照科学研究的一般规律,“数”的产生,必定以拥有大量的“据”为基础。也就是说科研过程中使用的所有文献资料都应该纳入管理的范围。
基于研究数据的定义,研究数据管理可归纳为对在科学研究活动中产生的科学数据进行统筹协调、科学配置、整合管理。内容涉及对各类型研究数据进行收集、分类、清洗、监护、发布及共享,以形成管理研究数据的理念、政策、规范、环境、措施与体系,发挥研究数据资源的最大效益。
2 基于研究数据管理重构图书馆学科服务
2.1 图书馆介入研究数据管理的意义
科学研究形成数据(或可称之为成果)作为一所高等学校宝贵的财富,需要有机构从成果发生之初就要介入,直至成果的保存、传播再利用等。以数据管理服务为专长的图书馆是科研数据完整性、可用性、传播性的重要保障。
依照国内的科研现状分析,研究数据主要来源可以分为两大类:一是国家级科研机构、985高校;二是省、市属高校、民间研究机构等。也有学者将研究数据的来源分为大科学研究和小科学研究[9]。大科学研究往往在管理上有国家标准作为执行的准则,同时其研究成果有相应的管理机构进行监管,基本上来说有相对完善的数据政策,并有管理人员对数据进行维护和发布。小科学研究通常由高校个别学者承担的横向课题,预算投入有限,参加人员来自于不同单位或部门。所以从目前的研究分布来看,大量的高校科研工作者的研究工作应该属于小科学研究。基于研究者基数的庞大,这种小型科研积累的数据总量非常惊人,据估算为大型科研项目的2~3倍,而其研究数据通常保存在项目组成员的计算机和服务器里,没有专人维护。由于研究方法多样化,数据格式纷繁复杂,既没有统一标准,也没有分享机制,更缺乏项目完结后对数据的长期利用策略[10]。高校图书馆为了保证这部分海量的数据不因为客观的因素而流失、损毁,应该通过研究数据管理进行介入。
高校是数据的使用者也是生产数据的主力军,理应成为“研究数据管理”的先行者。根据教育部新发布的《普通高等学校图书馆规程》,图书馆的任务其中两项分别是不断拓展和深化服务,积极参与学校信息化建设,以及积极参与各种资源共建共享,发挥信息资源优势和专业服务优势,为社会服务。高校图书馆是众所周知的信息汇聚地和传播地,图书馆对高校研究数据收集、保存、利用负有不可推卸的责任。根据调查,国外图书馆在数据管理政策制定与宣传、数据管理参考/咨询、数据管理的信息技术基础设施建设、数据管理教育与培训、构建数据管理组织与人员等领域中发挥重要作用[11]。图书馆将“研究数据管理”纳入学科服务,将其作为重要工作内容之一,对于未来提升整体服务层次及社会地位有极强的现实意义。
2.2 学科馆员在研究数据管理中的影响及作用
如前文所述,随着高校图书馆开展的学科服务的深入发展,图书馆馆员的主要服务功能逐渐向学科馆员转移,而因应图书馆用户信息环境及需要的变化,学科馆员也从第一代演进到了第二代。当前随着E-science和E-research由理想转为现实,高校的科研方式也逐渐发生改变。这些新科研平台的诞生,直接的后果是科研大数据的涌现,这对图书馆馆员特别是学科馆员提出了更高的要求。学科馆员势必跟随工作地点、工作内容、工作方式的变化而变化,这个阶段的学科馆员可称其为第三代学科馆员。第三代学科馆员与第二代学科馆员的最大不同是对科研生命周期的全介入及数据生命周期的全管理[12]。科研生命周期如图1所示,数据生命周期如图2所示。
图1 科研生命周期简略模型
图2 数据管理生命周期
科研人员在科研生命周期内需要得到诸多领域的支持,包括在规划、组织、安全、记录和共享、数据集存储和长期保存方面的准备工作,以及更为普遍的关于著作权、许可和知识产权等问题的咨询和解答方面[13]。在这些阶段,学科馆员都可以介入提供相应的服务。相较于科研人员来说,学科馆员的专业背景虽然不如他们,但是其最大优势是对信息组织熟练掌握,对元数据标准、数据政策的把握。
基于数据管理生命周期,在新科研环境下,学科馆员可以做的工作有:①参与制定数据政策;②提供元数据标准;③接收数据集并检查;④评估数据集并典藏;⑤辅助用户进行数据发现;⑥对数据集进行宣传推广。这些新的工作既是新的挑战,又是馆员重要的机会,也是图书馆的必然选择。
2.3 基于研究数据管理的数据协同学科服务模式
我们将科研的流程与数据生命周期相结合形成新的模型(如图3所示),就会发现高校图书馆要想在新的科研平台下有所作为,需要把学科服务的时间提前,即在项目的执行阶段,甚至是项目规划阶段就要介入,这样图书馆才能把握科研的流程及数据工作的需求。
图3 科研生命周期内研究数据管理模型
为了确保科研工作中研究数据的收全和收准及日后的推广使用,图书馆学科服务需要构建馆院所数据协同模式:一是机构协同,在项目规划阶段要与科研团队及科研管理部门对接,参与制定研究数据的管理框架[14],数据长期保护的政策,为数据管理提供必要的场地和设施。二是项目协同,全程对研究数据进行监护(data curation)[15],根据规定制定元数据标准,审核数据并对不合格数据进行加工,规范数据的交割,对数据进行评估。三是数据协同,数据馆员嵌入项目组,跟踪数据的产生过程,及时掌握跟进科研进度,保证数据及时入档,保障数据的收全率。四是安全协同,保障数据的可用性,保存与数据格式相匹配的软硬件,保证数据在储存期不被非相关人员篡改、盗窃或毁灭。五是推进协同,协助数据进化或者再利用,对研究数据进行宣传推广,协助用户进行数据分析、数据挖掘和融合。
数据协同的学科服务模式需要图书馆与高校内外相关单位合作,前进到科研一线,深入到科研过程。同时在馆员能力、基础设施、知识更新等方面进行大的转变,再次改变服务的形态与内容。
3 结语
如同图书馆是“成长的有机体”一样,学科服务也应是一个“成长的有机体”,由多种因素驱动产生,也由多种因素驱动进化。它整合图书馆人力和用户参与,注重服务整体保障和内涵,同时通过宣传推广扩大影响,进而拓展服务效果。它适应信息环境、信息技术和用户需求的变化,根据用户学习模式、科研习惯,以及知识交流渠道、信息利用方式等用户行为方式的变化而调适,产生出新的服务模式。
研究数据管理已经在国外高校图书馆作为学科服务的一项正式工作有所开展,而国内对于此方面的研究起步不久。就目前的调查来看,只有少数几所高校图书馆有所实践,且集中在重点高校,地方性大学囿于组织、资金及人才的限制,对研究数据管理较少提及,笔者希望通过本文能够综合前人的研究成果,为后来的研究者提供借镜。