APP下载

学科馆员在科研数据管理中的角色分析

2015-10-10穆向阳

新世纪图书馆 2015年8期
关键词:信息流数据管理馆员

穆向阳 洪 跃

E-science环境使得原有的科研范式发生了悄悄的改变,以数据密集型为基础进行科学发现的第四范式将会越来越受到重视。大数据时代的到来提供了足够的技术手段,使得科研工作能够更好地管理以及利用数据。数据管理已经成为图书馆非常重要的服务内容,而承担这部分工作的将主要是学科馆员。早在2008年,国内外一些专家学者便提出了学科馆员2.0概念[1]。学科馆员2.0主要体现为服务的主动性,科研活动整个流程的参与性以及与专职科研人员更好的协作等。美国研究图书馆协会(ARL)在A Special Issue on Liaison Librarian Roles上全面探讨了学科馆员的未来发展方向[2]。在新的服务内容面前,学科馆员的角色需要重新定位。

科研数据管理涉及到众多学科,从数据流的角度来看不同学科的科研数据管理具有不同的特征,这些特征决定了学科馆员的数据管理服务应该包含不同的管理及工作模式。因而有必要对数据管理的整个数据流所包含的不同环节,以及学科馆员在各个环节中的参与方式进行深入研究。

1 科研数据管理的定义

科研数据是指数字形式的研究数据,包括在研究过程中产生并存储于计算机上的任何数据[3]。从存储形式上,包括文本型、数值型以及多媒体型等。科研数据具有如下一些特征:(1)科研数据是科研过程中形成的第一手资料,具有客观性以及档案文件价值,比如,遥感勘测数据、实验数据等都具有这样的特征,有的科研数据稍纵即逝如果不对其进行有效保存将造成极大损失;(2)科研数据作为第一手科研资料具有可重复利用的特点,从而有助于科学质疑公开以及节约研究成本等;(3)科研数据能够更好地支持大数据分析,通过深度数据挖掘更好地支持学术创新;(4)科研数据本身具有建构性特点,也就是说科研数据在整体上属于一个自组织的有机体系,它们以建构性特质体现人类知识的整体性。正是科研数据具有如上一些特点,其重要价值已经引起学界充分关注。图书馆作为信息与知识服务机构,也已经将数据管理作为自身的一项重要服务内容。比如澳大利亚莫纳什大学,在科研数据管理方面一直是澳大利亚国家数据服务的领导者[4]。

科研数据管理可以被看作是围绕着科研数据整个生命周期的管理活动,围绕各个环节会产生不同的服务方式。澳大利亚国家数据服务网(ANDS)认为,科研数据管理包括以下八个过程:创建、存储、描述、鉴别、注册、发现、获取、开发[5],每个阶段都会涉及相应的服务形式。科研数据管理对于图书馆来说是一种科研过程参与性以及融入性都很高的服务方式,学科馆员在科研数据管理中将扮演十分重要的角色。科研数据管理也对学科馆员的个人知识结构以及综合素质等提出了更高的要求,如何在科研数据管理服务过程中更好地发挥学科馆员的创造性价值,如何与学科馆员个人的发展相结合起来等问题都需要进行深入的研究。从科研数据整个生命周期体现的信息流环节入手,在每个环节探讨学科馆员的参与方式,可以使学科馆员在数据管理中扮演的角色更加具体,也可以使学科馆员在科研活动中的分工更加明确。

2 科研数据数据流

科研数据构成了一类特殊的建构性信息资源,具有信息资源生命周期的基本结构,但是也有区别于其他信息资源生命周期的特征。由于学科性质的差异,不同学科其科研数据在信息流上也体现出细微的差别,这些差别要求学科馆员必须了解自己所服务学科的特点。比如社科类科研数据无论从资源的获取上,以及资源的鉴别上都区别于自然科学类科研数据,因而决定了不同学科的学科馆员在服务角色上的差异,有些学科其学科馆员的科研参与性将更强,而有的学科其学科馆员的参与性则相对较弱。因而有必要从科研数据的信息流不同环节入手,有分别地探讨学科馆员的参与方式。科研数据整个信息流过程如图1所示。

(1)科研数据的采集。是指通过相应的技术手段获得数据的过程。比如直接采集科研过程中形成的数据,或直接从观测仪器中获取相应数据等。科研数据也可以来源于非数字资源的数字化等过程。学科、环境、技术手段等方面的差异,也使数据采集的方法以及手段上存在很大不同。

(2)科研数据的鉴别。科研数据因为具有档案价值,而且能够被不同研究反复使用,所以其学术权威性必须得到充分保证。对其存储之前,必须要进行科学地鉴别,以保证科研数据资源集的客观性以及内在统一性。

(3)揭示与描述。经过鉴别的科研数据要被充分揭示,从而获取科研数据资源的内在特征,在此基础上,通过相应的元数据进行描述。经过这一环节,科研数据便可以保存到相应的存储设备上。

(4)存储。经过揭示与描述处理后,便可以将科研数据存储起来供用户使用。由于科研数据具有可重复操作的特征,因而应该选用相应的数据存储格式以保证数据的可重用性及易用性。另外,数据的存储还应该注意与其他相关数据格式间的关系,以便于对整个数据集进行大数据分析等。

(5)利用。科研数据的利用,主要是指从整个数据集中检索出数据供用户使用的过程。另外,也包括图书馆自身的研究工作对科研数据的使用等。

(6)剔除。科研数据作为一种信息资源,同样会涉及到信息老化问题。比如随着技术的进步对于同一现象的观测数据越来越精确,那么更精确的数据将取代原有的数据从而造成了老化资源的剔除等。

3 科研数据管理与学科馆员

3.1 科研数据管理的特征

科研数据管理是一项非常复杂的管理活动,它涉及到科研数据从产生到最后被剔除的整个过程。从上文的科研数据信息流来看,其具体环节跟一般的图书馆信息流也存在很大不同,比如对科研数据进行鉴别这一环节是其他信息流所不具备的。另外,科研数据学科性质上的差异,也造成了管理方法、手段以及服务形式上的差异。科研数据管理所具有的特征可以总结为如下几点:

(1)科研数据管理要求馆员具有更多的参与性以及相应的学科背景知识。科研数据管理要求馆员能够具有相应的学科背景,从而以自身完备的知识结构更深入地参与到相关的科研工作之中。学科馆员将会成为科研工作的重要力量,他们可以无缝地参与到科研数据信息流的整个过程,并具有不可替代的重要地位。

(2)科研数据管理具体方法、手段受到学科性质的影响。学科性质决定了其科研数据上的差异。无论从科研数据的采集上还是管理方法以及数据的老化规律上,理工类科研数据都明显不同于社会科学类科研数据,因而科研数据的具体管理模式受到学科性质的影响。

(3)科研数据管理是跨界管理、动态管理以及嵌入管理的结合。科研数据管理并不属于传统图书馆的服务范畴,另外它还涉及到不同组织之间的深入合作,它是一种跨界服务。学科馆员应该更好地嵌入到科研团队以及用户之中,它也是一种嵌入式服务。另外,科研数据管理是一个连续的过程,服务还呈现连续性与动态性等特征。

(4)科研数据管理需要维护数据宏观层面的内在统一性以及客观性等。科研数据作为一种具有档案价值的信息资源,其价值及学术权威性来源于数据的客观性及可重用性等特征,而作为学术质疑的最后评判,科研数据应该保证其自身的内在统一性及客观性。这需要学科馆员具有相关的知识背景以及敏锐的眼光,能够对科研数据进行科学鉴定。

3.2 学科馆员与科研数据管理之间的关系

从上述几点特征上看,科研数据管理与学科馆员之间具有十分自然而紧密的关系。学科馆员无疑将成为科研数据管理的主要力量。科研数据信息流整个过程所包含的诸多环节,学科馆员都可以参与其中,在某些环节学科馆员将成为最主要的角色。凭借图书馆拥有的资源优势,学科馆员完全可以提供深度知识产品,创新服务方式,提升服务的水平。学科馆员与科研数据管理之间的关系具体包括如下几点:(1)科研数据管理拓展了学科馆员的服务边界,使学科馆员从单纯的服务型向服务与科研相结合的类型转变,从而更好地促进学科馆员的个人发展。(2)科研数据管理的具体模式会因学科性质不同而不同,所以必须要求管理人员具有相应的学科知识背景。学科馆员应专注于所服务的具体学科,在知识结构上要能够满足科研数据管理的要求。(3)科研数据管理能够使学科馆员的知识结构得到进一步完善和发展,对科研过程的深入参与使得学科馆员能够将工作与个人发展更好地结合在一起,并为其提供更好的智力创新机会。(4)除参与到科研数据管理信息流的整个过程,学科馆员还可以提供大量的辅助性服务,比如通过技术支持、活动组织以及相关内容培训等保证科研数据管理的顺利展开。

科研数据管理是一项非常复杂的任务,涉及到众多的服务形式。以科研数据信息流为主线,从学科馆员的视角出发,能够更好地定位学科馆员的角色,也能够更好地将科研数据管理与学科馆员的个人成长结合起来。

4 学科馆员在数据管理中的具体角色

科研数据信息流所包含的各个环节涉及到不同的管理工作,学科馆员可以不同程度地参与到具体的科研工作之中,从而可以进行不同程度的创造性劳动。每个环节涉及到的工作内容不同,有必要针对不同的信息流环节进行讨论,明确学科馆员在不同环节中的具体角色。

4.1 学科馆员在科研数据采集中的角色

科研数据的采集是指从信息源直接获取数据的过程,数据的获取主要包括三个方面:(1)通过实验或者仪器进行观察而得到的科研数据;(2)通过已有文献的分析、调查问卷等方式获得的数据;(3)主要对已有非数字化数据资源的数字化。学科性质的差异决定了数据获取方式上的差异,第一种通过实验或仪器观测获取科研数据的方式主要存在于理工学科。这种科研数据获取方式中,由于专业性较强以及设备操作需要专门的知识等原因,学科馆员的参与性相对较低,其主要工作在于跟科研人员建立良好的沟通渠道,及时准确地将科研数据保存起来,分担科研人员存储数据的工作。第二种方式主要存在于社会以及人文学科之中,相对于第一种方式来说,学科馆员在这些学科的数据采集工作中参与性相对较强,可直接参与到相关数据的获取工作。比如,采集某一历史阶段特定社会群体的相关数据,制定数据采集计划后,学科馆员完全可以与相关科研人员协同起来,分头进行数据采集任务。由于历史类数据主要通过相关历史文献等渠道获取,学科馆员便可以利用图书馆的资源优势进行相关的文献分析,从而得到所需的研究数据。学科馆员也可以参与问卷调查等数据获取工作。数据获取以后,学科馆员还应该负责数据的格式转换、汇总等操作,将分散的数据集中起来统一存储。第三种方式也是学科馆员进行数据采集的重要方式,将图书馆馆藏的非数字化数据转换为数字化存储,是充分挖掘馆藏资源的重要手段,可以将这部分转化后的数据直接提供给用户使用。

4.2 学科馆员在科研数据鉴定中的角色

科研数据从采集到存储的过程必须要经过鉴定,这是由这种资源的固有特点决定的,因为科研数据是客观实在的定量反映,具有极强的客观性,从而也决定了其数据集在宏观层面的逻辑统一性。现实中的科研数据是良莠不齐的,如果不对其进行严格的质量控制将会造成资源自身逻辑上的矛盾。因而在科研数据资源进入存储之前,需要具有相关数据管理经验的人员对其进行必要的鉴定。学科馆员既具有相关学科的知识基础,又具有数据管理的工作经验,科研数据的鉴定自然成为了学科馆员的一项非常重要的任务。数据鉴定也对学科馆员提出了更高的要求,学科馆员需要从宏观层面了解科研数据资源的整体情况,需要具有敏锐的职业眼光对科研数据的真伪以及优劣进行判断。在E-science时代,学科馆员的跨学科优势将更为重要,在嵌入科研的过程中学科馆员的分工也更加明确、深入。

4.3 学科馆员在科研数据揭示与描述中的角色

对经过鉴定的科研数据进行保存,还需要揭示与描述这一环节。所谓科研数据的揭示是指对科研数据进行充分的分析,从而获取其内容特征。然后,通过与之相适应的元数据进行描述。对于传统文献资源的内容揭示,馆员可以进行直接的阅读与分析,但科研数据的特点使得其内容揭示更加困难,客观上要求学科馆员能够熟练掌握相应学科的数据分析软件,并结合自己的工作经验相对间接地获取资源特征,并根据这些特征对资源进行元数据描述。科研数据的元数据描述既要考虑资源本身的特征,还要考虑标准之间的统一问题。学科馆员要比较全面地跟踪整个科研数据的生命周期,以准确揭示资源特征,并合理地对资源进行元数据描述。

4.4 学科馆员在科研数据存储中的角色

科研数据存储给学科馆员带来了大量的工作内容,这些任务主要包括如下几方面:第一,科研数据存储格式的转换。科研数据的存储与其他资源不同,不仅要注重对数据本身的保存,还要注重数据的可重用性,这就要求对采集来的数据进行一定的格式转换,使那些不能够被直接利用的数据转变为能够被相关软件直接处理的数据。第二,科研数据的逻辑存储结构设计。科研数据是唯一的,也就是说它绝对不会像图书类文献那样存在众多副本。同一学科的不同科研数据,代表了这个学科在不同方向上取得的定量描述结果,这些科研数据具有一定的内在逻辑性。为了方便用户使用,完全可以利用其内在的逻辑性对科研数据进行存储,比如某一学科的科研数据的树形逻辑存储结构等。第三,科研数据的长期保存。从资源建设的角度来说,科研数据的长期保存不仅旨在满足当代人的科研需求,还能够向未来的研究工作提供客观的、全面的以及可供其直接使用的数据。科研数据的长期保存除了赋予资源以相应的档案价值外,还赋予了资源可用性价值,对于未来的科学研究来说,这部分资源将具有十分重要的意义。重要科研数据的保存工作可能成为学科馆员的一项主要工作职责。

4.5 学科馆员在科研数据利用中的角色

在科研数据的利用过程中,学科馆员主要提供科研数据的检索服务,即为相应的科研人员快速地检索出可供其直接使用的科研数据。学科馆员也可以对科研过程进行跟踪,从而主动为科研人员提供所需数据。比如科研项目开始之前,主动为其搜集相关的历史科研数据供其参考,在科研过程中还可以适时地将新产生的科研数据搜集起来,并对其进行处理以及存储,作为新的资源。

学科馆员掌握着最全面的科研数据,相对于专职科研人员来说在这方面具有得天独厚的优势。这种优势可以使得学科馆员的工作从辅助性的转变为主动性的,也就是说学科馆员可以从事基于科研数据的独立的科学研究工作。比如,学科馆员利用相关工具对某一学科的科研数据进行大数据分析,从而得出重要的科研结果等。从这一点上看,科研数据对于学科馆员来说,提供的是全新的机遇,它给学科馆员实现个人价值提供了前所未有的空间。

4.6 学科馆员在科研数据剔除中的角色

科研数据有着自身的生命周期,当其使用价值不复存在,或者已经被更精确的科研数据所取代时,那么它就完成了科研数据管理的整个生命周期。不过考虑到科研数据的内在逻辑一致性,其剔除工作并非那么容易。旧数据的剔除意味着新数据的引入,这一点不同于传统的信息资源,因为对于科研数据来说没有新的替代资源,旧的数据一般并不具有退出科研舞台的必要,而新旧数据的转换往往会涉及到整个资源存储逻辑的调整。也就是说,必须通过学科馆员这样有相关工作经验的人进行替换、调整等操作,才能维持资源整体的内在一致性。

以上以科研数据的生命周期为主线,探讨了学科馆员在其不同环节中的具体角色。可以看出科研数据作为一种重要的信息资源,其管理活动既需要相应的知识背景,又需要图书馆相关服务的工作经验,这一点使得学科馆员与科研数据管理之间具有十分自然的联系,科研数据管理将会成为最能体现学科馆员个人价值的工作之一。科研数据管理虽然在宏观上包括上述相同的环节,但是在每个具体的环节之中科研数据的管理活动会因学科性质的不同而产生极大的差异。这种差异越大就越体现学科馆员工作的独特性与重要性,同时也为学科馆员提供了极为广阔的创新空间。

5 学科馆员知识结构要求及个人发展

可以看出,科研数据管理以全新的工作内容与方式,给学科馆员原有的更倾向于辅助性以及机械性的工作赋予了更多的建构性特征。对于学科馆员来说,科研数据管理意味着某种契机以及创新空间,学科馆员可以根据自己的兴趣爱好、知识结构,通过科研数据管理嵌入到相应的创造性工作之中,这种嵌入性工作将具有更为明确的定位,在这里学科馆员因为跨领域的知识结构而具有不可替代的重要地位。比如,学科馆员因为其得天独厚的资源优势,而对某一领域进行大数据分析,从而得出重要的科研成果等,这样的工作使学科馆员具有独立从事某一领域研究的机会。从某些方面来说,对于学科馆员的个人发展来说,这一转变是本质性的。

在传统观念中,学科馆员的工作是服务性的,属于一种高尚的利他主义行为。很多学科馆员在工作中放弃了自身学习及专业知识提升的机会。科研数据管理为学科馆员提供了一种新的契机,学科馆员可以将个人的兴趣爱好与本职工作很好地结合在一起,从而有机会进行个人专业知识方面的发展,这对于学科馆员个人的全面发展来说是极为重要的。科研数据管理将利己的个人发展与利他的服务行为合理地融合在一起,从而赋予学科馆员的个人全面发展以最自然的尊重,与此同时也提升了学科馆员的服务水平,因为学科馆员在科研数据管理方面提供的服务是以专业背景知识为基础的,学科馆员相应的学科知识基础更为扎实,那么他所能提供的服务也将更具价值。通过科研数据管理,学科馆员的自我发展与其提供的科研数据方面的服务自然地交织在一起,科研数据管理成了学科馆员最自然的工作内容,而同时也提供了个人发展与服务完美衔接的舞台,学科馆员的工作将更具建构性和创造性,这无疑有助于提高科研数据相关服务的质量。

6 结语

本文从科研数据管理的定义、特征以及信息流入手,探讨了科研数据管理与学科馆员之间的关系。在此基础上,分析了科研数据作为一种特殊的信息资源所包含的信息流环节及特点。然后针对科研数据信息流的具体环节,探讨了学科馆员在相应工作中的具体角色。通过分析,科研数据管理与学科馆员之间具有极为自然的关系,科研数据管理赋予学科馆员个人发展以全新的契机与舞台。通过科研数据管理,学科馆员的工作将会获得更多的建构性以及创造性,从而赋予图书馆数据服务以更多的内涵和价值。

[1]Subject Liaison 2.0[EB/OL].[2014-09-20].http://www.learningtimes.net/acrlconference/2009/subject-liaison-20/.

[2]ARL publishes special reporton liaison librarian roles[EB/OL].[2014-09-20].http://www.arl.org/news/pr/rli 265pr.shtm l.

[3]ANU data management manual:Managing digital research data at the Australian National University[EB/OL].[2014-09-10].http://ilp.anu.edu.au/dm/ANU_DM_Ma nual_v1.03.pdf.

[4]王婉.澳大利亚高校图书馆参与科研数据管理服务研究[J].图书馆论坛,2014,34(3):130-136.

[5]Ball A.Review of Data Management Lifecycle Models[EB/OL].[2014-09-25].http://opus.bath.ac.uk/28587/1/redm1rep120110ab10.pdf.

猜你喜欢

信息流数据管理馆员
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
航发叶片工艺文件数据管理技术研究
基于约束逻辑的网络非集中式信息流整合系统设计
基于信息流的作战体系网络效能仿真与优化
基于人本理念的高校图书馆创新管理探讨
战区联合作战指挥信息流评价模型
数据挖掘在学生成绩数据管理中的应用研究
数据挖掘在学生成绩数据管理中的应用研究
图书馆青年馆员的职业生涯规划研究