图书馆员的角色定位与重塑:从学科馆员到数据馆员
2019-06-19李翠花
李翠花
摘 要 文章从数据馆员的岗位名称、数据馆员的工作内容、数据馆员的技能要求等方面阐述了数据馆员的角色定位,分析出数据馆员与学科馆员之间的差异,并指出学科馆员向数据馆员转变的关键,最后提出加强数据馆员的培训、制定科学的数据管理规范、完善数据服务流程、推动人才引进计划是数据馆员重塑的重要策略。
关键词 数据馆员 角色定位 学科馆员 数据服务 图书馆
分类号 G252
DOI 10.16810/j.cnki.1672-514X.2019.05.002
Abstract This paper expounds the role of data librarians from the aspects of the post name of the librarian, the work content of the data librarian, the technical requirements of the data librarian, and analyzes the difference between the librarian and the subject librarian. It points out the key to the transformation of subject librarians to data librarians, and finally puts forward that strengthening the training of data librarians, formulating scientific data management norms, perfecting data service process and promoting talent introduction plan are important strategies for data librarians to remodel.
Keywords Data librarians. Role orientation. Subject librarians. Data services. Library.
0 引言
学科馆员是指基于馆内资源为用户提供学科信息组织、学科信息检索、学科信息挖掘服务的图书馆员[1]。大数据的出现,使得图书馆的学科馆员正向着数据馆员的方向转变。2006年,美国研究图书馆协会首次提出了数据管理在图书馆中的重要作用[2]。2008年,Swan和Brown正式命名了“数据馆员”这一职业角色,指出数据馆员是图书馆中对数据进行采集、储存、分析和管理的人员[3]。2015年,国务院颁布了“关于印发促进大数据发展行动纲要的通知”,提出了我国要加强数字图书馆的建设,并大力發展科学大数据和知识服务大数据的应用[4]。经过几年的实践,可以说图书馆的学科知识服务,已经从过去的文献资源服务、学科咨询服务发展到了嵌入式科研服务、智能数据预测服务等新阶段,因此数据馆员也将逐渐成为图书馆的重要岗位。对于数据馆员的认识和定位,国内的业界学者针对其专业技能,岗位职责,数据意识,数据管理等开展了相关研究[5-7]。本文拟从目前国内外图书馆学科知识服务发展中,根据相关的工作内容,岗位技能要求等方面来论述数据馆员的定位与重塑。
1 数据馆员的角色定位
到目前为止,国内图书馆尚未出现以“数据馆员”命名的岗位,但已经有一些图书馆依托高校开设了相关的岗位,如上海交大图书馆、复旦大学图书馆、中科院的文献情报中心和武汉大学的 “高校科研数据共享平台”等[8]。与国内相比,国外对数据馆员的重视程度较高。根据调查发现,国外不仅有美国航空航天局、英国研究理事会、澳大利亚研究理事会等权威机构发布的数据馆员政策,而且还有耶鲁大学图书馆、爱丁堡大学图书馆、墨尔本大学图书馆等世界名校图书馆发布的数据馆员招聘信息[9]。以国际科学信息服务与技术协会(IASSIST)为例,该协会的网站上列出了从2005年至今的数据馆员招聘信息。通过对这些信息进行分析,可以大致从数据馆员的岗位名称、工作内容和职业素养三个方面看出数据馆员的角色定位[10]。
1.1 数据馆员的岗位名称
从国外图书馆有关数据服务来看,“数据馆员”的岗位名称在图书馆中并没有统一的命名。最基本的是数据馆员(Data librarian),此类馆员侧重于对数据的管理,主要负责数据采集、数据处理、数据存储等工作。第二种是数据专家(Data specialist),此类馆员侧重于对数据的分析,馆员需要掌握数据的统计分析方法和相关工具的使用。第三种是数据服务馆员(Data services librarian),此类馆员侧重于数据的应用,通过使用可视化工具对数据进行分析,不仅可以为图书馆提供决策支持,还可以为用户提供参考咨询、科研数据分析、数据管理计划等服务。第四种是研究数据馆员(Research data librarian),此类馆员侧重于为用户提供嵌入式的学科服务,根据科研数据进行数据挖掘和科研热点预测。第五种是专门性的学科数据馆员,此类馆员侧重于对单一学科或领域的数据进行分析,如社会科学馆员、生物学馆员等。
1.2 数据馆员的工作内容
在实际工作中,不同数据馆员的工作内容有很大的差异,即使其命名相同,工作内容也大相径庭。具体而言,数据馆员的工作内容可以从数据生命周期的角度进行划分。数据采集是数据馆员的首要工作,通过网页爬虫工具、图书馆数据管理系统等,数据馆员可以方便地采集到所需的数据信息。通过DSpace、Dataverse、Hadoop 等,数据馆员可以优化数据的存储结构。通过R语言、Python、MapReduce、Hive等,数据馆员可以对数据进行统计和计算,并生成可视化的图表,实现对数据的处理和分析。通过Tensorflow,数据馆员还可以对数据进行图像处理和影像处理,形成神经网络,实现从线性数据到非线性数据的处理和分析。
除了从数据生命周期的角度进行划分外,数据馆员的工作内容由于经常与图书馆的参考咨询服务和科研服务有关,还可以从图书馆的服务内容进行划分,包括根据网络数据和搜索行为构建的个性化信息推送服务、图书推荐服务等工作。从这些工作内容可以看出,数据馆员的工作内容比学科馆员更有深度和广度,与学科馆员有很大的差别。
1.3 数据馆员的技能要求
在图书馆中,数据馆员属于综合性人才,因此其技能要求也比较多。这些技能主要包括计算机应用技能、数据管理技能、专业学科知识水平、团队协作和领导能力等。在计算机应用技能方面,数据馆员除了需要掌握Python、Java、HTML等开发语言外,還需要熟悉My SQL、oracle 等数据库的存储原理和使用方法。在数据管理技能方面,数据馆员需要了解数据的生命周期规律,对数据所形成的信息资源具有良好的组织能力,能够在数据产生、获取、处理、存储、分析和利用的过程中,对数据进行有效的管理。另外,数据馆员还需要掌握DSpace、SPSS、CiteSpace等工具的使用方法。
在专业学科知识水平方面,数据馆员必须对相关学科的基础知识和科研背景有一定的了解。这就要求数据馆员对其他学科有所涉猎。为了更好地支持学校或科研机构的研究,数据馆员还应该熟悉规范的科研政策和流程,并对科研中涉及的知识产权、数据隐私等信息具有法律上和道德上的认识。在团队协作和领导能力方面,数据馆员除了要具备独立完成任务的能力外,还需要具备良好的沟通协调和组织领导能力。从数据馆员的技能要求可以看出,数据馆员的角色定位更偏重于对数据存储和分析的支持,它反映了数据馆员工作的综合性、复杂性和专业性。与学科馆员相比,数据馆员更应是一名具有专业技能的数据专家。
2 从学科馆员到数据馆员的角色转变
数据馆员是图书馆数据服务深化后的产物,从上述可以看出,数据馆员在岗位名称、工作内容和技能要求上与学科馆员有很大差异。而在目前一些图书馆中,数据馆员工作实际上是由学科馆员兼职担任。例如,复旦大学图书馆在2017年7月招聘的“学科信息分析与研究馆员”除了需要负责基本的学科服务外,还需要完成研究数据的收集、管理、分析等数据服务工作[8]。图书馆若想为用户提供更好的数据服务,就应该明确学科馆员与数据馆员之间的差别与联系,在管理制度、服务思维、服务形式上加以修整,完成从学科馆员到数据馆员的角色转变。
2.1 从专指性思维到关联性思维
图书馆在每天日常的服务工作中会产生大量的借阅信息、咨询信息、电子资源使用记录、数据库购买信息、科研成果等数据。对于数据馆员而言,这些数据都具有关联性。熟悉图书馆的业务数据只是数据馆员最基本的要求,数据挖掘与用户行为分析才是数据馆员的根本工作。例如,不同类目的学科馆藏数据不仅作为统计之用、进行图书推荐,更应在思维意识中认识到这些学科馆藏数据在时间和空间上具有关联性的,它们不仅与图书的利用率、人们对图书的喜爱程度有关,而且还与科研数据发展的趋势和热点、用户学科结构与资源建设情况等有很大的关系。通过对这些数据进行分析,可以生成不同数据之间的动态网络,并通过可视化的方式呈现给图书馆和用户,实现多维的数据服务。
2.2 从事实数据分析到隐性知识挖掘
事实数据是指具有某种具体事实或知识数据的信息,它是图书馆开展各项工作的基础。以图书馆支持的科研项目为例,除了关注课题相关的事实数据,如文献的数量、增长量、增长率等,则更多地需要关注到事实数据背后所包含的隐性知识。数据馆员应通过CiteSpace等工具,有效地对文献的关键词、学科领域、发文作者、所属机构等信息进行分析,并生成具有关联性的知识图谱,更好地挖掘出其中的隐性知识。
隐形知识的挖掘不仅需要依赖相关工具的数据分析,还需要依赖于个人的数据分析经验,以及对数据的观察力和理解力。因此,数据馆员在数据分析和学科研究方面,需要有比学科馆员更高的数据素养。只有这样,数据馆员才能从庞大的数据中,敏锐地发现事实数据之间的关联,提取出关键信息进行定量和定性分析,为图书馆的数据服务提供决策支持。
2.3 从任务执行到动态跟踪
从工作职责来看,数据馆员与学科馆员是有本质区别的。以图书馆的参考咨询服务为例,传统学科馆员的工作内容是目标导向的,用户提出了问题,然后由学科馆员进行解决,问题解决完毕后,学科馆员的工作也就结束了。这种工作模式只会让学科馆员关注到任务的执行结果,而无法了解到用户提问的真正需求和思维脉络,不利于图书馆为用户提供更高层次的增值服务。而数据馆员在开展数据服务时,不仅需要解决用户当前的问题,还需要动态跟踪用户的行为数据,从而分析出用户的隐性需求,为后续开展个性化服务作铺垫。
因此,数据馆员应融入到不同的图书馆业务中,对图书馆及其用户的数据进行跟踪,而无需局限在某一个部门或岗位上。通过数据馆员对各类数据的动态分析,图书馆才可以了解自身资源建设和服务的情况,并针对用户的需求进行调查,从根本上提高图书馆服务的质量。
2.4 从馆员独立到多馆员协作
在数据化时代,图书馆的数据服务需要多种学科和技能的融合,一名图书馆员即使学习能力再强,精力再多,也会存在知识的盲点,更无法面对庞大的数据采集和分析量。因此,在图书馆的数据服务方面更需要多馆员进行协作,不同的馆员分别负责数据的采集、数据的管理、数据的分析、数据的服务等内容,必要时还可以邀请相关领域的专家进行协助,这样才能更好地发挥出不同馆员的长处,提高图书馆数据服务的优势。
根据“数据越庞大,分析的结果越准确”[9]这一大数据理论定律,图书馆联盟的出现,可以让数据馆员在采集到更多的数据进行数据分析时,能增加数据预测的准确率。目前,有很多图书馆已经联合起来建成了图书馆联盟。通过图书馆联盟,数据馆员可以通过分工协作的方式,进行相关数据的采集和存储,减轻单一图书馆在人力和资金方面的压力,并且还可以根据图书馆不同的学科优势和特色馆藏,通过共享的方式,为用户提供跨地区、跨领域的专业性服务,提高图书馆整体的数据服务水平。
2.5 从基础服务到智能化服务
数据馆员对图书馆管理与服务整体过程的数据进行分析和预测,其结果不仅能不断提高服务水平、更将变革整个图书馆的服务形式。数据馆员辅助开展的智能化服务从目前现状来看包括图片影像信息自动化提取、嵌入式科研服务、用户行为分析和预测、图书馆决策支持、智能机器人问答、个性化信息推送等。这些服务的开展预示着图书馆的基础服务已逐渐走向智能化服务阶段。在智能化服务过程中,所应用到的数据就在于数据馆员对基础服务产生的数据的挖掘,整合,以此来支撑智能化服务系统的运行。以TensorFlow为例,它是谷歌研发的一个开源人工智能学习系统。数据馆员通过这一系统软件,可以方便地进行用户数据的语音识别和图像识别,构建机器人深度学习策略,并用于图书馆的参考咨询服务当中。因此,数据馆员的服务是基础服务向智能化服务的延伸。它根植于原有的服务,但又能够为图书馆创造更多的价值。
3 从学科馆员到数据馆员的发展策略
随着图书馆的创新服务发展,图书馆在管理制度、服务思维、服务形式等方面都发生了根本性的转变,这表明图书馆员必须在数据素养、专业技能、服务质量上需要着力更大的提升。因此,学科馆员在向数据馆员方向发展转变的过程中,图书馆需要在人员培养、管理规范、完善数据流程服务等方面制定好发展策略,这样才能满足图书馆用户日益增长的数据服务需求。具体而言,图书馆可以通过以下策略构建专业化的数据馆员团队。
3.1 加强数据馆员的培训
数据馆员的工作性质决定了数据馆员应该是一名综合性的人才,因此,这一岗位要求馆员必须要掌握多方面的知识和技能,数据馆员除了要掌握基本的计算机知识外,还必须掌握大数据分析、数据管理等内容。为了让数据馆员树立终身学习的意识并掌握相关的专业技能,图书馆应该定期开展数据馆员的培训和交流活动,例如可积极参加中国图书馆学会专业图书馆分会定期举办的关于数据馆员的培训课程。在最近的数据馆员培训班中,该分会开设了面向初学者和进阶者的培训班,培训从数据政策、数据采集、数据处理、数据存储、数据管理、數据计算、数据分析、深度学习、案例分析等方面,介绍了DSpace、Dataverse、R语言工具、Hadoop、Python、Tensorflow等工具的使用方法,满足了不同数据馆员的学习需要[10]。
3.2 制定科学的数据管理规范
即使数据馆员拥有良好的知识技能,但如果图书馆没有良好的数据管理规范,也会对数据流产生负面的影响,从而影响数据分析的真实性和准确性。因此,图书馆应该制定科学的数据管理规范,让数据馆员能够在协调合作的良好氛围中,高效地利用数据,最大限度地挖掘出数据中的有用信息。首先,图书馆应该制定统一的元数据规范,让数据馆员在进行数据编码时有章可循,提高数据编码的兼容性和系统性。其次,图书馆要制定规范科学的Web服务接口、数据库接口标准,让不同的数据馆员可以利用不同的工具或平台对数据进行采集和分析。最后,图书馆还应该为用户提供一个统一的访问平台和检索平台,以利于数据馆员获取到标准化的数据,减轻数据处理和分析的负担。
3.3 完善数据服务流程
数据馆员的服务模式并不是一成不变的,随着图书馆用户需求的改变,数据馆员需要提供的服务也会发生改变。因此,图书馆应该根据用户的需求和馆内的实际情况,制定完善的数据服务流程,在保证基本服务顺利进行的同时,让数据馆员有充分表达自身想法的空间,以一种开放的方式对待数据服务,这样才能不断地满足用户的动态需求,推动个性化服务的发展。另外,也要正确对待图书馆用户反馈的意见和建议,如果这些意见和建议能够得到数据馆员的分析,同样也可以成为完善数据服务流程的宝贵资料。由此可见,图书馆的数据服务流程,一方面需要图书馆的领导人员加以重视,制定相关的政策,而另一方面也需要数据馆员进行协助,从服务的过程的过程细节中不断完善,把握动态的学科趋向,挖掘关联数据,弥补数据缺失,只有这样,才能最大限度地满足用户的需求。
3.4 推动人才引进计划
图书馆需要面对的用户有不同的学科背景,数据馆员即使学习了很多的技能,也无法满足所有用户的需要。因此,图书馆要因地制宜地引进不同学科的优秀人才,以学科带头人或学科顾问的方式,辅助数据馆员开展数据服务。另外,图书馆可以招募多学科背景的专业人才成为数据馆员,并大力挖掘现有的人才资源参与数据服务,逐步培养出一批高素质的数据馆员队伍,为图书馆的未来创造新的发展方向。
4 结语
从学科馆员到数据馆员的角色转变,不仅仅是馆员职能的转变,更是馆员从数据素养、专业技能、服务思维的转变。为了建立一支优秀的数据馆员团队,图书馆应该在数据馆员培训、数据管理规范、数据服务流程、人才引进等方面多加努力。另外,当前国内在数据服务方面的实践才刚刚起步,数据馆员这一岗位要求无论在工作内容上,还是在数据素养等方面还有很多发展的空间,图书馆应该借鉴国外有关数据馆员的建设经验,并在我国国情的基础上加以创新,努力推动图书馆事业在数据馆员方面的新发展。
参考文献:
祝小静,张璇.学科馆员学科知识服务能力建设研究[J].图书馆学研究,2017,15:98-101,97.
钱鹏.高校科学数据管理研究[D].南京:南京大学,2012.
SWAN A, BROWN S. The skills, role and career structure of data scientists and curators: an assessment of current practice and future needs[J].Nieuwsbrief Spined,2008,22(6):20-22.
国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].[2017-09-14].http://www.gov.cn/zhengce/
content/2015-09/05/content_10137.htm.
崔宇红,楚恒亚,李枫.学术图书馆数据馆员职业发展状况的调查与分析[J].图书情报工作,2017,(6):67-72.
顾立平.数据治理:图书馆事业的发展机遇[J].中国图书馆学报,2016,(5):40-56.
刘桂锋,卢章平,化慧.图书馆大数据知识服务生态体系及其动力机制研究[J].国家图书馆学刊,2016,(3):52-60.
郭桑,林薇.数据馆员及其对高校图书馆职能转型的影响[J].农业图书情报学刊,2017,(2):193-197.
康旭琴,陈锐,程瑾,等.科学数据管理和数据馆员的发展
及关键问题[J].中华医学图书情报杂志,2016,(5):1-5.
IASSIST Home[EB/OL].[2017-9-18].http://www.iassistdata.org/.
复旦大学图书馆2017年7月招聘10名专业馆员[EB/OL].[2017-09-14].http://www.gaoxiaojob.com/zhaopin/
gaoxiaojiaofu/20170727/258589.html.
艾瑞斯.大数据思维与决策[M].北京:人民邮电出版社.2014.
佚名.2017年数据馆员培训班(第二期)通知[J].图书情报工作,2017,(2):152.