国外数据监护教育与职业发展研究
2013-12-06□叶兰
□叶 兰
科学研究,无论是自然科学,还是人文社会科学,通常需要利用并产生大量的科学数据。从2002年我国启动科学数据共享工程开始,国内学者及机构就已开始了对科学数据的研究。进入21世纪,随着e-Science的产生,科学数据的作用和地位被提到了前所未有的高度,以科学数据的长期保存、组织、维护、管理和再利用为重点任务的Data Curation(美国经常使用该称谓,在英国通常使用Digital Curation)作为一个新兴的研究领域应运而生。对于这一新术语,国内还未有一个统一的翻译。笔者较为倾向杨鹤林在《数据监护:美国高校图书馆的新探索》[1]一文中所提出的译名。下文将以“数据监护”作为对此新术语的中文译名。
国内图书情报学领域较早涉及数据监护的是杨鹤林。随后,谭榕[2]、程莲娟[3]、吴敏琦[4]、沈婷婷[5]等对数据监护的定义、产生背景、意义、图书馆的实践活动等进行了研究。钱鹏和郑建明[6]、师荣华和刘细文[7]则从科学数据组织与服务的角度开展研究,对科学数据的含义、组织与服务模型、实施路线、需解决的关键问题、生命周期流程下的图书馆数据服务进行了相关研究。总体来看,国内目前对数据监护的研究还不多,主要是对国外发展情况进行概括性介绍,对数据监护发展中一个重要的问题——教育与职业发展,仅简要提及,还未有专门文献研究该主题。本文将详细介绍国外(主要是英国和美国)数据监护教育与职业发展的理论与实践进展,为国内图书情报学教育课程体系的构建及人才培养提供借鉴。
1 国外理论研究
大规模数据集的收集、组织与存储催生了对具有数据监护技能的数据人文主义者(Data Humanist)、数据专家(Data Scientist)、数据研究科学家(Data Research Scientist)、数据服务馆员(Data Services Librarian)等岗位的需求。岗位的需求促使国外不少学者研究数据监护的职业技能,并根据不同的角色提出了不同层次的技能需求。研究内容主要有3类:
一类是从整体上分析数据监护相关利益者的角色与职责。2007年,L.Lyon[8]总结了数据监护各相关利益群体,包括科学家、数据管理机构、数据中心、第三方数据使用者、基金资助者、出版商,并分析各自的角色、权利、职责及相互间的关系。2008年,A.Swan和S.Brown[9]在英国JISC报告中提出了科学数据服务的4种角色:数据创造者(Data Creator)、数据专家(Data Scientist)、数据主管(Data Manager)、数据馆员(Data Librarian),并区分了各自的职责与技能,部分技能呈现相互交叉(见图1)。
第二类是专门研究图书馆员在数据监护中的角色定位及职业技能。一部分学者通过问卷调查与访谈形式了解馆员对数据监护工作技能的需求。如:A.Creamer[10]等通过对美国新英格兰地区6个州的141个健康科学馆员及科学技术馆员的调查,了解他们在数据监护实际工作中所需的技能。调查结果列出了20个数据监护相关的技能,馆员们经常使用的技能有Web2.0技术、数据存档与保存服务、数据管理工具的使用、数据共享与机构库管理、宣传推广、了解研究人员的数据管理需求等。同时也指出,
目前开展数据监护的图书馆还不多,但图书馆已开始意识到自身在数据监护中的角色及掌握数据管理技能的紧迫性,已开始对数据管理进行战略规划。Y.kim等[11]通过访谈了解eScience专家及实习学生的工作任务与工作技能以总结eScience专家应具备的职业技能。他们将所需的技能分为三大类:数据相关的技能(包括原始数据收集、二次数据收集、数据存储、数据管理、数据分析及数据展示等6大技能)、与人相关的技能(包括发现合作机遇、与人交流、团队与组织合作、分析科研人员需求、促进科研人员与信息专家的合作、教育与培训等技能)及与事物相关的技能(主要是计算机与软件的使用技能,包括调研及推荐技术解决方案、辅助科研人员使用IT技术等),并推荐了10个课程供eScience专家参考,包括数据监护、数据库设计与管理、项目管理、数据挖掘等课程。
图1 数据监护利益相关者的职责与技能
第三类是追溯数据管理技能的教育与培训机构以了解他们对数据管理人才的培养计划。2012年,V.E.Varvel Jr等[12]对55家iSchool(图书情报学或信息学院)在2011年秋季学期开设的476门数据相关课程进行了调研,发现仅有11所机构提供专门针对数据监护的课程,12所机构提供了数据相关的课程,15所机构提供涵盖数字内容但是未涉及数据监护的课程。A.T.Creamer[13]等对北美58个 ALA认证的图书情报学项目(来自美国、加拿大及波多黎各)进行了调查,通过搜索各机构主页上2011年秋季至2012年春季及夏季的课程目录、课程大纲及课程描述,统计涉及科学数据生命周期管理但不包含元数据、数据挖掘及结构、数字馆藏、数据库原理、数据可视化与分析、数字图书馆、数据网络与信息系统等相关的课程。调查发现,仅22%(共13个)的课程专门涉及数据监护。Spencer D.C.Keralis[14]在2012年8月图书馆与信息资源委员会(Council on Library and Information Resources,CLIR)发布的报告TheProblemofData中撰写了数据监护教育部分的内容,归纳了图情领域目前的数据监护教育课程及大学之外的其他机构组织的培训项目。总体而言,国外理论界已开始对数据监护的职业技能进行探讨,对各利益相关者的角色与技能都提出了不同的要求,还调研数据监护教育课程与培训项目的现状,为国外图书馆、研究机构等根据自身角色参与数据监护教育与职业技能的培养提供了理论指导。
2 国外实践进展
2.1 数据监护教育与职业发展项目
近年来,国外不少项目开始研究数据监护各利益相关者应具备的职业技能。在英国,联合信息系统委员会(JISC)、数字保存中心(Digital Curation Centre,DCC)、研究信息网络(Research Information Network,RIN)、数据档案馆(UK Data Archive,UKDA)等组织成为探索数据监护职业技能的领先者。JISC的RDMTrain项目[15](项目时间:2010.8.1-2011.7.31)资助了艺术学科、考古与社会人类学、健康研究、心理学、地理科学、社会科学与临床心理学等学科领域的数据管理培训。此外,JISC与RIN合作资助由DCC领导的DaMSSI项目[16](项目时间:2010.11-2011.8),旨在促进由 Vitae开发的“研究者开发框架”及英国高校与国家图书馆学会推出的信息素养7个支柱模型等工具的应用,帮助研究者更有效地组织数据管理培训与职业发展。目前,DaMSSI已进入第二阶段(Assessment,Benchmarking and Classification,简 称 DaMSSI-ABC,2012.8-2013.8),将继续第一阶段的工作,并支持JISC RDMTrain项目所开发的科研数据管理培训资源的发布与重用。另外,由欧盟委员会资助,来自欧洲、美国、加拿大的多家机构参与的DigCurV项目[17](项目时间:2011.1-2013.7)旨在建立一个数据管理职业培训的课程框架,为图书馆、档案馆、博物馆及文化遗产机构的从业者提供必要的新技能以促进数字资源的长期保存与管理。
在美国,北卡罗来纳大学教堂山分校图书情报学院为全美数据监护教育与培训做出了突出贡献。2008年,该学院建立在线论坛(Digital Curation Exchange)促进数据监护教育领域资源的共享[18]。2009年10月,受JISC及美国博物馆和图书馆服务协 会(Institute of Museum and Library Services,IMLS)的资助,该学院与DCC合作开展项目“缩小数据监护的差距:促进数据监护实践、研究及教育的国际合作[19]”,旨在为中小文化遗产机构提供基本的数据监护知识与技能,为相关利益组织提供教学内容与角色定位的框架模型,并提供相关的教育工具。项目原计划是2009.10-2011.9,后来延长至2012年10月。此外,美国国家科学院的研究数据与信息董事会(Board on Research Data and Information,BRDI)在2011年12月启动了一项对数据监护职业发展机遇与教育需求的研究[20]。该项目旨在确定数据监护职业发展的技能,为数据监护从业者探寻可行的职业发展道路,调研及评估现有的数据监护教育与培训模式,最终形成一个建议报告。
2.2 数据监护教育与职业发展的会议
国际研讨会往往是一个新兴的学科领域或者研究领域得以确立的标志,也是促进相关领域的研究和实践进展的不可或缺的组成部分。2008年,DCC与RIN联合举办的第二届“研究数据管理论坛”探讨数据管理的角色与职责[21]。2011年6月29日,DCC举办“国际数据监护教育论坛”研讨会[22],为数据监护领域的教育人员、培训人员、学生及从业者提供课程设计、教材的编制、学术资料与教程的使用等方面的交流与探讨。2008年,DCC、欧洲数据保存联盟与北卡罗来纳大学教堂山分校图书情报学院联合推出IDEA项目[23],目的是促进数字保存教育与培训的国际合作与交流,至2011年,已举行7次会议。北卡罗来纳大学教堂山分校图书情报学院开展的DigCCurr第一阶段项目(2007-2009)分别在2007年和2009年举办了两次关于数据监护教育与培训的会议。2007年会议主要侧重于对数据监护的认知及所需具备的职业技能[24]。2009年会议主要探讨数据监护的具体实践及未来展望[25]。DigCCurr第二阶段项目(2008-2012)举办了一系列公共研讨会及博士生研讨会以分享数据监护的最新进展,目前已召开3届公共研讨会。美国国家科学院的BRDI于2012年7月19日至20日召开了主题为“大数据时代的数据监护:职业发展机遇与教育需求”的研讨会,来自政府、大学及私人企业的从业人员从各自角度分析对数据监护的看法,并探讨数据监护的教育与职业发展[26]。
2.3 数据监护教育与职业发展课程
教育、培训和课程体系的建立是一个领域得以持续发展的重要保证。目前,国外数据监护的教育已经基本形成了从本科生到硕士、博士,以及在职进修的课程体系。笔者以国外研究数据监护教育与职业发展的文献为线索,参考DCC网站的“Data Management Courses and Training[27]”栏目列表,并访问和检索各大学及机构的网站,从开设机构、课程名称、开课时间、授课对象、课程模式、课程内容等方面调查国外目前数据监护教育与培训课程的现状。并依据开设机构的不同,将国外数据监护教育与培训课程划分为两类:一类是大学图书情报学院开设的专门课程(见表1),该类课程具有教育性质,授课形式正规,一般授予相应的学位,门槛较高,通常仅针对图书情报学领域硕士及博士,学生不仅需要学习数据监护相关的课程,有时还需要学习数字图书馆、数字保存、信息管理等课程。另一类是非大学图书情报学院组织的培训课程(见表2),该类课程具有培训性质,一般不授予学位,形式比较灵活,一般采取研讨会、座谈、短期培训等方式,门槛较低,相关从业者或感兴趣者都可参加。由于是培训性质,培训内容较有针对性,一般集中在数据监护的内容。由于篇幅限制,本文未列出所有的课程,仅选择了一些开展较成熟且反响较好的课程列在表1和表2中,为国内图书馆、图书情报学院等机构开展数据监护教育与培训提供参考。
3 国外数据监护教育与职业发展的特点与启示
(1)数据监护教育与培训的课程还不多,正在兴起
通过调查,笔者发现国外很多数据监护课程与培训计划都是近两年开始设置的,如雪城大学信息学院2012年开设的数据管理相关课程及美国国会图书馆2011年开展的DPOE培训计划。从V.E.Varvel Jr、A.T.Creamer、Spencer D.C.Keralis等作者及笔者的调研来看,目前国外数据监护教育与培训处于尝试与探索阶段,体现在专门针对数据监护的课程还不多,有的课程名称虽然是数据监护,但课程内容仍是传统的数字保存与数字图书馆,还有的是根据现有课程的简单修改而开设的。但不管怎样,国外图书情报学院及图书馆已经敏锐意识到数字科研环境下数据组织与管理、数据保存与利用的新需求,主动变革课程体系以培养数据管理的人才,并开展各种形式的培训更新与提高馆员的数据管理技能。
目前国内的图书情报学院有的课程已不能适应实际工作需要,应抓住数字科研的契机,并吸取国外的经验,设置数据监护课程。在课程设置上尽量将数据监护课程与原有的数字图书馆课程区分开来,在原有数字图书馆课程的基础上,多增加科研工作流、科研生命周期、科研数据分析、学科背景知识等内容的教学。此外,考虑到科学数据管理涉及学科背景知识,图书情报学院在招生时可考虑增加具有自然科学、计算机技术、工程学及数学等学科背景的学生,以更好地适应未来科学数据管理的工作需求。对图书馆来说,应开展多种形式的培训,更新馆员的知识技能以适应未来数据驱动的科研,特别是帮助学科馆员重新审视自身的职业发展规划,推动学科馆员承担数据馆员及数据科学家的角色与职责。可喜的是,国内图书情报学领域开始逐步认识到科学数据管理的重要性。2012年11月4日北京大学图书馆110周年会议“变革与走向:重新定义大学图书馆的未来”将“数据管理与数据服务”作为主题之一。《图书情报工作》杂志社发起的“新型图书馆员能力培训班”(2012.11.14-18)也将科学数据作为其中的一项培训内容。2012年数字图书馆前沿问题高级研讨班将“科学数据管理与学科服务”作为分会场主题之一。
表1 大学图书情报学院开设的课程
表2 非图书情报学院(信息学院)组织的培训课程
(2)课程类型多样,还未形成统一的课程模型
由于数据监护还处于发展阶段,国外不同学者及不同机构根据自己的理解及需求提出了不同的技能要求,导致课程体系也呈现多样化趋势(如:课程名称及课程内容的多样化),迫切需要统一的课程模型与体系以指导各类机构开展数据监护教育与培训。为此,2009年北卡罗来纳州大学教堂山分校图书与信息学院的C.Lee提出DigCCurr Matrix,该矩阵设计了数据监护课程体系的6个维度[41],任何一门课程可选择其中的一个维度或几个维度进行内容设计(见表3)。另外,马塞诸塞大学医学院的Lamar Soutter图书馆与伍斯特理工学院的乔治·戈登图书馆联合发布了数据管理课程框架[42]。该项目受美国IMLS及美国国家医学图书馆资助,为自然科学、健康科学及工程领域大学生及研究生的数据管理教育提供课程规划。该项目认为数据管理课程一般包括7个模块:科研数据管理概况;数据类型、阶段与格式;元数据;数据存储、备份与安全;法律与道德问题;数据共享与重用政策;存档与保存。该框架为准备或正在开展数据管理课程的机构提供了一个模型,在课程设置时可根据学生实际需求选择其中几个部分或全部。因此,我国的图书情报学院及图书馆在开展数据监护教育与培训时,可参考国外这些成型的课程框架。不过需要说明的是,即使是有统一的模型框架,也只能作为参考,国内相关机构需要根据自身需求设计具体教学与培训内容。
表3 DigCCurr课程矩阵
(3)形成了针对各层级的教育与培训项目
国外形成了针对不同人群的数据监护教育与培训体系,不同层次群体可根据各自需求选择参加教育和培训,获取所需的职业技能。如:在校学生可选择相应的本科生、研究生或博士生的培养课程。在职的数据/信息专业人员、研究人员可参加图书馆或其他机构组织的继续教育项目,或选择各图书情报与信息学院提供的教育课程。我国的图书情报从业群体与国外基本类似,也需要针对不同层次水平开设不同的课程与培训体系。
(4)存在多种形式的合作模式
国外的图书馆及大学图书情报学院成为数据监护教育与职业发展的主力。这主要是因为数据监护作为一项知识服务,其数据处理和管理方法实际上源于信息管理,正是图书馆及图书情报学院的强项。为培养数据监护相关人才,国外图书馆及大学图书情报学院开展了不同形式的合作,包括图书馆之间合作(如 CLIR/DLF的 Data Curation Fellowship Program)、图书馆与图书情报学院合作(如:纽约布拉特学院图书情报学院与布鲁克林公共图书馆、布鲁克林博物馆及布鲁克林历史协会合作开设的课程)、图书情报学院与学校其他部门合作(如:亚利桑那大学图书情报学院与外事学院合作开设DigIn课程、缅因州大学数据监护课程的教师基本来自本校的新媒体系、计算机系、历史系、艺术系、空间科学与工程系及图书馆特藏部等)、图书情报学院之间合作(如:伊利诺伊大学图书情报学研究生院、田纳西大学信息学院、美国国家大气研究中心合作提供数据监护教育)、国际合作(如:DigCCurrII是美国北卡罗来纳大学教堂山分校图书情报学院、美国国家档案与记录局、英国格拉斯哥大学HATII合作的成果)。
因此,国内的图书馆及大学图书情报学院在开展数据监护教育与职业发展时也应积极探索适当的合作机制,不能局限于系统内的合作,更需要扩大视野,寻求跨系统合作。因为数据管理本身是一个复杂的过程,其中包含各个领域的问题,还涉及各类交叉学科,并不是图书馆及图书情报学院所能独自完成的,国内的图书馆及图书情报学院应积极与其他学科领域的教育部门合作探索数据监护教育与培训。同时从长远角度来看,更需要与国际上已经开展数据监护教育与培训较好的机构合作,探索与国际接轨的教育与培训课程体系。
(5)教育与培训的课程内容体现实际岗位技能需求
对比国外学者对数据监护职业技能的理论研究与数据监护教育及培训的实践项目,笔者发现国外数据监护教育及培训的课程内容主要包括数字保存、数字馆藏、数据管理工具、协调与交流技能等,基本体现了数据管理岗位的技能需求,表明国外数据监护教育与培训很务实,目的在于让学生及从业者更快地掌握职业技能以适应未来或正在从事的工作。如,CLIR/DLF 的 Data Curation Fellowship Program,其中的自然科学及社会科学数据博士后奖学金计划是与6家大学图书馆合作,由合作的图书馆接收学员,学员直接参与图书馆的实际业务,在具体工作中提高职业技能。北卡罗来纳大学教堂山分校图书情报学院DigCCurr第一阶段的Carolina Digital Curation Fellows项目采取课程学习与图书馆、数据中心、档案馆的数据管理业务相结合的形式资助了9个学生的学习,培养学生的实际工作技能[43]。
这种将课程与实际工作相结合的新型模式值得国内数据监护教育借鉴。国内数据监护教育在理论教学的同时需要注重学生实际工作技能的培养,把到具体学科领域、数据中心、图书馆等的实践作为课程内容之一,培养符合实际业务需求的人才。
4 结语
随着科学数据的发展,制定及规范科学数据管理工作中的能力结构与技能要求将是一项新的发展需求。国外图书情报学院及图书馆无论是在理论研究及实践进展上都已取得一定的成果。国内图书情报学院需要与时俱进地对传统教育课程进行创新,将科学数据管理纳入学科课程体系,为国内科学数据管理培养合格的人才。图书馆必须意识到在数据密集型科研环境中的机遇与挑战,重新规划馆员的职业发展技能,在数据管理和服务中赢得一席之地。
1 杨鹤林.数据监护:美国高校图书馆的新探索.大学图书馆学报,2011(2):18-21,41
2 谭榕,亓靖涛.新时代新角色:数字保存的监管.图书与情报,2011(3):45-48
3 程莲娟.美国高校图书馆数据监护的实践及其启示.图书馆杂志,2012,31(1):76-78
4 吴敏琦.Digital Curation:图书情报学的一个新兴研究领域.图书馆杂志,2012,31(3):8-12
5 沈婷婷,卢志国.数据监管在我国高校图书馆的应用展望.图书情报工作,2012,56(7):54-57,87
6 钱鹏,郑建明.高校科学数据组织与服务初探.情报理论与实践,2011,(2):27-29
7 师荣华,刘细文.基于数据生命周期的图书馆科学数据服务研究.图书情报工作,2011,55(1):39-42
8 Lyon L.Dealing with Data:Roles,Rights,Responsibilities and Relationships.[2012-11-26].http://www.jisc.ac.uk/media/documents/programmes/digitalrepositories/dealing_with_data_report-final.pdf
9 Swan A,Brown S.The Skills,Role and Career Structure of Data Scientists and Curators:An Assessment of Current Practice and Future Needs.[2012-11-26].http://eprints.soton.ac.uk/266675/
10 Creamer A,Morales M E,Crespo J,et al.An Assessment of Needed Competencies to Promote the Data Curation and Management Librarianship of Health Sciences and Science and Technology Librarians in New England.Journal of eScience Librarianship,2012,1(1):18-26
11 Kim Y,Addom B K,Stanton J M.Education for eScience Professionals:Integrating Data Curation and Cyberinfrastructure.The International Journal of Digital Curation,2011,6(1):125-138
12 Varvel Jr V E,Bammerlin E J,Palmer C L.Education for Data Professionals:A Study of Current Courses and Programs.[2012-11-26].http://cirssweb.lis.illinois.edu/DCCourseScan1/Images/iSchoolPoster2012Final.pdf
13 Creamer A T,Morales M E,Kafel D,et al.A Sample of Research Data Curation and Management Courses.Journal of eScience Librarianship,2012,1(2):88-96
14 Keralis Spencer D C.Data Curation Education:A Snapshot.[2012-11-21].http://www.clir.org/pubs/reports/pub154/education
15 Research Data Management Training Materials(RDMTrain).[2012-11-21].http://www.jisc.ac.uk/whatwedo/programmes/mrd/rdmtrain.aspx
16 Research Data Management Skills Support Initiative(DaMSSI).[2012-11-21].http://www.dcc.ac.uk/training/damssi
17 Digital Curator Vocational Education Europe.[2012-11-21].http://www.digcur-education.org/
18 Digital Curation Exchange.[2012-11-21].http://digitalcurationexchange.org/
19 Closing the Digital Curation Gap(CDCG).[2012-11-21].http://digitalcurationexchange.org/cdcg/?q=about
20 Future Career Opportunities and Educational Requirements for Digital Curation.[2012-11-29].http://sites.nationalacademies.org/PGA/brdi/PGA_069853
21 RDMF2:Roles and Responsibilities for Effective Data Management.[2012-11-20].http://www.dcc.ac.uk/events/re-search-data-management-forum/roles-and-responsibilities
22 International Curation Education(ICE)Forum.[2012-11-20].http://www.jisc.ac.uk/whatwedo/programmes/preservation/iceforum
23 International Data Curation Education Action.[2012-11-20].http://ideaworkgroup.org/index.html
24 DigCCurr 2007.[2012-11-21].http://www.ils.unc.edu/digccurr2007/
25 DigCCurr 2009.[2012-11-21].http://www.ils.unc.edu/digccurr2009/
26 Symposium on Digital Curation in the Era of Big Data:Career Opportunities and Educational Requirements.[2012-11-29].http://sites.nationalacademies.org/PGA/brdi/PGA_070217
27 Data Management Courses and Training.[2012-11-19].http://www.dcc.ac.uk/training/data-management-courses-and-training
28 University of Arizona Graduate Certificate in Digital Information Management.[2012-10-31].http://digin.arizona.edu/
29 The Data Curation Education Program(DCEP).[2012-10-31].http://cirss.lis.illinois.edu/CollMeta/dcep.html
30 UNT Receives More Than$800,000in Funding to Investigate Needs in Archiving Research Data.[2012-11-1].http://untsystem.edu/news/2011/August/11-08-09-arch-resdata.htm
31 The iCAMP Project.[2012-09-01].http://icamp.unt.edu/icamp/content/project-abstract.
32 Digital Curation at the University of Maine.[2012-11-23].http://digitalcuration.umaine.edu/
33 Project CHART.[2012-11-23].http://www.pratt.edu/academics/information_and_library_sciences/grant_scholarship_internship/chart/
34 DigCCurr.[2012-11-19].http://ils.unc.edu/digccurr/index.html
35 CAS in Data Science.[2012-11-19].http://ischool.syr.edu/future/cas/datascience.aspx.
36 CLIR Postdoctoral Fellowship Program.[2012-10-31].http://www.clir.org/fellowships/postdoc
37 Digital Curation 101.[2012-11-22].http://www.dcc.ac.uk/training/dc-101
38 UK Data Archive Training Resources.[2012-11-22].http://www.data-archive.ac.uk/create-manage/training-resources
39 Digital Preservation Training Programme.[2012-11-22].http://www.dptp.org/about-2/
40 Digital Preservation Outreach and Education(DPOE).[2012-11-01].http://www.digitalpreservation.gov/education/
41 Lee C.Matrix of Digital Curation Knowledge and Competencies(Overview).[2012-11-21].http://ils.unc.edu/digccurr/digccurr-matrix.html
42 Frameworks for a Data Management Curriculum.[2012-11-19].http://library.umassmed.edu/data_management_frameworks.pdf
43 Background to the Fellowship Program.[2012-11-28].http://ils.unc.edu/digccurr/fellows.html