基于SWOT分析的数据科研环境下图书馆数据素养教育策略研究
2018-01-02王维佳
摘 要:文章从数据化科研环境的形成,环境变化所产生的科研人员数据素养需求两方面对当前科学研究与数据素养教育的内在需求关系进行了论证,指出在科研数据问题的解决、科学的数据化生产方式以及科学交流体系都存在着数据素养教育的需求空间。在此基础上,采用SWOT分析法,剖析了图书馆进行用户数据素养教育的内部条件和外部环境。利用SWOT四种分析模型方法,分别提出了以学术引领促教育的增长性策略、以集成资源促应用的开发型策略、以宣传推广赢关注的营销型策略,以人力资源建设促发展的扭转型策略。
关键词: 科研数据环境;数据素养教育;大学图书馆;SWOT分析;策略
中图分类号:G252.7 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2017100
Study of Data Literacy Education Based on SWOT Analysis of Research Environment
Abstract The relation between scientific research and internal demand of data literacy education is demonstrated from the formation of digital environment of research and the lack of data literacy of researchers. On this basis, the paper analyzes the internal conditions and external environment for library to conduct data literacy education with SWOT analysis method. Strategic plans with SWOT analysis are proposed to promote academic research strategies, to facilitate integrated resources development strategy, to conduct marketing strategy, and to aggregate multiple disciplinary human resources.
Key words data landscape for research; data literacy education; university library; SWOT Analysis;strategy
在科学研究领域,对于数据的关注已经从自然科学范畴扩展至人文社科领域,科学研究对数据积累和高质量数据的依赖与要求日益凸显,科研人员获取、管理、保存数据,对数据的运用与操作能力正逐步成为新的数据化科研环境下研究人员的必备素养和内在需求。有学者将数据时代用户对数据的操作能力理解为信息社会环境下信息素养的延续和拓展,称之为数据素养。目前学界对数据素养教育的内涵、定义和作用等方面都有较为集中和深入的讨论[1-2],在实践方面的关注点也主要集中在数据素养教育的用户需求[3]、培训方式、课程内容设计和实施步骤等方面[4-5]。对于图书馆而言,发挥其自身信息管理的专业优势,提供研究数据管理的数据服务和数据管理最佳实践正逐渐成为研究图书馆的开展创新型服务的趋势和增长点。因此,分析数据时代科学研究数据化生态环境,研究环境变化所带来的对数据素养教育的需求,在此基础上明晰图书馆开展数据素养教育的优势、劣势、潜在机会和威胁,并有针对性的探讨应对策略,不仅对图书馆进行数据素养教育的理论依据提供更为全面和细致的论据与梳理,同时也是综合环境、需求因素和图书馆自身的实际情况,开展数据素养教育具体实践的前期准备和精准规划。
1 数据化科研生态环境的形成
1.1 科学研究范式演变中的数据洪流
移动技术和网格技术的飞速发展极大的促进了科研生产方式的数字化程度,生产方式及流程信息化的逐步实现,带来了各种信息资源的高度数字化。新技术和计算手段的发展和突破,使得科学研究在经历了描述、观察为依据的经验范式,归纳总结分析的理论范式,进入模拟运算的计算范式。模拟的方法引领科学界走过了上个千年的大半时间,科学界在模拟方法生成了大量数据和实验科学积累的海量数据基础之上,通过软件进行处理,发现新的信息和知识,科学的生产方式演变为以数据为基础,联合理论、实验和计算模拟为一体的数据密集型范式[1]。
数据密集型范式的科研生产中,数据从大型国际实验室、联合实验室或单一实验室、个人观测实验等不同规模和性质的来源产生。科学实验研究设备的更新,计算机辅助技术的进步以及大规模跨地域合作的态势,使得高通量、自动化的数据采集成为可能,数据在以千万亿字节的速度在海量增长,天文学领域的斯隆数字巡天项目收集了30亿个天体的照片,获得了1.3亿个天体的数字谱图,源数据总量达40TB,其中目录数据就達5TB[6];人类基因组测序计划检测出的2.5万个人类基因的30亿对碱基对的遗传信息[7],但仍并未包括基因与基因间的非编码DNA的碱基对,而目前的研究已经发现,这些非编码DNA的基因区间与许多疾病的发生发展密切相关,蕴含着更多的未探测的科学信息。当科研成果投入到工业化的生产中后,随着工业规模自动化的应用,数据量还会进一步大幅度的增加。
1.2 深入数据层面的科学交流体系
数据密集型科学范式的形成和演变也必将带来科学交流体系的深刻变革。格雷博士认为,公共资金资助的学术论文都可以在互联网上传播,科学研究数据也将公开与科学文献形成一个互操作的世界,信息用户在获取研究论文的同时还可获得论文的原始数据[8]。原始数据的获得和公开在科学交流体系中具有重大的意义。首先,科学数据的共享和交流极大的促进了数据效益的开发和用户的使用。科学研究成果以学术论文发表,并以完整的原始数据作为备注,不仅避免了许多成本巨大或者获取难度大的珍贵数据的流失,同时也为多学科、多角度的数据复用和重组提供了可能;其次,从科研伦理、诚信监督的角度,科学研究原始数据进入学术交流领域,使得科学界对研究结论的论证和结果的重现扩展到了一个更为广泛、公开、透明的交流层面, 更多兴趣、方向相同的研究者通过关注原始的科研数据,共同致力于某个问题的研究与探讨。此外,原始数据的出版与发表势必带来数字出版业的变革,促进元数据、本体、语义网技术在数据信息组织方面的发展。
目前,欧美发达国家已经在政府、科研基金资助机构的层面对科研数据管理做出了要求,从国家管理和政策层面营造了数据共享与利用的宏观环境。2003年人类基金组计划完成之后,美国国立卫生研究院(National Institute Health,NIH)即颁布了科研数据共享计划的实施细则。后续又颁布了《NIH数据共享政策与执行指南》,对所资助的项目申请者要求提供数据共享计划,保护研究人员对研究数据的优先和持续使用权,但也明确了科研数据非长期独家使用的性质[9]。美国自然科学基金会(National Science Fundation,NSF)从2007年起要求申报自然科学基金的项目书中需要阐述科研数据管理的内容,并于2010年逐一修订了各学科领域的数据管理计划要求,细化了学科领域的数据管理要求,为未来数据共享奠定了良好的信息组织基础[10]。2013年,美国白宫科学和技术政策办公室(OSTP)向其下属的所有职能部门和机构发布“增加联邦资助研究成果的访问”的政策。这项政策要求联邦政府直接资助的研究成果,包括同行评审出版物和数字形式的科学数据,都能被公众、各行业和科学社区用户访问和使用[11]。英国科学研究理事会[12]和澳大利亚科学研究理事会[13]颁布的数据共享政策和开放获取指南中,倡导并呼吁以研究数据的共享和开放来支持学术成果交流,并指出共享数据可以有效地促进知识创新,加速科学研究的进程和科技水平的进步,数据共享是科学研究过程的重要组成部分,科学交流体系需要实现强制性共享数据,科学研究的成果需与全社会共享。
1.3 数据化的科学行为方式
计算机图灵奖获得者、数据库专家詹姆斯·格雷 (James Gray)博士2007年预见在科学研究范式演变的历史格局下,所有的学科X都将向两种类型的分支进化,一种为模拟X学,一种为X信息学,如生物信息学、天文信息学。在X-信息学中,科学生产的方式转变为将实验和设备产生的、文献档案中产生的、模拟产生的事实都保存在一个空间中,人们通过计算机向这个空间提问并获得答案[8]。这种依赖于各种数据集模拟建模,对未知事物、问题进行推理和判断的方法逐渐改变了科学研究的行为方式。一方面,应用科学数据的场景将更为广泛,利用和联系数据集成为知识创新和发现的重要增长点。以生命科学为例,现代生物学可以从各类的组学数据以及其他学科,诸如化学、临床医学和公共卫生学的数据整合中获得新的知识和规律。医学领域,人们利用分子水平的组学数据和流行病学观察的数据相关联,预测个体疾病发生的潜在危险,并制定预防和治疗方案。再如行为科学领域中,社交媒体中焦点事件的话语情感数据,可以同社会经济数据间实现相互映射,发生联系,发现影响金融市场的非物质因素的存在。在这些情形下,科学研究将多尺度的数据同多维度的数学模型进行连接,研究结果展示了跨学科、跨领域的数据集成的巨大价值;另一方面,科学成果间的链接将更为紧密,科学研究的生产效率迅速提高。科学实践的阵地从实验室转移到了计算机和数据空间,以往的研究经验和结果转化为明确的、可重用的规范,与后续的研究过程形成了随时可以调用的无缝链接。当规模化的数据生成与规模化的处理方法相匹配时,流程化的数据组装、数据挖掘可以将科学家从常规的数据处理的事务中解放出来,使得他们可以更加专注于科学发现,更为快捷地实现科学假设的验证。科学假设的验证既可以通过定向数据采集和分析来进行,也可以通过已有的数据组合和挖掘而进行[14]。
2 科研生态环境对数据素养教育的需求
1999年美国学者提出“信息生态系统”,认为在特定的环境里由人、实践、技术和价值共同构成了信息生态系统,其中占据核心地位的是技术支持下的人[15]。那么在数据化科研环境中、科研活动主体、数据技术和创新实践活动等要素构成了特色鲜明的科研数据生态环境体系,其核心为数据科研环境中的各种主体,即数据的生产者、数据利用者、数据传播者、技术服务者、管理监护者等。因此,在数据科研生态环境中,学界更为关注的是在技术变革中各种类型的主体,即科研信息数据交流链条中的所有数据用户,正是这些在数据传播、交换体系中的数据用户的需求与需求被应答的过程直接引擎了整个生态系统的内部运动,同时也调控着数据信息的可用性和数据的分布与分配。用户需求理论认为,用户的需求是环境刺激因素和主体目标共同作用下产生的,是主体适应环境变化的外在表现。在这个生态系统中,数据、信息在各种角色和主体的需求与环境反馈的交互中螺旋上升,逐步演进,从而促进了新的科学发现。有研究表明,数据服务需求中,提高研究人员处理和管理数据能力将会是数据服务的重要活动和内容[16],许多研究人员将数据素养教育同信息素养教育一样,列入学术型图书馆提供数据管理服务的内容[17-18]。
2.1 科学数据问题与数据素养
一段时间以来,科学研究数据作为科研的支撑材料并未得到很好的处理,它们散落在实验记录或者个人的存储介质中,数据随人员的流动接替和时间的推移而模糊甚至消失,数据的长期保存和交互都存在很多障碍,数据所蕴含的潜在信息也因此而湮没和沉寂;另一方面,虽然科研数据在急剧增长,数据传送能力也在攀升,但是高质量可以复用的数据却并未成比例的增长[19]。数据共享的实践和研究成果告诉我们,从生产者到消费者,从管理者到服务者,在数据管理基础设施和机制尚未完备前,对于数据长期保存的认知、数据管理基本流程的掌握、科学数据规范化组织的实践都将作用于科学数据管理的各个环节,从而直接影响数据的质量,影响科研工作的进程和效率甚至成败。科学网中报道的一篇涉嫌數据造假的案例,正是因为实验室人员数据意识的薄弱和数据管理的缺失,给数据造假提供了可乘之机,使得后续的研究工作进行了许多重复性的劳动甚至是错误方向的努力[20]。因此,提高数据意识[21],培养具有数据素养的科学工作者[22]是解决科学数据问题的重要突破口,提高科学研究数据的质量需要数据素养教育。
科研人员数据素养的教育一方面是为了提高科研人员或是将成为研究人员的学生处理数据及相关问题的能力和技能;另一方面也是为了培养数据管理的专业人员而进行的教育活动[5]。Haendel[23]提出建立一种语义科学家的文化,鼓励研究人员使用统一规范的标准标注研究数据,使得科学数据具有可解释性。有观点认为数据素养是科研工作者必备的基本素质,在数据密集型科学范式下,对于一个科学研究人员而言,很难将其所具备的数据技能和数据专家的专业技能区分开来,因为两者往往是相互重叠的[3],一位优秀的科研人员同时也是一个可以辨析数据价值、可以使用合适的研究方法运用数据发现知识,并可以提供高质量数据的数据专家。因此,一些大学的图书馆招聘数据专家的职位开展数据素养的教育课程,以帮助用户理解科学数据管理的意义,教授数据收集、数据处理、数据分析和统计的方法和工具[24]。
2.2 科学数据化生产与数据素养教育
数据化大生产的科学研究模式需要数据的科学管理,而科学数据管理需要数据素养教育。英国一项分析数据处理链条中主体关系和义务的报告表明,科学数据的管理实质上就是人员数据素养外显和应用的全过程,在数据中心和数据存储机构中,面对科学数据,各类型关系主体承担着不同角色的义务,科学家作为数据的生产者同时也是数据使用者,享有数据的使用权和数据的著作权,享有接受数据培训和建议的权利,同时也承担着产生高质量数据、管理数据、遵守资助机构的数据政策的多重义务,在数据生产和消费过程中,需要对所在的机构、学术社区和资助机构负责;科研机构和数据中心作为数据保存的组织者和服务者,承担如下责任:制定数据长期保存政策、提供数据管理最佳实践指南、提供数据重用工具,向研究人员提供数据管理培训与服务支持[25]。在各主体的责权关系中,高质量的数据交互和数据管理的培训是各主体相互连接和交互的纽带与途径。
科研数据的质量问题是数据素养的内在驱动力。影响科研数据质量的因素有很多,首先数据生产者在行业内的权威性、认可度、声誉会影响其产生的数据[21];其次,数据生产过程中所采用的数据收集工具的可靠性、科研数据集构建的基本理论框架的完整性、数据的准确性、一致性和时效性,描述数据情景、揭示数据内容的科学性都是影响数据质量的重要因素[27]。影响科研数据的因素也正是数据素养教育中的内容要素,具有数据意识、具有系统的数据管理理论和知识技能,正是数据素养教育所要达到的目标和秉承的宗旨。
2.3 科学交流体系与数据素养教育
在科学研究的整个链条中,最终进入信息交流体系的是作为论文或者研究结果出版后的最高端的一部分成果,其实这些以各种传播渠道和方式发表出来的科研成果只是科学工作成果的一部分,或者说是精华浓缩的部分,但是支持研究成果的大量数据都被缩小到了极小的一部分,尽管科学界有少量利用数据或者重用数据成功的范例,但是总体来看,目前存在的科学交流模式未能发掘出这个原始科学研究素材的价值和功能。吉姆·格雷博士在《E-science: a transformed scientific method》中提到,互联网的数据共享范围并不局限于研究论文全文的可获取性,在e-Science的科学交流体系中,应当把所有的科学数据与文献统一,创建数据和文献的交互操作,让读者在阅读论文的同时,可以查看原始的研究数据,甚至可以重新做数据分析,发现新的知识[28]。
目前许多科研人员还并未认识到,科学交流体系不仅仅是科学家们进行相互学习和新交流的渠道,同时也是公众可获得数据集的重要和主要的來源。事实上,只有作为数据生产者的他们才最了解数据,了解数据产生的情境和具体的单位、收集方法、测量手段等内容,也只有他们才能提供数据复用所必备的第一手资料和信息。图书馆界已经注意到了科学交流体系中科学数据交流与传播的问题并意识到了其中的服务需求, e-Science环境下需要数据管理专业人员的教育和培训[24],Corrall等[29]在对澳大利亚、新西兰、英国、爱尔兰等国家的140个图书馆的在线调查发现,科研人员希望能得到未发表的研究数据管理方面的实践指南以及相关的课程培训。
3 图书馆开展数据素养教育的SWOT 分析
美国研究型图书馆联合会(ACRL)的研究计划委员会在2012年和2014年调查报告中两度提出,科研数据的管理服务是研究型图书馆发展的十大趋势之一[18]。同时,鉴于图书馆,尤其是高校图书馆在以往信息素质教育中所发挥的作用,许多学者呼吁“研究型或学术型图书馆投身于数据素养教育的工作中”[30]。国外数据素养教育项目的实践证明,数据素养教育是在数据科研大环境下,国家政策引导、基金组织支持、图书馆主导、管理和技术部门配合下逐步开展的服务与培训并行的教育活动,同时也是图书情报界对知识服务和专业化教育的深入探索和实践。那么我国的数据素养教育又该如何开展呢?目前国内数据管理和数据素养教育的项目和论文已成增长趋势,图书情报界的专家和学者们主要从国外数据管理项目和数据素养课程的文献和网络调研,对数据素养教育的内容、模式、教学目标、教学对象进行了细致而全面的总结和归纳,也有少数研究对图书馆数据素养体系进行了构建,但仍然缺少对国内图书馆开展数据素养教育内外部环境特征分析及系统的策略研究。为了探究图书馆开展数据素养教育的策略,本研究对高校图书馆内、外部环境进行了SWOT分析。
3.1 自身优势
3.1.1 以元数据为代表的知识组织专业技术
科学数据的元数据是以科学数据为描述对象的元数据,是对科学数据展开描述、组织、出版等工作的基础工具。目前,科学数据成为继科研文献之后的又一种重要科学研究资源,而科学数据元数据对于数据的仓储、数据的保存以及数据的获取都具有重要的作用和意义。同时科学数据元数据也是图书馆提供数据管理服务[31],培训数据管理方法的主要基本技术之一[32]。科学数据的元数据记录为科研人员理解和获取科学数据提供了可能[33],是科学数据管理实践和研究中较为关键的问题,数据素养教育的研究者在设计数据管理培训课程时,将元数据方面的教学内容作为课程的核心内容[34]。
图书馆在传统的图书和文档保存服务中积累了元数据方面的丰富经验。在自建机构库、学科库或者专题数据库过程中主要运用的持久的DOI识别、受控词表、元数据间的映射和互操作的技术和原理都是贯穿于科学数据管理计划中的必要元素[35]。元数据是图书馆从事资源编目、馆藏建设的基础和专业性技能,图书馆在元数据的生成与维护、标准的建立和应用方面具有扎实的理论基础和丰富的实践经验。此外,图书馆在信息管理、知识组织体系方面的方法和手段也是实现科学数据分类、聚合和关联的途径和工具,利用本体技术建立数据间的语义关联,从而实现数据的跨学科或者跨领域应用,本体等语义技术在数据管理中的应用既是目前探讨的学术前沿,同时也是数据管理课程内容更高层次的扩展和延伸。
3.1.2 关注把握用户需求的行业经验
无论是图书馆提供的服务还是图书情报行业的科学研究都是以满足用户需求,关注用户需求动态为基本出发点,在满足用户需求的过程中,一方面,图书馆研究用户行为、了解用户需求、探索需求空间,在调查分析用户需求、挖掘用户的潜在需要方面积累了一定的方法学的经验和基础;另一方面,图书馆通过不断提升自身的服务能力来达到与不断变化的用户需求之间的契合,从而提高图书馆的整体服务水平和创新服务能力。根据文献报道,图书情报机构对各种类型的服务对象都进行了从意识认知[36-37]到方法技能[37-38]再到数据使用行为[6]、专业课程大纲等[39]方面全方位的需求研究,这些需求分析都是开展数据管理服务,开设数据管理培训课程的第一手研究资料和设计基础。
3.1.3 信息素养教育的经验
“信息素养”从诞生之时就和图书馆有着密不可分的关系,信息素养理论也起源于信息检索能力和信息学理论,强调信息的各个层次的查询与应用,强调信息与学习、生活和工作的联系,强调终身学习与自主学习的联系。图书馆也一直在发挥自身的功能效益,在信息素养教育、提高用户信息素养水平方面不断延伸、扩大和深化自身的教育职能,同时也积累了丰富的实践经验和教学方法。信息素养教育非常强调批判性思维,注重对信息质量的判别和分析,这与数据素养教育对数据的搜索、选择、利用的培养目标是高度一致的。Calzada[40]对数据素养与信息素养的阐述中将两者视为科学研究的教育连续体,都是始于学校教育,在高等教育中继续深化和完善。因此,图书馆在信息素养教育中积累的经验和教学方法可以直接作为数据素养教育的借鉴和移植。
3.1.4 数据、信息资源集散地的社会角色
DataOne项目在数据管理服务指南中指出,图书馆作为学术资源的保存者和收集者,其收藏保存信息的角色和功能可延伸到成为数据资源的管理者。图书馆是潜在的科学数据的保存者和提供者,并可以利用知识发现的方法将数据有效的提供给需要的用户使用,使得机构的数据资产即使在有限的情况下能挖掘出更大使用价值[41]。可见图书馆提供文献信息保障、从事知识服务的社会角色赋予了其在数据科研环境下数据中心的使命。事实上,早有图书馆作为数据中心提供科研服务的先例,美国的一些大学图书馆在学术研究机构或计算机中心创建了数据支持中心或数据存储中心,如明尼苏达大学图书馆的机读数据中心[30];英国DCC(Data Curation Center)作为国家科学数据共享的平台,为研究机构存储、管理、保存和共享科研数据提供专业建议和实践帮助,同时也为各高校图书馆、研究机构的图书馆数据中心提供纲领性的业务指南、评估和管理工具[42]。
3.1.5 公益、非盈利機构的社会属性
图书馆具有公益性、均等性和共享性的特点。美国图书馆协会、国际图书馆联合会等机构对图书馆核心价值的阐述认为,图书馆的核心价值主要体现为自由、公平、平等、服务、社会责任、用户权利等共同的概念[43]。图书馆核心价值的确立为图书馆在数据信息环境中参与数据保存、数据交换、数据管理培训等提供了服务性质在制度上的保障。正是图书馆这种公益、非盈利机构的特点,才使得图书馆可以以非直接利益相关者的第三方机构的身份,参与到科研数据生产和传播的链条中,图书馆可以被数据生产者和消费者同时认可和信任,又具备成熟第三方服务机构的条件,假以相关的管理政策规范和约束,图书馆将会成为一个天然的提供数据服务的中心机构,同时也是一个合适的数据中介机构。
3.2 薄弱之处
当然,对于数据生产和管理的整个体系而言,图书馆作为服务支撑机构也有其自身的局限和不足,在一定程度上为数据素养教育的开展带来了困难。
3.2.1 领域或学科的专业知识不足
图书馆服务的对象具有多学科属性的特点,因此学科专业知识跨度大,差异性强,而数据从产生到描述,再到分析利用都需要运用领域的专业知识,图书馆作为公共的服务机构,很难具备所有学科的专业知识,这在某种程度上影响了数据管理及培训服务的针对性。数据素养的教育者和信息学专业人员认识到,数据、数据素养教育已经不仅仅是自然科学的专属,其同样已存在于社会、人文、艺术文化等学科中,数据时代不仅仅是对大数据现象的理解,数据的数量并非关键性的问题,决定性的因素是利用信息科学技术搜索、集合、交叉参考利用各种数据集的能力[44],当这种能力结合专业背景进行具体的实践和操作时,某种程度上需要对专业知识具有一定的理解和认知,因此在各个学科领域间,探讨数据素养教育的普适性方法是需要探讨和研究的又一命题。
3.2.2 非教育科研管理政策的决策者
数据管理和数据素养教育大环境的形成,需要国家、政府、管理机构在宏观政策层面的引导和要求,才能促进社会、机构对数据素养教育的关注和重视,但图书馆作为服务部门,并非教育科研政策的制定者和决策者,因此,只能从建言献策的角度向相关的管理者和机构积极倡导相关的诉求和举施,呼吁研究领域对数据管理和数据素养教育的认识和关注。这也提示图书馆可以在决策支持方面多做现状对比调查研究,从而为推动国家数据政策和科研领域数据管理的建设提供可靠依据。
3.3 外部机会
尽管存在上述的薄弱条件,但是纵观目前的数据科研环境,科学研究领域从管理到实践机构对数据共享的推进和倡导,数据开放获取政策的研究和施行,基金组织对相关研究的支持,相关数据服务的出现,数据素养用户需求的不断攀升,图书馆对数据素养教育的探讨和深入都是图书馆发展数据素养教育的有利外部条件和机会。
3.4 潜在挑战
3.4.1 数据库公司在数据支持决策领域的渗透
目前,通过运用数据和挖掘数据的价值来支持决策已经遍布各行各业。图书馆作为最大的科学文献资源的集散地,在数据环境中同样受到服务能力与实力的挑战和对冲。就文献信息的数据价值挖掘而言,科学文献数据库服务商对文献信息的深度加工所形成的数据信息产品的开发已经渗透到了科研战略的决策领域。以WoS平台的ESI和Incites为例,其是数据库公司在汇集和分析web of science的引文数据基础上建立的科研评价工具。许多高校和科研机构的排名均采用了这些工具性数据产品中的数据信息,作为机构之间和机构内部科研实力的指标和学科布局与资源规划的参考依据。数据库公司不断以自拥有数据开发数据产品的模式正在逐步走强,并有针对性的对特定用户开展培训,在用户数据意识还处于萌芽的阶段,以特定的数据产品启发和迎合用户的潜在需求,从而使得他们的理念和方法在用戶中先入为主。相对商业模式的数据服务,我国高等院校在利用数据、图书馆管理数据的服务性还较显不足,尽管国内许多高校都成立了数据研究院、数据研究中心,但科研、教育数据的信息化、标准化管理以及相关的培训和服务支撑还并未建立。
3.4.2 数据素养培养的专业性和跨学科性
对数据分析思维的支撑是数据素养教育的主要任务,而这种数据分析思维的建立和实施需要具有计算机、统计学、信息学和专业背景知识。首先,数据素养的教育离不开数据科学领域的知识和理论,而数据科学中采用的技术与工具具有一定的专业性,而且伴随着网格技术的进步,数据管理的方法与技术也发生了根本性的变革,数据管理的知识不仅包括传统关系型数据库的内容,还有许多新兴的管理理念和技术,如关系云、NoSQL 等;其次,数据素养教育对统计学等研究方法学内容的理解需要深入到学科的专业领域,如对数学统计方法的运用,并非要求达到统计专业人员的理解层面,但是需要从专业背景的角度理解科学问题,并运用合适的数据和统计方法进行检验,对于结果进行专业的解释和理解。因此,数据素养教育是一项专业性同时兼具跨学科特性的教育活动,无论对于图书馆还是从事相关工作的人员来说在知识结构和经验方面都具有相应的要求,这是与以往信息素养教育的不同之处,也是图书馆从事数据素养教育工作的巨大挑战。
4 图书馆数据素养教育基本策略
4.1 SO策略:以学术引领促教育的增长性策略
著名教育学家钱伟长认为,学术研究是教育的底蕴,是教育的灵魂和源泉。大学所承担的学术研究和教育教学两大基本职能相辅相成,互相促进。学术研究可以丰富教学内容、提高教育质量,提高教学人员的知识水平,对教育的促进作用十分显著。同样对于数据素养教育而言,对数据管理科学专业而深入的学术研究,是保证知识更新,完善知识结构、增强教学深度的最有效措施。尤其在开展数据素养教育的初级探索阶段,图书馆作为施教者,不仅要对国外的相关实践和模式进行总结和研究,同时更要注重对自身特点和优势的发掘与拓展,通过启动自身内部优势,撬起外部机会,使优势与外部机会充分结合。
目前在科学数据共享与利用的趋势下,科研人员将数据视为重要的竞争力,提高数据管理水平、数据处理能力的需求日渐旺盛,在科研合作、科学成果发表等所涉及的数据权益问题也日渐突出。在这种环境和情形下,图书馆有必要在科学数据元数据、用户需求、数据共享与开放政策的研究方面进行积极地探索,同时也为数据素养教育储备素材。以科学数据元数据的研究为例,元数据是实现数据的有效管理和各种形式的服务基础,但科学数据又不同于传统的文献资料,数据的元数据描述、科学数据元数据间互操作、数据的语义水平上的关联等是科学数据管理所需要解决的问题。在数据科学管理的研究上投入精力和人力,这既是一个学科的专业化发展之路,同时也是一个人才培养、队伍建设、师资储备的过程,更是一个以学术研究促进教育不断深化的过程,是图书馆启动自身优势结合外部需求环境而提升和增长的过程。
4.2 ST策略:以宣传推广赢关注的营销型策略
面对数据科研环境中数据素养教育的挑战和外部的竞争,图书馆发挥自身优势,化竞争和挑战为动力是ST策略的核心思想。鉴于外部拥有数据的数据库商与时俱进的服务和技术发展所带来的压力,图书馆在提升自身数据管理专业技术的水平之外,还需要有策略的开展数据素养教育及相关服务的宣传和推广,以试点培训和效果评估反馈为载体,有目标、有步骤、有方法、有渠道地在用户中产生影响。这里面既有利用各种传播媒体为渠道进行宣传的方法,也有以案例和实践促认识和口碑的营销策略思想。如以普渡大学的数据素养课程为例,基于农业和生物工程学专业人员数据管理课程的评估反馈,图书馆明确学员课程所掌握的技能和学员体验,从而修订了未来课程设计的方向。普渡大学图书馆将这些成果向本校的教务长汇报,获得了教务部门的支持和认可,将图书馆的数据素养课程列为2014年春季的专业选修课程。
图书馆要利用对用户需求深入调研的方法和对用户情况了解的经验,从服务的角度出发,发挥数据服务第三方服务的职能和公信力,有针对性的设计和构建特色的数据素养教育。图书馆可以采取从用户细分、目标分级开始,到产品营销、多渠道宣传等系列的营销策略,来实现其数据素养教育角色和作用的用户认知和认可。大学图书馆需要创新的延伸营销策略向用户推广教育服务,使得科学研究人员意识到图书馆的专业经验以及拥有的资源与工具。如根据专业、研究层次、研究与数据的密切程度、数据素养能力等将用户细分,确定不同的教育目标,将目标分级实现,设计多种课程,建立多方传播渠道、促进用户体验分享等,让用户亲身体验并认识到图书馆在他们数据素养能力提升方面所能发挥的作用和提供的支持,从而在数据管理、数据素养教育方面保持用户的粘附度,提高图书馆的专业声望。
4.3 WO策略:以集成资源促应用的开发型策略
数据密集型的科学范式下,无论是科研生产的方式还是科学交流体系都需要机构数据间实现广泛的共享和管理,而现阶段,可用的资源与信息需要的数据管理支持间存在着明显的鸿沟,研究人员在学术社区中共享研究数据仍然面临着共享机制、伦理、共享细节、软件工具或平台尚未完备的问题,问题的存在就是存在着需求的空间和发展的机会。学术型图书馆通过收集用户信息、参与机构和学科间的对话,发展和共享指导材料,教学策略,实践经验等方面展示了更多对资源的收集和促进学科间合作的能力。以新英格兰合作化数据管理课程项目为例,课程收集了很多不同的学科研究数据管理的实际案例,帮助用户应用于实践,并且在系列的数据管理课程基础上发展出了一系列最佳实践模型,可以在不同的背景和环境下适用[45]。未来的数据素养教育将会继续受到国家政府政策驱动和科研合作的学术因素影响,虽然图书馆并非政策的制定者,也并非学科方向发展的决策者,但图书馆基于长期与学术用户、机构管理层的密切联系和多次合作,一方面熟悉学术用户的情况,另一方面参与学校学科资源建设的筹划,其比较了解机构学科布局、人员团队、机构的发展目标和方向,因此可以致力于数据管理智力和人力资源的整合,与学科领域专业人员密切合作,结合学科布局的战略导向,提出促进科研数据环境建设的策略和具体方案,引进和利用跨机构的数据管理平台传播多种形式的学术项目,以科学数据管理项目的实施和应用带动起研究人员的培训。
4.4 WT策略:以人力资源建设促发展的扭转型策略
数据素养教育的专业性和跨学科性特点决定其师资来源多元广泛,学术图书馆不可能仅凭一己之力就能够完成和胜任。一方面可以通过建立数据馆员岗位,在服务中培养和发展具有数据管理实践经验的馆员;另一方面可以通过融合合作的形式发展专业科研人员参与到本专业的数据素养教学中,同时积极与科研管理部门合作,对于数据伦理、科研诚信、数据共享政策、共享机制等问题的教学,可以从管理人员的角度和思维构建,而面对科学数据存储的数据结构、关系数据库等问题,图书馆也可以同IT人员联合为用户提供帮助。康奈尔大学的数据服务和教育培训中心就是一个由图书馆、政策办公室、IT部门、统计咨询中心、计算机实验室共同组成的跨技术领域的合作平台,各职能部門围绕数据的分类、存储、分析、保存、合理利用提供专业所长的培训和服务[46]。根据康奈尔大学图书馆研究数据服务初期的工作报告,这个多学科融合的团队在一年半的时间里在社会学博士项目、人类学系教员、分子生物与遗传学教员等多个学系开课,解读基金组织的数据管理计划,并指导研究人员撰写数据管理计划。多元化的师资队伍组建大大的弥补了跨专业知识人员的不足,同时也提出了一条基于某一任务而集合多学科力量在同一个方向上实现知识融合的可行路径,是图书馆扭转自身劣势、抵御外在威胁的策略之举。但人力资源的使用必将涉及运行支持的问题,因此图书馆在为数据素养教育而组织教学力量前,还要争取到更多管理机构层面的认可和支持也能保证联合到多方的人员共同参与。
5 结语
数据科研环境的形成正改变着科学生产、知识交流和思维决策的方式,数据素养的培养已经成为一种与时俱进的需求和演进,图书馆吸取和借鉴国外的数据管理教育项目经验,分析自身优势、利用外部环境中的有利机会,学术研究、人员队伍建设、资源集成、宣传推广等都是初期开展工作时需要深入考虑和长久布局的策略和要点,但具体实施的机制和步骤以及可能存在的问题都是需要进一步讨论和研究。
参考文献:
[1] Koltay T.Data literacy for researchers and data librarians[J].Journal of Librarianship and Information Science,2015,49(1):3-14.
[2] 沈婷婷.数据素养及其对科学数据管理的影响[J].图书馆论坛,2015(1):68-73.
[3] Carlson Jacob,Fosmire Michael,Miller C C,et al.Determining Data Information Literacy Needs:A Study of Students and Research Faculty[J].Portal Libraries & the Academy,2011,11(2):629-657.
[4] 胡卉,吴鸣,陈秀娟.英美高校图书馆数据素养教育研究[J].图书与情报,2016(1):62-69.
[5] Qin J,D'Ignazio J.Lessons Learned from a Two-Year Experience in Science Data Literacy Education[EB/OL].[2016-08-10].https://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1009&context=iatul2010.
[6] Zhang J.Data Use and Access Behavior in eScience—Exploring data practices in the new data-intensive science paradigm[Z].Ann Arbor: Drexel University,2011203.
[7] Venter J C,Adams M D,Myers E W,et al.The Sequence of the Human Genome[J].Science,2001,291(5507):1304.
[8] Tony Hey,Stewart Tansley,Kristin Tolle,等.第四范式:数据密集型科学发现[M].北京:科学出版社,2012.
[9] NIH Data Sharing Policy and Implementation Guidance[EB/OL].[2016-06-09].http://grants.nih.gov/grants/policy/data_sharing/data_sharing_guidance.htm#inc.
[10] Scientists Seeking NSF Funding Will Soon Be Required to Submit Data Management Plans|NSF-National Science Foundation[EB/OL].[2016-06-09].http://www.nsf.gov/news/news_summ.jsp?cntn_id=116928.
[11] Expanding Public Access to the Results of Federally Funded Research | whitehouse.gov[EB/OL].[2016-06-07].https://www.whitehouse.gov/ blog/ 2013/02/22/ expanding-public-access-results- federally- funded- research.
[12] RCUK Policy on Open Access—Research Councils UK[EB/OL].[2016-06-07].http://www.rcuk.ac.uk/research/openaccess/.
[13] ARC Open Access Policy|Australian Research Council[EB/OL].[2016-06-09].http://www.arc.gov.au/arc-open-access-policy.
[14] Kreinovich V,McClure J,Symons J.The End of Theory?Does the Data Deluge Make the Scientific Method Obsolete?[C].APS Texas Sections Fall Meeting Abstracts,2008.
[15] Nardi,O'Day.Information ecologies: using technology with heart[J].First Monday,2000,4(3):249-250.
[16] Merrill A.Library+[J].Public Services Quarterly,2011,7(3-4):144-148.
[17] ACRL.Framework for Information Literacy for Higher Education[EB/OL].[2016-07-25].http://www.ala.org/acrl/sites/ala.org.acrl/files/content/issues/infolit/Framework_ILHE.pdf.
[18] ACRL .Top trends in academic libraries:A review of the trends and issues affecting academic libraries in higher education[J].College & Research Libraries News,2014,75(6):294-302.
[19] Borgman C L.Why Are Scientific Data Rarely Reused?(Keynote)[C].Information Policies in Science International Seminar,Consiglio Nazionale delle Ricerche,2013.
[20] 北美博后見闻|我所经历的学术造假——美捷登的博文[EB/OL].[2016-05-21].http://blog.sciencenet.cn/blog-475824-977993.html.
[21] Koltay T.Data literacy: in search of a name and identity[J].Journal of Documentation,2015,72(2):401-415.
[22] Schneider R.Research Data Literacy[M].Springer International Publishing,2013.
[23] Haendel M A,Vasilevsky N A,Wirz J A.Dealing with Data: A Case Study on Information and Data Management Literacy[J].Plos Biology,2012,10(5):e1001339.
[24] Si L,Zhuang X,Xing W,et al.The cultivation of scientific data specialists:Development of LIS education oriented to e-science service requirements[J].Library Hi Tech,2013,31(4):700-724.
[25] Lyon E.Dealing with data:Roles,rights,responsibilities and relationships[EB/OL].[2016-05-21].http://jisc.org.uk/media/documents/programmes/digitalrepositories/dealing_with_data_report.pdf.
[26] Madrid M M.A study of digital curator competences:A survey of experts[J].International Information & Library Review,2014,45(s3-4):149-156.
[27] Giarlo M J.Academic Libraries as Data Quality Hubs[J].Journal of Librarianship & Scholarly Communication,2013,1(3):ep1059.
[28] 周曉英.情报学进展系列论文之七数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.
[29] Corrall S,Kennan M A,Afzal W.Bibliometrics and Research Data Management Services:Emerging Trends in Library Support for Research[J].LIBRARY TRENDS,2013,61(3):636-674.
[30] Kellam L,Peter K.Numeric data services and sources for the general reference librarian[M].Elesvier,2011.
[31] Qin J, Ball A,Greenberg J.Functional and architectural requirements for metadata:Supporting discovery and management of scientific data[C].International Conference on Dublin Core and Metadata Applications,2012:62-71.
[32] Starr J,Gastl A.isCitedBy:A Metadata Scheme for DataCite[EB/OL].[2016-10-11].https://www.research-collection.ethz.ch/bitstream/handle/20.500.11850/85769/eth-4674-01.pdf.
[33] Gray J,Liu D T,Nieto-Santisteban M,et al.Scientific Data Management in the Coming Decade[J].Acm Sigmod Record,2005,34(4):34-41.
[34] Qin J,Ignazio J D.The Central Role of Metadata in a Science Data Literacy Course[J].Journal of Library Metadata,2010,10(2-3):188-204.
[35] Metadata—ANDS[EB/OL].[2016-05-27].http://www.ands.org.au/working-with-data/metadata.
[36] Amanda L W,Michael B,Shan C S.Variability in academic research data management practices:Implications for data services development from a faculty survey[J].Program,2015,49(4):382-407.
[37] Megan M B,Andrew M J.Assessing scholarly communication and research data training needs[J].Reference Services Review,2013,41(3):413-433.
[38] Federer L M,Lu Y,Joubert D J.Data literacy training needs of biomedical researchers[J].Journal of the Medical Library Association :JMLA,2016,104(1):52-57.
[39] Maybee C,Carlson J,Slebodnik M,et al.“It's in the Syllabus”:Identifying Information Literacy and Data Information Literacy Opportunities Using a Grounded Theory Approach[J].The Journal of Academic Librarianship,2015(41):369-376.
[40] Calzada Prado J,Marzal M.Incorporating Data Literacy into Information Literacy Programs:Core Competencies and Contents[J].Libri,2013,63(2):123-134.
[41] Carly Strasser,Stephanie Wright,Gail Steinhart.Primer for Librarians.DataONE:An Overview[EB/OL].[2016-05-01].https://www.dataone.org/sites/all/documents/DataONEforLibrarians.pdf.
[42] Digital Curation Centre | because good research needs good data[EB/OL].[2016-05-30].http://www.dcc.ac.uk/.
[43] 毛刚,李贺,李琳.图书馆用户需求外溢研究[J].图书情报工作,2013,57(1):60-65.
[44] Boyd D,Crawford K.Critical questions for big data[J].Information Communication & Society,2012,15(5):1-18.
[45] New England Collaborative Data Management Curriculum | Lamar Soutter Library-University of Massachusetts Medical School[EB/OL].[2016-05-01].http://library.umassmed.edu/necdmc/index.
[56] Data Management Services at Cornell|Research Data Management Service Group[EB/OL].[2016-05-22].http://data.research.cornell.edu/services.
作者简介:王维佳(1979-),女,中山大学资讯管理学院在读博士生。