基于ITE-KSA结构的科学数据素养能力指标体系研究
2019-06-25秦小燕初景利
秦小燕 初景利
摘 要:科学数据素养能力指标体系是评价科研人员管理和利用数据进行科学研究与创新能力的重要依据,是探析科学数据素养教育现状以及分析数据素养教育对策与机制的重要前提和基础。文章基于科学性与导向性、可操作性、独立性与灵活性、前瞻性与可持续性原则建立了科学数据素养能力指标体系,提出从“个人”(individual)、“团队”(team)和“数据生态”(data ecology)(简称ITE)三个维度构建18个一级指标、47个二级指标,并且从“知识”(knowledge)、“技能”(skill)、“态度”(attitude)(简称KSA)三个层面对每个指标内容进行描述与表征。基于ITE-KSA的能力指标体系呈现多维立体结构,既有纵向的类属维度和能力域层级划分,又有横向的具体能力要素分解,使得科学数据素养能力指标体系在指导科学数据素养能力评价、相关课程开发与教育实践等方面具有很強的实用性和可操作性。
关键词:科学数据素养;能力;指标体系;个人;团队;数据生态
中图分类号:G316 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2019016
Abstract The scientific data literacy competency index system is an important basis for evaluating the ability of scientific researchers to manage and utilize data for scientific research and innovation. It is an important premise and basis for analyzing the status quo of scientific data literacy education and analyzing data literacy education strategies and mechanisms. Based on the principles of science, orientation, operability, independence,flexibility, foresight, and sustainability, this paper established the scientific data literacy competency index system, and put forward 18 first-level indexes and 47 second-level indexes from three dimensions of "individual", "team" and "data ecology"(ITE for short). It also described and characterized each index content from three levels: "knowledge", "skill", and "attitude"(KSA for short). The index system based on ITE-KSA presents a multidimensional structure, which has both vertical category and capability domain hierarchy, as well as horizontal specific capacity factor decomposition. This makes the scientific data literacy competency index system very practical and operable in guiding the evaluation of scientific data literacy, related curriculum development and educational practice.
Key words scientific data literacy; competency; index system; individual; team; data ecology
1 引言
科学研究活动实质上是一项以数据为核心的工作,数据获取和数据分析贯穿于整个科研周期。在大数据时代,科研环境的数据密集型特征尤为明显,研究资料、实验过程、实验结果等均以数据的形式而存在,无论个人、企业还是国家,谁能更好地掌握数据、理解数据、分析数据,谁就能在科研创新中取得竞争优势。科学数据素养是时代发展对科研人员素养能力提出的更高要求,是科研人员学术研究与交流的必备能力之一。关于数据的知识,将成为个人知识结构中的必备要素和基础,关于数据的思维和行为模式也将发生重大变革。
科学数据素养是新兴的跨学科研究领域,科学数据素养在以数据为中心的科研时代,其价值毋庸置疑,然而科研人员到底应该具备哪些能力才被认为具备科学数据素养,相关教育机构的培养方案和教学体系如何构成,如何对从事科研的学生与教师进行系统有效的科学数据素养能力培养,这一系列问题都值得从学术角度进行深入地剖析与研究。
目前为止,关于科学数据素养能力指标体系,国内外尚没有形成较为系统和权威的理论框架,缺乏一个具备通用性、本土化以及系统性的整体参考框架,这不利于科学数据素养教育的发展。因此,本文基于前期对科学数据素养教育的基础理论模式和一般实现途径的深度归纳和演绎,以及我国科研人员科学数据素养的本土化特征研究[1],启发、指导和组织科学数据素养能力指标体系的构建过程,凝炼科学数据素养能力指标体系的核心内容。
2 科学数据素养能力指标体系的重要性与构建原则
2.1 科学数据素养能力指标体系的重要性
科学数据素养能力指标体系是评价科研人员管理和利用数据进行科学研究与创新能力的重要依据,也是探析科学数据素养教育现状以及分析数据素养教育对策与机制的重要前提和基础,可以为各级各类教学机构的教师、图书馆员、行政管理人员明确培养科研人员数据素养的目标和方向,也为各个机构的课程设计提供基本的指导。
科学数据素养能力指标体系对科研人员自身也非常重要,它为科研人员提供一个如何处理数据的指南,使其认识到培养自己批判性思维能力和学习方法的重要性,促进数据时代受教育者提高学术研究能力,并使他们明确数据管理和数据利用所需要的具体技能,进而推动科学数据管理与共享的发展。科学数据素养能力指标体系的研究为在大数据时代数据密集型科研范式下探讨数据素养提供一个整体框架,具有高层次的參考价值和宏观的指导意义。
2.2 科学数据素养能力指标体系的构建原则
大数据时代的科学家培养,注重跨领域复合型人才培养,培养过程中需坚持“应用为先”的导向,而不是纯粹依靠“技术驱动”。因此,对于科学数据素养能力指标体系的构建,需要以提升数据应用能力和科研创新能力为目标,改变从认知数据、采集数据到分析数据的线性思维模式,以“互联网+数据”的理念作为指导,强调“互联网+”新业态下,知识社会创新推动下的数据思维培养、数据技能提升和数据生态创建与发展。
科学数据素养能力指标体系是将科研人员从事科学研究过程中应该具备的数据能力科学化、具体化、细化为一系列相互联系的指标的集合,从而更为客观和公正地评价科研人员的科学数据素养水平。为了保证指标体系的有效性、合理性,保障评估过程和评估结果的科学性,在构建能力指标体系时,应该遵循以下基本原则,即科学性和导向性、可操作性、独立性与灵活性、前瞻性与可持续性[1]。
3 科学数据素养能力指标体系的架构
综合国内外文献中所涉及到的科学数据素养相关能力指标与特征[2-13],结合对我国科研人员科学数据素养能力期望与需求的本土化研究结果[1],为了更加全面地评价科研人员的科学数据素养水平,本文基于科学数据素养的过程-目标结构内涵[1],依据指标体系的构建原则,初步将指标体系框架确定为3个维度,分别为“个人”(individual)、“团队”(team)、“数据生态”(data ecology),本文简称“ITE”结构(见图1),每个维度都有相应的数据素养能力特征要求(见表1)。
3.1 “个人”维度
如果说信息时代,信息素养是人的必备素养,那么数据时代,数据素养势必成为个人生存和发展的基本技能,也应该成为个人终身学习的目标。生活在数据社会的每一位个体,不但是数据的生产者,而且是数据的消费者和管理者,将自己融入数据活动的每个过程中时,需要对数据行为进行反思,不断考察数据来源、数据质量、数据技术与研究任务的适应性,在不断变化的技术环境和数据实践活动中,努力学习和掌握必备技能,一方面顺利完成各项科研任务,另一方面推动数据密集型科研环境的良性发展。
因此,“个人”维度强调个人数据技能的终身学习以及个人数据管理。这个维度下的所有数据能力,也将是终身学习的重要组成部分,随着新技术的出现和时代的发展,这些数据技能将支持个体应对更加复杂的数据环境,更加高效地完成数据管理。基于“个人”维度的评价重点与考察目标,结合科学数据素养过程-目标结构体系,该维度下设10个一级指标,分别为:“数据意识”“数据收集”“数据分析”“数据保存”“数据管理”“数据评价”“数据引用”“数据交流”“数据安全”“数据伦理”(见图2)。每个一级指标根据其能力构成要素,设立了若干二级指标(“个人”维度的二级指标体系见表2)。
3.2 “团队”维度
“团队”是为了完成某一项研究任务,由一群具备不同背景、不同技能及不同知识的人员进行协调、协作、协同工作的组织构成。美国自然科学基金会2011年提出在更大的背景下理解科学研究,强调数字学术(digital scholarship)的特征与趋势为:“数据密集型、多学科交叉、团队合作与协作、以问题为导向”[14]。合作是数字学术环境下的最主要特征,不仅是同一所学校、同一个院系的个体研究者之间的合作,而且包括跨学科、跨机构、跨项目组的合作。国际上大规模科研合作的典型案例,如人类基因组计划,来自美、英、日、法、德、中国等国家的科学团队参与了项目研究[15];第一篇关于引力波发现的报道中,共有来自欧洲、德国、意大利、法国、中国等多达1083名作者[16]。中规模和小规模的科研合作更是不胜其数。合作成为一种常态,不是新生事物,随着时代发展技术进步,其合作的广度和深度将会不断拓展。
“合作、交互式计算、重现性研究”是数据驱动学术研究的主要特征。在数据驱动的研究当中,既然有很多团队参与合作,那么数据都要做到可开放、可获取,依赖于元数据和数据之间的规范、标准,依赖于科研人员良好的伦理道德与行为表现,作为科研人员来说,必须要有数据处理的知识和能力,现代科学研究,需要同时掌握不同工具的使用方法,而且往往是结合在一起协同工作的,特别强调研究效率与精准度。每位科研人员会为同一个项目而承担其中一部分任务,如何来管理整个项目,提升研究质量,保证研究效率,是项目成功的重要保障,需要考虑和解决的问题非常多。数据驱动的研究,尤其是各类数据工具的驱动,对于整个科研过程,要进行反思,要清楚研究目标是什么,科研团队可以做什么。尽管人文科学和自然、工程以及社会科学的研究流程有一些不同,但总的来说大同小异。
“团队”维度强调团队知识建构,以及团队数据管理。这一维度所包括的数据素养能力是围绕着一个团队内部成员高效而有效地共享数据、合作管理数据、共同达到团队科研目标而设置的。“团队”维度下设3个一级指标,分别为“个人与团队成员之间的数据共享性”“个人数据与团队目标数据的相容性与一致性”“个人数据与团队目标数据的差异性与容错性”(见图3)。根据每个一级指标所包含的能力要素,设立了若干二级指标(“团队”维度的二级指标体系见表3)。
3.3 “数据生态”维度
“生态”就是指一切生物的生存状态以及它们之间和它与环境之间环环相扣的关系,生物与环境是一个不可分割的整体。“数据生态”主要指大数据生态,是一个开放的、可扩展的、可靠的数据科学生态系统,是网络化数据社会与现实社会的有机融合、互动以及协调,形成大数据感知、管理、分析与应用服务的新一代信息技术架构和良性增益的闭环生态系统,目标是实现全球科研数据的关联与协作。互联网时代无论是代码还是数据,只有开放,才能集聚群体的智慧,激发创新的力量,放射出更大的价值,真正推动社会进步。大数据需要有大量能互相连接的数据,无论是自己产生的、还是通过开放共享的、亦或根据需要购买或交换的数据,其在大数据平台或者是能互通的各个数据节点上,均遵循相同的数据标准,能够正确的关联,通过大数据相关处理技术(如算法、引擎、机器学习等),形成自动化、智能化的大数据产品或者业务,自动智能地指导人类的生产活动、工业制造、社会发展等,进而形成从数据生产、采集、存储、分析、管理到应用服务,以及反馈的闭环生态系统。数据生态为人们提供了大量的机会,也带来了很多风险,处于生态系统中的利益相关者,彼此以开放的态度进行交流与合作,为了保证数据有序、规范、安全地运行,均应具有数据生态的法制意识和规范意识,充分地理解数据安全问题,并将其贯穿于数据活动和交互的每个环节,主动培养并提高科学数据素养水平,为数据生态的良性发展贡献力量。
个体处于数据环境之中,产生的数据会对整个数据社会环境产生影响,反之数据环境的变化也会影响个体的思维与行为模式,进而影响个体产出的数据。个体和数据环境是相互依存和相互影响的。
无论从教师视角、还是学生视角、或是图书馆员视角考虑,都应是将科学数据素养能力置于更广阔的“数据生态”来考虑。个人作为数据生态系统中的一员,有责任也有义务为推动建设良性健康的数据生态而努力,不仅掌握自身如何利用或合作管理數据,而且还要有能力指导共同体中的相关人员科学合理地利用数据、管理数据,并能在关键任务中知道如何获取资源、寻求帮助。“数据生态”维度强调个体在数据生态中的交流、发展和责任,共设立5个一级指标,分别为:“数据生态意识及数据文化”“数据共享”“数据生态动态平衡与调节”“数据生态法规建设”“数据教育与培训”(见图4),每个一级指标下设若干二级指标(见表4)。
4 科学数据素养能力指标的表征与描述
4.1 教育目标分类理论
教育目标是教育事业发展的导向和标准,教育目标分类理论是20世纪50年代,以美国教育与心理学家本杰明·布鲁姆(Benjamin Bloom)为代表的学者提出的,并随着相关学科发展和理论研究的不断深入而得到丰富与发展。在这个理论体系中,布鲁姆等将教学活动所要实现的整体目标划分为认知、情感和动作技能3个领域,并围绕各领域教育目标细化了层次结构(见图5)。在认知领域中,按照人的认知水平从低到高分为“记忆、领悟、应用、分析、评价和创新”6个层次[17];情感领域较为抽象和隐性,其教育活动与态度形成或改变、价值观念更新、高尚情操培养等密切相关,依据价值内化的程度,情感领域教育目标分为“接受或注意、反应、评价、组织、价值与价值体系个性化”5个层次[18];在动作技能领域,分为“感知、准备、有指导的反应、机械动作、复杂的外显反应、适应、创新”7个层次[19]。
科学数据素养属于教育领域研究范畴,因此在制定评估标准或教学方案的时候,可以以教育目标分类理论为指导,从认知、情感、动作技能三方面全方位考虑科学数据素养的能力要求,对学习者进行科学有效的培养。
4.2 能力指标的表征与描述
在科学数据素养能力指标体系中,二级指标是围绕其所属维度中一级指标的总体目标而设立的,分别从不同的侧面反映了一级指标范畴下所应该具备的能力要素。这些指标一方面用来评价科研人员数据素养水平,另一方面用来指导科学数据素养教育实践,对其进行准确表征与描述,是能力指标体系构建的重要任务。
美国大学与研究图书馆协会(Association of College & Research Libraries, ACRL)2015年发布的《高等教育信息素养框架》,作为全球素养评价中的先进理念,围绕6个主题构建了新的信息素养体系,每一部分以一个“阈概念”(threshold concept)作为信息素养的有机组成部分,并且通过“知识技能”(knowledge practices)和“行为方式”(dispositions)两个相关元素,来反映重要的培养目标。“知识技能”表示学习者理解和掌握“阈概念”之后所应具备的知识或技能,“行为方式”体现的是学习者以特定方式思考或行动的情感和态度倾向[20]。这些新兴的理念启发我们在理解新的科学研究和高等教育范式中,科学数据素养在注重技能培养的同时,要更加强调理念提升。因此,本文基于布鲁姆教育目标分类法,分别对二级指标进行了“知识”(knowledge)、“技能”(skill)、“态度”(attitude)三个方面(简称KSA)的具体表征,“知识”从认知层面考察被评估对象在能力指标要求下所应该具备的基本知识,包括事实性知识、概念性知识、程序性知识、元认知知识,掌握了这些知识,即通晓了一门学科或解决其中的具体问题所必须了解的基本要素、要素之间的关系、方法准则以及自我认知。“技能”则从行为层面对能力指标所应表现的相关反应或动作做出说明,包括对具体问题情境的感知、为了特定行动或经验而做出的相关准备、具体任务的操作行为或方式等。“态度”侧重于对个体情感层面的表征,即面对某一现象或某项行为时,所表现出的意愿、兴趣、个人品性、价值取向,从某种意义上说,态度决定了个体完成任务时准备付出的努力程度、克服困难和挫折的决心以及判断事物的价值标准。“知识”“技能”“态度”三个方面共同体现了科学数据素养的教育目标,不能孤立地把他们分割开来,这也意味着每种能力在理论上都可以通过多种方式进行评估。
如以某一条二级指标为例,“个人”维度中“数据意识”的二级指标“了解自己在学习或科研工作中的数据需求”(“知识”(认知层面)、“技能”(行为层面)、“态度”(情感层面)的具体描述方式见表5)。
5 结语
本文基于科学数据素养的过程-目标结构内涵,依据指标体系的构建原则,结合所提取的能力要素,设计了基于ITE-KSA结构的科学数据素养能力指标体系(见附表1)。创新性地提出从“个人”“团队”“数据生态”(即“ITE”)3个维度全方位架构指标体系的方法,探讨了每个维度对数据素养能力考察的重点和要求,以此为基础,形成了18个能力域,即一级指标。进而对每个能力域所包含的具体能力要素进行表征,共提取了47个二级指标,分别从“知识”“技能”“态度”(即“KSA”)3个方面对每一个二级指标进行了详细的表征与描述,最终构建了完整的能力指标体系。整个指标体系呈现了一种多维立体结构,既有纵向的类属维度和能力域层级划分,又有横向的具体能力要素分解。这种结构使得科学数据素养能力指标体系在指导科学数据素养能力评价、相关课程开发与教育实践等方面具有很强的实用性和可操作性。为科学数据素养教育对策与培养方案的制定提供了基本的框架和指南,同时也是评价科研人员管理和利用数据进行科学研究与创新能力的重要依据。
参考文献:
[1] 秦小燕.科学数据素养能力指标体系构建与实证研究[D].北京:中国科学院大学,2018.
[2] CARLSON J,FOSMIRE M,MILLER C C,et al.Determining data information literacy needs: A study of students and research faculty[J].portal:Libraries and the Academy,2011,11(2):629-657.
[3] OGIER A L,LENER E,MILLER R K.The data literacy advisory team at virginia tech:Developing a content model for data literacy instruction[EB/OL].[2018-01-19].http://docs.lib.purdue.edu/cgi/viewcontent.cgi?article=1054&context=dilsymposium.
[4] PRADO J C,MARZAL MIncorporating Data Literacy into Information Literacy Programs:Core Competencies and Contents[J].Libri,2013,63(2):123-134.
[5] SCHNEIDER R.Research data literacy[C].European Conference on Information Literacy.Springer International Publishing,2013,397:134-140.
[6] STEPHENSON E,CARAVELLO P S.Incorporating Data Literacy into Undergraduate Information Literacy Programs in the Social Sciences:A Pilot Project[J].Reference Services Review,2007,35(4):525-540.
[7] QIN J,D'IGNAZIO J.Lessons learned from a two-year experience in science data literacy education[C/OL].[2018-03-02].International Association of Scientific and Technological University Libraries,31st Annual Conference.Paper 5.https://docs.lib.purdue.edu/iatul2010/conf/day2/5/.
[8] HAENDEL M A,VASILEVSKY N A,WIRZ J A Dealing with data:A case study on information and data management literacy[J].PLOS Biology,2012,10(5):1-4.
[9] CARLSON J,JOHNSTON L,WESTRA B,et al.Developing an approach for data management education:A report from the data information literacy project[J].International Journal of Digital Curation,2013,8(1):204-217.
[10] Cambridge University Library.DataTrain[EB/OL].[2018-02-04].http://www.lib.cam.ac.uk/ preservation/dataTrain/.
[11] 胡卉,吳鸣.嵌入科研工作流与数据生命周期的数据素养能力研究[J].图书与情报,2016(4):125-137.
[12] 隆茜.数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析[J].图书馆,2015(12):51-56,62.
[13] 邓李君,杨文建.个体数据素养评价体系及相关指标内涵研究进展[J].图书情报工作,2017,61(3):140-147.
[14] 秦健.数字图书馆向开放数字仓储的转变:对图书馆数字学术服务的新要求[R].第十四届数字图书馆前沿问题高级研讨会(ADLS2017),2017.
[15] Human Genome Project.About the Human Genome Project[EB/OL].[2018-01-12].https://web.ornl.gov/sci/techresources/Human_Genome/project/index.shtml.
[16] ABBOTT B P,ABBOTT R,ABBOTT T D,et al.(LIGO Scientific Collaboration and Virgo Collaboration).Observation of gravitational waves from a binary black hole merger[J].Physical review letters,2016,116(6):061102.
[17] (美)布鲁姆.罗黎辉等译.教育目标分类学,第一分册:认知领域[M].上海:上海:华东师范大学出版社,1986.
[18] (美)克拉斯沃尔 D R,布鲁姆.施良方,张云高,译.教育目标分类学,第二分册:情感领域[M].上海:华东师范大学出版社,1989.
[19] (美)哈罗A J,辛普森 E J.施良方,唐晓杰,译.教育目标分类学,第三分册:动作技能领域[M].上海:华东师范大学出版社,1989.
[20] 秦小燕.美国高校信息素养标准的改进与启示——ACRL《高等教育信息素养框架》解读[J].图书情报工作,2015,59(19):139-144.
作者简介:秦小燕,女,北京航空航天大学图书馆馆员;初景利,男,中國科学院文献情报中心、中国科学院大学图书情报与档案管理系教授。