APP下载

基于文献计量的数据素养及其教育领域研究态势分析

2017-01-16胡卉吴鸣

现代情报 2016年12期
关键词:数据素养文献计量教育领域

胡卉+吴鸣

〔摘 要〕本文从数据素养的概念、内涵和能力要素出发,以SCI、SSCI和CNKI收录的数据素养及其教育研究领域的论文作为信息源进行多角度、多侧面的分析与比较,揭示数据素养及其教育研究领域发表论文的时间趋势、国家/地区、机构、学科、期刊及作者和研究主题分布情况,为研究者了解数据素养及其教育领域研究发展态势提供参考,促进数据素养教育事业的发展。

〔关键词〕数据素养;数据素养教育;文献计量;教育领域;研究态势

〔中图分类号〕G254.97 〔文献标识码〕A 〔文章编号〕1008-0821(2016)12-0152-08

〔Abstract〕This paper firstly described the concept,content and competency frameworks of data literacy,and then regarded the SCI,SSCI and CNKI database as data sources,applied literature metrology method to analyze the distribution of countries,institutions,subjects,journals and authors,as well as the years tendency of published articles in the field of data literacy.It hoped that the results of the landscape analysis could provide refevence to the researcher in the field of data literacy and help domestic institutions implement data literacy education in the future.

〔Key words〕data literacy;data literacy education;literature metrology;education;research actuality

大数据时代的到来改变了21世纪公民的素养格局,尤其是数据密集型第四科研范式下,具备良好的数据素养和熟练的数据技能已成为研究群体开展研究工作的重要能力保障[1]。探讨数据素养的内涵和构成要素、针对用户在数据操作过程中的数据素养需求开展教育和培训也成为业界热点关注的课题。数据素养作为一个新兴研究领域,在理论研究和实践探索层面均获得业界学者的广泛关注并取得丰富的研究成果,研究内容不断深化和扩展。在此背景下,为了整体把握数据素养及其教育领域的研究现状和总体概况,本文从数据素养的概念、内涵和能力要素出发,采用文献计量学分析方法对数据素养及其教育领域的中英文文献进行统计分析,从时间趋势、国家/地区和机构分布、核心作者、学科/期刊分布、研究主题等角度宏观地揭示数据素养及其教育领域研究发展态势,为后来学者了解数据素养及其教育领域发展脉络提供参考,明晰研究目标和研究内容,对探索数据素养教育实践起到积极的促进作用。

1 数据素养概述

目前,业界对数据素养这一术语的表述尚未达成统一,常用的包括“数据素养”、“数据信息素养”、“科学数据素养”、“科研数据素养”、“数据管理素养”等,依据术语的内涵和表达范围,本文参考美国大学与研究图书馆协会(ACRL)表述,采用“数据素养”一词。就数据素养的概念而言,尽管尚未有机构或组织对其进行正式的界定,但业界学者对此展开了广泛的探讨,表1列举了国内外学者提出的具有代表性的数据素养定义表述。

2 数据来源与分析方法

2.1 数据来源

检索英文文献时,选取Thomson Reuters公司开发的Web of Science信息检索平台中的SCI和SSCI数据库作为数据源,检索中文文献时,选取CNKI数据库作为数据源。在分析数据素养的概念、内涵、能力要素,以及参考国内外数据素养教学内容主题的基础上,构建了数据素养及其教育领域的文献检索式,并对检索结果进行评估筛选,最终得到英文文献547篇,中文文献176篇。

2.2 分析工具

英文数据来源于Web of Science平台,因此直接导入分析工具TDA,对数据进行清洗整合后进行分析;中文数据来源于CNKI数据库,借助于文献题录分析工具SATI进行数据抽取和分析。同时,为了揭示数据素养及其教育研究领域的研究主题和热点,还借助社会网络分析工具UCINET和文献可视化信息分析软件CiteSpace。

3 数据素养及其教育领域的论文分布情况

3.1 数据素养及其教育研究领域时间趋势分析

图1和图2分别是SCI/SSCI、CNKI收录的数据素养及其教育研究领域英文和中文文献的年代分布情况。从英文文献的时间分布来看,国际上学者在很早以前即有关注科学数据管理能力方面的问题,最早是1957年美国Lawrence T.Hallett学者发表在《Analytical Chemistry》上题为“Fundamental Data Publication”的文章,探讨化学领域基础数据的发表与传播问题[21]。在2004年以前,数据素养及其教育领域总体发文较少,发文数量以个位数计,自2004年起发文数量逐年上升,其中2015年发文共计90篇,2016年上半年度(截至6月19日)已发文33篇。图中红色柱状标记为中国发文数量,中国首篇数据素养方面的研究论文是2004年由中国科学院地理科学与资源研究所的杜云艳教授发表在《ACTA OCEANOLOGICA SINICA》上题为“Construction and Implementation of Multisource Spatial Data Management System of Chinas Coastal Zone and Offshore”的文章,探讨了海洋及海岸带空间数据的组织和管理问题[22]。此后,越来越多的国内学者开始关注数据素养及其教育方面的问题,在国际期刊上的发文数量逐年上升,其中2015年发文9篇,2016年上半年度已发文5篇。从CNKI收录的数据素养及其教育领域中文文献的时间分布来看,国内学者自2000年便在数据素养研究领域有所涉猎,最早发文是中国科学院前任院长路甬祥院士于2000年在《遥感学报》上发表题为“空间数据共享及其面临的伦理挑战”的文章,主要探讨空间数据政策的特点和空间数据共享问题和面临的伦理挑战[23]。但2000-2011年间国内数据素养及其教育领域总体研究较少,自2012年以来发文数量呈现快速增长趋势,其中2015年发文数量共计51篇,2016年上半年度(截至6月19日)已发文33篇。综合国内外数据素养及其教育领域研究论文的时间分布情况可知,数据素养及其教育领域发文总体呈逐年上升趋势,特别是在2012年以来发文数量快速增长,成为业界学者的热点关注问题。

3.2 数据素养及其教育研究领域国家/地区和机构分布 通过分析SCI、SSCI收录数据素养及其教育研究领域论文的国家分布情况可知(见图3),数据素养及其教育领域发文最多的5个国家分别是美国、英国、德国、中国、澳大利亚,其中美国发文238篇,占全世界发表论文数量总数的43.5%,遥遥领先于其他国家,显示了美国在数据素养及其教育研究领域的核心地位,这与美国数据素养教育实践调研结果相吻合。调研结果显示,美国各级各单位均格外重视数据意识和数据技能的培养和教育,其中美国国家科学基金会(NSF)、美国国立卫生研究院(NIH)等资助机构大力支持数据素养及其教育项目的研究与探索,美国大学与图书馆学会(ACRL)等专业学会以数据素养教育为题展开研究与讨论,并发布白皮书、操作指南等指导和引领数据素养教育事业发展,伊利诺伊大学、北卡罗来纳大学、威斯康星大学等高校图情信息学院纷纷开设数据管理专业教育认证和数据管理课程,培养具备良好数据素养的专业人才,而普渡大学、哈佛大学、麻省理工学院等高校图书馆则积极开展科研数据管理服务和数据素养培训,以培养用户的数据意识和数据技能,积累了较丰富的数据管理培训资源和实践经验,是国际数据素养及其教育研究的前沿和标杆。中国发文28篇,位居第四位,与美国数据素养教育实践相比存在较大差距。

3.2.1 国家/地区分布

3.2.2 机构分布

数据素养及其教育研究领域发表论文的TOP10机构见表2。从SCI、SSCI收录的数据素养及其教育领域研究论文的发文机构来源来看,再次印证了美国在这一研究领域的主导地位,前10位的发文机构中占了八位,另外两所发文前10的机构是英国的爱丁堡大学和中国科学院。从机构性质来看,发文机构主要集中于大学,其中位于前5名的大学分别是美国加州大学圣地亚哥分校(美)、北卡罗来纳大学(美)、哈佛大学(美)、约翰霍普金斯大学(美)、爱丁堡大学(英),通过对这些高校图书馆网站的调研发现,图书馆均专门设立了数据管理服务平台和数据素养教育模块,提供数据管理导航、数据操作讲解、以及具体数据管理技能方面的介绍,为提升数据素养提供全方位的指导。此外,NASA和中国科学院等科研机构也注重数据素养的研究与培养。从国内数据素养及其教育领域的主要发文机构来看,中国科学院文献情报中心发文最多,在数据素养教育、数据引用伦理和规范、科学数据管理与服务方面取得了一定的研究成果,也面向国科大研究生试点开设了“地学科学数据管理”、“生命科学数据管理”课程等课程,面向图书馆员举办“科研数据管理与服务实践”等短期培训班,积累了一定的成果和经验。而武汉大学信息管理学院、上海大学图书馆、中国科学技术信息研究所等机构亦在积极探索数据素养教育与研究,是国内数据素养及其教育领域的主要研究机构。从发文机构的性质来看,主要分布在高校图书馆和高校图情信息学院,如东南大学图书馆、上海大学图书馆、深圳大学图书馆、武汉大学信息管理学院、浙江大学公共管理学院等。

3.3 数据素养及其教育研究领域核心作者分析

表3是数据素养及其教育研究领域发表论文TOP10的作者,他们在数据素养及其教育领域进行了深入研究。就英文文献的发文作者来看,发文最多的是美国国家科学基金委教育与人力资源部的Gummer,Edith S和Mandinach,Ellen B,分别发文5篇,他们的研究方向主要集中于数据素养数据素养能力要素[24]、教师数据素养能力要求[25]、高校数据素养教育[26]等方面,其他的高发文作者包括新西兰奥克兰大学的Costello,Mark J、英国谢菲尔德大学的Cox,Andrew M、美国华盛顿大学的Kolker,Eugene等。就中文文献的发文作者来看,东南大学图书馆的孟祥保和上海大学图书馆的沈婷婷是国内发文最多的作者,分别发文5篇,孟祥保主要研究图书馆数据素养教育[18]、数据管理专业教育实践[27]、高校图书馆数据馆员岗位设置[28]等问题,沈婷婷主要关注科学数据监管[29]、数据素养教育[19]等问题。其他发文较多的作者包括福建师范大学的陈娜萍、武汉大学的黄如花、中国传媒大学的沈浩、上海大学的郝媛玲等。

3.4 数据素养及其教育研究领域学科/期刊分布

3.4.1 学科分布

表4列举了数据素养及其教育研究领域中英文文献涉及的TOP学科。从数据素养研究论文的学科分布来看,图书馆与情报学是数据素养研究领域中最活跃的学科,在英文文献中,其他较为活跃的学科包括计算机科学、工程科学、生物化学与分子生物学、环境科学与生态学、化学、医学信息学等,针对不同学科领域的特点,将数据素养教育有机地融入专业课程教学和课题研究过程中,帮助教学者和研究者掌握有效地获取、筛选、评价、管理信息的理论、方法和技巧,也将是数据素养研究者需要面对的重要课题之一。从国内数据素养研究文献的学科分布来看,除了图书情报与数字图书馆领域,计算机科学软件与计算机应用、教育学、新闻与传媒、出版、科学研究管理等领域也较为活跃。总体而言,数据素养研究领域学科分布呈现多样化趋势,相互之间不断交叉融合,体现了数据素养是一个跨学科的综合性研究课题。

3.4.2 期刊分布

通过统计数据素养及其教育领域论文的期刊分布可知(见表5),数据素养领域的研究论文分布较为广泛,不但包括图书馆学情报学领域的核心期刊,还包括其他学科的专业期刊,共涉及300余种英文期刊和70余种中文期刊,表列出了数据素养研究领域发文最多的TOP10种中英文期刊。

4 数据素养及其教育领域研究主题分析

关键词在论文中所占篇幅非常小,却是文章主题的高度凝练,可以从一定程度上反应该领域的研究内容。本文主要从频次和中心度两个角度展开分析。首先,关键词词频是指某一关键词在该领域文献中出现的次数,一般而言,关键词词频越高,说明该主题越是研究领域内的热点主题,本文利用STAI和TDA工具抽取中英文关键词,进行清洗整合后按频次排序,选取TOP20的高频关键词,如表6、表7所示。但仅用高频关键词揭示研究内容存在局限性,因此本文辅之以关键共现中心度进行补充分析。中心度是在网络分析中刻画节点中心性的最直接度量指标。即表示一个关键词与其它所有关键词相联系的程度,关键词的中心度越高说明该关键词在整个研究网络中就越重要。在计算关键词中心度时,采用TDA和STAI工具对关键词进行清洗合并后生成共现矩阵,后导入社会网络分析工具UCINET计算关键词节点的中心度,根据相对点度中心度值排序,选取TOP20的高中心度关键词,如表6、表7所示。为了对比高频关键词与高中心度关键词,文中对同时位列高频关键词TOP20和高中心度关键词TOP的关键词进行加粗处理。

通过分析SCI、SSCI收录的数据素养及其教育领域研究论文的高频关键词和高中心度关键词可知,关键词词频与中心度指标呈一致性趋势,TOP20关键词中有18个关键词既是高频关键词又是高中心度关键词,分别是:数据管理、数据发表、数据监管、数据保存、数据共享、元数据标准、数据基础设施、科研数据、数据库、开放数据、学术图书馆、数据知识库、数据访问、数据管理系统、数据隐私、数据伦理、E-science、科研支撑。而分析CNKI收录的数据素养及其教育领域研究论文的高频关键词和高中心度关键词显示,关键词词频与中心度指标呈现部分一致趋势,有11个关键词同时位列TOP20高频关键词和TOP20高中心度关键词,分别是:数据管理与共享政策、数据素养、科学数据、数据管理计划工具、数据生命周期、数据管理计划、信息素养、数据引用、数据素养教育、数据馆员、数据监管。

综合SCI/SSCI和CNKI收录文献中的中英文高频关键词和高中心度关键词,可大致将数据素养及其教育领域的研究内容归纳为以下5个方面:

4.1 新型科研环境的转变

为顺应大数据环境尤其是数据密集型科研环境的发展趋势,资助机构、期刊出版商纷纷发布数据管理政策,要求研究人员制定数据管理计划,规范数据管理行为,而研究人员自身在科研实践中也面临着庞大的数据量和复杂的数据管理问题,因此国内外学者聚焦新型科研环境下的数据管理与共享的挑战作了诸多探讨,如Christine L.Borgman、青秀玲等学者介绍了大数据环境下数据共享面临的挑战,并就如何应对数据洪流的困境提出了合理化的对策和建议[30]。

4.2 数据素养的概念与能力要素

数据素养作为21世纪公民必备的新兴素养,国内外学者辨析了数据素养、信息素养、统计素养等相关素养之间的区别与联系,并就数据素养的概念、内涵以及能力要素等各方面展开深入研究,如M Schield专门发文介绍了什么是信息素养、统计素养和数据素养[2],他们的研究成果为后来学者了解数据素养研究脉络和数据管理服务与数据素养教育的开展奠定了基础。

4.3 基于数据生命周期的数据管理流程

许多国内外学者从数据产生与收集、数据处理与分析、数据存储与共享、数据再利用等具体的数据生命周期阶段出发,探讨如何科学规范地管理数据,包括数据收集、数据描述、数据存储、数据发表、数据访问,以及数据利用中的数据引用、数据伦理与道德等问题,如P Richard、R Joakim等介绍了嵌入科研过程的数据共享问题[31]。

4.4 数据管理基础设施建设

数据的规范管理和发表共享离不开信息技术与基础设施的支撑,因此数据库、数据仓储、数据管理系统、数据共享平台等基础设施也是业界学者的重点研究问题,例如面向临床医学数据管理与共享开发的医学数据管理系统OpenClinica[32],针对生物医学领域科研管理需求设计专门的科学数据管理系统[33]。

4.5 科学数据服务与数据素养教育实践

在新型科研环境的驱动下,高等院校、科研机构、图书馆等信息服务机构积极探索科学数据服务和数据素养教育实践,旨在指导和帮助研究人员合理规范地管理数据,培养其数据意识和数据技能,例如E P Frank等介绍了其所在的路易斯安那州立大学的数据信息素养教育课程[34],Haendel M A等介绍了俄勒冈健康与科学大学的信息素养与数据管理课程实践[35]。

对比国内外研究主题发现,国外在以上5个方面的研究内容已经较为充实和丰富,而国内主要探讨新型科研环境的转变和数据素养的概念与能力要素研究,在基于数据生命周期的数据管理流程和数据管理基础设施建设方面研究较少,在科学数据服务与数据素养教育实践研究方面,尽管武汉大学、复旦大学、北京大学已经开始实施科学数据服务,中国科学院文献情报中心试点了科学数据管理课程,但研究基础较为薄弱,主要还集中于国外科学数据服务和数据素养教育的调研和总结,为国内进一步实施科学数据服务和数据素养教育提供参考和借鉴。

5 结 语

E-Science科研环境下,数据不再局限于传统的调查或科学实验产生的定量分析结果,而被视为独立的科研成果,是科研产出的重要组成部分[36]。这无疑给研究人员的数据获取、分析、管理等方面的能力提出了更高的要求[18],数据素养成为研究群体的必备技能。探讨数据素养的内涵和能力构成要素,探索数据管理服务和数据素养教育实践,培养研究人员的数据意识和数据管理技能,已成为业界热点关注的课题。基于此,本文采用文献计量学分析方法,从时间趋势、国家/地区和机构分布、核心作者、期刊分布、学科分布、高影响力文献、热点研究主题等角度分析了数据素养及其教育领域的文献研究现状,期望能为我国数据素养及其教育研究领域的研究者提供参考。

参考文献

[1]Koltay T.Data literacy for researchers and data librarians[J].Journal of Librarianship and Information Science,2015:1-12.

[2]Schield M.Information literacy,statistical literacy and data literacy[J].IASSIST Quarterly,2004,28(2/3):6-11.

[3]Qin J,DIgnazio J.Lessons learned from a two-year experience in science data literacy education[EB/OL].http:∥docs.lib.purdue.edu/iatul2010/conf/day2/5/,2016-10-17.

[4]Calzada Prado J,Marzal M?#.Incorporating data literacy into information literacy programs:Core competencies and contents[J].Libri,2013,63(2):123-134.

[5]Mandinach E B,Gummer E S.A systemic view of implementing data literacy in educator preparation[J].Educational Researcher,2013,42(1):30-37.

[6]Ridsdale C,Rothwell J,Smit M,et al.Strategies and Best Practices for Data Literacy Education[EB/OL].https:∥www.researchgate.net/publication/284029915StrategiesandBestPracticesforDataLiteracyEducationKnowledgeSynthesisReport,2016-10-17.

[7]Schneider R.Research data literacy[C].European Conference on Information Literacy.Springer International Publishing,2013:134-140.

[8]Carlson J,Fosmire M,Miller C C,et al.Determining data information literacy needs:A study of students and research faculty[J].portal:Libraries and the Academy,2011,11(2):629-657.

[9]Swan K,Vahey P J,Rafanan K,et al.Challenges to Cross-Disciplinary Curricula:Data Literacy and Divergent Disciplinary Perspectives[EB/OL].https:∥www.scpa.sri.com/sites/default/files/publications/aera2009twd.pdf,2016-10-17.

[10]Wolff A,Kortuem G,Cavero J.Urban Data in the primary classroom:bringing data literacy to the UK curriculum[EB/OL].http:∥oro.open.ac.uk/43855/1/webSci%20-%20CR.pdf,2016-10-17.

[11]Bhargava R,DIgnazio C.Designing Tools and Activities for Data Literacy Learners[EB/OL].http:∥www.dataliteracy.eita.org.br/wp-content/uploads/2015/02/Designing-Tools-and-Activities-for-Data-Literacy-Learners.pdf,2016-10-17.

[12]Stephenson E,Caravello P.Incorporating Data Literacy into Undergraduate Information Literacy Programs in the Social Sciences:A Pilot Project[J].Reference Services Review,2007,35(4):525-540.

[13]张静波.大数据时代的数据素养教育[J].科学,2013,(4):29-32,4.

[14]杨晓菲.从信息素养到数据素养:内涵、关系及培养途径[J].河北科技图苑,2015,(6):30-32.

[15]何海地.大数据背景下大学图书馆开展数据素养教育的思考[J].现代情报,2015,(9):130-134.

[16]高淑莲.大数据背景下国外数据素养教育及启示[J].图书馆研究,2015,(6):108-111.

[17]郝媛玲,沈婷婷,高珊.高校数据素养教育实践的思考和建议——基于哈佛大学案例和我国图书情报人员访谈的分析[J].图书情报工作,2015,(12):44-51.

[18]孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014,(3):11-16.

[19]沈婷婷.数据素养及其对科学数据管理的影响[J].图书馆论坛,2015,(1):68-73.

[20]张艳梅.用户数据素养教育视角下的图书馆科学数据管理研究[J].图书与情报,2015,(4):139-141,109.

[21]Hallett L T.Editorial.Analytical Interest Strong in Nuclear Energy[J].Analytical Chemistry,1957,(12):1725-1725.

[22]DU YY,WANG J,WANG Z,et al.Construction and implementation of multisource spatial data management system of Chinas coastal zone and offshore[J].Acta oceanologica sinica,2004,23(1):97-108.

[23]路甬祥.空间数据共享及其面临的伦理挑战(英文)[J].遥感学报,2000,(4):245-250.

[24]Gummer E,Mandinach E.Building a Conceptual Framework for Data Literacy[J].Teachers College Record,2015,117(4):n4.

[25]Mandinach E B,Gummer E S.Every teacher should succeed with data literacy[J].Phi Delta Kappan,2016,97(8):43-46.

[26]Mandinach E B,Gummer E S.A systemic view of implementing data literacy in educator preparation[J].Educational Researcher,2013,42(1):30-37.

[27]孟祥保,钱鹏.国外数据管理专业教育实践与研究现状[J].中国图书馆学报,2013,(6):63-74.

[28]孟祥保,钱鹏.国外高校图书馆数据馆员岗位设置与管理机制[J].图书与情报,2013,(4):12-17.

[29]沈婷婷,卢志国.科研项目不同阶段的科学数据监管方法[J].图书馆建设,2013,(3):49-51.

[30]Christine L.Borgman,青秀玲.科研数据共享的挑战[J].现代图书情报技术,2013,(5):1-20.

[31]Platt R,Ramsberg J.Challenges for Sharing Data from Embedded Research[J].New England Journal of Medicine,2016,374(19):1897-1899.

[32]Meineke F A,Lbe M,Stubert S,et al.Integration of the clinical data management system OpenClinica into the research infrastructure of the Center for Sepsis Control and Care(CSCC)[C].Infection.Tiergartenstrasse 17,D-69121 Heidelberg,Germany:Springer Heidelberg,2011,39:S141-S141.

[33]Myneni S,Patel V L.Organization of biomedical data for collaborative scientific research:A research information management system[J].International journal of information management,2010,30(3):256-264.

[34]Frank E P,Pharo N.Academic librarians in data information literacy instruction:a case study in meteorology[J].College & Research Libraries,2015:crl15-828.

[35]Haendel M A,Vasilevsky N A,Wirz J A.Dealing with data:A case study on information and data management literacy[J].PLoS Biol,2012,10(5):e1001339.

[36]Carmichael P.Tribes,territories and threshold concepts:Educational materialisms at work in higher education[J].Educational Philosophy and Theory,2012,44(s1):31-42.

(责任编辑:郭沫含)

猜你喜欢

数据素养文献计量教育领域
3D显示技术在教育领域的应用研究
我国医学数字图书馆研究的文献计量分析
大数据时代高校图书馆数据素养教育研究
教育领域综合改革成功运行的三大机制
对深化教育领域综合改革的初步认识
教育领域综合改革需要全民戮力而行