APP下载

基于CiteSpace知识图谱的近十年中国数据素养研究现状分析

2023-06-25张文茹

现代信息科技 2023年8期
关键词:数据素养知识图谱

摘  要:随着大数据时代的到来,对于数据收集、分析和处理能力都有着更高的要求,而且數据素养也是科研研究人员必须要掌握的一项能力。这也意味着需要提高对于人才的培养的要求,要求教育要进一步适应社会的发展,加强对于数据素养的相关教育。文章通过关键词检索,在知网当中共检索到1 188篇与数据素养有关的中文文献,使用CiteSpace可视化软件以及科学知识图谱法对于国内目前数据素养的研究现状进行分析。通过现状分析,指出国内对于数据素养研究存在的问题,并且为我国目前数据素养的研究带来一些新的启示。

关键词:数据素养;CiteSpace;知识图谱

中图分类号:TP391    文献标识码:A  文章编号:2096-4706(2023)08-0126-04

Abstract: With the arrival of the era of big data, there are higher requirements for data collection, analysis and processing ability, and data literacy is also an ability that scientific researchers must master. This also means that it is necessary to improve the requirements for talent training, require education to further adapt to the development of society, and strengthen the relevant education for data literacy. In this paper, a total of 1 188 Chinese literatures related to data literacy are retrieved from CNKI through keywords search. The CiteSpace visualization software and scientific knowledge graph method are used to analyze the current research status of data literacy in China. Through the analysis of the current status, it points out the existing problems in the research of data literacy in China, and brings some new enlightenment for the research of data literacy in our country.

Keywords: data literacy; CiteSpace; knowledge graph

0  引  言

习近平总书记在党的二十大报告中明确强调,我们要坚持人才引领驱动,加快人才强国的建设,全面提高人才自主培养质量,着力造就拔尖创新人才[1],为国家培养创新人才,为国家培养创新型人才。以大数据时代为背景,科学研究需要的创新型人才应当需要数据处理的能力,数据素养的是现在创新型人才必须具备的核心素养之一。信息当中还包含着一些无用的内容,但是数据不论是哪种类型,在研究中都可以对其进行分析加工。互联网的快速发展,随处可见的数据越来越多,数据呈现出了爆炸式的增长,社会开始进入大数据的时代。在大数据时代,对于数据收集、分析和处理能力都有着更高的要求,而且数据素养也是科研研究人员必须要掌握的一项能力。这也意味着需要提高对于人才的培养的要求,要求教育要进一步的适应社会的发展,加强对于数据素养的相关教育。

在以大数据和人工智能为背景的数据信息环境下,为了提高大众对于数据素养的重视程度,培养大众对于数据素养的意识,我国先后出台了相应的政策[2]。2015年,以国务院印发的《促进大数据发展行动纲要》《国务院办公厅关于运用大数据加强对市场主体服务和监督的若干意见》为主导,推动国内对于大数据的发展利用;2018年,针对科学大数据管理这一问题,国务院又颁布了《科学数据管理办法》,主要目的在于全面提升国内高等教育行业对于大数据教育的重视,推动国内大数据相关应用的发展,进一步促进数据素养教育与高等教育的挂钩。2019年又相继发布了《中国教育现代化2035》强调教育要培养创新型人才,要适应社会发展的要求。国家对于数据素养越来越重视,因此在未来的发展中,数据素养将成为大学生所必须具备的一种核心素养。

1  文献综述

对于数据素养的研究国外起步较早,在2004年发表的《信息素养、统计素养和数据素养》一文中就较早的提到了“数据素养”这一概念[3]。该文中认为数据素养是信息素养和统计素养的重要组成部分,认为学生必须具备与数据相关的一些知识:学生必须要具有能够访问、评估、操作、总结和展示数据的相关知识。国外部分学者认为数据素养应该侧重于数据的产生、保存与管理等技术性更强的方面[4]。对于数据素养的定义,学术界目前还没有形成统一的观点,但是以下两个概念是在国外数据素养的相关研究中引用的较多。Stevenson和Caravello[5]对其进行定义,认为“数据素养”就是找到、评价和有效合理使用信息(包含数据资源)的能力;Hogenboom[6]等对其进行定义,认为“数据素养”就是阅读、解释、分析、批判性思考统计数据以及将统计数据作为证据的能力。目前,学术界对于数据素养的界定还存在一定的争论,所以有的学者称为“数据信息素养”[7],部分称为“科学数据素养”[8]以及“科研数据素养”[9]。

国内“数据素养”这一词最早出现在项华的《论物理教育中数据素养的培养》[10],该文认为数据素养是科学素养的一部分,并且数据素养是一种基于计算机计算的素养。缪其浩[11]认为数据素养是一种能力,能够理解本行业本专业的数据问题和意义,能够与数据专家对话,使数据产生价值,帮助企业提升竞争力、提高管理决策的有效性和及时性,数据素养是科学素养和信息素养的重要组成部分,会成为任何专业大学生必备的基础知识之一[12]。张静波[13]认为“数据素养是一种对数据的理解、创造和使用的能力,是对媒介素养、信息素养等概念的延伸和补充”;并且张静波还认为数据素养是指科研人员在开展科学研究时应具备的一种能力,属于大数据时代对学生进行专业技能教育的要求之一,是针对传统“信息素养”教育的进一步提高与深化。黄如花、李白杨[14]等认为数据素养应该包含以下几个方面,数据意识、数据能力以及数据伦理,认为在大数据时代数据素养是信息素养的一种扩展,也是人们的必备素养。孟祥保[15]等认为“科学数据素养”包括三个层次:一是具有“数据”意识,能够认识到数据是一种资源;二是具备数据基本知识与技能,熟悉数据生命周期与科学研究生命周期,在特定专业领域内具有查找、管理、利用与共享数据的能力,了解相关数据管理政策法规和数据伦理等知识;三是在大数据时代,能够利用数据资源发现问题、分析问题与解决问题。

因此,本文将以“数据素养”为检索词在中国知网中对其进行检索,并且对检索到的结果进行文本分析。

2  研究方法

2.1  数据来源

本研究所使用的国内相关文献来源于中国知网(CNKI)数据库,以保证全面把握和分析数据素养的历史脉络。本文所使用的研究文献时间跨度从2010年到2021年底的国内相关期刊论文,文献均来自中国知网。在知网中输入“数据素养”检索词,然后进行检索,共检索到1 192篇,经过筛选,其中有四篇被剔除,因此最终用来分析的共1 188篇。用refworks格式导出并进行格式转换,得到适合CiteSpace分析的原始数据,然后使用CiteSpace对这些数据进行文本分析。

2.2  研究方法

本研究采用的研究方法主要是科学知识图谱法,利用CiteSpace可视化软件对数据素养的研究现状进行可视化的分析。该方法是一种用于研究科学知识发展进程和结构关系的图谱,既是可视化的知识图形又是序列化的知识谱系,具有“图、谱”两种属性。利用这两种方法对对于相关领域进行研究分析。CiteSpace该软件是在2004 年由美国华裔陈超美教授团队开发研制,该软件是对特定领域的文献进行分析,最后形成可视化的科学知识图谱。

3  数据素养的研究情况

3.1  发文数量的变化

从图1可以看出,我国对于数据素养的研究始于2010年,到2021为止,具体可以分为两个阶段:

1)缓慢增长期(2010—2014年),这一阶段发文量的变化特点是缓慢增长,从2010—2013年以个位数增加,这三年的发文量分别为1篇、1篇和9篇,而从2013—2014年缓慢增加,增加了18篇。

2)快速增长期(2014—2021年),这一阶段发文量从27篇增长到266篇,在这8年期间,有关数据素养的发文量一直保持较快的增长势头。

3.2  关键词分析

3.2.1  关键词共现分析

使用CiteSpace对最后获得的1 188篇文献进行分析,对其进行关键词共现的分析,如图2所示。通过CiteSpace对于数据素养相关关键词的检索图谱中可以得到,该图谱的节点数为395,连线数量916,密度为0.011 8,说明关键词之间的相关度较高。在图谱中,关键词的字号越大,说明其出现的频率越高,研究的热度越高。从图谱可以看出,“数据素养”和“大数据”的字号最大,说明有关数据素养的研究主要围绕数据素养和大数据这两个方面进行,而且这两方面的研究热度最高。“信息素养”“图书馆”“数据新闻”“高校”“可视化”“互联网+”“大学生”“数据意识”“数据管理”“数据服务”“数据驱动”“科学数据”等也都是围绕数据素养的几个研究热点。

3.2.2  关键词频率分析

对高频词进行整理、统计,筛选出近10年来有关数据素养研究领域位居前10的高頻词分别是“数据素养”“大数据”“图书馆”“数据新闻”“大学生”“信息素养”“互联网+”“数据挖掘”“高校”“可视化”,每个高频词出现的频次如表1所示。从表1当中可以看出“数据素养”出现了476次,“大数据”346次,图书馆出现了76次,“数据新闻”出现了45次,“大学生”出现了27次,“信息素养”出现了103次,大数据时代出现了98次。在CiteSpace中,中介中心性超过0.1的节点称为关键节点,因此这10个关键词均为关键节点。

3.3  关键词聚类分析

CiteSpace可以依据网络结构和聚类的清晰度,提供模块值和平均轮廓值,这两个指标分别可以简称为Q值和S值,通过这两个值可以评判图谱绘制的效果。通常情况下,Q值一般多在区间[0,1)的范围内,Q>0.3就表示社区结构是显著的;当S>0.7时,表示聚类就是高效的,若在0.5~0.7之间聚类也是合理的。从图3当中可以看出该图谱的Q值为0.5,这表明该图谱划分出来的社区结构是显著的;S值为0.6,这表明该图谱的聚类是合理的。从该图谱中可以看出目前对于数据素养的研究可以聚集为以下几个类别:“大数据”“数据素养”“信息素养”“图书馆”“数据科学”“数据新闻”“高考”“互联网+”“高校教师”“基础设施建设”和“媒介融合”。

4  研究结果分析

结合以上所有的图表数据可以得出,国内对于数据素养的研究起步较晚,对于数据素养的研究主要还是集中于高校图书馆领域和教育领域,并且覆盖中小学、大学等各个阶段。

國内数据素养针对图书馆领域的研究主要有宋甲丽等以网络的形式,对国内42所“双一流”知名高校图书馆科学数据素养的教育情况进行调研[16];孙金宝等则是将研究的重点放在了国外,对于国外的36家高校图书馆,从教育对象、教育方式、教育内容3个方面对其数据素养教育现状进行调研,分析其数据素养教育特点[17]。司莉等对于国内的38所iSchool院校、138个图书情报专业研究生以及开设的多门课程进行调研,从多个维度对于数据素养课程的设置情况和特征进行分析[18]。

针对教育领域的研究主要有隆茜对于部分高校的教师、博士生、硕士生、本科生的数据素养能力的现状进行了调研[19];余维杰等人以双生命周期理论作为研究视角,对于我国研究生的数据素养现状进行调研[20];林书兵等通过梳理美国有关数据素养研究领域20年的先行经验和实践启示,为国内这一热点实践领域提供深入推进的思路和方法[21]。聂云霞等从教育核心、模式、手段和导向4个层面,对数字人文视域下档案学学生的数据素养培育目标进行探讨,探索数据素养的培育策略[22]。

根据上述的文献可以看出国内虽然有关数据素养的研究力量主要集中在图书馆和教育这两个领域,但是在其他的领域中也应当加强对于数据素养的教育。基于以上数据素养的研究可以得出一个结论,目前我国高校的教育应当加强对于数据素养的教育。不管是面向哪个群体,不管是哪个领域,都要加强对于学生数据素养的教育,数据素养应当成为当代大学生步入社会必须具有的一种素养。

5  结  论

数据素养不仅对于创新型人才来说是必须具备的素养,对于大学生的来说更是一种要具备的素养。目前有关数据素养的研究对象主要集中于高校、图书馆、大学生以及研究生。随着社会逐渐进入到大数据时代,那么就应当让数据“发声”成为发挥数据价值的关键。

首先,国内对于数据素养的研究起步较晚,人们对于数据素养的意识不够。对于大众而言,我们应当培养国内大众对于数据素养的意识,针对这一部分群体只需要他们意识到数据的重要性,保护好自己的隐私。不需要拥有处理数据的能力,对他们进行“数据扫盲”,意识到自己身边“数据”的重要性,不会轻易地将自己的私人信息透漏在网络上。

其次,对于图书馆这一领域来说,应当重点培养具有数据素养的高校图书馆管理人才。当今的图书馆不再是以前的图书馆,科技的进步,图书馆也在发生着巨大的改变。相比之前的图书馆,现在的图书馆具有很多的电子图书。随着图书馆藏形式的改变,这就要求图书管理人员也需要随着社会的发展而逐步发展。对于高校来说,应当为图书管理相关专业的学生设立专门的课程,培养大数据时代下图书管理员所需要的技能;对于在职的一些图书管理员来说工作单位应该为其提供相关的技能培养。

第三,社会的快速发展,大数据时代的到来,科技对于各个行业也产生了各种各样的影响。教育行业是一个非常传统的行业,但是在现在这个时代,教育行业也在快速的发展。教师需要学会在自己的课堂活动中提取自己需要的研究数据,具有对于数据进行处理的技能,使自己不光成为教育者,也成为研究者。对于在校师范生来说应当为其培养相关数据素养的意识,可以让师范生在未来的教育中使用数据说话,不仅是一位教育者,更是一位研究者;对于在职教师来说,学校应当为教师提供进行数据素养教育的机会。而且,在教育领域里面重点要培养大学生的“数据素养”,对于大学生来说,高校一定要加强对于数据素养的培养。数据素养的教育对于大学生来说不仅是为了适应社会发展的需要,这也是提高大学生核心竞争力的基本要求。而且数据素养对于创新型人才来说更是必须具备的一种能力。高校应当对于不同的专业设立不同的数据素养教育的专业课程。

参考文献:

[1] 新华社.习近平:高举中国特色社会主义伟大旗帜为全面建设社会主义现代化国家而团结奋斗——在中国共产党第二十次全国代表大会上的报告 [EB/OL](2022-10-25).http://www.gov.cn/xinwen/2022-10/25/content_5721685.htm.

[2] 国务院.国务院关于印发促进大数据发展行动纲要的通知 [EB/OL].(2015-09-05).http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.

[3] SHIELDS M. Information Literacy,Statistical Literacy,Data Literacy [J].IASSIST Quarterly2005,28(2-3):6.

[4] ZUBIAGA A,NAMEE B M. Knowing What You Don't Know:Choosing the Right Chart to Show Data Distributions to Non-Expert Users [EB/OL].(2022-09-19)https://www.researchgate.net/publication/278406228_Knowing_What_You_Don%27t_Know_Choosing_the_Right_Chart_to_Show_Data_Distributions_to_Non-Expert_Users.

[5] STEPHENSON E,SCHIFTER C P. Incorporating data literacy into undergraduate information literacy programs in the social sciences:A pilot project [J].Reference Services Review,2007,35(4):525-540.

[6] KAREN H,HOLLER P C M,KAYE H M. Show Me the Data! Partnering With Instructors to Teach Data Literacy [EB/OL].(2022-09-19).https://www.ideals.illinois.edu/items/73613.

[7] CARLSON J,FOSMIRE M,MILLER C C,et al. Determining Data Information Literacy Needs:A Study of Students and Research Faculty [J].Portal:Libraries and the academy,2011,11(2):629-657.

[8] QIN J,D'LGNAZIO J. Lessons learned from a two-year experience in science data literacy education [C]//International Association of Scientific and Technological University Libraries,31st Annual Conference.Boston,2010:188-204.

[9] SCHNEIDER R. Research Data Literacy [C]//ECIL 2013:Worldwide Commonalities and Challenges in Information Literacy Research and Practice.Cham:Springer,2013:134–140.

[10]項华.论物理教育中数据素养的培养[J].中国现代教育装备,2011(4):84-85.

[11]缪其浩.大数据时代:趋势和对策[J].科学,2013,65(4):25-28+4.

[12]缪其浩.了解大数据,具备起码的数据素养[J].世界科学,2013(2):14.

[13]张静波.大数据时代的数据素养教育[J].科学,2013,65(4):29-32+4.

[14]黄如花,李白杨.数据素养教育:大数据时代信息素养教育的拓展[J].图书情报知识,2016(1):21-29.

[15]孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014,32(3):11-16.

[16]宋甲丽,程结晶.高校图书馆科学数据素养教育现状调查及建议[J].图书馆学研究,2018(19):2-9.

[17]孙金宝.国外高校图书馆数据素养教育研究及启示[J].图书馆工作与研究,2021(10):44-51.

[18]司莉,姚瑞妃.图书情报专业研究生数据素养课程设置及特征分析——基于iSchool联盟院校的调查[J].图书与情报,2018(1):28-36+101.

[19]隆茜.数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析[J].图书馆,2015(12):51-56+62.

[20]余维杰,周娅莉,吴锦池.我国研究生在科研活动中的数据素养现状研究——以双生命周期理论为视角[J].图书情报工作,2020,64(7):84-93.

[21]林书兵,陈思琪,张学波.从数据素养到数据智慧:教学决策的实践脉络与绩效追问[J].中国电化教育,2021(9):79-87.

[22]聂云霞,肖坤.数字人文视域下档案学专业学生数据素养培育探析[J].档案学通讯,2020(3):95-103.

作者简介:张文茹(1997—),女,汉族,甘肃秦安人,硕士研究生在读,研究方向:教育学。

猜你喜欢

数据素养知识图谱
大数据环境下高校图书馆的数据素养教育
大数据环境下高校图书馆的数据素养教育
基于文献计量的数据素养及其教育领域研究态势分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
大数据时代高校图书馆数据素养教育研究
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展