APP下载

国内数据素养研究的文献计量分析

2021-04-29

文教资料 2021年34期
关键词:发文师范生聚类

董 芸

(宜春幼儿师范高等专科学校 学前教育学院,江西 宜春 336000)

在人工智能时代,数据素养作为一项重要的素养引起了学界的关注,涌现了许多相关研究成果。本文借助文献计量法,检视国内相关研究成果,把握国内数据素养研究现状,可以为后续研究提供依据。

一、研究方法

借助“中国知网”的高级检索功能,检索条件设置如下:范围为“期刊”,来源类别为“核心和CSSCI”,篇名为“数据素养”。共检索到175 条文献,检索到的所有文献均符合研究需要。借助COOC、VOSviewer 软件及“中国知网”自带的计量可视化分析功能,对所有检索结果进行文献计量分析,以揭示国内数据素养研究现状。

二、国内数据素养研究现状分析

(一)文献年度分布

在“中国知网”上,将检索到的全部结果按照“发表年度”浏览,并对其进行计量可视化分析,借助办公软件Excel 绘制、美化折线图,如图1 所示。可以看出,2013 年国内才开始出现数据素养研究的高质量研究成果,且数量较少。2014 年开始增长,2016 年达到顶峰,发文量高达36 篇。2016—2020年,发文量经历了“回落—上升—回落—上升”的过程,但这五年里发文量总数最低都保持在23 篇,呈“W”型增长,虽不稳定,但总体呈增长趋势。这说明近些年来数据素养一直是学界关注的热点,且涌现了不少高质量研究成果。数据素养的研究受到国内学者的关注,与国家颁发的有关教育信息化和人工智能教育的相关政策有关。

图1 文献年度分布图(2013—2020)

(二)期刊发文量

在“中国知网”上将检索到的全部结果按照“期刊”进行浏览,并对其进行计量可视化分析,如图2所示。可以发现,国内关于数据素养研究的成果多发表在图书馆和情报学期刊上,排在前20 位的教育学类的期刊只有《电化教育研究》(发文量6 篇)、《现代教育技术》(发文量4 篇)和《开放教育研究》(发文量3 篇)三种。结合学科分类的计量可视化结果,如图3 所示。可以发现,66.85%属于图书情报档案学科,25.41%属于教育学学科。这说明教育学学科领域还需加强对数据素养的研究。

图2 期刊分布

图3 学科分类分布

(三)作者分布

利用COOC 软件绘制发文量前20 位作者的柱形图,如图4 所示。发文量最高的作者发表论文篇数为9 篇。根据普莱斯公式来确定核心作者,求得N=0.749×√9 ≈2,核心作者即发文量2 篇及以上?者,根据后台结果,符合此条件的作者为48 人,意味着核心作者有48 人。为进一步挖掘研究方向高度一致的作者,利用COOC 软件构建基于关键词的作者耦合矩阵,再将作者耦合矩阵转化为邻接表,邻接表转化为VOSviewer 能识别的.net 格式的文件,导入VOSviewer 中,绘制出基于关键词的作者耦合网络,如图5 所示。在该网络图中,属于同一颜色的作者意味着他们的研究方向比较接近,可以发现,形成了四大耦合团体,分别是以胡卉、吴鸣、陈秀娟、李建霞、郭倩、黄如花、陈琦、余维杰、徐萍、沈玖玖、艾文华、刘爱琴、尚珊、王维佳、曹树金、卢祖丹为代表的团体;以刘智、孙建文、张斌、刘三女牙、杨现民、林秀清、李新、李青、陈明星、钱鹏、张娟、任一姝、付超、左平熙、胡洋、谢友宁为代表的团体;以孟祥保、杨文建、邓李君、隆茜、程结晶、刘敏、张路路、张群、刘玉敏、彭奇志、宋甲丽、秦小燕、初景利为代表的团体;以郝媛玲和沈婷婷为代表的团体。

图5 基于关键词的作者耦合网络图

(四)研究机构分布

利用COOC 软件绘制发文量前20 位研究机构的柱状图,如图6 所示,位居第一位的是中国科学院文献情报中心,发文量前20 位的研究机构多属于双一流高校或高水平研究机构,且多是图书馆情报领域的,仅有江苏师范大学智慧教育学院属于师范类院校。从这个层面上说,教育学学科领域在数据素养方面研究相对较为系统的师范类院校当属江苏师范大学。

图6 发文量前20 位的机构

(五)高频关键词的主题聚类

利用COOC 软件构建词频大于等于3 的关键词的共现矩阵,将其转化为邻接表,再转化为.net 格式,将.net 格式的文件导入VOSviewer 中,绘制高频关键词的主题聚类图,颜色相同的关键词为一个主题,如图7所示。可以发现,一共有九个聚类:聚类一包含大数据、大数据素养、师范生、教师专业发展等关键词;聚类二包含数据素养、图书馆、大数据时代、教育等关键词;聚类三包含数据意识、用户教育、科学数据管理等关键词;聚类四包含人才培养、信息素养教育、数字人文等关键词;聚类五包含指标体系、能力、能力模型等关键词;聚类六包含信息素养、大学生、数据素养教育等关键词;聚类七包含数据管理、科研人员、科研数据等关键词;聚类八包含科学数据、素养教育、高校图书馆等关键词;聚类九包含馆员一个关键词。

(六)高频关键词的系统聚类分析

利用COOC 软件构建词频大于等于3 的高频关键词相异矩阵,并绘制谱系图谱,此实质上为系统聚类分析,结果如图8 所示。据此,将国内数据素养研究分为档案学专业学生数据素养教育研究(领域1)、教师和师范生数据素养研究(领域2)、图书馆科学数据素养研究(领域3)、高校图书馆数据素养教育研究(领域4)、中小学教师和大学生数据素养研究(领域5)五大领域。

图7 高频关键词主题聚类图

领域1 为档案学专业学生数据素养教育研究,包括人才培养、数字人文和档案学三个关键词,主要围绕档案学专业教育的数据素养教育内容体系[1]、基于数字人文理念的档案学专业学生数据素养培育策略[2]展开。

领域2 为教师和师范生数据素养研究,包括教师专业发展、师范生、模型构建、教师数据素养、教育大数据、大学图书馆、美国、能力、指标体系等九个关键词。关于教师数据素养研究,主要围绕基于数据素养的中小学教师专业发展的内涵与路径[3]、教师数据素养的内涵、价值和发展策略[4][5]、教师数据素养模型及教师数据素养教育实施建议[6]、美国发展教师数据素养的基础和路径[7]等研究展开。关于师范生数据素养研究,主要围绕师范生数据素养概念、构成要素、教育模式[8]、培养目标及课程体系[9]、模型及培育实践研究[10]展开。

领域3 为图书馆科学数据素养研究,包括科学数据素养、科学数据管理、用户教育、科研人员、数据生命周期、数据管理、科研数据等七个关键词。主要围绕科学数据素养的内涵结构[11]、能力指标体系构建[12]、科研人员科学数据素养能力评价体系[13]、高校图书馆用户科学数据素养能力与需求[14][15]、用户科学数据素养研究架构及干预策略[16]、图书馆员科学数据素养能力框架及发展策略[17]、高校图书馆科学数据素养教育的现状及建议[18]、高校图书馆科学数据素养教育体系模型[19]、研究生科学数据素养教育模式[20]、国内外高校图书馆科学数据素养教育的比较分析[21]展开研究。

领域4 为高校图书馆数据素养教育研究,包括信息素养、数据素养、大数据、慕课(MOOC)、数据素养教育等十三个关键词。主要围绕某一具体课程中数据素养教育的方法[22]、图书馆开展数据素养教育的内容与方式[23]、发展策略[24][25][26][27][28]、针对不同培训对象的数据素养教育策略[29]、存在的问题及对策[30]、高校图书馆数据素养教育体系框架[31]、数据素养教育体系以及服务模式[32]、面向学科的高校图书馆数据素养教育特征与模式[33]、开展嵌入式数据素养教育的路径[34]、基于数据素养教育高校图书馆的服务转型策略[35]等方面展开研究。

领域5 为中小学教师和大学生数据素养研究,包括数据意识、中小学教师、大数据时代、教师、教育、大学生、馆员、大数据素养、因子分析等九个关键词。关于中小学教师数据素养研究,主要围绕中小学教师数据素养评价指标体系构建[36]、发展路径与培养策略[37]展开。关于大学生数据素养研究,主要围绕大学生数据素养现状及培养方法[38]、评价[39]、提高的途径与对策[40]、数据素养能力评价的实证研究[41]、高校数据素养教育对其影响[42]、大学生数据素养教育的目标定位及体系构建[43]展开。

图8 高频关键词系统聚类

三、研究结论与展望

本研究以国内刊载在核心及CSSCI 期刊上的175篇关于数据素养研究的文献为研究对象,基于文献计量分析,得出结论并展望如下。

第一,从学科视角来看,国内关于数据素养的成果集中分布在图书情报档案学科,基于教育学学科视角的高质量成果偏少,因而教育学学科领域应加强数据素养研究。比如关于师范生的数据素养现状、提升对策、师范生数据素养教育等研究应该加强。

第二,从研究方法来看,已有的研究多为理论研究,实证研究相对偏少,特别是关于大学生、教师、师范生的数据素养研究,也多集中在数据素养的基本理论的探讨上,忽视了有关这些不同群体数据素养现状和培育实践的实证研究。因而需进一步加强实证研究。

第三,从研究内容来看,数据素养的基本概念、内涵、价值、教育模式、发展策略等方面的研究比较丰富,但关于数据素养现状、提升策略、培育实践的实验研究等相对偏少。未来研究在关于数据素养的实践层面的内容应该加强。

猜你喜欢

发文师范生聚类
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
校园拾趣
爷孙趣事
以牙还牙
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
师范生MPCK发展的策略
浅析师范生PCK知识的构建
一种层次初始的聚类个数自适应的聚类方法研究
自适应确定K-means算法的聚类数:以遥感图像聚类为例