APP下载

基于数据挖掘技术的中学化学教学现状分析研究

2020-07-13沈秀童

山东化工 2020年11期
关键词:中学化学分词图谱

沈秀童,艾 阳

(1. 西南大学 化学化工学院,重庆 400715;2.青岛科技大学 数理学院,山东 青岛 266100)

新中国成立以来,我国基础教育在不断改革的过程中取得了长足的发展。化学作为一门基础的自然科学,在促进科技进步和社会文明发展、提高人们的生活质量等方面具有重要的价值。化学教育作为学校科学教育的重要组成部分,与其他学科教育一样,承担着传递人类文明遗产、为国家发展培养人才的重要作用[1]。我国中学化学课堂教学在理论建构和实践探索方面取得了丰硕的成果,呈现出明显的阶段性特征[2]。通过探索新时代中学化学教学的方向和内容,充分发挥化学课程的育人价值,对促进学生全面发展具有重要意义。

自 20 世纪 50 年代开始,我国在中学化学教学上产生过一系列探索。如 1952 年 3 月教育部颁布的 《中学暂行规程(草案)》提出,“中学的教育目标是使学生得到现 代化科学的基础知识和技能。”[3]同 年 12 月教育部颁发了以前苏联教学大纲为蓝本编写的 《中学化学教学大纲(草案)》,明确指出中学化学教学的基本任务是使学生获得一定的、系统的 和巩固的化学基本知识;使学生获得计算、实验等基本技巧[4]。1978 年 1 月教育部颁布的《全日制十年制学校中学化学教学大纲(试行草案)》指出 “中学化学教学的目的是使学生牢固地、系统地掌握化学基础知识和基本技能。”[5]。借鉴国际科学教育改革经验和对国内中学化学教学现状调研的基础上,体现国家基础教育课程改革纲要精神的《全日制义务教育化学课程标准(实验稿)》于 2001 年 7 月正式出版[6]。2018 年 1 月,《普通高中化学课程标准(2017 年版)》正式出版,明确提出以发展化学学科核心素养为宗旨,并对化学学科核心素养的内涵和要求进行了明确的说明。

而作为学术研究发展的重要力量硕博研究生,硕博毕业论文的主题代表了该行业的发展现状,本文选取“中学化学教学”—为研究对象,因考虑到目前该方面的综述文献主要从理论研究方面进行阐述,故本文采用数据挖掘的方法对 2020 年以前 CNKI 收录的该主题方面的硕博论文进行相关研究,为从另外一个角度了解该领域的研究现状提供参考。

本文的其他部分组织结构如下:第二部分,我们给出本文数据收集和研究的方法思路,第三部分给出本文对硕博论文发表时间、培养单位、基金资助、关键词、论文题目、师生关系等方面的具体分析内容,最后部分给出了相应的结论。

1 数据收集与研究方法

1.1 数据收集

本文采集自 2020 年以前 CNKI 中国知网收录的硕、博论文,以“中学化学教学”为主题词进行检索,共搜索硕博论文 1724 篇,再将检索得到的论文题目、作者、单位、发表年份、导师、关键词等关键信息用 Excel 形式导出,以便进行数据预处理和相关分析。

1.2 研究方法

区别于传统综述研究的视角来刻画该领域的研究现状,本文拟采用数据挖掘技术来进行以下处理分析,以便更加直观清晰的得到该领域的相关信息。

1.2.1 共词分析法

共词分析法是通过基于内容的分析技术,分析一对词同时出现在同一文献中次数,以此为联系进行分层聚类,形成共现矩阵,来揭示词与词之间的亲疏关系,进而表现它们所代表的主题和科目的结构变化。本文主要对检索文献中的论文题目,关键词,师生关系等进行了共现分析。

1.2.2 数据可视化

数据可视化方法是一种借助于图形化的方式,清晰有效地传达与沟通数据信息的方法。本文将通过对收集到的数据进行清洗后,利用折线图、热力图等方式对文献的数据信息等进行展现,起到一图胜万言的效果。

1.2.3 知识图谱

知识图谱是一种通过提取数据中的信息,对其分析相似性及测度的方法,利用可视化技术去挖掘、构建、分析、绘制以及描述知识及其载体之间相互联系。本文通过共词分析得到关键词、论文题目、师生关系的共现矩阵,然后使用知识图谱的方式对相互之间的关系进行了分析。

1.3 数据分析工具

采用如下工具来对 2.2 制定的研究方法加以实现。

1.3.1 Python 语言

本文使用的 Python 编辑器 Jupyter 网络分析平台对文献信息进行预处理,将关键词、单位作者等高频数据提取出来,并通过共现分析得到共现矩阵。另外也可以使用 Python 中Pyecharts 库进行数据可视化等操作。

1.3.2 ROSTCM 软件

推广4 已知双曲线过双曲线外任意一点D作双曲线的切线,若存在两条切线,设切点为P,Q,过点D作直线l与双曲线C交于不同的两点M,N,过点M作与DQ平行的直线与直线PQ,QN交于点A,B,则A为线段BM的中点.

ROSTCM 软件作为文本分析研究平台,具有强大的文本处理功能,可进行有效的分词处理,其中基于字符串匹配的分词功能可将文本中无意义词过滤,并将高频词提取形成共词矩阵。本文将检索到主题词的论文题目整合到 txt 文本中,利用 ROSTCM 功能性分析中的分词功能对论文标题进行分词,然后利用社会网络分析功能对分词后的数据生成论文题目共词矩阵。

1.3.3 Ucinet 软件

Ucinet 网络分析集成软件提供了大量的数据管理和转化工具,包括一维与二维数据分析工具 NetDraw 等。通过将文献中提取得到的共现矩阵导入 Ucinet 软件生成.h 文件,用 NetDraw 工具生成 Network 社交网络知识图谱,从而实现对存在关联关系的数据进行分析。

2 基于数据挖掘技术的中学化学教学研究现状分析

2.1 论文时间分布

硕博士论文的数量是评价某领域发展的关键指标,在一定程度上反映了该研究方向的研究水平和规律,描绘论文的数量分布曲线,为评估该领域所处的阶段,预测未来发展趋势和动态具有十分重要的意义。对检索到的“中学化学教学”主题词的硕博论文发表时间绘制折线图如图 1 所示。

图1 论文发布年份

由图1分析论文发表的情况可知,从 2000 年起“中学化学教学”方面的硕博论文开始出现并呈快速上升的趋势,在 2007 年到 2010 年的短暂下降之后,从 2010 年开始,论文数量再次出现增长,并在 2017 年达到峰值。2017 年以后该方面的硕博毕业生开始逐年减少。随着减少的趋势渐渐消失,预计在未来几年该主题的硕博论文将会仍然保持在较高水平。

2.2 培养单位情况

图2 “中学化学教学”top10培养单位

培养领域的硕博士数目在一定程度上代表了科研机构在该领域的研究实力,毕业生较多的单位在该领域通常具有较高的影响力。“中学化学教学”主题共涉及 86 家培养单位,排名前 10 的培养单位如图 2 和表 1 所示。

由图2可知,在“中学化学教学”方面培养硕博士最多的单位是华中师范大学和华东师范大学,分别发文 169 篇和 113 篇。在论文的数量上遥遥领先于国内其他高校,培养的“中学化学”领域人才众多,在该领域研究有丰硕的研究成果。

表 1 “中学化学教学”发文 top10 高校表

2.3 关键词共现分析

图3 “中学化学教学”关键词知识图谱

论文的关键词是整个文章的核心与凝练,是论文思想的高度概括和总结,高频出现的关键词则显示出研究领域的热点,因此对关键词的数量及它们之间的共现分析可以发现该主题研究的现状。首先利用Python该主题检索到的4027个关键词进行数据预处理,对其中出现次数排名前50的关键词提取之后生成共现矩阵,利用Ucinet软件和Pyechart画出该主题关键词知识图谱(如图3所示)以及近五年的关键词热力图(如图4所示)。其中知识图谱中连线粗细表示关键词之间联系的紧密程度,点的大小表示关键词出现的次数,热力图中的数字代表该词在该年份的数量排名。

图4 “中学化学教学”关键词热力图

在图3中,化学作为出现频次最高的关键词除了与教学,中学化学等相近关键词紧密联系以外,还与研究、策略、实践、化学实验等有密切联系,说明这些方面是该领域的主要研究方向。另外从图4关键词的热力变化显示,教学设计、高中化学、中学化学近几年占有较高位次。

2.4 论文题目共现分析

论文标题是一篇论文的核心部分,可以直观展现出本篇论文所研究的主要内容与方向,让读者可以迅速评定论文对自己是否产生帮助,因此对论文标题进行研究有十分重要的意义。

本文利用文本分析软件ROSTCM将提取后的论文题目进行分词处理,在过滤掉无意义的词后提取高频词形成共现矩阵,画出的知识图谱如图5所示,图谱中点的大小代表出现次数多少,线的粗细代表两个词之间的联系程度。

图5 “中学化学教学”标题分词知识图谱

从图5论文题目的分词知识图谱看出,该主题下的论文以基础性研究为主,同时结合实践,在创新性研究方面也有较多涉及。其中“研究”、“实验”,“实践”、“探究”,“创新”、“策略”,“现状”是常和主题结合的词汇。

2.5 师生关系知识图谱

导师是学生在研究过程中的关键指导,在该领域指导的毕业生数量在一定程度上体现了该导师在该领域的学术地位,通过分析导师与学生之间的关联性能刻画出在某领域有影响力的学者。利用python预处理检索到的数据,提取出主题词下指导学生较多的导师,通过共现分析法形成共现矩阵,然后利用Ucinet构建知识图谱(指导毕业学生分别大于等于15名)如图6所示,其中方块表示学生,圆点表示导师。圆点的大小表示了导师指导学生的数量多少。

在图6的高频导师知识图谱中,共有17位老师的学生数量大于等于15,在所有导师中,王后雄和毕华林两位老师的圆点最大,分别有48条和44条线段与之相连,表示两位老师在该领域较其他老师有较大影响力。此外郑长龙,马宏佳分别指导了38篇和33篇硕博论文发表,表示他们二人在该领域也做出过突出贡献。图中王萍,刘程程,何永红,王艳四人同时连接着两位导师,说明在论文创作过程中得到过不同导师的指导。

图6 “中学化学教学”高频导师

3 结语

本文基于数据挖掘技术对2020年以前CNKI收录的以“中学化学教学”为主题的硕博论文进行了数据分析,通过数据可视化、共现分析、知识图谱等方式对论文时间、单位、关键词、题目关键词、师生关系等方面进行研究,从不同角度刻画了该主题的研究现状和未来趋势。从分析中可以看出,“中学化学教学”呈现出阶段性发展的规律,随着国家对教育投入的不断加大以及化学研究的不断发展,该领域在未来仍具有良好的研究前景。华中师范大学和东北师范大学在该主题上具有较高水平。而王后雄和毕华林两位老师培养出该领域大批的优秀硕博毕业生,对中学化学教学的研究与发展做出了突出贡献。

猜你喜欢

中学化学分词图谱
分词在英语教学中的妙用
绘一张成长图谱
“四步”解答中学化学工艺流程题
结巴分词在词云中的应用
结巴分词在词云中的应用
基于微课的中学化学教学探讨
补肾强身片UPLC指纹图谱
主动对接你思维的知识图谱
例析中学化学中对硝酸强氧化性的
杂草图谱