层次聚类算法在实现高职教学推荐系统中的应用
2021-01-13蒋海锋
蒋海锋
摘要当前我国的职业教育正面临大改革,国家把职业教育提升到与本科同等重要的地位,同时职业教育也将进行大幅度的扩招,不仅面向中职、高中生,还面向各类社会人员,在师资力量有限、知识技能更新迅速的职业教育现状下,要实现高质量的人才培养,需要借助机器学习算法来辅助教师开展教学,通过设计符合机器学习算法的题目,可以有效的减少教师出题的负担,实现分层的个性化教学效果。本文研究层次聚类算法在学生动态分组及推荐中的应用,以辅助教师实施补救性教学,并有效缓解学生学习需要及教师精力有限的矛盾。
关键词 层次聚类算法 推荐系统 辅助教学
中图分类号:G712文献标识码:ADOI:10.16400/j.cnki.kjdk.2021.29.012
Application of Hierarchical Clustering Algorithm in Realizing Higher Vocational Teaching Recommendation System
JIANG Haifeng
(Guangdong Polytechnic of Science and Technology, Zhuhai, Guangdong, 519090)
AbstractAt present, China’s vocational education is facing major reforms. The country has promoted vocational education to the same important status as undergraduates. At the same time, vocational education will also undergo a substantialexpansion,notonly forsecondaryvocational and highschoolstudents,butalsoforallkinds ofsocialperson. Under the current situation of vocational education with limited teachers and rapid updating of knowledge and skills, to achieve high-quality talent training, machine-learning algorithms need to be used to assist teachers in teaching. By designing topics that conform to machine learning algorithms, teachers can effectively reduce the number of questions and achieve hierarchical personalized teaching effects. This paper studies the application of hierarchical clustering algorithmin students’dynamicgroupingandrecommendation toassistteachers in implementingremedialteaching,and effectively alleviate the contradiction between students’ needs and teachers’ limited energy.
Keywordshierarchical clustering algorithm; recommended system; assisted teaching
引言
2019年,國家推出《国家职业教育改革实施方案》,为未来职业指明了方向,提升了职业教育的地位。未来职业教育将覆盖更广的人群,包括农村务工人员、退伍军人、下岗工人、返乡农民工等,对于基础知识和认知能力均有较大差异的学生,教师的课题教学将面临更大的挑战。大数据和人工智能的发展,为个性化培养学生提供了技术支持。智能推荐系统,可以动态跟踪学生的学习情况,为每个学生智能推送练习题,实现以学生为中心的教学活动。本论文研究一种基于层次聚类算法的智能推荐系统的实现方法,可快速进行学生多层次的分类,为不同分类的学生推荐不同的练习题,实现动态分类和分组互助学习,有利于提升职业教育的效率和效果。本文将以H5课程教学为例,研究层次聚类的实现方法和效果。
1层次聚类算法的原理
聚类算法是一种无监督的机器学习算法,可根据特征进行自动分类,聚类算法分类中常用的有基于划分的聚类、基于密度聚类,基于层次聚类等。对于具体应用,聚类算法的选择取决于数据的类型、聚类的目的。而每一类聚类算法也有多种算法,例如:划分方法中的k-means聚类算法、层次方法中的凝聚型层次聚类算法、基于模型方法中的神经网络聚类算法等。
本文研究并应用层次聚类算法来对学生进行动态分组。层次聚类算法的核心思想是通过对数据集按照层次,把数据划分到不同层的族,从而形成一个树形的聚类结构。层次聚类算法可以揭示数据的分层结构,在树形结构上不同层次进行划分,可以得到不同粒度的聚类结果。
假设有A、B、C、D、E、F、G共7个学生,通过测试进行层次聚类,一个模拟的结果图1:
根据不同的层次粒度,可以划分不同的聚类结果,例如(AF)、(BC)、(DE)、G,如果在实际应用中,太细的粒度不适合,可以进行更高层次的划分,例如:(AFBC)、(DEG)。
2算法的应用流程
教学是“评估-教育-再评估”的循环过程,应用算法的基本要求是精心设计测试题目,对学生完成情况自定分析结果,发现学生的弱点,提出学习能力的建议。然后,改善自己的弱点之后,进行另一个递进的测试,重新完成分析和推荐过程。
图2展示了一个通用的教学推荐系统架构。
应用框架的主要过程说明:
教师根据算法要求,编制一定数量的分类测试题目,形成测试库;学生完成测试库,收集学生对各个知识点的掌握程度的数据;应用机器学习算法,进行学生的层次聚类,每个类别包含共享相似犯错特征的学生;根据聚类结果,为不同层次的学生推荐不同的学习内容,为教师提供决策指导。
以上基本应用流程由应用系统自动循环,直至学生对知识点的掌握程度达到一个预设的阈值。其意义在于分层、分组实施,采用较少量的学习内容实现更高效的全育人。
3算法的应用示例
分层的核心是研究每个学生对各个知识点的掌握程度,因此算法的首要任务是收集学生对知识点的掌握情况,教师首先需要归纳罗列待检测的n个知识点,编制一定数量的题目,每个题目对应考查若干个知识点,构成题目与知识点的关系对应表。
教师根据对应关系统计表设计一定数量的题目,每个知识点覆盖的总数应该满足一个最小值,以降低算法误判的概率。
系统收集学生的测试结果,测试的结果统计每个学生应用各个知识点的错误次数,形成一个学生与知识点错误数量统计二维矩阵表。(表2)
本示例中,给出的测试包含18个知识点共70道题目。试验对象包含不同生源的学生共50人,包括统招生、退伍军人、社招人员等。在这50名学生中,有25名是实验组,其余25名是对照组。实验组按照系统提供的推荐计划进行补救性自学,对照组则以正常方式进行教学。
对第一轮的测试结果进行从下而上的层次聚类,得到聚类结果并进行模型可视化(模型化采用Ward策略,即让所有类簇中的方差最小化),得到聚类图见图3。
从聚类图中,教师可以根据实在教学需要,在不同的层级进行学生分组,同一个组的学生具有相似的犯错特征,通过对分组进行补救性辅导,可有效提升教学效率和效果。
经过十几轮补救性教学,同样对这批学生进行一次测试,测试结果表明,实验组的学生平均成绩有20%的提升,而对照组的平均成绩波动不大。
测试结果表明,遵循系统的补救性教学推荐计划,可以有效提升学生的学习效果,系统的应用不仅能发现学生的问题和弱点,还能提供补救性建议,为学生规划更高效的补习策略。
4总结
基于层次聚类的分类算法,可以快速地基于知识点的掌握情况进行学生分类,从而实现动态分类与推荐,有助于缓解学生水平参差不齐、职业教学内容更新迭代快与教师精力有限等矛盾。高职教育中,分组学习是很有效的一种课堂教学方法,层次聚集的结果与该方法吻合,实现了动态分组学习,有利于快速提升学生的整体水平。但是基于多输入特征、更细粒度的个性化学习及基于时序的动态跟踪,需要我们进一步融合多种机器学习算法,共同构建多应用目标的智能推荐系统,进一步发挥大数据和机器学习算法在智能辅助教学方面的优势。
基金项目:广东科学技术职业学院校级科研项目“SOM聚类算法在智能教学系统中的研究与应用实施”(项目编号:XJJS202106);广东科学技术职业学院校级教改项目“媒体融合视域下高职网络新聞与传播专业人才培养模式的研究与实践”(项目编号:JG202102)
参考文献
[1]席运江,杜蝶蝶,廖晓,等.基于超网络的企业微博用户聚类研究及特征分析[J].数据分析与知识发现,2020(08).
[2]张海涛,唐诗曼,魏明珠,等.多维度属性加权分析的微博用户聚类研究[J].图书情报工作,2018(24).
[3]陈娟,吴卓青,邓胜利.基于层次聚类法的“知乎”用户细分与行为分析[J].情报理论与实践,2018(07).
[4]张琳,谢忠红.基于聚类的微博用户类型与影响力研究[J].情报科学,2016(08).
[5]楚志凯.智能推荐系统在网络学习空间中的应用[J].福建电脑, 2020,36(07):120-121.