基于数据挖掘的肿瘤学课程计算机辅助教学系统设计
2022-05-11谢蕊
谢蕊
(哈尔滨医科大学附属肿瘤医院, 黑龙江, 哈尔滨 150081)
0 引言
传统课堂教学与计算机辅助教学技术相结合,师生互动性较差,学生的学习主动性受限,学习内容缺少针对性与个性化[1]。因此,有必要设计一种个性化的计算机辅助教学系统。当前,有学者[2]提出基于.net平台构建交互式计算机辅助教学系统,由用户界面层、业务选择层和数据管理层3层结构体系构成硬件结构,利用交互性的在线教学实现计算机辅助教学系统的设计。还有学者[3]提出利用深度学习构建智能教学系统,进行成绩预测和在线学习行为规律分析,据此得到学生学习行为特征提取,完成教师的辅助教学。但现有的计算机辅助教学系统个性化与智能化性能有所欠缺,且未对特定课程教学进行分类拓展,导致针对性不强。
我国肿瘤学课程涉及知识面较广,对专业人才队伍建设与学科发展形成制约。因此,本文面向肿瘤学课程,构建出一种基于数据挖掘的计算机辅助教学系统。通过挖掘学生学习能力与聚类学生学习特征,实现教学模式个性化服务,通过因材施教来优化学习方法,提升学习效率。
1 基于数据挖掘的肿瘤学课程计算机辅助教学系统
1.1 计算机辅助教学系统数据挖掘效用
1.1.1 学生学习能力挖掘
利用由输入层、输出层、隐藏层组成的BP(Back Propagation,反向传播)神经网络[4],具体架构如图1所示。本文用它来挖掘学生学习水平与认知能力,获取其知识点掌握度。其中,BP神经网络的输入层、输出层结点与资源学习程度、知识点理解程度一一对应,隐藏层间为全互联连接形式。
图1 BP神经网络框架图
利用布鲁姆目标分类策略,划分学生认知能力分为6个等级,设定输入项X={X1,X2,…,Xn}为认知能力的评估值、作业情况、测试结果以及学习效率等多个变量,输出项Y={Y1,Y2,Y3}是关于概念、技能、应用的学生掌握度。假设变量个数是n,则任意知识点理解程度从n维到三维空间的非线性映射量化表达式为
(1)
式中,认知能力6个等级的评估值为X1~X6,作业情况、考试情况等信息为X7~Xn。
肿瘤学课程学生的学习导航流程如图2所示。以学生知识点掌握程度与学习目标为基础,展开学习导航,将合适的学习资源与建议针对性地推荐给学生。
图2 学习导航流程图
1.1.2 学生学习特征分类
根据学生知识点掌握情况,利用k-means算法[5-6]聚类分析学生特征,将各类别学生标记作为因材施教参考依据。假设输入项为数据集合Li,所含对象个数是l,输出项为聚类中心Zj与对应聚类数据集合Cj,聚类个数是K,则学生学习特征分类算法流程描述如下。
(1)聚类中心Zj初始化。
(2)利用式(2)求解数据与中心之间的距离:
D(Li,Zj)=|Li-Zj|
(2)
其中,i=1,2,…,l,j=1,2,…,k。
(3)当间距D(Li,Zj)满足下列等式时,有Li∈Cj,进行类别划分:
D(Li,Zj)=min{D(Li,Zj)}
(3)
(4)若l=1,则有下列表达式:
(4)
当下列等式成立时,需重置聚类中心,并返回第一步进行重新分类:
(5)
1.2 计算机辅助教学系统框架
计算机辅助教学系统主要由教学界面模块、教学子系统、教学规则库与学生信息库、教学资源库架构而成,具体架构如图3所示。系统整体框架中的关键模块是教学子系统,组成模块分别为用户数据的预处理与采集[7-9]、数据分析、信息调度。
图3 肿瘤学课程计算机辅助教学系统整体框架图
1.3 计算机辅助教学系统功能
按照用户权限可将系统功能角色分成管理员、教师、学生。建立肿瘤学课程计算机辅助教学系统功能结构,设定管理员角色职责为维护、管理系统信息、用户信息以及用户权限;教师在管理教学资源的同时,还需通过挖掘学生信息,分析、评估对应学生的学习行为,并对教学策略作出合理调整;而学生只能在学习界面中执行对应指令。具体的结构如图4所示。
1.4 计算机辅助教学系统数据库
数据库对系统快速、便捷、精准地调用、管理所需数据具有决定性作用,同时也是评价系统运行质量的一个关键指标。采用DBMS(Database Management System,数据库管理系统)体系结构[10],有效结合应用程序与DBMS,保证数据库数据录入准确。系统通过Access[11]建立一个星状数据仓库,结构如图5所示。该数据库的事实表内容主要包括学生信息维表主键、教师信息维表主键、课程信息维表主键、练习与考试数据。
图5 数据库示意图
2 计算机辅助教学系统实际案例分析
2.1 实验环境
采用如下运行环境搭建系统内部网络平台:apache 1.3.43 Web服务器软件;MySQL 3.16.52数据库服务器;Windows XP操作系统;4 GB内存;3.2 GHz CPU;Java development tools开发工具。
2.2 学生学习特征聚类性能
选取10名学生知识掌握情况,整理、统计其分析数据,具体信息如表1所示。
表1 学生知识掌握具体信息
以表1数据为分类依据,按照优、一般、欠佳3个等级,获取学生聚类结果,如表2所示。由此可以看出,本文系统根据用户数据采集模块采集得到的各知识点掌握情况,利用数据分析模块、BP神经网络算法以及k-means聚类算法,准确划分了学生学习特征与学生等级,为后续教学策略调整与教学内容推荐奠定了良好的数据基础。
表2 学生学习特征聚类结果
2.3 动态信息检测
动态测试是通过执行程序测试计算机错误,一般采用黑白盒测试方法。黑盒测试的是系统功能,当发现程序错误后,利用白盒测试法挖掘错误根源并进行修正。从某大学参与肿瘤学课程学习的学生中任选50名,展开教学系统测试实验,系统主要模块的测试结果如下,其中,登录模块检测结果如表3所示,在线考试模块检测结果如表4所示,课程资源提交模块检测结果如表5所示。根据各模块检测结果可以看出,本文系统均呈现出理想的检测结果,具有较好的有效性与可行性以及体现了较好的个性化功能。
表3 登录模块检测结果
表4 在线考试模块检测结果
表5 课程资源提交模块检测结果
2.4 不同用户并发数对系统吞吐量影响
分别选取50、100、150、200个用户并发数,探索不同用户并发数与系统吞吐量之间的关系,具体结果如图6所示。通过图6所示的系统吞吐量曲线图可以看出,系统吞吐量随着用户并发数的增加而上升,但当并发数达到一定数量后,吞吐量不增反降。这是因为本文系统通过Access建立了一个星状数据仓库,所以需对用户并发数设定界限,以获取系统的最佳吞吐量。
图6 吞吐量曲线图
2.5 系统响应时长检测
系统响应时长检测结果如图7所示。由此可以看出,本文系统由于用户数据预处理模块,清理、集成、归约了用户初始数据,去除了噪声与不相关数据,通过数据合并与离散化,减少了挖掘时长,提升了数据质量,所以,响应时长用时较短,波动较小,具有良好的时效性与稳定性。
图7 响应时长柱形图
3 总结
本文利用数据挖掘技术构建肿瘤学科课程的辅助教学系统,通过挖掘学生的学习能力和学习行为特征,个性化地推荐学习资源,有针对性地辅助教师教学。但本文研究未考虑学生学习的隐私安全问题,在未来的研究中,考虑设计数据传输加密模块,确保学生得到理想教学体验的同时,隐私也被很好地保护,进一步完善教学系统功能。