基于决策树的智慧课堂教学策略设计

2019-11-25孙丽艳

西安邮电大学学报 2019年4期

周健, 马季, 高玲, 孙丽艳

(安徽财经大学管理科学与工程学院, 安徽蚌埠 233041)

智慧课堂教学是教学改革的一项重要研究内容[1-2]，智慧课堂教学能够更好地对教学过程和学习过程进行记录、监督和分析，进一步提高教学和学习效率。智慧课堂教学中，智能终端能够为知识提供多种多样的载体，如语音、图像、动画、影视，使得学生和教师可以采用异时、异步、异地的方式进行教学活动，拓展教学边界[3]。最重要的是智能终端可以时刻记录教学和学习数据，为学习和教学提供辅助决策分析[4]，从而为学习和教学分析提供有效的数据支撑。教学和学习过程中的辅助决策机制研究是智慧课堂建设的核心，教师可以利用智能终端高效地设计教学过程，如通过智能技术将教学过程分解成面向知识点结构的多个教学片段[5-6]，学生根据自身的属性选择组合多个知识点进行学习，实现利用智能终端定制个性化的学习过程。通过智能终端追踪教学和学习活动的细节，实现教学活动的定量分析要求。在智慧课堂中，教学和学习活动的实施更加随机化、精细化、个性化和智能化[7]。

在教学中，专业由课程组成，课程由章节组成，章节由知识点组成，因此每门课程由知识点组成。知识点的难易程度、规模、关联复杂度等直接影响学习效果。教学过程是通过判断知识点的学习程度来判断教与学的效果，对教学过程的分析也是对知识点学习的分析。由于过去的课堂教学过程无法记录和分析大量的知识点数据，因此对学习和教学状态的分析较为困难[8]。智能终端可以跟踪记录每个知识点，结合相应的智能分析算法，就能够分析知识点的教学和学习记录状态，建立教学和学习的辅助决策机制。对教学学习数据进行智能分析，建立辅助教学学习过程的决策机制，不仅可以降低教师的教学劳动强度，更加关注知识点的传授过程而非组织过程，而且能够通过有效分析学生的学习状态，提高学习的精细度。在一定阶段内的教学和学习过程中，数据规模的大小决定决策策略的准确度。

本文拟建立一种基于决策树的智慧课堂教学策略。通过知识点属性对学习和教学记录进行结构化，建立以字段名为知识点属性的决策头，以字段名为教学手段的规则尾；基于信息熵的方法构建知识点决策树，通过决策树发现知识点和教学方法之间的潜在关联关系，给出该关系的置信度；通过学生的学习和教师的教学轨迹，推荐相应的学习策略和教学策略，供学生和教师进行选择。

1 基于知识点的教学过程

教师根据知识点进行片段教学，每个片段教学针对一个知识点或者几个知识点，或者横向，或者纵向，如单个知识点的讲解、多并行知识点的讲解、多串行知识点的讲解、系统性知识点的讲解、跨学科知识点的讲解、跳跃式知识点讲解、延展性知识点讲解，这样针对某个知识点通过在多种语境环境中多个角度对其进行讲解，学生根据自身的条件和外部环境选择一种或多种学习方式。例如，根据学习的程度，教学手段可以分为知识了解型、知识掌握型、分析应用型、系统应用型、构造创新型，如针对一般性的学习提供知识了解型和知识掌握型的教学，而对有了一定学习基础的学生提供分析应用型和系统应用型的教学，对更高层次的学生提供构造创新型教学，从而达到分类教学，因人施教，个性化的学习。

1.1 知识点的交互过程

在学习过程中，学生对知识点从陌生到掌握，乃至应用，存在一个明显的学习轨迹，如知识点的调用频率、资料搜索、作业水平、问答记录、考试测试等等，学习轨迹的记录保证学习状态的可分析性。教学过程与学习过程类似，教学过程通过学生知识点掌握的状态不断调整教学状态。因此在教师和学生之间传递的核心是知识点。知识点在学生、教师、智慧课堂软件、决策库和知识点库之间的数据流动情况，如图1所示。

图1 面向知识点的智慧课堂实体交互过程

图1中，在学生的学习和教师的教学过程中，需要调用知识点库的课程知识点，通过教学记录和学习记录保存知识点学习状态，并将知识点的记录提交给决策库进行决策分析，产生优化教学方案和优化学习方案，反馈给学生和教师的下一次学习和教学活动。该过程是一个循环的迭代和交互过程，可记录、可分析、可结构化。在使用智慧课堂软件过程中，学生和教师自主反馈学习、教学状态或者后台捕获学习、教学状态，系统对捕获的状态进行结构化，形成多维度的数据存储记录，决策分析过程使用关联数据模型、聚类模型和分类模型对教学和学习中的知识点记录进行分析。

1.2 基于知识点的决策库

基于知识点的决策库是智慧课堂的核心，在教学过程和学习过程中，数据流程主要功能是记录知识点的状态变化，基于知识点决策库的结构如图2所示。

图2 基于知识点决策库的结构

图2中，教师和学生组成了外部实体，也是智慧课堂的使用者。教师和学生在教学和学习活动中产生的状态数据，被保存在教学记录库和学习记录库中。教师对课程的知识进行编辑，形成知识点库D，建立知识点的属性集合A={a1,a2,…,an}(n为知识点属性规模)和教学手段集合T={T1,T2,…,Tm}(m为教学手段规模)。教师通过教学模块调用知识点库和教学手段库组织教学，其过程被系统记录保存在教学记录库中，学生同样调用知识点库和教学手段库进行学习，系统将学习过程的状态数据进行保存形成学习记录库。决策模块调用学习记录库和教学记录库进行分析，在知识点和教学方法之间建立关联规则，并将可信的关联规则保存在教学规则库和学习规则库中，教学组织模块和学习组织模块，通过调用教学规则库和学习规则库中规则，为教师和学生提供教学和学习活动的建议，教师通过教学反馈模块进行教学组织，学生通过学习反馈模块对学习进行组织。通过智慧课堂系统，系统根据教学和学习记录对教学方法和教学内容进行合理组织，克服传统教学中教师根据教学经验进行选择教学方法和组织教学内容的缺陷。

决策分析过程是智能课堂的重要组成部分[9-10]，依赖知识点、学习状态、教学设计内容对教学和学习活动进行决策分析。决策分析过程依赖长期的数据统计过程，每次教学或学习的决策，依赖对过去统计数据的学习，因此数据规模决定了决策分析结果的精确性、可行性和可信性。决策分析过程是动态的，随着外部环境的变化和数据量的不断积累，因此教学和学习的决策结果一直是变化的。

决策分析的方法有很多，如神经网络、机器学习等等。选择决策树作为规则建立方法，具有以下几个优点：满足智慧课堂的智能终端的较低硬件水平需求；适合监督学习，即规则的规则头和规则尾都是确定字段，本文指定教学方法为规则尾，知识点为规则头；较快地执行效率，决策树的构造方法简单，具有较高的执行效率。

2 教学策略选择

构造决策树是智慧课堂决策分析的重要内容，下面通过例子描述教学策略的选择过程，该例子在已有的经验知识基础上，统计知识点群和对应的教学手段实施方法，统计了14条关于学习的记录，形成一个样本集合L，L为二维结构数据表，包括4个属性字段，其中3个知识点字段和1个教学手段字段，每个知识点具有不同的属性集合，如知识点K1分为3个等级表示为{A1,A2,A3}，这里的等级表示难度、范围和关联程度，可以根据具体的问题指定。知识点K2分为两个等级{B1,B2}，知识点K3分为两个等级{C1,C2}，教学手段T分为两种形式分别为{T1,T2}，这里的形式可以是教学方法、教学手段，如理论和实验、考试和考察等等，可以根据具体的目标进行指定。知识点与教学手段记录示例如表1所示。

表1 知识点与教学手段记录示例

如果属性字段规模为n，令Ki(i∈{1,2,…,n})为其中的某个属性字段，i为字段属性的标号，则字段Ki的信息熵值[11]为

其中，n为字段规模，pi为第i个属性值出现的概率，且各属性字段独立。

分析表1中各个字段的信息增益，决定构造决策树的字段选择。设|T|为T的规模，|T2|为T2的规模，|T1|为T1的规模，则字段T的信息熵值为

表1中，字段T有14个记录，则T的规模|T|为14，T2的规模|T2|为9，T1的规模|T1|为5，根据上面公式计算训练样本中教学手段字段T的信息熵值为0.940 3。

设|K1|为字段K1的规模，|A1|、|A2|和|A3|分别为属性值为A1、A2、A3的规模，则知识点K1收益为

表1中，字段K1的规模|K1|为14，其中属性值为A1、A2、A3的规模|A1|、|A2|和|A3|分别为4、6、4，根据上式，则知识点K1收益E(K1)为0.911。

知识点K1增益为

G(K1)=I(T)-E(K1)。

根据表1，E(K1)为0.911，I(T)为0.940 3，则G(K1)为0.029 2。

设字段K2中，|K2|为K2的规模，|B1|、|B2|为属性值为B1、B2的规模，根据如下公式，则知识点K2收益为

表1中，字段K2的规模|K2|为14，其中，属性值为B1、B2的规模|B1|、|B2|为7，根据上式，则知识点K2收益E(K2)为0.237 8。知识点K2增益为

G(K2)=I(T)-E(K2)。

根据表1，E(K2)为0.237 8，I(T)为0.940 3，则知识点K2增益为0.702 5。

设字段K3中，|K3|为K3规模，|C1|、|C2|为属性值为C1、C2的规模，则知识点K3收益为

根据表1中字段K3的规模为14，其中属性值为C1、C2的规模|C1|、|C2|为6，8，根据上式，则知识点K3收益为0.892 1。

则知识点K3增益为

G(K3)=I(T)-E(K3)。

根据表1，E(K3)为0.982 1，I(T)为0.940 3，则知识点K3增益为0.048 2。

知识点K1,K2,K3之间的信息增益大小比较结果为

G(K2)>G(K1)>G(K3)。

可见，知识点K2的信息增益大于知识点K1的信息增益，知识点K1的信息增益大于知识点K3的信息增益，因此决策树构建中以知识点2为树根进行构造。

3 教学学习实践

3.1 规则构建

在获得上述知识点的分析后，画出知识点教学的决策树如图3所示。依据该决策树建立关联规则[12]，在图3中决策树的圆形节点为属性节点，对应表1中样本集合L中知识点K1、K2和K3，其子节点(长方形节点)为属性节点的对应属性值节点，它们属性值的范围决定了属性节点的孩子数量，如知识点1节点下有3个孩子节点，叶子节点为教学方法节点。

图3 基于知识点的教学方法决策树

根据决策树从根节点到叶子节点的路径构造一条规则，叶子节点为规则尾，T(属性值)，路径中的非叶子节点为规则头K1(属性值)∧K2(属性值)∧K3(属性值)，并给出该条规则的置信度λ，置信度是指在条件K1、K2和K3下出现T的概率。

在一个知识点规模为3的规则中，其公式为

K1(属性值)∧K2(属性值)∧K3(属性值)⟹T(属性值),λ

置信度的值为

其中，Pr(k1∪k1∪k3∪T)为属性K1、K2、K3和T的概率值，Pr(k1∪k1∪k3)为属性K1、K2和K3的概率值。

学生和教师依据决策树可以得到多条规则，根据规则选择教学方法。如B1程度的知识点2和A1程度的知识点1实施T教学方法的规则为，根据表1的记录，其中字段K1和K2属性值为A1和B1的记录有3条，而字段K1K2和T属性值为A1、B1和T1的记录有2条，它们的比值为66.7%，即为λ的值。

K1(A1)∧K2(B1)⟹T(T1),λ=66.7%。

B2程度的知识点2、A3程度的知识点1和C1程度的知识点3实施T2教学方法，根据表1的记录，其中字段K1、K2和K3属性值为A3、B2和C1的记录有2条，而字段K1、K2、K3和T属性值A3、B2、C1和T2的记录有2条，它们的比值为100%，即为λ的值。

K1(A3)∧K2(B2)∧K3(C1)⟹T(T2),λ=100%。

由于数据表中的记录只有14条，在B2程度的知识点2、A2程度的知识点1和C2程度的知识点3实施T2或T，这一决策过程需要进一步的数据分析。随着学习和教学记录的增加，决策树的记录规模逐渐增加，决策判断更为精确。

在真实的教学数据中，知识点1分为3个等级{A1,A2,A3}表示学习的程度了解、熟悉和掌握，知识点2分为两个等级{B1,B2}表示知识点的测试通过状态非通过状态和通过状态，知识点3分为两个等级{C1,C2}学习的两种方式理论和实践。教学方法{T1,T2}分别为两种不同的试卷，根据学生的日常学习记录分析得到，如果一个学生对知识点1、知识点2和知识点3的掌握程度分别为A1、B2、C2，则该智慧课堂系统在测试中选择T试卷进行测试，置信度为100%；如果一个学生对知识点1、知识点2和知识点3的掌握程度分别为A3、B2、C1，则该智慧课堂系统在测试中选择T2试卷进行测试，置信度为100%。

3.2 实例验证

以数据结构课程为例，智慧课堂软件如何从试题库中为不同的学生抽取合适的测试题目，依据学生的学习状态选择合理的测试题目。设定教学方法为考核方式T，考核方式包括两种T1和T2，T1对应为填空、选择题型，T2对应为程序设计题，T2的考核难度要高于T1，随着学生学习的逐步深入，测试的方式应该由简易测试进入综合性的测试。

以数据结构课程中树结构一章为例，设知识点1为树结构基础，学习程度包括了解、掌握和设计，知识点2为二叉排序树，学习程度包括了解、掌握和设计，知识点3是霍夫曼树，学习程度包括了解、掌握和设计。

根据决策树DT，由此可以得到学习规则：树结构基础(了解)∧二叉排序树(了解)⟹填空题，λ=66.7%。

针对学生的学习状况，在了解树结构基础和二叉排序树的状态下，系统给出填空题测试。树结构基础(熟悉)∧二叉排序树(设计)∧霍夫曼树(了解)⟹程序设计题。此时学生的学习过程已经学习到该章节的最后一节，系统可以选择程序设计题测试学习程度。学生也可以通过知识点调取对应的测试题，提高了学习效率和针对性。

在数据分析的基础上，基于知识点的教学和学习状态，为教学活动和学习活动提供辅助决策是可行的，知识点是教学和学习活动中数据流动的核心。构造样本数据集合是进行决策分析的基础，采用决策树的方法，能够分析出知识点和教学方法之间建立潜在的关联关系，教师和学生可以根据置信度对规则进行评估，有效地定量分析教学和学习效果。

样本集合L数据量规模和结构决定决策树构造的规模、准确性和规则形式，因此智慧课堂的决策过程是建立在大量数据分析的基础之上的。数据量越多隐含的规则和知识就越多，构造的决策树规模也越复杂。在规模较大的样本中，错误数据和噪声数据更容易被检测，因为它们在样本集合中所占比例较小，持续动态的扩大样本规模有利于决策树构造的正确性。关联关系的构造结构与决策树的广度和深度具有相关性。决策树的广度越大，得到的关联规则数量就越多，如图3所示，可以得到的关联规则数量为6，从根节点到所有叶子节点的路径总数。决策树的深度越大，得到的关联规则的复杂程度就越高，具有较大的规则头，如图3所示，最左边的分支对应规则的规则头有3个组成部分，同时样本集L中的字段规模决定了规则头的最大规模，表1中3个字段K1,K2,K3作为规则头的备选字段，因此决策树中构造的最大规则头规模为3，字段T作为规则尾，因此决策树种构造的规则尾的规模为1。