APP下载

浅析深度多实例学习算法在学生学习结果预测的应用

2020-10-21侯勇

科学与信息化 2020年4期
关键词:预测

侯勇

摘 要 多实例学习作为一种典型的弱监督学习方法,在计算机视觉、生物识别、自然语言处理等许多应用中是有效的。本文提出了一种深度多实例学习算法,将神经网络与多实例算法集成。最后将所提出算法应用于学生学习结果预测,取得了良好的效果。

关键词 多实例学习;学习结果;预测;MIL 池

1深度多实例学习算法

在诸多机器学习问题中,如图像分类,并假设图像被清楚地表示类别(类)。但在许多实际应用中,会有多个实例,并且仅给出该类别的一般说明,这就是多实例学习(MIL)或基于弱注释数据的监督学习。计算病理学、乳房X光检查或CT肺筛查等医学成像中,通常单个标签(良性/恶性)或感兴趣的区域(ROI)描述图像,因此使用弱注释图像数据极为普遍。

MIL算法训练包实例,生成能够预测包类别标签的模型,实现包标签的预测。在医疗诊断中,广泛应用MIL算法,通过发现关键实例,决定包标签。在医学领域中,人们提出了各种不同的方法,实现包分类,如包相似性分类法,嵌入层低维表示分类法,集成实例级分类器响应法等[1]。

本文中,我们提出了一种深度多实例学习算法-DMIL。DMIL分为Fc1-512 + ReLU,Fc2-256 + ReLU,Fc3-128 + ReLU,Fc4-64 + ReLU,dropout (rate=0.38)(fc3),MIL-max pooling ,fc5-1 + sigm,一共6層,如表1所示。将该算法应用于学生学习结果的预测,取得了良好的效果。

所提出的DMIL 可表述为:

(1)

其中,在包Xi中,多个实例通过DMIL传递。DMIL由L层组成,每个图层都由非线性变换组成,其中索引图层。可以是内积(或完全连接)或修正的线性单位 (ReLU) [22]等操作的复合体。我们将实例的第层的输出表示为。在第(L-2)层中的实例特征,表示为,实例概率是[0;1]范围内的标量,表示为。在最后一层中,有一个MIL池层,该层将实例概率作为输入和输出包概率,表示为。

2学生学习结果预测

预学生学习结果在任何高等教育计划中都起着至关重要的作用。学生学习结果可以使用可测量和不可测量的属性进行预测。所用的数据集如下表2所示。

表2描述了本工作中使用的数据。其中No_as_t:学生书写作业数量;No_st_a:布置作业的学生数;No_as:学生作业数;No_qz:测验数量;No_qzt:解决测验所需的时间;Lab:实验次数;No_t1:参加考试1的学生人数;No_t2:参加考试2的学生人数;score1:学生在考试1中得分;score2:学生在考试2中得分;TS_t:考试1和考试2的总分数;TS_a:作业总得分;TS_q:测验总得分;TS_lab:实验总得分;TotalE:除去实验总得数;TotalA:上述分数总和;结果:通过/未通过。

学生学号就是包的id号,其他属性被视为实例,结果属性是目标值。在预处理阶段将删除所有缺失的值,以便数据集已准备好实现。各种MIL算法比较结果如表2所示。

3结束语

在本文中,提出了一种深度多实例学习算法-,该算法重点是对实例级标签的估计 。将所提出的算法应用于学生学习结果的预测过程中,取得了卓越的效果。今后,将开发更有效的 MIL 池,并研究如何在数据有限的 MIL 中,训练更深入、更广泛的深度多实例学习算法。

参考文献

[1] Xiao Y,Liu B,Hao Z. A Sphere-Description-Based Approach for Multiple-Instance Learning[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2017,39(2):242-257.

猜你喜欢

预测
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(A卷)答案与提示
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
2017年高考选修考点预测
2017年高考三角热点考向预测
电力系统短期负荷预测方法与预测精度
《福彩3D中奖公式》:提前一月预测号码的惊人技巧!
预测高考