基于视频关键帧分析的课堂教学效果研究
2018-09-25孙元陈立军吴庆妍
孙元 陈立军 吴庆妍
摘要:目前针对课堂教学效果的研究很多,大多依据源于问卷调查之类的主观数据,但是将主观数据作为依据得到的结果是否准确有待商榷。本文针对学生上课期间的姿态、表情等视频信息进行提取的关键帧进行分析,客观地直接获得学生上课期间的学习状态信息,以该表现为依据,针对教师整个授课期间或者部分授课时间或者某一个知识点的学生表现提醒教师继续沿用或者改进授课方式、方法,从而达到更好的授课效果。
关键词:课堂教学;视频;关键帧
中图分类号:G642.0 文献标志码:A 文章编号:1674-9324(2018)38-0184-02
目前针对课堂教学效果的研究很多,比如:冯利英等教师发表的“高校教师课堂教学效果评价研究综述”建立了科学系统、操作性强的评价指标体系[1];刘坚等教师发表的“基于多元统计分析的高校课堂教学质量评价研究”针对高校课堂教学质量评价进行了主成分分析及聚类分析。聚类分析对各个教师进行了有效分类,使得评价结果更加科学[2];吴国誉等教师发表的“以学生为本的高校课堂教学评价指标体系研究”从学术性、互动性、成长性、差异性、导向性和可测性等多方面构建“以学生为本”的教学评价指标体系[3]。
以上研究大多依据于问卷调查之类的主观数据得来,虽然分析的方法很多,但是将主观数据作为依据得到的结果是否准确有待商榷。目前需要有更为客观的学生课堂数据作为依据,在此基础上再进行的各种方法分析才具有更为客观的意义。本论文就是客观地针对如何提取授课过程中学生学习状态来进行的,进而依据学生听课状态分析教学效果,从而进一步延续或者改进教学方式、方法。
本论文中所使用的视频关键帧处理方法主要利用深度学习来实现,深度学习使用了分层抽象的思想,高层的概念通过低层的概念学习得到。这一分层结构通常使用逐层训练算法构建而成,并从中选取有助于机器学习的有效特征,很多深度学习算法都是以无监督学习的形式出现的,因此这些算法能被应用于其他算法无法企及的无标签数据,这一类数据比有标签的数据更为丰富,也更容易获得,这一点成为深度学习的重要优势。下面就本论文实施过程进行重点论述。
一、标准学生上课状态入库
基于大数据思维,采集学生上课过程中状态视频信息,提取出其中标准的学生上课状态:学生姿态以及面目表情。其中学生姿态包含:认真听讲、举手、低头、看手机、睡觉、长时间写字不抬头、同学两两之间侧头交头接耳等;如果采集的数据足够清晰,可以采集听课过程中的学生面目表情进行各种听课状态的分析。学生面目表情包含:睁眼、皱眉、闭眼、用手支撑头部并眼部斜视、同学两两之间侧头交头接耳等。
利用视频关键帧的颜色、纹理、形状等多维度特征将这些学生上课期间的标准状态信息录入数据库。
1.基于视频提取关键帧。由于整个上课过程都是基于一个镜头进行的,所以不需要镜头切换的算法。首先把视频的第一个关键帧作为基本关键帧,确定学生所在位置,提取相关状态,将各个学生的状态和标准库中的学生状态进行比较,分析确定刚刚上课时学生的基本状态,如果听课比例较低,则说明需要调动积极性,或者说明学生上堂课精力消耗过多。为了避免整个上课过程中提取关键帧缺失的问题,利用渐变提取关键帧的方式。渐变提取关键帧的方法就是在提取一个关键帧之后一段时间内播放的视频中和最近一个提取的关键帧的多维度特征计算的差值没有达到给定的阈值,那么就按照时间间隔经验值在视频中提取一个关键帧,比如:间隔5秒或者10秒等提取一个渐变关键帧。针对于切变的关键帧提取方法:当前一个关键帧与后一关键帧多维度特征比较结果高于给定的阈值时,需要提取这一变化较大的关键帧作为下一个视频关键帧。该阈值的设定依据于学生姿态以及面目表情在听课期间的变化比例,对于该变化与前一提取关键帧学生听课状态比值高出或低于5%,那么就提取;当然这一经验值的设定需要在实践过程中进行总结而得,目前暂定为5%。
2.针对于关键帧的处理。视频关键帧的处理有多种方式,首先提取相关的多维度特征,即提取颜色、纹理、形状等特征进行比对,如果学生位置不变化,那么整个身体的颜色基调基本一致,如果学生的姿态发生变化:(1)由坐姿变成趴在桌子上,那么颜色特征的提取比对就具有非常大的意义,当然针对以上情况,形状特征的提取和比较也非常有意义,这是一种针对坐姿变化的特征比对方法。学生从抬头到低头的变化可以利用将头部颜色和纹理进行结合对比进行获取。(2)学生将手机拿到桌面上看的时候头部不会是直视前方,关键帧中获取的是一部分头顶、一部分脸部,和标准的听课姿态中头部信息比较,头部要比显示的比例要更多,当然也可以加入眼睛部分的特征,因为其眼睛部分不会直视前方,而是直视前方座椅后背或者直视桌面,这样就可以根据颜色和纹理两个特征的结合与标准听课姿态进行比对。(3)睡觉的姿态可以通过形状特征比对即可,由于睡觉姿态没有学生坐姿的形状特征,只有座椅,所以简单地通过分析关键帧的形状特征就可以达到目的。(4)长时间写字不抬头:由于该姿态头部不是被前面的座椅后背完全挡住,所以长时间低头,手臂不在头部下面,说明是在写东西,不是睡觉。由于是长时间处于该姿态,说明这段时间没有抬头听课,所以分类到不认真听课类别中。
以上属于面目表情的分析,由于上课学生可能人数众多,所以需要对提取的关键帧进行分块处理:首先将视频关键帧按照座位或者按照学生的形状特征进行分块处理,在获得了学生上课位置信息之后,再定位头部所在位置,进一步对头部几个主要区域进行分块处理,比如提取学生的眼睛状态、眉毛状态等多种面部器官的特征,为分析面目表情信息做好前期铺垫。利用深度学习与面目表情相结合是将特征提取和模式分类在同一个模型中依次实现,利用它特殊的结构特点,先逐层地进行特征学习,以得到类似人脑认知的抽象特征,然后在模型中直接用于分类。
以下的几种表情属于比较细小的特征,需要有清晰程度较高的摄像设备才可以做到:(1)睁眼或闭眼:主要分为两种状态,一种是睁眼,一种是闭眼。利用人脸识别算法中针对眼睛的瞳孔位置以及大小来判定是否处于睁眼的状态,否则就属于闭眼。(2)皱眉:首先定位该位置在两眉之间,平滑和褶皱的比较。(3)用手支撑头部并眼部斜视:该姿态可以利用形状特征与学生正常听课姿态比较即可获得。(4)同学两两之间侧头交头接耳:该姿态主要从头部角度分析,由于侧头说话,面部特征与头顶特征比例不同,同时邻座两个人相向侧身,将两个侧身相对作为一个整体分析。
二、采集学生上课状态并比对
采集学生上课过程中状态视频和教师的板书或者演示文稿,基于渐变和切变等原理提取学生状态的视频关键帧,针对学生听课状态、基于计算机视觉提取关键帧的多维度特征,将特征结果与数据库中的标准学生上课状态进行比对,得到学生上课各种状态。
1.分析学生上课状态数据。分析依据如下:姿态中认真听讲、举手表明学生认真听课;低头、看手机、睡觉、长时间写字不抬头等说明学生没有认真听课。针对面目表情:皱眉,说明可能有难度,没有听懂;点头,说明学生已经领悟了所讲授的知识;睁眼,说明认真听讲;闭眼,说明虽然抬头了,但是比较疲倦,没有听课;用手支撑头部并眼部斜视,说明没有认真听讲;同学两两之间侧头交头接耳,说明学生对讲解的知识点有疑问或者没有认真听课。基于以上学生状态分析出绝大部分、部分、少部分等多种比例学生属于认真或不认真听课,進而作为教师改进或延续授课方式、方法的依据。
2.分析数据结果更改或延续教师授课方式、方法。在分析出绝大部分、部分、少部分等多种比例学生属于认真或不认真听课之后,对于学生认真听课时段的授课内容以及授课方式,授课教师要总结是何种原因让大部分学生能够认真听讲,比如:授课内容、授课方式、案例生动程度、与现实产品结合的情况等多种原因,在今后的授课过程中要延续该方式、方法;对于一部分学生上课期间认真听讲而另一部分不认真听讲的,需要分析是不是方式、方法有问题,做出适当的调整;如果大部分学生上课期间不认真听讲,那么要改进教学方式、方法。
三、总结
通过本论文的相关想法以及实现,可以利用课堂上学生的状态以及表情信息作为判断学生学习状态的标准,由此授课教师可以继续保持或者改变授课方式、方法,最终达到讲授的知识点被学生吸收的目的。
参考文献:
[1]冯利英,等.高校教师课堂教学效果评价研究综述[J].内蒙古工业大学学报(社会科学版),2014:81-85.
[2]刘坚,等.基于多元统计分析的高校课堂教学质量评价研究[J].保险职业学院学报(双月刊),2012:84-87.
[3]吴国誉,等.以学生为本的高校课堂教学评价指标体系研究[J].教育探索,2015,(10):19-23.