基于深度学习的MOOC课程重构系统研究
2020-06-08路红
摘 要 为解决MOOC课程利用成效低、资源重复建设等问题,基于深度学习理论,依据各MOOC平台课程和知识的关系设计一款MOOC课程重构系统,并使用Jsoup技术对大量数据进行收集和存储,使用自然语言处理技术对数据进行关键字分析,继而生成知识图谱,同时系统记录学习者学习状态,以便用户持续性学习,以期能为优化MOOC课程资源提供一定的指导。
关键词 深度学习;课程重构;MOOC课程;SPOC;知识地图;Jsoup技术
中图分类号:G642.3 文献标识码:B
文章编号:1671-489X(2020)04-0053-03
Study on Reconstruction System of MOOC Courses based on Deep Learning//LU Hong
Abstract In order to solve the problems of low utilization of MOOC courses and repeated construction of resources, this paper designs a MOOC curriculum reconstruction system based on the theory of deep learning, and uses Jsoup technology to collect and store large amounts of data. The use of natural language processing technology to analyze the data keywords, and then generates knowledge map, while the sys-tem records the learners learning status, so that users continue to learn, in order to optimize the MOOC course resources can provide some guidance.
Key words deep learning; course reconstruction; MOOC courses; SPOC; knowledge map; Jsoup technology
1 引言
MOOC课程重构(Courses Reconstruction)是以各类MOOC课程资源、SPOC课程资源和网络公开课等为基础,依据课程教学目标或学习者的学习需求,采用知识图谱生成技术重构相应课程资源的非结构化关系图,生成满足课程教学目标和学习者学习需求的非线性MOOC课程,并为学习提供相应的动态学习路径推荐,其本质是以学生为主体的动态学习任务规划与实时优质课程资源推荐过程。在过去的几年中,不同架构的MOOC平台不断涌现,上线的MOOC课程和SPOC课程、用户数量也呈爆炸式增长趋势[1]。但随着MOOC课程在教育教学实践中的深入应用,逐渐暴露出课程辍学率高、课程资源重复、跨平台资源检索困难、课程评价模式单一等问题[2-3]。
王继元等通过利用NVivo工具对10篇访谈文本的数据进行分析,指出MOOCs的高辍学率主要是因为学习者的学习主动性和自我学习管理能力不足,MOOCs的高辍学率不应该是评价MOOCs课程的唯一指标[4]。徐振国等通过调查研究发现,学习者自制力差、学习动机不强烈、后期跟不上学习进度等因素是导致MOOC学习者辍学的首要因素,并提出采用学分认证、MOOC课程积分、奖学金、混合式教学、强化在线学习互动等策略提高MOOC課程的完成率[5]。胡航等对深度学习概念的界定、有效实施建议等进行了阐述,提出深度学习理论的本质内涵是“转向学生、关注学习、技术促进学习”[6]。
知识图谱具有关联性、结构性和导航性,能够帮助学习者采用非线性方式组织课程内容,加速学习者对知识的理解和意义建构,避免学习者因知识结构复杂迷失学习方向甚至终止学习过程。周颖等指出,知识地图在课程学习中的应用,能够帮助学生有效管理学习目标、知识体系、知识点间的逻辑联系等,促进学生对知识的理解、意义建构、共享和创新。刘红晶等提出一种基于教师视角的SPOC课程知识地图的构建方法,以利用知识地图解决SPOC课程资源线性组织、课程知识体系不清晰等问题。姜宛彤等通过将知识地图应用在微课视频、学习资源管理等方面,解决了微课资源碎片化所给学习者所带来的困难[7]。
Nen-Fu Huang等提出一种基于知识地图的个性化自主学习路径规划方法,指出学习路径规划为完成预期的学习目标,学习者需要完成的学习活动序列,可根据自身的学习状态与学习评价反馈选择和变更学习活动路径及学习内容,依据分析学习者的现有知识水平构建知识地图,并为达到最终学习目标自动规划下一步学习路径[8]。
综上所述,现有的MOOC课程存在完成率持续较低、学习效率较差等问题,而关于深度学习视角下MOOC课程资源建设、跨平台共享与检索的研究很少,大部分集中在MOOC课程学习过程中遇到的问题探究和深度学习概念本身的研究。因此,研究一款基于深度学习的MOOC课程重构系统,将为学习者利用MOOC课程资源持续开展深度学习提供有力的技术服务,同时将为优质数字课程教学资源的跨平台检索与共享提供技术支持。
2 基于深度学习的MOOC课程重构系统设计
基于深度学习的MOOC课程重构系统帮助学习者采用非线性方式组织课程内容,加速学习者对知识的理解和意义建构,避免学习者因知识结构复杂迷失学习方向甚至终止学习过程。该系统主要包含四大模块,分别是个人信息模块、数据收集模块、学习中心模块、知识导航模块,其功能模块图如图1所示。
个人信息模块 基于深度学习的MOOC课程重构系统是一种以学习需求和学习主动性为驱动力的个性化MOOC课程学习服务平台,以保持学习者MOOC在线课程学习的持续性和注意力为目标。个人信息模块主要包含用户登录、注册和用户信息可视化显示功能,该模块用于将用户的登录信息和学习需求信息存储到数据库,并在用户登录后以可视化进度条的形式展示在前台页面,用户登录注册的基本信息将被应用于数据收集。
数据收集模块 由于大部分MOOC课程资源建设标准不统一,需要为训练MOOC课程重构模型收集和标注一个具有规范标准的MOOC课程资源数据集。
首先,以某一门MOOC课程为例,收集来自不同MOOC平台、SPOC平台、网络公开课平台和精品课程平台的课程资源(含教学目标、课程内容、视频、课件、历史互动记录等)、知识点相关的文本描述和图片等资源。
其次,分析该课程的学习目标、知识点,各知识点对应的学习内容及其相应的学习资料,同时标注和记录“课程—学习目标—知识点—学习内容—各类学习资源”之间的相互关系,以此为依据,对所收集的课程资源进行标注,以用于构建知识图谱。
学习中心模块 对于视频、音频和图像课程资源,首先,基于双向长短时记忆(Bidirectional Long Short Term Memory,BLSTM)训练一个MOOC课程资源的文本描述模型,并生成相应的文本描述信息;
其次,以所生成的文本描述信息和其他文字形式的在线辅导记录、交流互动内容等作为输入,采用深度神经网络方法训练一个自动知识点抽取模型;
最后,采用度量学习方法计算各知识点之间的关系及其相似度,以三元组“知识点—关系—知识点”为基础,采用非监督学习方法生成面向MOOC课程重构的知识图谱,以用于知识导航学习资源推荐。
知识导航模块 以重构的MOOC课程知识图谱为基础,根据学习者的学习需求、学习特征、学习评价等,利用增强学习方法Q-Learning为学习者生成动态学习路径。同时,采用神经协同过滤(Neural Collaborative Filtering,NCF)算法为学习者推荐相应的多模态优质课程资源或在线辅导,变革传统MOOC课程的线性学习活动序列和资源利用方式,及时发现和解决学习者的学习需求和学习困难,保证深度学习过程的可持续性进行。
3 系统实现关键技术
类结构设计 基于深度学习的MOOC课程重构系统的类结构主要分为五层。
1)用于连接数据库的DAO层。DAO层的构成是由一个BaseDao、多个自定义Dao接口和与其对应的实现类组成的,其主要作用是从数据库获取数据。
2)用于业务服务的SERVICE层。SERVICE层包括自定义的Service接口和相对应的实现类,这一层的主要作用是将业务与数据库连接分开,起到分离的作用,降低了代码的耦合。
3)用于与JSP交互的SERVLET层。SERVLET层包含多个Servlet,用于和对应的不同JSP传输数据,由于每一个JSP都会不止响应一次后台,因此,Servlet的数量还是很多的。
4)用于完成逻辑处理的FUNCTION层。FUNCTION层为了减少代码耦合,主要存放数据处理方法,以达到接口和具体实现相分离。
5)实体类层MODEL。MODEL层用实体类作为存储媒介,可以方便与数据库对接,同时也定义了一些类比以便于数据传输。
数据收集的方法 Jsoup是一种用来解析网页信息的基于Java语言的工具包,可以直接分析Url地址指向的网页和Html文件。Jsoup工具包中定义了Document类,借助title()、getElementsByClass()和getElementsByTag(),可以将Html页面转化为一个独立的Document对象。所以,通过Jsoup封装的方法即可通过网站的Url,获取到整个网页的信息。
数据处理技术 汉语言包HanLP常用于中文分析,其功能包括中文分词、命名实体识别、关键词提取、自动摘要、短语提取、拼音转换、简繁转换、文本推荐、依存句法分析等。系统中使用HanLP提取MOOC课程的微视频标题、字幕、测验作业的问题与答案等文本信息,以形成知识节点。
知识图谱的生成 Jsoup是一款Java的Html解析器,可直接解析某个Url地址、Html文本内容。它提供了一套非常省力的Api,可通过Dom、Css以及类似于jQuery的操作方法来取出和操作数据,用于展示创建好的知识图谱。
知识导航的建立 知识导航主要涉及将用户在课程系统中的学习状态返回给后台,其由异步传输和zTree的回调函数实现。zTree的回调函数写在setting内的callback
代码块内,当用户点击叶子节点以后,Js方法将会检测到用户点击的叶子节点的name项。为提高用户体验感,使用Ajax异步传输技术。异步传输获取到用户点击的节点以后,就要将该节点的name信息传向后台,记录到数据库中。向后台传输两个数据:课程号id和节点信息name。后台根据课程的id将传来的name拼接到数据库中的课程节点字段中,以此实现学习路径规划。
4 结语
本文结合当下MOOC课程辍学率高和跨平台资源检索困难等问题,基于深度学习理论设计并实现一款MOOC课程重构系统原型,以期指导提高MOOC课程评价的效用和课程资源的质量,避免MOOC课程资源的重复建设。下一步工作将采用增强学习算法Q-Learning和神经协同过滤算法NCF,实现基于多模态MOOC课程知识图谱的动态学习路径规划和优质多模态学习资源推荐,以提高MOOC课程资源的利用率和MOOC课程的学习效率。
参考文献
[1]张刚要,沈大为.理解MOOCs的完成率:归因与挑战[J].中国电化教育,2017(12):82-89.
[2]徐振国,张冠文,石林,等.MOOC学习者辍学行为的影响因素研究[J].现代教育技术,2017,27(9):100-106.
[3]王雪宇,邹刚,李骁.基于MOOC数据的学习者辍课预测研究[J].现代教育技术,2017,27(6):94-100.
[4]王繼元,张刚要.限制MOOC学习者自由对其持续学习意向的影响机制研究[J].电化教育研究,2019(2):54-61.
[5]徐振国,张冠文,石林,等.MOOC学习者辍学行为的影响因素研究[J].现代教育技术,2017(9):100-106.
[6]胡航,董玉琦.深度学习内容及其资源表征的实证研究[J].中国远程教育,2017(8):57-63,80.
[7]刘红晶,谭良.基于教师视角的SPOC课程知识地图构建方法研究[J].电化教育研究,2017(9):64-70.
[8]Huang N F, Lee C A, Huang Y W, et al. On the Auto-matic Construction of Knowledge-Map from Handouts forMOOC Courses[M]//International Conference on Intelli-gent Information Hiding and Multimedia Signal Pro-cessing.2017:107-114.
项目来源:江苏省教育科学“十三五”规划课题“深度学习视角下基于多模态知识图谱的MOOC课程重构研究”阶段性成果(课题批准文号:C-b/2018/01/19)。
作者:路红,南京理工大学紫金学院,讲师,研究方向为知识图谱、深度学习(210023)。