基于在线学习者特征的个性化学习路径研究
2021-11-04游琪陈红玲
游琪 陈红玲
DOI:10.19850/j.cnki.2096-4706.2021.09.033
摘 要:随着移动互联网的发展,人们纷纷转向在线课程等线上学习,然而海量学习资源的出现引发了诸如“学习迷航”和“信息过载”等问题,给学习者带来巨大挑战,亟待解决。文章运用lxml、RE等爬虫手段获取慕课网用户和用户学习课程相关信息,并利用Python软件对慕课网在线学习者的特征进行可视化数据分析,基于学习者特征构建个性化学习路径,有效解决了网络迷航问题。
关键词:在线学习者;特征;个性化;学习路径
中图分类号:TP391 文献标识码:A 文章编号:2096-4706(2021)09-0127-04
Research on Personalized Learning Path Based on the Characteristics of Online Learners
YOU Qi,CHEN Hongling
(Guangdong Polytechnic of Science and Technology,Zhuhai 519090,China)
Abstract:With the development of mobile internet,people have turned to online courses and other online learning. However,the emergence of a large number of learning resources has caused problems such as “learning trek” and “information overload”,which has brought great challenges to learners and need to be solved urgently. In this paper,crawling means such as lxml and RE are used to obtain the relevant information of IMOOC users and user learning courses,and Python software is used to make visual data analysis to the characteristics of IMOOC online learners,and builds a personalized learning path based on learnerscharacteristics,which effectively solves the problem of network getting lost.
Keywords:online learner;characteristic;personalized;learning path
0 引 言
中共中央、国务院印发的《中国教育现代化2035》提出,推进教育现代化要“更加注重因材施教的教育理念”,并将“加快信息化时代教育变革,利用现代技术加快推动人才培养模式改革,实现规模化教育与个性化培养的有机结合”作为重要的战略任务[1]。新时代以“学习者为中”的人才培养模式为学习者提供个性化学习环境,学习者可以根据自己的需求进行学习,激发学习的自主学习意识。随着移动互联网的蓬勃发展,在线学习已成为学生的一种常态,各类在线教育平台拔地而起,网络学习资源层出不穷,人们在汲取知识的同时也面临着新的问题,如“信息过载”、“网络迷航”等,都会阻止学习者的个性化学习路径的发展。因此,迫切需要解决制约个性化学习路径中的诸多因素,如学习者特征、学习者需求等。
1 学习路径
1.1 国外相关研究
国外对于学习路径方面的研究侧重于学习路径的算法实现。例如:提出一种基于图论的学习设计推荐系统的构建模型,挖掘教育数据相关新特性,使用小团体概念帮助学习者在学习过程中找到合适的学习对象,建立有效的学习路径[2];基于学生学习方式的需求,应用群体智能模型和蚁群优化方法,在静态和动态学习单元中寻找合适的学习路径[3]。
1.2 国内相关研究
国内则侧重于通过大数据对学习者的行为习惯进行分析,主要集中在学习行为、知识结构、学习模式和情境推荐学习路径。例如:单佩佩基于知识图谱的个性化推荐研究,从知识图谱的定义出发,综述了知识图谱的知识提取、表达、存储和检索以及教育资源个性化推荐方向的应用研究进展[4];段玉聪等基于知识图谱的云端个性化测试推荐,将知识图谱引入到非结构化语义信息中来改进搜索效率和目标有效性,语义知识丰富了基于内容的搜索,增强了所推荐内容的正确性,降低了计算复杂度[5];姜强等基于AprioriAll算法,整合知识水平相当、学习偏好接近的学习群体行为轨迹,根据学习者特征、学习的难度等级、学习的媒体类型等要素,绘制学习路径,用以支持个性化学习[6]。
基于上述情况,个性化学习路径已成为在线学习平台中不可或缺的部分,研究也有很多,但是针对在线学习者特征分析的个性化学习路径很少。
2 在线学习者特征
据中国互联网信息中心(CNNIC)发布的第47次《中国互联网络发展状况统计报告》[7]显示,截至2020年12月,我国在线教育用户规模达3.42亿,较2020年3月减少8 125万,占网民整体的34.6%;手机在线教育用户规模达3.41亿,较2020年3月减少7 950萬,占手机网民的34.6%,如图1所示。
随着教育信息技术的发展,在线学习逐渐成为人们的关注点。特别是2020年,受新冠肺炎疫情影响,教育信息化进一步深化落实,各类在线学习平台也推出了五花八门的在线学习类型,一定程度上满足了广大用户的个性化教育的需求。在线学习平台的优势在于可以随时随地学习、资源重复利用、投入资金较少、每个人都可享受高质量课程资源等,这是传统教学模式无法比拟的。但是,学习者们在享受这些在线学习平台便捷服务的同时,也面临着信息过载等问题,如何在众多的在线教育平台中为学习者推荐满意的、符合需求的课程,节省学习者时间成本、提高学习者满意度、增加学习者黏性是在线教育平台的关注重点和亟须解决的问题。为此,个性化推荐系统应运而生,该系统能有效地解决信息过载的问题。
在线学习平台积累了大量的用户学习数据,包括学习者的基本信息、在线学习行为、习惯统计数据、在线学习效果评估等,图2是慕课网某课程學习的用户数量可视化统计。
3 在线学习者数据分析
3.1 在线学习的数据获取
在线学习者在学习过程中产生的一些历史数据,如学习时间、发帖讨论、在线测试和练习等。运用lxml、RE等爬虫手段,将慕课网上学习者相关在线学习信息爬取并存储到CSV文件中。主要步骤为:
(1)请求解析课程信息,关键代码为:
html = requests.get(url, headers=head)
selector = etree.HTML(html.text)
content = selector.xpath("//html")
(2)通过XPath或RE匹配获取课程名称、课程URL、课程类型等信息。关键代码为:
course_id = int(url.replace('http://www.imooc.com/learn/', ''))
course_name = each.xpath('//h2[@class="l"]/text()')
course_type_other = each.xpath('//div[@class="path"]/a[3]/text()')
if course_type_other:
course_type = each.xpath('//div[@class="path"]/a[2]/text()')[0] + '-' + each.xpath('//div[@class="path"]/a[3]/text()')[0]
else:
course_type = 'other-' + each.xpath('//div[@class="path"]/a[2]/span/text()')[0]
print('course_type: ' + course_type)
(3)解析学习难度关键代码为:
course_difficulty = each.xpath('//div[@class="static-item l"]/span[@class="meta-value"]/text()')[0]
(4)解析学习时长关键代码为:
course_time_1 = each.xpath('//div[@class="static-item l"]/span[@class="meta-value"]/text()')[1]
print('course_time_1: ' + course_time_1)
course_time_2 = course_time_1.strip().replace(u'小时', 'h').replace(u'分', 'm')
(5)打开并创建csv文件,将爬取到的内容写入到csv文件中。创建线程池,构建爬取课URL,一般慕课网的课程URL,执行爬虫。将爬取的数据进行整理,得到慕课网用户的在线学习信息。该信息包括静态特征的学习者个人基本信息和具有动态特征的相关信息。
3.2 静态特征数据
在线学习者的个人基本信息、历史学习成绩和学习背景,这些特征记载着学习者的基本信息,是分析学习者特征的基础,这类数据一般情况是没有变化的。
3.3 动态特征数据
该数据包含学习者的在线学习行为、学习实效等,这个数据是时刻有变化的。通过Python软件对爬取的用户学习课程情况数据进行分析,如图3所示;该图显示的用户在过去一年内的学习集中在Web前端技术的学习。
用户数排名前10不同地区的不同性别的用户的学习情况统计,如图4、图5、图6、图7所示。
图4、图5、图6、图7是从用户学习课程数、用户学习积分、用户学习经验和用户学习分钟数四个方面进行了统计。根据这些数据,在线平台可以重点推荐一些资源给用户活跃度高的地区。
根据上述特征,慕课网随机给出了视频、作业、章节测试、讨论和过关游戏等基本模块应用满意度的在线问卷调查,共有254 562人填写了问卷,调查结果显示如图8所示。
从图8中可以看出,学习者对于课程模块中的讨论和过关游戏满意程度均达到80%以上,根据该调查问卷,课程建设者可以修改相应的学习模块资源,既可以提高用户的学习兴趣,又能推广课程的应用。
4 基于学习者特征构建个性化学习路径
从图8中,可以看出在线学习者对课程模块中的讨论和过关游戏类的学习模块满意度较高,对于常规的视频和作业满意度较低。综合学习者的静态、动态特征和课程问卷调查结果,构建出符合学习者特性的认知和行为习惯的个性化学习路径,如图9所示。
该学习路径的进行模式:根据学习者的学习状态采用不同的匹配策略向学习者推荐个性化学习列表,学习者依据自己的需求选择一个最合适的学习列表进行学习,然后测试学习效果,这个效果可以生成学习者的动态特征。为了能向学习者精准推荐个性化学习列表,因此,需要保证学习动态特征的产生过程是不断迭代的;个性化学习列表推荐可以让学习者根据每个人自己的情况自主选择学习方式,避免了向学习者强制推薦学习内容而导致的学习者厌烦情绪。
5 结 论
通过分析在线学习者特征类型,运用lxml、RE等爬虫手段获取了慕课网用户和用户学习课程相关信息,并利用Python软件对慕课网在线学习者的特征进行了可视化数据分析,构建了基于学习者特征构建的个性化学习路径,有效解决了在线学习中的“信息过载”“网络迷航”问题。但同时是也存在一些问题,如:对于新用户的特征,需要积累一段时间的迭代数据才能够构建出对应的模型及相关学习路径,考虑动态时间序列对所有在线学习者特征进行建模分析,是下一步解决个性化学习路径的关键。
参考文献:
[1] 中共中央国务院印发《中国教育现代化2035》 [J].人民教育,2019(5):7-10.
[2] 钟绍春.构建信息时代教育新模式 [J].电化教育研究,2019,40(4):23-29.
[3] 中国互联网络信息中心.CNNIC发布第47次《中国互联网络发展状况统计报告》 [R/OL].(2021-02-03).http://cnnic.cn/gywm/xwzx/rdxw/20172017_7084/202102/t20210203_713 64.htm.
[4] 唐烨伟,茹丽娜,范佳荣,等.基于学习者画像建模的个性化学习路径规划研究 [J].电化教育研究,2019,40(10):53-60.
[5] 单佩佩.基于知识图谱的个性化推荐研究 [J].电脑知识与技术,2020,16(36):177-178+184.
[6] 段玉聪,邵礼旭,崔立真,等.基于知识图谱的云端个性化测试推荐 [J].小型微型计算机系统,2018,39(12):2743-2747.
[7] 黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述 [J].计算机学报,2018,41(7):1619-1647.
作者简介:游琪(1981—),女,汉族,江西九江人,讲师,硕士研究生,研究方向:教育大数据;陈红玲(1980—),女,汉族,湖南邵阳人,讲师,硕士研究生,研究方向:大数据挖掘。
收稿日期:2021-03-08
基金项目:广东省教育科学“十三五”规划项目(2018GXJK320,2019GXJK272)