基于在线数据过滤提取的高职学生网上学习行为调查与分析
2016-08-04谭阳陈琳刘艳宁可
谭阳 陈琳 刘艳 宁可
摘 要:网络化教学是高等职业教育发展的必然趋势,要提升网络化教育的质量,掌握学习者在网络中的学习行为是基本的切入点。本文通过构建基本网络学习行为提取模型,以在线监控的方式收集学习者在网络学习过程中的行为数据;并以协同分类的算法过滤网页页面内容,以提取高职学生网络学习行为的特征数据。在此基础上,本文还研究了所获得的网络学习行为数据,分析了学习行为产生的原因,给出了针对性的建议。
关键词:在线数据;过滤算法;网络学习行为;高等职业教育
中图分类号:G434 文献标志码:A 文章编号:1673-8454(2016)11-0026-05
一、引言
随着我国网络及在线教育的迅速发展,计算机网络已成为我国高等职业教育过程中重要的教学工具、认知工具以及学习环境。随着高职师生对计算机网络使用率的不断提升,网络化教学已经成为职业教育重要的发展方向,通过购买或定制方式来将现有的职业教学资源网络化,成为很多高职院校完善自身的网络教学平台和资源内容的重要手段。[1]然而,随着网络学习资源的不断丰富、网上学习条件的不断完善,高职学生的网络学习成效却没有随之得到相应的提升。如何构建高质量的、更具针对性的、符合高职教育特点的网络教育体系,一直为高职教育工作研究者所重视。[2-3]
掌握学习者的网络学习行为是教育者做好网上教学的出发点和切入点。由于高职院校学生的学习特点和心理特征具有特性化的一面,如基础知识比较薄弱,学习的积极性和主动性较差,比较喜欢操作型、技能型的知识等。[4]针对高职学生自身的特性来构建其网络学习行为的模型,并以该特性模型来对高职学生在线行为数据进行过滤,以提取能够反映高职学生网络学习行为特征和网络学习能力的数据。以此为基础,为研究高职学生网络学习的效果和改进网上职业教育教学方法提供参考数据。为此,本文以湖南网络工程职业学院信息工程系两届学生的实际网络数据为例,进行详细的调查与分析。
二、相关研究
(一)网络学习的概念
当前,国内外对网络学习行为概念的基本描述为:学习者利用计算机或其他信息工具,通过网络来主动运用和调控自我的认知、动机和行为所进行的学习活动,强调学习者的“自我导向、自我激励和自我监控”。[5]网络学习行为作为全新学习理念,较传统学习行为表现出了不同的特征,主要表现在以下四个方面:[6]
1.发生学习行为的环境具有开放性。网络学习行为,通常是借助数据传输技术来对各种远距离教育资源进行认知的行为;它强调教育资源和教学对象具有时空分离的特性,因而具有较强的开放性。
2.网络学习行为控制的自主性。网络学习行为允许学习者自主确定学习目标、制订学习计划、选择学习方法,从而实现网络学习行为控制的自主化。
3.网络学习行为交互的充分性。网络环境下的学习行为表现出更加充分的交互性,有利于学习者表达自己的思想情感和观点,克服对教师和学伴的畏惧及羞涩心理。
4.网络学习行为技能的专业性。网络学习行为技能表现出一定的专业性特征,学习者不但要掌握学科相关的专业知识,还要对以网络数字媒介为主的信息技术有较好的掌握。
(二)网络学习行为的研究
与传统的课堂教学相比,网络教学过程更为强调程序化,以保证网络教学过程的质量。但是程序化的网络教学资源必须要学生成为网络学习行为的实施主体才能转化为头脑中的知识。[7]因此,研究网络教学质量,必须从研究学生的学习行为入手,当前国内外有关网络学习行为的研究主要集中在以下三个方面:[8]
1.通过问卷、访谈等形式调查学习者的网络学习行为现状和水平,总结影响学习者在网络学习效果的行为因素,探讨提高学习者学习质量的对策。
2.网络学习行为监控研究,试图通过学习者以往学习行为的分析,通过技术途径为学习者学习提供适当的指导和监控措施。
3.基于网络学习行为信息挖掘及智能化教学平台研究,尝试为不同学习行为的学习者提供多种在线学习方案和学习指导。
本文尝试结合三个研究方向的特点:首先,通过构建自动化数据收集平台来对学生的网络学习行为进行监控和样本的收集;其次,采用数据提取方法来对初始数据进行清理和分类,并对符合条件的数据以ItemCF算法[9]的兴趣度进行量化,得出相关的参考数据;最后,对特定数据及其对应的网络行为,以对学生进行回访的形式来获知其产生的原因。
三、网络学习行为的调查
(一)网络学习行为模型的构建
根据网络学习行为程序化的特点,分析模型主要针对以下三个方面的行为内容进行构建:一是导向型的学习行为,指教师通过引导学生点击网络资源的学习行为。二是交互型的学习行为,主要是指具备师生互动过程的网络学习行为。三是拓展型学习行为,是指学生利用搜索引擎等网络工具来主动对课程相关内容进行拓展性认知。为了能够有效地对所有收集到的网络学习行为进行区分和归纳,本文将网络学习行为进一步具体化为9种不同的行为子类型,分别为导向型(课程导学、教学辅导、考前辅导、网上考核)、交互型(课后作业、答疑、FAQ、BBS)、拓展型(使用搜索引擎)。如图1所示。
(二)在线数据的来源及构成
本文用于分析的原始数据来源于对湖南网络工程职业学院信息工程系学生2013级(202人)、2014级(396人)计算机应用技术、计算机网络技术、软件技术三个专业学生所采集的在线数据。样本的选取基于以下两点考虑:第一,信息类专业的学生计算机(信息终端)的普及率远高于其他专业,样本分布广泛度高且均匀度较好;第二,信息类专业的学生自身的信息化操作水平较高,无需教师更多的介入,能够较好地保障数据的天然性。[10]
数据采集的课程为三个专业方向均开设的《计算机应用基础》、《计算机专业英语》、《综合布线技术》及《IT企业文化》。选取这4门课程的原因是:《计算机应用基础》为公共基础课程,同时信息工程系的学生对于这门课程的基础知识掌握得相对较好;《计算机专业英语》是一门结合传统教学资源的专业基础课;《综合布线技术》为专业核心课程,同时也是强调技能操作过程化考核的课程;《IT企业文化》是一门院级专业通识课程。这4门课程的覆盖面较广,同时自身特性的重叠度较低,具有较好的代表性。
数据采集的时间段为2013年9月至2015年7月,为期4个学期。为了保证采集的在线数据的样本具备自发性和多样性,将上述4门课程的考核方式由传统的“平时成绩+作业成绩(纸质提交)+终结性考核”的方式,调整为“平时成绩+作业成绩(网络提交)+点播课程资源+课程网络交互(BBS网络答疑)+终结性考核”的方式。并人为地减少终结性考核的比重,增加网上学习过程考核部分,同时提高过程考核的系数,以促进学生的学习行为由线下转移到线上。
(三)在线数据的过滤提取方法
ItemCF算法是目前工业界应用最广泛的分类协同过滤算法之一,它通过基于邻域的方法来对用户行为数据库进行相似度计算,采用近邻算法来构建用户的历史行为,并以此来分析用户对某些行为的偏好程度。因此,本文以ItemCF 算法为基础提出一种用户网络行为的协同过滤算法,其主要分为两个步骤:首先计算网页页面内容之间的相似度;然后根据用户历史行为和页面内容的相似度计算出用户的模式(兴趣)列表。
为了能够度量网页内容之间的相识度,本文用余弦相似度定义页面i与页面j的相识度,如式(1)所示:
wij=(1)
若网上学习系统中有m个网页页面,则用式(2)计算用户u对网页页面i的兴趣程度,其中ruj表示用户u对页面内容j的兴趣。
Pui=wijruj(2)
本文对ItemCF算法应用于网络学习行为模式提取的执行过程如下:
第一步:对每个观测学生以IP+MAC地址为账户,建立网络学习行为数据库,并记录由服务器获取的学生感兴趣的网页页面列表。
第二步:获取每个账户的个人共现矩阵,并将所有账户的个人共现矩阵相加,得到系统的网页页面共现矩阵Cm×m。其中,Ci,j被称为协同因子。
第三步:对共现矩阵中每一个不为0的元素计算页面的余弦相似度,得到网页页面之间的余弦相似度矩阵Wm×m。
第四步:从账户的行为记录中获取每个学生对网页页面的偏好矩阵R。
第五步:将页面相似度矩阵与偏好矩阵相乘,即可获得模式(兴趣)矩阵P,如式(3)所示,其中Pi,j表示用户j对网页页面i的兴趣值。
Wm×m×Rm×n=Pm×n(3)
第六步:对矩阵P的每一列进行排序,并剔除一些特定页面,例如成绩查询页面、账户登录页面等,即可得到每个学生最为感兴趣的页面内容的排序,对每个账户兴趣度排名前十的页面以表1中的高斯分布加权值进行统计,通过排序即获得该群体的网络学习行为的模式(兴趣)列表。
四、网络学习行为数据的分析
数据服务器通过对学生所访问的页面内容进行数据采集,并对采集到的数据以ItemCF算法进行过滤分析。通过数据整理,共获取2013级、2014级学生590个有效的活跃账户(能够进行有效分类页面采集,且次数在10次以上的账户),占总人数的98.76%。共抓取有效样本(页面)247613个。通过ItemCF算法筛选其中包含4门统计课程内容的页面,并按照每个账户的兴趣度计算权值。过滤后所得到的页面,以8种不同的统计类别按年级分别计算。其中,“兴趣总权值”为对有效账户兴趣排名加权值的求和,这个数据主要体现参与某项网上学习行为的学生对于页面内容的频繁(喜好)程度,其数值越高代表其频繁度越大。“参与比”为参与有效兴趣权值(大于0)计算的账户与学生总人数的比值,这个数据具体表现为学生对某项网络学习行为参与程度的高低,反映学生对某种网络学习类型接受的广泛性。为了尽量体现学生对网络学习行为的自发性和天然性,对属于强制性必然行为的“网上考核”进行了剔除,没有将其纳入学习行为的统计之中。经过数据整理,2013级、2014级学生对不同课程的学习行为统计如表2所示。
(一)对主导型学习行为的分析
通过分析表2中的数据,在“导学资料”、“教学辅导”、“考前辅导”这三类教师行为影响较大的主导型学习行为项目中,平均参与比例为35.3%,平均兴趣权值为0.632,这也表明教师对教师主导型的网络学习行为活动的产生,仍然具备较强的影响力和控制力。其中,整体教学手段较为传统的《计算机专业英语》和《综合布线技术》的学生参与度要高于其他两门整体教学手段更网络化的课程。其中,《计算机专业英语》的“考前辅导”平均参与比例高达61.8%,远高于其他三门课程的参与比例,这是因为该门课程终结性考核(闭卷笔试)的比例较大,学生更寄希望于通过考前辅导来获取更好的成绩。而在另一方面,强调技能操作考核的《综合布线技术》课程的平均参与比例仅为22.7%;这一差异体现了课程主体考核方式的不同对学生网络学习行为产生不同的影响。
(二)对交互型学习行为的分析
在交互型的4类网络学习行为方面,学生参与程度最高的为“网上作业”,其平均参与度为39.8%,平均兴趣权值为0.714,这体现了较高的参与度和认同度;其中《计算机专业英语》和《IT企业文化》两门课程教师分别对2013级和2014级学生做出了不同的要求,教师提高了“网上作业”在课程总体考核中的比例,这直接导致了学生参与程度平均提高了21个百分点。通过这一变化,也可以确定教师通过间接的手段,同样能够对学生的网络学习行为施加较大的影响。
在学生完全自主的相互交流的平台“BBS”中,整体教学手段更为网络化的《计算机应用基础》和《IT企业文化》的学生参与比例则高出教学手段较为传统的课程20%以上。可见对于教学手段网络程度较高的课程,学生之间相互以网络平台进行交流的程度也有所提高。同时,值得我们注意的是《IT企业文化》是一门通识课程,而《计算机应用基础》对于信息类专业的学生来说其通识化程度也较高。这也说明相对于专业程度要求更高的课程,通识课程对学生的专业基础要求较低,也更容易引发以群体讨论为主体的网络学习行为。这一点在《IT企业文化》这门课程上体现得尤为明显,两个年级的平均参与度超过60%,平均兴趣权值超过0.851,这是一个非常显著的数值,意味着在参与《IT企业文化》课程学习的学生中不少于25%的学生将BBS讨论作为该门课程兴趣度最高的网络学习行为。
就交互型的四类学习行为的总体情况而言,其平均参与比例为21.2%,其中“FAQ”的平均参与比例仅为8.1%,平均兴趣权值为0.373。通过后续的问卷调查得知,学生在遇到问题的时候通常第一选择是问其他同学,特别是当时在附近的同学;其次是通过网络搜索工具来获取问题的答案。这反映出学生在进行网络学习活动时,遇到问题会自然地以就近原则选择回复速度最快的方式;而通过网络教学平台以留言给教师的方式来解决问题,则因为时效性的问题难以成为学生的首要选择。因此,网络教学活动中时空的分离,反而成为了阻碍师生间进行交互型教学活动的因素之一。
(三)对拓展型学习行为的分析(见表3)
在搜索引擎的使用上,《计算机应用基础》和《IT企业文化》两门课程的平均参与比例分别为65.1%和78.8%,平均兴趣权值分别为0.855和0.862。这也表明在这两门课程中使用搜索引擎的成为了学生主要的网络学习行为之一。其中值得注意的地方是,在这4门课程中BBS与搜索引擎的参与程度表现出两者呈正向关系。为此,我们通过事后对学生访谈得知,在活跃度较高的BBS中提出开放性问题,相对容易引起学生参与对该问题的讨论,在进行网络讨论的过程中参与者会自发地、大量地使用网络搜索,从而提升了针对讨论内容的网络搜索行为。
就总体情况而言,低年级(2014级)较高年级(2013级)在所有课程的参与度上都有所提高,平均兴趣权值除《计算机应用基础》之外都有所提升,这表明高职学生对于网络学习行为总的认可程度是朝着正向发展的。同时,我们也应该看到,对于工科类高职学生而言,对技术类课程还是倾向于以操作教学和实践教学为主要手段的传统教学模式。学生对网络资源的获取也较多地集中在教师行为介入较深的导学资料和教学辅导上。对于更为强调自主的BBS和搜索引擎的使用则相对较少。而《计算机专业英语》这门课程,学生在网上的学习过程主要集中在“考前辅导”上,通过观察该门课程的各项网上学习行为数据,学生总体的参与比例都较低,通过事后走访,得知学生的英语基础普遍不高,对于用英文编写教学资料和课后辅导资料在阅读上存在客观上的困难;因此造成该课程的网上参与程度相对较低。而对于《计算机应用基础》和《IT企业文化》这样的基础通识课程,学生则明显地更加倾向借助网络来完成课程的学习,特别是当前在国家层面提出“互联网+”战略的情况下,学生通过搜索引擎和网上互相讨论的方式可以更快、更好地获取相关知识。
五、思考与建议
为了能更好地促进高职网络教学模式的改革,制定符合高职学生特性的网络教学手段,在前文数据分析的基础上对网络学习资源建设和网络学习行为引导提出几点建议,以供参考。
(一)进一步加强教师在网络学习行为中的引导作用
进入网络学习时代,教师在学生的网络学习过程中仍然是十分重要的角色。在教师为主导的网络学习活动中,进一步加强对网络教学资源的优化,使教学资源更加符合高职网络教学的要求;由于高职学生在知识基础、认知程度等方面存在薄弱环节,网络学习资源的类型和内容需要充分考虑不同类型学生的特性,做到“因特性施教”。在交互型学习活动中,教师应明确学生课程学习的目标和任务,教学活动的设计尽量以传统与在线相结合、特性化与合作化相结合的方式进行。特别是对于学生在线提出的问题要及时地予以反馈。
(二)提高学生网络学习的意识和自主性
学习过程网络化是今后高职教育发展的必然趋势。让学生从思想上可以真正接受网络化的学习模式,并且习惯于这种学习模式,教师和学校仍需加强培养学生网上学习的能力和网上学习的意识。同时,鼓励学生群体通过社交软件(微信、QQ、微博)来建立小型的交流、讨论群,这样不但可以扩展学生的交流范围,也可以增加学生对网络交互的认同感,利于网络教学的推广和普及。
(三)注重课程自身的特点,建立符合课程教学规律的教学资源
课程教学的网络化并不是简单地将教学资源上传至网端。对于实操型和技能型的课程,课堂教学和实训教学的作用目前来说还是无可替代的;这一点在工科为主体的技术型职业院校中尤其值得注意。有针对性地组织课程中网络教学的内容,通过对线上教学资源和线下实训、实习过程有机的组合,才能够促进高职学生通过网络将原有的知识与将要学习的内容建立横向和纵向的联系,有利于学生对知识进行解构,提高综合学习效率。
(四)建立多元化的网络学习评价体系
从技术层面来说,现有的网络学习平台已经可以为学生的学习过程提供多种方式的评价,从而避免单一评价方式的片面性。对于高职学生网络学习的评价,应重点落在对学生的行为评价和过程评价上,以学习主体的行为产生来评价学习行为;以可量化的行为参数来评价学习过程。网络化的学习行为容易受到学习环境、认知能力、自我控制能力等多种因素的影响,所以评价结果要做到多元、客观,才能够真正反映高职学生的网络学习行为和认知迁移能力。
参考文献:
[1]曾美英,于红军,李爱国,侯伯明.高职生自主学习能力与网络依赖程度关系的研究[J].心理科学,2008(1):105-108.
[2]姜强,赵蔚,王朋娇.基于网络学习行为模式挖掘的用户学习风格模型建构研究[J].电化教育研究,2012(11):55-61.
[3]Anthony G. Picciano. The Evolution of Big Data and Learning Analytics in American Higher Education[J].Journal of Asynchronous Learning Networks, 2012, 16(3):9-20.
[4]姚洁.大学生在线课程学习准备状态实证研究[J].中国远程教育,2015(11):25-29.
[5]姜强,赵蔚,王朋娇.自适应学习系统中双向适应交互评价实证研究[J].现代远程教育研究,2013(5):106-112.
[6]王艳娟.理工类院校历史文化通识课程的网络教学研究[J].中国教育信息化,2015(18):44-46.
[7]周平,张莉.在线教学自主评价系统的构建与应用研究[J].中国教育信息化,2015(17):86-89.
[8]孙莹,程华,万浩.基于数据挖掘的远程学习者网上学习行为研究[J].中国远程教育, 2008(5):44-47.
[9]应毅,刘亚军,陈诚.基于云计算技术的个性化推荐系统[J].计算机工程与应用,2015(13):111-117.
[10]Picciano A G. The evolution of big data and learning analytics in American higher education[J].Journal of Asynchronous Learning Networks, 2012, 16(4):9-20.
(编辑:王天鹏)