APP下载

学习云空间中基于情感分析的学习推荐研究

2018-05-14黄昌勤俞建慧王希哲

中国电化教育 2018年10期

黄昌勤 俞建慧 王希哲

摘要:在“三通两平台”建设背景下,云空间以泛在的资源供给和便捷的交互支持特性,为学习者提供了一个高效、可定制的互联学习空间环境——学习云空间。正如其他在线学习平台一样,“情感缺失”一直是制约学习云空间中学习效率提升的一个重要瓶颈。该文聚焦学习云空间中学习者情感的获取与应用,提出了一个基于空间交互文本大数据的情感分析方法及其学习推荐机制。首先,利用时序特征数据适应性的LSTM网络构建学习者情感分析模型,并设计了一个可实时动态分析情感的执行算法。然后利用贝叶斯网络进行情感归因分析,建立情感驱动下的学习推荐机制与策略,并在已有学习云空间平台中实现了基于上述理论成果的学习推荐功能系统。最后进行效果验证,该系统可以分析学习者的情感并为其推荐学习支持服务,满足其基于网络空间的个性化知识建构需求。

关键词:交互文本大数据;学习情感分析;LSTM神经网络;情感归因;学习推荐

教育信息化是国家信息化的重要组成部分,教育信息化的发展,带来了教学形式和学习方式的重大改革,对传统教育产生了巨大的冲击,直接推动了教育的现代化。学习云空间建设是借助网络新技术促进学习型社会形成、提升教育教学效果的重要信息化举措,是国家教育信息化“十三五”发展规划中“三通两平台”的核心内容,它是基于开放式的云计算架构,以教师、学生为共建共享的主体,能最大限度的汇聚与共享教学相关信息、资源和服务,为用户提供一站式交互学习的网络互联虚拟实体。随着国家各级部门对“三通两平台”政策的高度重视,网络学习空间的建设实现了快速发展与广泛应用,主要集中在网络学习空间的内涵与演化、建设框架等理论研究以及教学策略、学校教育发展研究等实践层面。

以学习者个人诉求为核心,基于网络互联最大化满足学习者的特性需求,学习云空间为学习者呈现了自由选择、高度定制的空间化功能配置的场所,提供了便捷交互(人机、人与资源交互)与协作支持服务,以最大化支持学习者的自主知识建构。但正如其他网络学习平台一样,缺少Face-to-Face的交互,因此学习过程中的“情感缺失”成为了一种必然。同时,作为新课程的三维目标之一,情感态度价值观已成为了解学习者状态与衡量其发展程度的重要环节。大数据技术的出现,给众多复杂的特征选择与知识识别问题带来了新的机遇,在网络交互学习过程中动态产生的海量文本数据,不仅是学习者情感的典型物理载体和情感直接传递者,同是也是具有4V特征的文本大数据。鉴于LSTMfLong Short Term Memory)神经网络是一种能快速深度学习与识别具有时序性特征数据的大数据技术,能较好满足情感文本数据实时追踪与分析的需要,它为文本情感快速分析带来一种新的思路。而基于贝叶斯网络与多元回归的因果分析方法可以发现学习者情感与学习情境之间的因果关系,为个性化的学习推荐提供理论依据。

基于以上所述,本文聚焦学习云空间中学习者情感的获取与应用,拟将运用LSTM神经网络處理云空间交互文本数据,以此建立学习者情感分析模型,并进行学习情感归因分析,最后基于情感归因结果指导个性化学习推荐服务,提升云空间学习效果。

一、面向学习云空间的学习者情感分析及其归因机制

网络空间中学习情感的弥补离不开学习者情感的分析。情感分析一直是计算机科学与技术、自然语言处理、认知心理学等方面的研究热点问题。就其分析对象而言,包括文本、音频、视频及其混合媒体等。在现有学习云空间中,学习活动多以同步或异步的交互文本为主要载体。因此,基于文本的学习者情感分析是本文研究的重点。鉴于以上考虑,本文利用LSTM神经网络可以动态分析学习者情感变化的优势,首先构建了基于LSTM的学习者情感分析模型,然后对云空间中的交互数据等进行采集与预处理,最后进行情感分析及其归因机制的设计,各环节具体过程如下。

(一)基于LSTM的学习者情感分析模型

美国人本主义心理学家罗杰斯认为,人类的认知活动伴随着一定的情感因素,说明人的情感不是孤立存在的,它的产生必与当前所处环境与认知活动密切相关,学习情感也不例外。考虑到云空间中学习者在学习过程中产生的情境信息主要以文本形式呈现,因此本文提出了基于LSTM的学习者情感分析模型以实现情感状态的识别,如图1所示。该模型包括数据获取模块、数据预处理模块以及情感分析模块。数据获取模块负责获取学习云空间中学习者的交互或评论文本、表情符号、学习者个人信息、Web日志等数据;数据预处理模块通过对数据清洗、分词处理、词性标注、停用词处理等步骤完成对数据的预处理;情感分析模块主要对预处理之后的文本数据进行基于LSTM的情感分析并获得影响学习者情感的情境要素。另外考虑到学习者的情感变化是一个多因素有机结合、相互作用的过程,故将学习者在进行知识的主动建构过程中与情感产生直接关联的因素,如学习者个人特质、学习主题、学习方式、知识水平、学习效果、学习期望值等作为影响学习者情感的关键情境要素。

(二)学习云空间中数据的采集与预处理

学习云空间提供的便捷式交互特性,使得学习者在交互过程中积累了海量可用于情感分析的交互文本数据。主要分为两大类:对于年龄、姓名、背景知识等学习者个人特质信息,由学习者个体在系统注册过程中填写并记录在数据库中;此外,通过采集学习者在自主学习过程中的空间使用记录与Web行为日志等过程性数据,可从中提取该学习者的各项学习情境信息。在获取上述信息后,由于面向全过程的数据记录导致采集的各类数据中含有部分噪音数据(Html标签、停用词等),若不进行数据清洁操作极有可能影响后续的学习者情感分析效果。因此,针对交互文本数据特征,本研究主要通过分词处理、词性标注、去停用词、表情符号转化等步骤,实现数据的预处理,为后续的分析提供高可用的数据支持。

(三)面向学习云空间的学习者情感分析及其归因机制

1.数据的特征提取

为确保LSTM情分析技术可用于学习者情感状态的智能分析,需对预处理后的交互文本数据进行特征提取,即提取最具代表性的文本特征词来描述文本。作为应用最为广泛的特征抽取方法之一,TF-IDF在多个领域取得了较好的应用效果。因此,本文利用TF-IDF方法提取与学习者情感有关的学习情境特征词。首先使用向量空间模型(VectorSpace Model)将预处理后的文本转化为特征空间向量,然后选择文本中的主题或情感特征词并计算相应的权值。计算公式如公式(1)所示。

其中,tfij表示特征项在ti文本di中出现的频次,D为文本总数,df(ti)表示包含特征项的文本数,当特征在文本中出现的次数越多时,表明该特征越能代替文本。

2.情感词典及其情境知识库的构建

词语的情感倾向分析是文本情感分析的基础工作,其主要通过挑选出目标文本中能够体现情感倾向的词语,根据词语褒贬极性与强度构建情感词典,以此作为情感分析的主要依据。为实现学习者情感的分析,本文面向云空间中的交互文本大数据,在整合知网情感词典、知网评价词典等词典的基础上,经过去重、人工筛选过滤等步骤,加入在线学习领域的行业词汇,完成情感词典的构建。

另一方面,学习云空间中学习者的情感变化会持续在整个习交互过程中,为了能够有效利用随情感动态变化的学习情境信息,并为后续情感归因的分析与推荐提供支持,构建能将交互过程中的情感变化全过程记录下来的情境知识库成为接下来的重点。本文首先以艾森克的人格特质理论为基础,将学习者聚类为四类,分别为低神经质外倾、高神经质内倾、低神经质内倾、高神经质外倾。其中,神经质表示个体隋绪稳定性的一种人格特质,内外倾表示个体情绪乐观与悲观等外在表现。然后,根据不同类型的个人特贯将随情感动态变化的情境要素存储在情境知识库中,并在每次分析学习者当前情感状态时,动态更新情绪知识库中相应的情境要素,以确保数据的完整性。最后,在情感归因分析与推荐机制设计过程中,将已构建的情境知识库作为重要依据用于归因分析与推荐柳制设计。

3.基于LSTM的情感分析过程及其算法设计

为了具体实现面向学习推荐的情感分析,须依托学习空间内的学习行为,正如前文所述,其最直接的基础即是学习行为的过程记录,本文拟基于LSIM的学习者隋感分析模型进行过程记录分析。具体思想如下:首先收集学习云空间中学习者交互或评论文本以及web学习日志,进行数据预处理后得到情感特征向量;然后将其输入到LSIM神经网络,并利用saftmax分类器对输出的特征进行情感分类;最终得到学习者的情感类别标签。以下是基于LSTM的情感分析算法设计。

4.学习情感的归因机制

上述基于LSTM的情感分析模型已可以较好的获知学习者在学习交互过程中的真实情感状况,若能借此找出导致学习者情感状况的原因,将有效实现为学习者针对性的学习服务与指导推荐。因此,面向学习情感的归因分析成为本研究下一个必然。但LSTM本身为黑盒模型,且输人为整体交互文本数据,以其自身难以实现情感的归因,而贝叶斯网络与多元回归分析能够描述多个变量间因果关系,在已知结果的情况下可有效实现原因的挖掘。因此,本文采用了基于贝叶斯网络的建模方法,根据已构建的情境知识库找出影响学习者情感的各个因素,然后通过多元回归分析实现各因素的影响度判别,其归因机制的详细阐述如下。

(1)情感状态相关因素选择

考虑云空间中学习者的情感构成必然是由多个情境要素引起,根据系统与实际情况的调研,本研究选取了在学习云空间环境中影响学习情感表达的因素,定义符号为相关性运算符。相关计算公式如公式(2)所示。

其中,PpTp、Wp、Lp、Rp、Ep分别指学习者的个人特质、学习主题、学习方式、知识水平、学习效果、学习期望值,指学习者的情感状态,学习者的个人特质一般是稳定不变的,故采取Pp表示。a、β、y、μ、0、o分别代表个人特质、学习主题、学习方式、知识水平、学习效果、学习期望值各自的权重。下文将针对以上因素进行贝叶斯网络与多元回归分析,以此确定上述指标的因果联系及其影响程度。

(2)数据量化

在确定了可能的影响因素后,情感归因分析接着要解决的问题就是能够正确量化表示空间交互文本数据,以便后续贝叶斯网络与多元回归的计算。为了研究的方便与操作的可行性,对情感归因分析中涉及到的变量依次进行如下的概述与量化。

依据前文中提及的艾森克的人格特质理论,根据文獻研究结论,从人格特质对学习判断的影响程度,由低到高从“高神经质内倾”“低神经质内倾”“高神经质外倾”“低神经质外倾”四个层次构建人格特质编码模型Pp={P1,P2,P3,P4}={1,2,3,4}。

利用TF-IDF方法提取历史学习主题特征词,将学习主题进行聚类分析形成主题集合,并将各聚类主题与最终主题进行相似性匹配,按相似度从低到高进行编码建模。此外,为便于计算表达并考虑实际情况,本研究将主题个数n限制在100以内,以此形成学习主题量化表达Tp={T1T2,…Tn}={1,2,…n}n∈(0,100]。

(一)基于学习者情感分析模型的学习推荐机制

在获得学习者的情感及其影响因素后,针对学习者当前的情感状态并根据其自身个体以及周边群体情境,为其提供适合的学习推荐成为进一步的研究重点。因此,本文按照学习者在云空间中情感变化及其后续应有的举措,设计了如圖4所示的情感归因支持下的个性化学习推荐机制。

1.学习者情感分析模块

在基于情感的学习推荐中,情感分析是一个必不可少的环节,该模块首先采集学习云空间中与学习者交互行为有关的情感数据,并进行分词处理、词性标注等预处理步骤。然后提取其中包含的情感特征词,构建在线学习领域的情感词典。同时,利用数据库技术建立随情感动态变化的学习情境知识库。最后利用具有时序性特征的LSTM情感分析模型,动态获取学习者在不同时间内的情感状态,即积极情感、中性情感、消极情感。

2.学习过程监控模块

学习过程监控模块通过实时监控学习云空间的学习行为数据,根据已聚类的四种学习者个体特质,提取与学习者情感密切相关的学习情境要素,如学习主题、学习方式、知识水平、学习效果、学习期望值等,分类将其归档在已构建的学习情境知识库中。在此过程中,每分析一次学习者当前的情感状态,需在情境知识库对应更新,以便于获取学习者最新的学习情境信息,提高对学习者学习过程监控的精确性,为推荐合适的学习策略提供更有效的保障。

3.情感归因模块

结合以上两个模块获得的学习者的情感状态以及相应的情境要素,输入情感归因模块进行归因分析。首先量化表征获取到的情感以及情境数据,然后通过基本的三层贝叶斯网络结构发现学习者情感与各学习情境间的因果关系,最终基于多元回归分析获取各变量的因果关系影响程度,以此找出最重要的影响因素。情感归因的结果将为下一模块中对学习者进行个性化的学习推荐提供指导依据。

4.学习推荐模块

在获取影响学习者情感的归因结果后,结合该学习者的当前学习状况以及与之相关的其他学习者的相似情境,设计相应的学习推荐机制,即在学习云空间中学习推荐策略的具体实施过程中,根据学习者的情感状态及时调整情境知识库,为之提供符合其情感需求的学习情境。通过文献与实际应用情境调研,各类学习推荐服务将以学习者当前的不同情感状态作为触发条件,针对对应的各学习情境要素进行推荐,具体如表1所示。

(二)情感驱动下学习云空间中的学习推荐策略

1.基于学习者个人特质的学习同伴推荐策略

基于网络的在线学习是一种以学习主题为纽带、以学习者之间的交流协作为主的学习形式,学习同伴在学习交互活动中扮演着重要角色。良好的学习同伴会对彼此产生积极的相互依赖关系。为促进在线学习者学习效果达到最优化,本文提出基于学习者个人特质的学习同伴推荐策略。学习者的个人特质是自身独有的,一般是稳定不变的,并无任何好坏之分,但是会影响在线学习者的情感状态。当学习者处于消极情感状态,其本身属于低神经质内倾的个人特质时,需为其推荐高神经质外倾特质的学习同伴,促进其产生积极情感的能动效应,共同协作完成当前的学习任务;而当学习者本身属于高神经质内倾的个人特质时,需为其推荐低神经质外倾的学习同伴,引导其隋感处于稳定适中的状态,使其聚焦于当前的学习主题快速达成学习目标。

2.目标优先驱动下基于学习主题变更的学习推荐策略

学习主题贯穿于在线学习的全过程,是学习者进行交流的载体,也是与学习者情感发生直接关联的重要因素之一。基于学习者当前的学习目标,根据其认知负荷提出目标优先驱动下基于学习主题变更的学习推荐策略。

学习者处于浅层学习的阶段,将面临基础性的学习需求与低阶的学习目标。由于学习者存在接受与内化知识的差异性,并不是所有学习者都可以达成低阶学习目标。若学习者当前的情感状态为消极,可知当前学习主题所需的知识储备已超出学习者自身的认知负荷。为调动其积极情感,需根据已构建的情境知识库为其推荐符合其认知负荷的相似学习主题,引导其达成低阶学习目标;反之,若学习者情感为积极,说明学习者已达成目标,为满足其深度学习的需求,为其推荐学习目标相对较高的相似学习主题,引导其向深度学习过渡;若学习者情感状态为中性,为其推荐能够转变其情感状态的相似学习主题,直至学习者完成当前学习目标。学习主题相似性计算公式如公式(3)所示。

其中,Ti、Tj代表学习主题i.j,sim(Ti,Tj)代表学习主题i与j之间的相似性,当Sim(Ti,Tj)>0时,即可认为这两个学习主题相似,最终将排名靠前的Top-N个学习主题推荐给学习者。

3.面向学习期望值基于脚手架引导的逐步学习推荐策略

学习期望指学习者对成功完成某项学习任务可能性的估计。当学习期望值与目标高度一致时,即可激发学习者的学习诉求,维持相对稳定的积极情感,并形成可持续的学习动力;当学习期望值过高或过低时,都会导致学习者难以完成目标而产生消极情感。因此,本文根据最近发展区理论提出面向学习期望值基于脚手架引导的逐步学习推荐策略。

通过借鉴张丽霞等人的研究,基于加涅九段教学事件,将在线自主学习概括为指引方向、提供任务、创设情境、提供资源、促进学习发生、引导学习评价六个过程。并将其作为基本框架设置各阶段的脚手架,依次为方向型、任务型、情境型、资源型、交互与协作型、评价型等。按照维果斯基提出的“最近发展区”理论,在学习者现有水平基础上,通过学习者在不同阶段所面临的具体学习境况,分析其最近发展区并搭建适宜的脚手架,为其推荐基于脚手架引导的逐步学习策略,便于引导学习者进行递进式的小步子学习,逐步跨越最近发展区,以达到预期的学习期望值。同时,脚手架的搭建帮助培养学习者可持续自主学习的能力,使学习者在脚手架移除之后能够进行自我引导的学习,并形成长效的激励性学习动机机制。

三、学习云空间中学习推荐系统的实现与应用效果分析

(一)系统实现

基于以上的分析和设计,本文基于已建立的iStudv学习云平台实现了基于隋感状态的学习推荐功能系统,其实现的学习者情感呈现界面与学习推荐界面如图5和图6所示。图5显示了学习者当前的学习目标达成程度与情感状态,通过学习仪表盘呈现当前达成的学习目标百分比,并通过星级呈现目标达成度。学习者的情感状态通过柱状图呈现,外圆显示情绪,内圆显示对应的情感状态。图6为学习推荐界面,显示学习者当前的学习指数、情感状态等。系统根据学习者的学习状态,为其推荐学习主题、学习同伴等,按照推荐星级排名,排在靠前的位置星级越高,越符合学习者当前的学习需求。

(二)应用效果分析

为检验此基于隋感分析的学习推荐功能系统的应用效果与推荐机制的有效性,我们设计并实施了一系列实验。选取“数据结构”课程中《栈的定义》这一学习主题,以某大学某学院同年级的64名学生作为研究对象,将其随机分为A、B两个小组,A组学生使用带有学习推荐机制的学习云空间,B组学生使用不提供学习推荐机制的学习云空间。

首先通过问卷调查的方式调查了A组学生在认知、情感、行为三个维度对该学习推荐功能系统的应用效果,实际发放调查问卷32份,回收32份,有效回收率为100%。具体调查结果如表2所示。从认知维度看,大部分学习者认为该学习推荐系统能够促进自身进行主动学习,并对知识进行深层次的加工,引导其进行反思与评价活动等;从情感维度看,大部分学习者认为该系统可以促进學习交互过程中情感的交流,并改善其消极的情感状态,以提供满足其情感需求的学习支持服务;从行为维度看,大部分学习者认为该系统能够提高在线学习效果,并促进学习交互过程中的交流互动。从以上分析可知,该系统在认知、情感、行为三方面得到了大部分学习者的较高认可。

为了检验基于学习者情感分析模型的学习推荐机制能否有效促进学习效果,利用独立样本T检验方法(置信水平为0.05)在SPSS中统计分析A、B两组中的学习时间、学习成绩是否存在显著性差异,如表3所示。

从表中统计数据可以看出,学习时间的p值0.009<0.05,说明在0.05显著性水平上A组与B组学生的学习时间是有显著性差异,从数值上A组学生所用学习时间要少于B组学生(即80.24<86.48),可知,此学习推荐系统能够帮助学习者减少学习时间;由学习成绩统计分析,t值为1.253,P值为0.003<0.05,可以看出两组学生的成绩存在显著差异,说明此学习推荐系统能够有效地帮助学生提高学习成绩,改善学习效果。

四、结束语

随着网络技术的新发展,在线学习迎来了欣欣向荣的发展春天,然而不管何种在线学习平台,它们都必需面对和克服一种重要挑战——学习中的“情感缺失”,因此,当前的在线学习研究中,学习者情感问题研究显得尤其重要。着眼服务于良好的自主知识建构,本文针对学习云空间的学习情境现状,利用大数据等技术完成了学习者情感分析与归因,并基于已有的iStudy学习云平台实现了一个情感状态支持下的学习推荐功能系统。本文首先选用适宜时序数据处理的LSTM神经网络技术,建立学习者情感分析模型并完成情感获取,然后利用贝叶斯网络因果分析法对影响学习者情感状态的情境要素进行归因分析,以找出影响情感的关键情境要素,进而提出情感适应性的学习推荐机制与策略,并实现了相关学习推荐功能。最后,本研究设计了一系列的实验,分别从学习时间与学习成绩两方面验证推荐的有效性。实验结果表明,该情感处理方法及其支持下的推荐系统能够提高学习者的学习效果。目前,本研究还存在一定的不足,主要表现在两个方面:学习者情感维度关注的单一性与情感归因结果的精准量化问题,后续将对这两方面进行深入研究。