APP下载

教师在线学习社区中会话主题发现及演化分析*

2021-04-06张夷楠叶海智

远程教育杂志 2021年2期
关键词:参训帖子聚类

张 瑾 张夷楠 叶海智 朱 珂 张 思

(1.河南师范大学 教育学部,河南新乡 453007;2.华中师范大学 教育信息技术学院,湖北武汉 430079)

一、引言

教师教育是教育事业的工作母机。随着我国教育规模的不断扩大,学校、社会对于教师素质的要求也日益提高。2018年,国务院印发的《关于全面深化新时代教师队伍建设改革的意见》明确指出,要大力振兴教师教育,不断提升教师专业素质能力[1]。优化教师队伍结构,构建规模更大、效果更好的教师培训质量保障体系势在必行。当下,互联网的高速发展及应用,使在线学习社区已然成为学习的重要途径,学习形式变得多样化,支持人人皆学、处处能学、时时可学[2]。为了打破教师与教师之间交流的时空界限、扩大学习的规模,针对教师培训的在线学习社区被迅速搭建起来[3]。在线学习社区是指用于支持、促进、激发或增强学习和教学的“线上场所”[4]。在学习社区中,教师主要通过共同协作完成任务、讨论实际教学中出现的问题等方式,交换观点、促进反思,从而从多个角度思考教学问题,并使其更加细化。当前,在线学习社区研修模式研究尚处于起步阶段,如何通过技术手段为教师在线学习提供学习状态预测、学习激励等支持,仍有待深入研究和规范[5]。

教师在合作研讨过程中会产生大量的交互数据,主要以文本的形式呈现,对这些数据进行观察分析,能够快速了解教师在研修中的学习体验、学习关注点、学习态度等信息。通过对教师交互数据进行主题挖掘,有助于追踪教师的关注点,从而调整和干预研修计划[6]。主题模型作为篇章级别的文本语义理解工具,其理念是能够从一组文本数据中,抽取出若干组关键词来表达文章的中心思想。主题模型目前广泛应用于文章检索、产品推荐、词向量训练等相关研究中。

国内外研究者已为主题模型建立较为完整的体系架构,常用的主题建模方法有:VSM(Vector Space Model)、PLSA(Probabilistic Latent Semantic Analysis)以及LDA(Latent Dirichlet Allocation)主题模型[7]。其中,LDA 算法被视为最经典的主题模型之一,且常被作为各类改进模型的基准方法。然而,LDA 并不能解决所有的主题分类问题,传统LDA 主题模型主要适用于长篇章级别的文本,当遇到数据矩阵更加稀疏的短文本时,无法有效地提取主题信息。黄佳佳等[8]认为,LDA 主题模型在应用于短文本分类时,由于文档的平均长度较短,难以实现最佳的聚类效果。

鉴于现有研究的不足,本研究利用Word2Vec词向量模型结合K-means 聚类的方法,对教师在线学习社区中某教师工作坊的学习者讨论话题进行主题分类,并按照时间顺序,构建了学习者话题演化模型,从而为主题模型在教师在线学习社区中高质量地预测参训教师的关注点,提供数据分析依据。

二、文献研究

(一)教师在线学习社区中的会话活动及特征

会话是一种交互性的合作活动,会话参与者不仅要保证自身话语有较高质量、有足够数量、与主题有关联性,更要保证话语方式契合会话主题。一次完整的会话不只是独立句子的简单累积,还需具有连贯的层次结构。教师在学习社区中进行的在线讨论,能够有效促进其个人反思和集体反思,被认为是教师在线学习的重要驱动力[9];同时,由在线讨论产生的文本数据,也被认为是评定学习者投入程度的重要指标[10]。

随着信息技术的发展,许多基于社交媒体工具、在线学习平台的教师在线学习社区,为教师提供了新的学习交流场景。在线学习社区汇聚了具有共同学习目标、专业发展愿景的职前或在职教师,学习社区提供优质的视频教学案例、在线论坛等学习资源,为在职教师参与非正式、及时的专业培训增添了新的途径[11]。为了督促教师积极参与课程学习、及时反思,学习社区的管理者会在研修的不同阶段,开展灵活多样的讨论活动,如,课前议课、课中研讨、同伴互评、课后点评、反思研讨等。教师们在不同学习阶段围绕不同的“高教学价值问题”展开在线讨论,通过交换观点、相互评价来拓展思路,细化教学问题。

教师们讨论的内容主要为:分享对某个会话主题的看法或学习感悟,共同探讨与学习内容相关的概念及含义,对课程内容或学习平台提出改进建议。教师在线会话的形式可以分为:自发的评论和回复、有组织的坊内和坊间讨论。教师在线会话是指教师有组织或自发的、在兴趣或学习任务的驱动下,与其他教师或教师管理者共同探讨、解决教学问题的一种合作活动,具有显著的交互性。这种交互活动既能够促进教师对知识概念的深入理解,又能够帮助教师建立友谊、维护良好的学习关系[12]。

(二)主题模型及相关研究

在自然语言处理领域,主题模型是针对文本中的隐含语义结构进行聚类的统计模型。在主题模型中,经典LDA模型是一种基于三层贝叶斯的文档主题生成模型,即每篇文章中的每个词都是以一定概率选择了某个主题,并从这个主题以一定概率选择了某个词语。LDA 被认为是目前处理长文本最有效的方法。刘三女牙等[13]针对MOOC 课程中的学习者评论,利用LDA模型实现评论文本的自动建模,并追踪热点话题演化的趋势。何皓怡等[14]基于LDA 主题模型,在教师工作坊中,抽取教师在研修过程中产生的交互式文本,并结合TPACK模型,对教师在研修的不同阶段的关注点进行研究,结果指出:教师工作坊应注重学习者之间的交流,实时监测研修活动状态并提供针对性指导,主动跟踪学习者话题热度,促进学习者反思。谭春辉等[15]为获取国内外数据挖掘领域的研究热点,利用LDA 主题模型,将1998年—2018年数据挖掘领域出现两篇以上的文章进行主题建模,发现了国外研究的主题热度分布均匀,而国内研究分布差异化明显这一数据特点。刘江华[16]为了解决LDA模型在数据处于非常态分布状态且数量较小时,导致的计算正确率较低的问题,将Kmeans 聚类算法融入到主题模型检索中,并通过实验结果分析得出,主题模型在耗时和准确率上有所提升,检验了K-means 在处理短文本时的有效性。

随着深度学习研究的推进,我们可以基于米科洛夫(Mikolov T.)等[17]提出的Skip-gram模型,以及CBOW模型生成的Word2Vec 词向量工具,根据给定的语料,通过训练模型将一个词语表达成向量形式。通过该方法可以用向量表示词语之间的关系,且在Word2Vec 词向量空间中,充分考虑了词语的上下文顺序。这一技术,为自然语言处理领域打开了新的技术突破口。

(三)话题演化及相关研究

在教师在线学习社区中,学习者之间的交互主要以论坛讨论的形式进行[18]。随着学习的不断深入,教师讨论的内容也会随之变化[19]。分析教师话题演化规律、探究教师关注点变化,有利于对教师话题进行精准预测,进一步调整研修计划。刘智等[20]基于学习者学习兴趣的时序性及其与积极情感的伴随性特点,提出了“情感—主题”时序模型,以挖掘学习者兴趣主题及其演化趋势;他们通过分析学习者兴趣主题的演化趋势与学习者在不同时期的学习效果,说明了学习者的学习效果会随着学习者兴趣主题的变化而变化的规律。

安璐[21]等将深度学习思想引入微博舆情的主题分析中,基于Word2Vec模型结合K-means 聚类方法,对舆情演化进行了融合情感特征的主题演化研究,针对2016年“寨卡病毒”事件,将舆情趋势划分为起始阶段、爆发阶段、第一次衰退阶段、第二次增长阶段、第二次衰退阶段、平息阶段六个阶段;把微博发帖用户的情感分为 “乐”“衰”“怒”“惊”“惧”五种,并分析出了微博用户在不同阶段不同主题中的情绪变化情况,提供了舆情预测新方法。彭晛等[22]基于高校SPOC 论坛中的话题数据,构建了基于确定性时间信息的DTI-LDA模型,分析了SPOC 论坛中学习者的话题强度演化趋势以及内容演化趋势,为在线学习干预机制提供了新的技术支持方法。张佩瑶[23]等利用Word2Vec 词向量,结合BTM 主题模型,构建了基于时序的互联网话题焦点模型。

三、研究设计

(一)研究问题

参与研修的教师作为一个会话群体,教师个体之间的交流互动具有规律性,讨论的话题内容具有连贯性。教师在学习社区中以会话的形式针对某个话题进行讨论,会话产生的文本数据蕴含着丰富的潜在主题信息,这些数据为研究学习者的会话焦点及其话题演化趋势提供了条件。本研究分析的问题如下:(1)在线学习社区中,教师会话主题有何演化趋势? (2)在线学习社区中,教师会话主题能否反映教师的学习状态?(3)社区中积极参与会话讨论的教师,能否影响其他教师的话题关注点?

根据以上研究问题,我们针对教师在线学习社区中的话题帖子,进行数据分析,抽取其中的关键词,再基于关键词进行主题建模。最后,基于时序生成话题演化与参训教师交互网络图,探寻学习者之间交互与会话主题的时序演化趋势。

(二)研究方法

从问题出发,我们将研究分为三个部分:第一部分,使用爬虫技术采集教师在线学习社区中的帖子,针对收集到的帖子进行文本预处理工作,将这些帖子数据制作成可以满足实验需要的语料集;第二部分,使用TF-IDF 加权方法抽取数据集中的关键词,随后采用Word2Vec 词向量技术对关键词进行主题建模,采用K-means 方法将属于同一类别的关键词进行聚类,再从得到的最终聚类结果中,挖掘社区讨论中的主题信息;第三部分,结合本次研修主题,对教师会话的主题进行聚类,根据时间顺序生成教师会话主题演化趋势图,并划分话题演化阶段。整体研究框架如图1所示。

(三)数据来源及数据处理

1.数据来源

本研究利用数据爬虫的方法,获取国内某在线课程平台中“信息技术与中小学数学课堂” 课程自2019年10月至2020年5月期间参训教师发表的话题帖子,通过初步筛选整理,共计2342条帖子作为研究的原始数据,且全部以中文文本的形式呈现。该社区累积有294名教师参与学习,多为中小学一线教师。通过观察原始数据可以发现,参训教师发布帖子的目的,主要是交流学习体验、记录学习经历、分享学习感悟。

2.数据处理

本研究收集到的数据,是由词组、短语共同构成的、能够表达特定含义的文本数据[24]。为了使后续研究的开展更加顺利,我们需要针对这些数据进行文本预处理工作[25]。文本预处理的首要任务是通过筛选数据集,删除重复数据,以避免后续工作中出现重复数据导致词语权重受到影响;次要任务是剔除拼写错误、表述模糊的数据,避免错误的词语拼写影响模型质量。

经过文本预处理之后保留的数据共计2322条。随后使用Python 中的“jieba”中文分词工具,对收集到的话题帖子进行词语切分处理,例如:将“信息技术改变了教学方式” 切分为“信息技术”“改变”“教学”“方式”。

(四)构建主题模型

1.TF-IDF关键词

为提高模型对主题的呈现能力,本研究采用基于词频统计的TF-IDF 加权方法,选取能够代表文本特征的词汇,词语的重要程度随着它在文档中出现的频次增多而减少,同时也随着它在整个语料集中出现的频率降低而增加。基于词频统计的TFIDF 算法在查准率、查全率等指标方面的表现均比传统TF-IDF 算法良好,能有效降低关键词提取所耗时间[26]。本研究将数据以词频为基础,进行TF-IDF权值计算,不断调整参数以求得语料集中权重较高的关键词。为了确定关键词总数保留多少时,话题间的分离度最高、话题内部质量最好,我们分别将关键词计算结果,保留为关键词总数的4/5、2/3、1/2,保留情况如表1所示;把每一组结果按照TF-IDF 权值,从高到低排列之后,通过观察数据发现,在保留关键词总数的2/3 时,关键词的表达效果最佳;最后,将这些关键词整合为新的语料集。

表1 TF-IDF关键词保留情况

2.Word2Vec 向量化

Word2Vec是一种基于深度学习思想,利用浅层神经网络语言模型,将文本转化为向量以进行模型训练的方法[27]。模型通过独热(One-hot Representation)编码方式,将词语以“0”“1”矩阵的形式表现出来,即将每个词语映射到N 维向量空间中,并使用“0”“1”来表示词语的空间位置[28]。本研究采用的Word2Vec模型相较于传统主题模型的优势在于:词向量技术充分考虑了目标词语与“前词”“后词”之间的联系,使其能将计算机无法理解的自然语言符号转换为能够被计算机识别的特定向量,从而有效解决短文本主题难以提取的问题。Word2Vec 不仅解决了传统向量空间模型的“维度灾难”问题,还兼顾了词语之间的语义联系[29]。

Word2Vec中包含两种常用的模型:CBOW模型和Skip-gram模型。CBOW模型是将目标词的上下文作为输入来预测目标词,而Skip-gram模型是通过输入目标词来预测上下文,因此,Skip-gram模型对于出现频次低,但是重要程度高的词语,有更好的预测能力。Skip-gram模型假设给定的词序列D={w1,w2,……,wM}和词汇的上下文c,目标词wi的上下文是从大小为k的窗口中选取的词汇wi+c,并根据上下文预测wi。Skip-gram的任务是将整个词序列最大化,如公式(1)所示:

其中,p (wi+c│wi)=softmax(wi+c·wi),wi、wi+c是目标词wi及上下文词汇wi+c的词向量。

通过使用Python 编程语言,我们在Pycharm 平台上调用Word2Vec 词向量工具包,使用Skip-gram模型,将语料集中的每一条数据进行训练,并转换成维度为150的词向量[30]。

3.K-means 聚类话题

K-means是典型的迭代求解的聚类算法。Kmeans 在执行聚类操作之前,首先将数据分成N 组,每一组都含有一个聚类中心。随后,计算每一个对象与各个聚类中心之间的距离,并将对象传递至距离最近的聚类中心以形成簇类。每当有新对象加入分组,都会根据现有聚类对象的特征重新选定聚类中心。最后,聚类计算在所有对象都进入分组后终止[31]。

SSE 和平均轮廓系数是选择最佳聚类数目的主要指标[32]。为了确定语料集的最佳聚类数目,本研究利用簇类误方差SSE(Sum of The Squared Errors)[33],来确定最佳聚类K值的不断增加会导致SSE的变化。当K值低于真实聚类数时,K值的增大会增加每个簇的聚合程度,因此,SSE 会呈现出大幅下降的趋势;而当K值接近真实聚类数时,增加K值所得到的聚合程度会迅速变小,因此,SSE的下降幅度骤减,然后随着K值的继续增加而趋于平缓。因此SSE和K值的关系图近似一个手肘的形状,“肘部” 即为最佳K值区间。经过计算得出:当K(簇数)值为20时,聚类效果最好。因此,本研究指定使用的模型生成主题数量为20个。

为检验该模型性能,我们通过计算召回率、准确度及F1值(具体数值如表2所示),发现本研究所采用的主题建模方法性能优于LDA模型。

表2 模型质量评价

4.话题演化

基于学习过程的话题演化分析,可快速追踪学习活动的进展情况,为实现针对性指导提供数据支持服务[34]。本研究对学习社区中参训教师每月发帖总数进行统计,并绘制折线图。如图2所示,参训教师讨论帖子的数量变化趋势呈现“双峰”状:2019年10月研修刚刚开始,参与话题讨论的教师发帖数量较少,共计69条;随着课程的深入开展,参训教师在2019年11月、12月分别发帖635条、422条,在图中呈现出“高峰”;随后在2020年1月、2月,参训教师分别发帖36条、32条,数量较少,因此出现“低谷”;2020年3月,参训教师发帖数量共计506条,2020年4月,参训教师发帖数量共计606条,再次出现“高峰”;2020年5月,课程接近尾声,参训教师发帖数量仅有16条,再次出现“低谷”。

本研究根据数据变化趋势,将参训教师发帖数量变化情况划分为四个阶段,分别是:第一次上升阶段(2019年10月—2019年11月)、第一次下降阶段(2019年12月—2020年1月)、第二次上升阶段(2020年2月—3月)、第二次下降阶段 (2020年4月—5月),具体如图2所示。

四、研究结果与分析

(一)TF-IDF关键词分析

本研究为探究参训教师会话关键词的变化情况,通过TF-IDF关键词抽取的方法,依据数据的四个变化阶段,分别将四个阶段中权值排前五的关键词抽取出来进行观察,如表3所示。

由关键词的变化可以发现:在第一次上升阶段呈现的“信息技术”“两面性”“双刃剑”等关键词,反映了该阶段参训教师对信息技术存有质疑;在第一次下降阶段呈现的“中学数学”“教学质量”“辅助教学”等关键词,反映了该阶段参训教师对于中学教学与学生的关注;在第二次上升阶段,“PowerPoint”“动画”“flash” 等关键词反映了该阶段参训教师对于信息化教学工具的关注;在第二次下降阶段,“一目了然”“一举多得”“最优解” 等关键词反映了该阶段参训教师对于信息化教学的正面评价。

表3 TF-IDF关键词表

(二)主题聚类结果分析

本研究通过Word2Vec+K-means 方法生成主题聚类结果,为了对参训教师关注的主题有更高效的观测和认识,根据聚类结果的分离程度,将20组主题聚类结果整合为六类;为了便于分析会话主题的演化趋势,将语料集中的帖子进行相应的主题标注,部分具有典型性的主题聚类结果,如表4所示。

表4 部分典型性主题聚类结果

结合本次工作坊的学习主题以及原始数据帖子分析表4数据,可以看出:

“主题1” 中出现的“中小学”“学习者”“思维”“数学”“多角度”等词汇,反映了教师对于信息技术与中小学学习者的数学思维的关系、信息技术与学生学习效果的关系的讨论,因此,将该主题确定为“信息技术与学生”。在原始数据中,如“多媒体教学激发了学生的学习兴趣和潜能的发挥,使课堂教学从一开始就确立了学生的主体地位,让学生带着浓厚兴趣主动地接受了知识的引入”之类帖子,也印证了这一主题分类。在该主题下,参训教师认为,在信息技术支持下的教学,更能激发学生的学习兴趣,能够为教学效果提供高质量的保障。

“主题2”中出现的“多媒体教学”“几何”“公式”“具体化”等词汇,反映了教师对于多媒体教学与数学教学关系的讨论,因此,将该主题确定为“信息技术与数学”。在原始数据中,如“多媒体对几何的教学特别有效,能够把抽象的事物比较直观的展现给学生;对于数学教学能够节省书写时间”之类帖子也印证了这一主题分类。在该主题下,参训教师认为,信息技术能够将抽象的数学概念直观具体地表现出来,且能让学生更深层次地理解数学公式与规则。

“主题3” 中出现的“恰当”“华而不实”“分散”“多媒体”“效率”等词汇,旨在讨论信息技术在教育教学中发挥的作用以及信息技术应用于教学的利弊,因此,将该主题确定为“评价信息技术”。在原始数据中,如“华而不实的课件不但不能优化课堂教学,还会令学生分散注意力”“信息技术大大提高课堂效率,有利于帮助学生进行探索和发现”等帖子,也印证了这一主题分类。在该主题下,参训教师讨论与信息技术相关的内容,且教师对信息化教学褒贬不一。

“主题4” 中出现的“传统”“传承”“手段”“取代”等词汇,反映了教师对于信息化教学与传统教学之间差异的讨论,因此,将该主题确定为“信息化教学与传统教学”。在原始数据中,如“在九年级抛物线上的动点问题教学时,用传统教学手段的话,由于以静态为主,很难在黑板上将这种复杂的现象展示出来,更不用说借助情境来分析。信息技术使抽象的动点问题很形象直观地呈现出来,学生很容易地接受知识,提高了学生的学习积极性等”,这类帖子也印证了该主题分类。在这一主题下,教师讨论了信息技术支持下的教学与传统教学之间的差别。

“主题5” 中出现的“教师”“信息技术”“利用”“分析”等词汇,旨在突出信息技术与教师之间的关系,因此,将该主题确定为“信息技术与教师”。在原始数据中,如“课堂上有了信息技术的加入,教师教学方式也多种多样了”“教师掌握和运用多媒体技术,一方面提高本身素质,另一方面可以拓宽学生的思维想象能力和知识面”等帖子,证实了该主题分类的合理性。在这一主题下的帖子,普遍反映了“教师要顺应信息化教学的时代变革,努力培养自身信息化能力”等观念。

“主题6” 中出现的“充分利用”“创设”“分解”“教学内容” 等词汇,旨在讨论信息技术与教学过程、教学情景、教学任务之间的关系,因此,将该主题确定为“信息技术与教学”。在原始数据中,如“在教学中,若能充分利用信息技术这一优点,变抽象为直观,变静为动,通过向学生展示教学情境,有效地完成教学任务”等帖子,表达了参训教师认可信息技术对于教学的辅助作用,证实了该主题分类的合理性。

综上所述,该教师在线学习社区的在线讨论主要包括“信息技术与学生”“信息技术与数学”“评价信息技术”“信息化教学与传统教学”“信息技术与教师”“信息技术与教学”六个主题。

(三)话题演化结果分析

我们通过对整个学习期间的各类帖子数量进行统计得出:信息技术与教学—602条(约占25.93%),评价信息技术—508条(约占21.88%),信息技术与学生—514条(约占22.13%),信息技术与数学—268条(约占11.54%),信息技术与教师—226条(约占9.73%),信息化教学与传统教学—204条 (约占8.79%)。为了探究会话参与者与讨论主题导向之间的关系、教师关注的话题变化与学习进度之间的关系,本研究基于时序,将四个阶段中参训教师讨论的帖子数据,制作成话题网络图。

如网络定义图(图3)所示,图中节点代表参训教师,节点大小反映参训教师发帖数量,节点越大代表参训教师的发帖数量越多。箭头连线代表话题交互的导向方向,对应的编号分别代表不同的主题类别:编号1 对应“信息技术与学生”、编号2 对应“信息技术与数学”、编号3 对应 “信息技术与教学”、编号4 对应“信息技术与教师”、编号5 对应“信息化教学与传统教学”、编号6 对应 “评价信息技术”。为了判断教师之间话题导向性的强弱,本研究逐一计算了每一条数据与后一条数据的文本相似度,并依据文本相似度赋予连线权重。节点之间的话题连线越粗,说明帖子之间的话题相似度越高,也说明上一个发布帖子的参训教师对下一个参训教师的影响性越强。

(1)学习初期——第一次上升阶段的交互情况如图4所示。可以看出,本阶段网络图表现出最显著的特征是:主题分布较为均衡,交互线条稠密但普遍较细,大节点数量多且交互线条多指向大节点。由“评价信息技术”主题产生的交互最多,说明参训教师在本阶段围绕 “评价信息技术” 主题的讨论更热烈、交互频率更高。在本阶段“评价信息技术”原始数据中,如“信息技术是一把双刃剑,用的好效果也并不明显,用不好就毁了课堂了”“多媒体技术能实现课堂的增容,让课堂变得高效”等帖子,反映了参训教师在这一主题下对信息技术应用于教学褒贬不一的态度。观察节点可以发现,T92、T208、T104、T115、T72 等参训教师在本阶段拥有的交互线条数量最多且线条较粗,说明这五名参训教师在本阶段参与的交互最频繁且话题主导性强,这也表明他们是本阶段讨论交互的主要参与者,由他们产生的讨论主题更多倾向于“评价信息技术”。

(2)学习中期——第一次下降阶段的交互情况如图5所示。可以看出,在这一阶段参训教师讨论交互的热烈程度远低于上一阶段,呈现出线条稀疏、节点数量少的特点。对比上一阶段,本阶段参与讨论的参训教师数量降低,参训教师之间的交流互动减少。参训教师的讨论主要围绕 “信息技术与教学”“信息技术与学生”两个主题,其他主题的分布也较为均匀,而“评价信息技术”主题的帖子数量大幅减少。原始数据中如“数学课程与信息技术的整合,是数学教学改革中的一种新型教学手段,不仅丰富了教学内容,也活跃了课堂气氛,还提高学生的学习兴趣,调动学生求知的自觉性和积极性”等帖子,表明参训教师逐渐意识到本次学习的意义,正在进入学习状态,开始接受学习任务的引导,并将学习的主要关注点从评价对信息技术教学的看法,转移至信息技术和教与学之间的关系。观察节点可以发现,T92、T154、T215、T234 等参训教师为本阶段讨论的主要参与者。相较上一阶段,本阶段主要参与者拥有的交互线条数量有所减少,主要参与者倾向讨论的主题为“信息技术与教学”与“信息技术与学生”。

(3)学习中期——第二次上升阶段的交互情况如图6所示。可以看出,本阶段交互图表现出节点普遍较大、线条稠密且粗线条较多的特点。这说明本阶段学习者参与讨论的积极性普遍较高,且话题之间的相互影响作用较强。这一阶段讨论话题,主要围绕“评价信息技术”“信息技术与教学”“信息技术与学生”三个主题展开。原始数据中如“借助多媒体的演示,能把知识直观地显示出来,有助于学生的理解,促进学生的‘建构’”等帖子,反映参训教师对于信息技术与教学有了全新的认识。观察节点可以发现,T11、T55、T261 等参训教师为主要参与者,从交互连线数量看,他们发挥的话题影响作用相较于上一阶段有所提高。本阶段主要参与者倾向讨论的主题主要为“信息技术与教学”与“信息技术与学生”。

(4)学习末期——第二次下降阶段的交互情况如图7所示。可以看出,本阶段交互图呈现出节点数量多、线条稀疏的特点,说明参与讨论的教师数量多,但是参训教师之间的交互较少。本阶段讨论话题主要围绕“信息技术与教学”“评价信息技术”两个主题,由“信息技术与教学”产生的交互最多。原始帖子中如“不学不知道,信息技术真的能把抽象的数学直观化! ”表明参训教师在本阶段已经完全融入到学习中,对信息技术支持下的数学教学有了全新认识。观察节点可以发现,本阶段的主要参与者为T181、T216 等,其中,T216 在“信息技术与教学”主题中起到了较大影响作用。这一阶段主要参与者倾向讨论的主题为“信息技术与教学”与“评价信息技术”。

五、结论与启示

本研究首先利用TF-IDF 加权方法,抽取了教师讨论话语中的关键词,其次利用Word2Vec 词向量技术,对关键词进行训练并转化为词向量,使用K-means 聚类方法对生成的词向量进行聚类,最后针对教师在线学习社区中的讨论内容,进行基于时序的主题演化分析。我们通过对教师讨论的话题进行主题聚类,以交互网络图的形式,展现了参训教师在学习各个阶段中的学习关注点以及交互的变化情况。针对参训教师话题讨论的主题及其变化趋势,围绕研究问题及研究结果,本研究对学习社区管理者预测和干预学习,具有以下启示:

(一)教师会话主题随学习进度推进发生变化

在学习初期,社区的学习活动处于起步阶段,此时参训教师会话帖子,倾向于“评价信息技术”主题。结合会话讨论中如“信息技术是一把双刃剑”“信息技术的应用要为教学服务,计算机也是与黑板一样是一种教学工具,信息技术的应用只是一种教学手段,而不是用来炫耀的新事物”等帖子表达的内容,可以发现,参训教师对于信息技术的教学应用存有质疑。在学习中期,随着学习进度的推进、学习活动的逐步展开,参训教师有计划地按照研修任务进行学习,进一步了解了信息化教学与课堂有效融合的优秀教学成果,使得教师对使用信息技术制作数学教学课件有了全新认识,因此,话题开始转向“信息技术与教学”“信息技术与学生”。在原始数据中,如“老师利用信息技术进行教学,真实感强、立体效果逼真,变化过程真实、全程、全方位、多维度的展现出来”等帖子,说明教师正在深入学习如何使用信息技术制作数学课件。在学习末期,教师重新审视了信息技术对数学课堂的作用,因此,出现了“信息技术与教学”和“评价信息技术”两个话题最为突出的情况。

由此可见,参训教师会话主题的变化情况与学习进度是密不可分的。参训教师会话主题的改变反映出:随着学习深度的增加、学习任务的不断拓展,参训教师的学习状态呈现出由浅层次领会到深层次理解的变化趋势。

因此,建议学习社区的主管教师或管理者,将组织会话讨论活动作为课堂兴趣导入的关键方法。在学习初期布置学习任务、开展课堂学习之前,通过安排合理的话题为后续学习任务做铺垫,激发教师对于学习内容的兴趣,使教师更快地进入学习状态。在学习中期,管理者要注意引导学习相关话题的主题走向,多设置与实际教学问题相关的话题板块,激励教师们围绕话题进行讨论,通过对问题的探讨,进一步促进教师对新知识的理解。在学习末期,管理者应注意及时安排有趣味性的话题讨论,防止教师出现懈怠心理。

(二)教师最关注教学相关的话题

通过分析话题演化结果可以看出,教师对于讨论信息技术与教学、学生之间的关系更感兴趣。例如,在第一次上升阶段,当参训教师的会话中大量出现“评价信息技术”“信息技术与教学”“信息技术与学生”时,网络图变得更复杂,这表明参训教师之间的交互更加密集。由此可见,在教师在线学习社区中,参训教师对于教与学相关的话题讨论更感兴趣。通过观察数据帖子发现,参训教师在“评价信息技术”这一话题下,讨论的内容与本次学习目标的相关性并不高。参训教师在讨论与教学或学生相关的话题时,帖子的内容最能表达教师的学习体验、最具建设性,因此,该类型的话题帖子参考价值最高。

(三)社区会话讨论中的主要参与者至关重要

会话的主要参与者倾向讨论的话题,往往与整个阶段的会话主题相契合,且由主要参与者发起的会话,往往能够得到其他参与者的响应。会话主要参与者的数量越多,教师之间产生的交互越多。因此,建议学习社区管理者在学习早期,尽快发掘会话讨论中具有影响力的教师,并安排他们适时参与会话讨论、担任会话督促者,从而提高整体教师的会话参与度,调动其学习积极性。

(四)对改进教师在线学习社区的启示

教师一般在学习任务的驱动下参与话题讨论,其参与过程具有被动性。而当前在线讨论作为教师学习的重要驱动力,并没有发挥长效的影响作用。主管教师、学习社区管理者应充分利用数据分析手段来预测教师的学习状态,并适时调整学习计划;针对状态不佳的参训教师,恰当地采用启发式语言或“制造认知冲突”的方法,促进教师进行个人反思,激发其分享学习体验的主动性与交互积极性。主管教师、学习社区管理者应密切关注参训教师的讨论内容,注意监控教师的研修状态,利用数据支持服务,实现对参训教师兴趣点的预测和监控;建议在研修全面展开之前,通过对参训教师发布的帖子进行分析,及时修正研修方案,注重围绕参训教师的关注点设计研修任务。

猜你喜欢

参训帖子聚类
一种傅里叶域海量数据高速谱聚类方法
一种改进K-means聚类的近邻传播最大最小距离算法
山东莱西加强公务员试用期培训
改进K均值聚类算法
暴力老妈
基于Spark平台的K-means聚类算法改进及并行化实现
“师太”扛枪
高手是这样拍马屁的
我是怎样在坛子里堕落的