APP下载

基于R-Boson的在线课程评论情感分析模型研究

2024-11-05陈爽陈俊

现代信息科技 2024年16期

摘 要:随着在线教育平台的普及,蕴含丰富情感信息的在线课程评论文本不断涌现,其对于优化在线教育平台和提升教学效果具有重要意义。故构建一种基于R-Boson情感词典的在线课程评论情感分析模型。首先,爬取B站课程评论并运用jieba等技术进行数据预处理;其次,根据评论特点建立教育领域否定词和程度副词词典;最后,使用R-Boson情感分析模型计算评论情感倾向。结果表明,与基础Boson词典相比,添加否定词和程度副词的R-Boson模型性能有所提升,其F1值从93%提升至95%,负向召回率从54%提升至79%,负向精确率从76%提升至87%;同时,模型在递增数据规模下F1值从89%逐渐提升至95%。

关键词:在线课程评论;情感分析;R-Boson;B站

中图分类号:TP391.1 文献标识码:A 文章编号:2096-4706(2024)16-0107-06

Research on Sentiment Analysis Model for Online Course Comments Based on R-Boson

Abstract: With the popularization of online education platforms, online course review texts containing rich emotional information continue to emerge, which is of great significance for optimizing online education platforms and improving teaching effectiveness. Therefore, a sentiment analysis model for online course comments based on R-Boson sentiment dictionary is constructed. Firstly, it crawls course comments from bilibili and uses techniques such as jieba for data preprocessing. Secondly, it establishes a dictionary of negative words and degree adverbs in the field of education based on the characteristics of comments. Finally, it uses the R-Boson sentiment analysis model to calculate the sentiment tendency of comments. The results show that compared with the basic Boson dictionary, the R-Boson model with negative words and degree adverbs improves its performance. Its F1 value increases from 93% to 95%, the negative recall rate increases from 54% to 79%, and the negative accuracy rate increases from 76% to 87%. At the same time, the F1 value of the model gradually increases from 89% to 95% in increasing data size.

Keywords: online course comment; sentiment analysis; R-Boson; bilibili

0 引 言

《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》指出:发挥在线教育优势,完善终身学习体系,建设学习型社会。由此可见,在线教育在推动教育现代化改革方面具有显著作用,未来的教育信息化研究方向将着重探讨在线教育互动机制对教与学过程的影响[1]。此外,基于我国在教育信息化领域的不断推进以及疫情对教育提出的现实挑战,在线教育迅速崛起为一种新的教育形式,大量在线教育平台和网站的使用率持续上升。如慕课、网易公开课等大规模在线开放课程平台和YouTube、bilibili(以下简称B站)等在线视频网站因其丰富的教育视频资源,成为广大网络用户进行学习的重要途径。而B站目前已成为“中国青年最大的原创视频发布平台”,许多在线开放课程被搬运至此[2],其在线课程评论作为学习者互动的关键渠道,具有反映个体对视频课程的情感和评价的功能,蕴含大量极富价值的学习者情感信息[3],深入挖掘评论文本中隐含的情感信息有助于缓解在线教育中存在的师生情感交流不足的问题,从而提升在线教育的实施效果[4]。

与电商、微博等领域的评论情感分析不同,在线教育评论文本具有区别于通用场景数据的特有属性,并且在中文语料方面,暂且没有公开的在线教育评论语料可供文本情感识别使用,这为在线教育领域的情感识别研究、应用和发展带来巨大的挑战[5]。此外,分析B站部分在线课程评论发现,情感词在评论中占据主导地位,正面情感词如“重难点”“受益匪浅”以及负面情感词如“难懂”“遥遥无期”等凸显了评论较强的情感极性,同时以上关键情感词在BosonNLP(波森情感词典)中已有相应的记录,这进一步验证了情感词汇在情感分析中的重要性。

故采用文本情感分析技术构建教育领域的在线课程评论情感分析模型,文本情感分析是自然语言处理中的一项基本任务,其目的是根据文本表达的情感倾向将其划分到不同的情感类别。尽管基于深度学习的情感分析方法在解决情感分析问题方面取得了良好的成效,但是多数方法往往过于注重数据驱动,而忽略了词性特征、文本否定词特征等文本情感特征对情感分析的影响[6]。总之,虽然基于深度学习的情感分析已取得了显著成效,但在教育领域仍主要依赖情感词典进行情感分析[7]。基于此,本研究以B站课程评论文本数据作为数据来源,依照教育语言的特征来构建教育领域的否定词和程度副词词表,并在此基础上使用波森情感词典作为辅助工具计算文本情感倾向,从而提升R-Boson(即重新构建波森情感词典)在线课程评论情感分析模型的准确性。该模型的应用有助于B站等在线教育平台更加精准地分析学生评论,为教学质量和学习体验提供有针对性的改进建议。

1 相关技术

目前,国内外针对在线教育评论文本进行情感分析的方法主要包括基于机器学习的分析、基于深度学习的分析以及基于情感词典的分析[8]。

1.1 机器学习技术

基于机器学习的情感分析方法一般会先提取文本的词频、词性等情感特征,接着利用支持向量机(SVM)、决策树等机器学习方法构建一个分析模型。该模型通过学习训练数据中的文本与相应情感标签之间的关系,使其能够对新的文本进行情感分析。例如朱军等[9]通过构建情感词典,提取特征词,并根据评论中情感词的出现与否选择朴素贝叶斯或SVM分析器进行情感分析。然而,这种方法的效用在很大程度上取决于人工标注的准确性,且无法对文本的上下文语义进行建模,故存在很大的局限性[10]。

1.2 深度学习技术

基于深度学习的情感分析方法近年来发展迅速且取得良好成果。目前,主流的深度学习情感分类模型包括卷积神经网络(CNN)、长短时记忆网络(LSTM)以及门控循环单元(GRU)[11]。尽管基于深度学习的情感分析方法能够自动学习语义特征,但针对网络中存在语义模糊的短文本这一情况,这一方法面临着有效训练的困难,影响了情感分析的性能[12]。另外,由于模型输入的文本特征相对单一,未充分整合情感特征信息,致使所提取的文本语义信息相对不足。因此,为了获得更为准确的分析效果,需要借助更多的训练样本进一步丰富模型对语义的理解。

总体而言,基于机器学习和深度学习的情感分析方法需要依赖昂贵的人工成本。其出色的分析效果往往得益于高质量地标注训练集,而人为主观地对数据进行标注也可能对分析效果产生影响[13]。

1.3 情感词典技术

由于B站中的课程评论具有非正式的语言风格,针对此类文本,基于情感词典的方法具有粒度精细、操作简便、可解释性高、结果稳定等优势[14]。

1.3.1 概述

词典型情感分析方法利用现有情感词典提取文本的情感特征,同时通过人工设计有关单词、句法结构等的判断规则,以计算文本的情感得分[15]。目前,人工构建的中文情感词典主要包括台湾大学情感语料库、大连理工大学中文情感词汇本体库、中国知网的HowNet情感词典、BoSon语义情感词库等[16]。闫晓东等[17]通过人工构建的词典(其中包括情感词、否定词、转折词等多个要素),以文本结构为基础识别情感短语,着重分析了转折词对句子情感倾向的影响。这种方法实现起来相对便捷,然而由于语言句法的复杂性,相同的词汇在不同的语境中可能呈现天差地别的差异[18],所以存在准确度不高且泛化能力差的缺点。因此,高质量的情感词典对于提升情感分析的准确率、精确率和召回率有着至关重要的作用。

1.3.2 波森情感词典

波森情感词典是一种基于微博、知乎等社交软件hpqxpZ5ybY4+IY5XZ/oGOA==数据构建的词典,专为处理社交软件中的短文本而设计。该词典为每个单词赋予一定的权重,根据单词权重计算整个句子的情感得分。相较于其他种类的情感词典,波森情感词典具有高准确率、高效率以及广泛的语言支持等优势。然而,基于波森情感词典的情感分析方法存在非领域化的不足。例如,在教育领域中没有充分考虑中文语言的特殊性:一方面是由于程度副词引起的情感极性加重,如“我喜欢这节课”与“我特别喜欢这节课”两者虽然都传达积极的信号,但后者明显表达了更强烈的情感;另一方面,否定词在情感分析中扮演着至关重要的角色,例如,“我很喜欢这节课”与“我很不喜欢这节课”两者明显表达不同的情感极性,而仅仅采用波森词典中的情感值进行简单的加减可能无法很好地反映这种情感变动,容易造成正负抵消的情况,而将明显的负面情感误判为中性。

综上所述,本文将聚焦基于情感词典的情感分析,主要参考HowNet情感否定词和程度副词词袋,构建适用于教育领域的否定词和程度副词情感词典。研究旨在建立一个适用于在线教育课程评论的R-Boson情感分析模型,通过计算评论的情绪值,深入分析B站在线课程评论的情感倾向。

2 模型构建

基于上述相关理论,本文提出了R-Boson在线课程评论情感分析模型,模型结构如图1所示。模型的构建流程主要包括数据采集、数据预处理、建立教育领域的否定词和程度副词词表、计算文本情感值以及评估模型五个步骤。

2.1 数据采集

B站作为国内最受欢迎的视频网站之一,汇聚了大量丰富的在线课程评论。因此本文选择B站数学、化学、物理等国家中小学精品系列课程的教育评论作为实验案例。为获取教育课程评论数据,利用Python爬虫技术和bilibili开放API,依次爬取了视频楼层、时间、点赞数、用户ID、用户名、性别、评论内容等信息。最终,共抓取20 041条教育课程评论数据,图2是部分评论数据的展示。

2.2 数据预处理

缺乏价值的教育课程评论文本会对分析结果产生较大影响,因此,在进行文本分析之前,需要先对教育评论进行数据清洗。首先,利用扩展库Pandas的drop_duplicate函数去除教育评论中的重复数据;其次,对语料进行停用词过滤,停用词是指那些没有实际意义的词,如“的”“了”等,这些词对教育评论的本质含义影响较小,应该被去除;最后,采用在中文分词中表现出色的jieba分词包[19]对评论文本进行分词处理。

此外,对所获取的20 041条教育评论数据进行分析发现,去除重复评论等无意义文本后,具有明显否定词和程度副词特征的教育评论在总体评论中占比较大,统计占比约为44%,深入分析这类评论可以更准确地把握学习者对课程的情感态度。因此,本研究通过人工的方式筛选出具有明显否定词和程度副词特征的教育评论,最终获得8 871条数据,其中正向评论4 686条,负向评论4 185条。这一精心筛选的数据集为后续深入研究提供了坚实的基础。表1为筛选后的正负向教育评论示例。

2.3 建立否定词、程度副词词表

为解决波森情感词典非领域化的问题,对波森词典情感分析模型进行基于词性的修改。

2.3.1 词表构建

构建教育领域否定词和程度副词词表的步骤如下:

1)分析包含否定词和程度副词的8 871条教育评论,了解B站课程评论的语言特点,人工筛选出具有学龄特征的否定词和程度副词。

真不错,很适合复习 老师讲光路图的时候最好是画下图,太难理解了

2)去除知网程度副词和否定词词表中不符合中小学学龄特征的程度副词和否定词,如“毋”“忌”“弗”“切莫”等。

3)汇总上述人工筛选后具有学龄特征的否定词和程度副词,最终构建一个教育领域的否定词和程度副词词表,其中包含70个否定词和121个程度副词,这些词汇均具有特定的学龄特征,适用于中小学教育阶段。

此外,否定词和程度副词的权重分配规则主要参考张小艳[20]等学者对程度副词范围的等级划分,对最高等级的修饰词取权重2,其次以0.3为下降梯度[21],对其他等级的修饰词权重进行赋值,带入情感词典分析模型。修饰词权重分配如表2所示。

2.3.2 程度副词处理

评论文本中的程度副词反映了情感的强度,根据强度的不同赋予程度副词不同的权值。程度副词的情感强度主要分为most、over、very、more、ish、insufficiently等,表示情感强度逐渐减弱。文中在构建教育领域的程度副词词表时,给予了程度副词对应的权重,从而更准确地表达情感的强烈程度。图3为所构建的部分教育领域程度副词表及其权重的展示。

2.3.3 否定词处理

当情感词被否定词修饰时,会导致文本情感倾向性的变化。具体而言,否定词的个数会对情感词组的情感值产生影响:如果否定词的个数为奇数,情感分数将取相反数;反之,如果否定词的个数为偶数,情感分数将保持不变。这一规律反映了否定词对情感表达的强烈影响,且通过奇偶性判断进一步决定了情感值的正负方向。

2.3.4 评论文本情感值计算:累加和

基于情感词典计算文本情感值因实现方法简单,得到广泛的应用[22]。首先,利用jieba分词工具对文本进行分词处理,遍历情感词典,找出其中的情感词;其次,向前寻找修饰该情感词的程度副词和否定词,将情感词的分数乘以副词的权值,得到该情感词组的分数;最后,将句中所有情感词组的分数相加,获取句子的总体情感值。当情感值大于0时,判定为正向课程评论;当情感值小于0时,判定为负向课程评论。核心代码为:

总的来说,本研究首先进行数据预处理,获取具有明显否定词和程度副词特征的教育评论;其次,在此基础上结合HowNet情感否定词和程度副词词袋建立教育领域的程度副词和否定词词表;最后,通过核心代码实现评论文本情感值的计算。最终构建的R-Boson在线课程评论情感分析模型有针对性地弥补了波森情感词典非领域化的不足,同时可在一定程度上提升情感分析的精度,为后续分析提供更可靠的数据。

3 模型评估

3.1 衡量指标

目前,对于中文文本分析模型的评价通常从召回率R(Recall)、精确率P(Precision)以及F1值来考量。召回率是对覆盖面的度量,它代表了分析器正确分析的比例[23],精确率表示被分为正例的事例中实际为正例的比例,而F1值则中和了精确率和召回率,是它们的加权调和平均数。相关计算式如下:

在混淆矩阵中,TP(True Positive)表示正向类别中被正确预测为正向类别的样本数量;TN(True Negative)表示负向类别中被正确预测为负向类别的样本数量;FP(False Positive)表示负向类别中被错误预测为正向类别的样本数量;FN(False Negative)表示正向类别中被错误预测为负向类别的样本数量。

3.2 实验数据

前文数据预处理部分显示,近一半(44%)的在线教育评论中包含否定词和程度副词,对这部分评论进行情感分析有助于更准确地了解学习者对课程的情感倾向。因此文章选取前文人工筛选的具有明显否定词和程度副词特征的8 871条评论作为测试集,并使用相同的评论文本测试集对比R-Boson情感分析模型的输出结果和人工标注的结果,进行精确率、召回率和F1值的计算,以评估模型的性能。

3.3 实验设计

3.3.1 添加程度和否定副词前后性能对比实验

首先使用教育领域的程度副词和否定词词表进行匹配,其次计算在线教育评论文本情感值,最后经过统计分析得出R-Boson情感分析模型的F1值为95%,负向召回率为79%,负向精确率为87%,比未添加程度副词和否定词词表的基础波森情感词典分析效果更好。分析结果如表3所示。

具体而言,包含教育领域否定词和程度副词词表的R-Boson模型的综合性能有所提升:F1值、正向召回率和精确率从93%提升至95%,负向召回率从54%提升至79%,负向精确率从76%提升至87%,R-Boson情感分析模型更成功地捕捉到了负向情感评论。原因是通过在R-Boson在线课程评论情感分析模型中添加教育领域的否定词和程度副词,成功地强化了模型的特征学习能力,模型能更有效地处理包含程度副词和否定词的教育评论,进而增强了模型对教育评论的语义理解。

3.3.2 数据量递增实验

为全面了解R-Boson情感分析模型在不同数据规模下的性能表现,文章进行数据量递增实验。首先从8 871条含否定词和程度副词的评论中选取递增的教育评论数据集:2 000、4 000、6 000和8 000条评论,每个数据集都维持正负评论的平衡;其次,对不同数据集采用相同的评估方法,利用R-Boson模型处理评论数据,与人工标注的情感标签比较,重点评估F1值、负向召回率和负向精确率等指标;最后,绘制折线图展示模型性能随数据量递增的趋势,折线图如图4所示。

由图5可知,随着教育评论数量的递增,模型性能整体上呈现稳步上升的趋势,其F1值从89%逐步提升至95%,正向召回率和正向精确率也随评论数量的增加而提升,表明模型更有效地捕捉了正向情感。此外,负向召回率和负向精确率在评论数量递增的过程中有轻微波动,但总体上保持稳定,负向召回率维持在78%—82%区间,负向精确率维持在84%—89%区间。通过实验证明,逐步增加教育评论数量将对情感分析模型性能产生积极影响,更多的训练数据有助于提升模型的泛化能力,使其在不同情感分析任务中更为有效,本研究为进一步优化情感分析模型提供了实证支持。

4 结 论

文章构建的R-Boson在线课程评论情感分析模型通过添加具有教育领域特征的否定词和程度副词,成功提升了情感分析模型的整体性能。结果显示:在否定词和程度副词对比实验中,添加否定词和程度副词对模型性能产生了积极影响,正负向召回率、正负向精确率以及F1值均得到一定程度的提升,模型更好地适应了教育评论中的语境变化,这进一步验证了教育否定词和程度副词在情感分析任务中的重要性;在数据量递增实验中,模型在递增数据集中的F1值稳步提升,且负向召回率和精确率在适度规模数据集上保持相对稳定,这对实际应用中的情感分析具有积极意义。

然而,与正向精确率和召回率相比,R-Boson情感分析模型的负向精确率和召回率仍然相对较低,这可能是因为在线课程评论中包含特定的教育术语和语言结构,如“犯困”“啰嗦”“照本宣科”等带有负向情感的词语充分表达了学习者对课程的意见与不满。因此,为进一步提升模型在教育领域的情感分析性能,让模型更好地适应教育领域的特殊语境,后续研究将构建教育领域情感词典,该词典包含教育领域常用的情感词汇,最后进行模型优化,期望可以在教育领域情感分析任务中取得更好的成效。

参考文献:

[1] 吴鹏泽,黄嘉歆,华子荀.基于价值共创理论的在线教育价值投入-产出度分析 [J].现代教育技术,2023,33(10):74-85.

[2] 杜恩龙,常纪超.传播仪式观视域下的刷屏弹幕解析——以B站《西游记》弹幕为例[J].东南传播,2021(7):53-57.

[3] 张婧婧,杨业宏,安欣.弹幕视频中的学习交互分析 [J].中国远程教育,2017(11):22-30+79-80.

[4] 李浩君,汪旭辉,廖伟霞.在线教育弹幕情感信息智能识别模型研究——融合变式情感词典与深度学习技术 [J].现代远距离教育,2023(1):19-31.

[5] 魏晓聪,于澜.中文慕课评论情感识别语料库的构建与应用 [J].重庆理工大学学报:自然科学,2023,37(4):174-181.

[6] KONG L,LI C Y,GE J D,et al. Leveraging Multiple Features for Document Sentiment Classification [J].Information Sciences,2020,518:39-55.

[7] PIRYANI R,MADHAVI D,SINGH V K. Analytical Mapping of Opinion Mining and Sentiment Analysis Research during 2000-2015 [J].Information Processing & Management,2017,53(1):122-150.

[8] 陈龙,管子玉,何金红,等.情感分类研究进展 [J].计算机研究与发展,2017,54(6):1150-1170.

[9] 朱军,刘嘉勇,张腾飞,等.基于情感词典和集成学习的情感极性分类方法 [J].计算机应用,2018,38(S1):95-98+107.

[10] KIRITCHENKO S,ZHU X D,CHERRY C,et al. Nrc-Canada-2014: Detecting Aspects and Sentiment in Customer Reviews [C]//Proceedings of the 8th International Workshop on Semantic Evaluation. [S.l.]:Association for Computational Linguistics,2014:437-442.

[11] 陈可嘉,柯永诚.融合多特征的在线评论情感分类[J/OL].小型微型计算机系统,1-9[2023-11-17].http://kns.cnki.net/kcms/detail/21.1106.TP.20230223.1407.014.html.

[12] 戚天梅,过弋,王吉祥,等.基于机器学习的外汇新闻情感分析 [J].计算机工程与设计,2020,41(6):1742-1748.

[13] 马瑞,李明,郑自园,等.基于MOOC课程评论的情感分析与主题挖掘研究 [J].教育信息技术,2023(9):3-7.

[14] XU G,MENG X F,WANG H F. Build Chinese Emotion Lexicons Using a Graph-based Algorithm and Multiple Resources [J].Proceedings of the 23rd international conference on computational linguistics. Beijing:[S.n.],2010:538-546.

[15] 刘鑫,祁瑞华,徐琳宏,等.融合多级特征的俄语推特文本情感分析 [J].小型微型计算机系统,2021,42(6):1176-1183.

[16] 张学波,王卿.社交媒体平台中健康报道标题对公众情绪影响研究——以人民日报微信公众号为例 [J].传媒论坛,2022,5(3):19-22.

[17] 闫晓东,黄涛.基于情感词典的藏语文本句子情感分类 [J].中文信息学报,2018,32(2):75-80.

[18] 赵妍妍,秦兵,石秋慧,等.大规模情感词典的构建及其在情感分类中的应用 [J].中文信息学报,2017,31(2):187-193.

[19] 尚永敏,赵榆琴.基于机器学习的在线评论情感分析与实现 [J].大理大学学报,2021,6(12):80-86.

[20] 张小艳,白瑜.基于加权融合字词向量的中文在线评论情感分析 [J].计算机应用研究,2022,39(1):31-36.

[21] 张丽,张祯.基于文本挖掘的新冠肺炎疫情下医药在线消费者的需求研究[J/OL].运筹与管理,2023:1-8[2024-07-17].http://kns.cnki.net/kcms/detail/34.1133.G3.20230901.0849.002.html.

[22] 丁森华,邵佳慧,李春艳,等.文本情感分析方法对比研究 [J].广播电视信息,2020(4):92-96.

[23] 张宇.面向微博文本的情感分析模型研究 [D].天津:天津商业大学,2019.