APP下载

融合文本情感分析的个性化学习模式

2018-07-24

现代盐化工 2018年3期
关键词:分词语义个性化

白 杨

(辽东学院 信息工程学院,辽宁 丹东 118003)

近年来,随着多媒体技术和网络技术的发展,在线学习已成为人们学习的另一种主要方式。在线学习打破了传统教学在时间和空间上的限制,给学习者提供了一个宽松、自由、开放的学习环境。大数据技术的兴起对社会生产和生活都产生着深刻的影响,过去无法收集和分析的数据被大数据技术赋予了新的可能性,近年来涌起了对人们行为和喜好挖掘的研究热潮,大数据技术成为了教育变革与创新的重要推动力。大数据所特有的“全面性”的数据、潜在的“大价值”及先进的技术手段,为充分挖掘学习者的情感语义进而促进个性化学习平台构建提供了有力的支撑。在大数据环境下,教育学习资源变得越来越丰富,学习者模型的内容不仅包含了学习者的知识状态,而且还包含了学习者的兴趣偏好、学习风格和认知能力等特征,因此个性化学习成为新时期学习者的更高要求。同时,在线学习中学习者以自主学习为主,长时间处于孤立的学习状态,缺乏情感支持。现有的研究对学习者的动机、情感等非智力因素还关注不够,不仅缺乏有效的表示方法,而且缺乏恰当的建模技术,严重影响了在线学习的效果。因此,如何为学习者构建一个智能化、个性化的学习环境,成了近年来人工智能教育应用领域的研究热点。通过对大数据个性化学习模型的分析,能够深入探究学习者的学习过程与情境,发现学习规律,并根据每一个学生的需求和能力为其提供个性化自适应学习。本研究从学习者文本情感分析的视角,重点研究在线教学网络的学习者的个性化学习模式,使智能学习系统具有情感能力,符合智能推荐、信息共享等个性化服务发展的实际需要。

1 文本情感分析

文本情感分析是利用计算机自动挖掘出主观性文本中表达的情绪、态度和意见[1]。随着Web2.0的迅猛发展,人们从被动地浏览信息到主动地发表意见、表达思想,网络由此而产生了海量的、主观的文本数据。在线教学网络如慕课、可汗学院等平台不仅提供了大量的学习资料,还为学习者提供了一个自由表达情感的空间,学习者通过参与讨论、发表评论等方式进行知识交流和共享,而由此产生的数据大部分以文本形式存在,许多学者开始分析和挖掘这些文本数据中的情感信息。文本情感分析已经成为自然语言处理中的研究热点,通常包括以下4个方面研究内容[2]。

(1)词语极性判定。词语的情感分析是句子、篇章情感分析的基础。词语情感分析包括情感词语自动识别和词语情感极性判断两方面内容,实现的基本思路通常有两种:基于语料库的方法和基于语义词典的方法。

(2)文本情感分类。根据文本中表达的观点、态度,将其划分为“肯定”、“否定”或“中立”3种基本的文本情感分类。目前,主要有基于情感词语和基于机器学习的两种实现文本情感分类的思路。

(3)评论意见挖掘。学习者评论文本中一般包含多个主题,学习者对不同的主题往往持有不同的意见。为了深入挖掘用户对某个主题的态度和意见,目前流行的挖掘方法是细粒度的意见挖掘。

(4)文本情绪识别。以上3种一般是面向评论文本,而对于博文、日志等文本内容,通常需要识别学习者高兴、悲伤、生气等情绪。目前比较流行的研究方法是通过情感词和语义规则来识别文本中的情感信息。

2 个性化学习模式

在线学习者在学习过程中情感状态会随着学习活动的进行而发生变化,这一变化产生的因素主要有学习内容、学习时间、学习结果等。譬如,学习之初由于学习内容较为简单,学习者的情绪往往表现为轻松、高兴;而随着学习内容难度的加深,学习者的情绪逐渐呈现沮丧、难过。这时,学习者参加的讨论活动中,这些情绪会在相应的文本数据中有所体现,学习模式系统通过对这些文本数据进行情感识别,建立情感模型,以智能学习系统为支持,为学习者提供个性化服务,比如为学习者推荐相应的学习资料、分享多数人在此时的经验、做法,甚至推送一段轻松的音乐等,已达到对学习者进行情感调节,使他们在学习过程中脱离孤立无援的状态的目的。融合本文情感分析的个性化学习模式框架结构如图1所示,主要包括4个环节内容。

图1 融合本文情感分析的个性化学习模式框架

2.1 文本分词

分词处理将确定语句的粒度,如词(words)或词项(terms)。分词方法包括词典分词和无词典分词两种,前者是利用词典中包括的领域术语,根据设定好的切词字数,通过最大正向匹配将语句从左至右进行切分。后者是利用统计思想来分词,如最大概率法公式为:一个词的概率=其出现的次数/语料中总的词数,以此区分词在一个文档中的重要程度。另外,还有一些常用的切词工具如Standard Analyzer,Chinese Analyzer等都各具优势。

2.2 情感建模

情感建模是个性化学习模式的关键环节。随着情感计算的发展,研究者已提出了许多有效的情感识别技术,为学习者情感建模打下了良好的技术基础。可以通过文本挖掘技术识别学习者某一时间的情感状态,主要包括情感特征选择、情感语义描述、情感类别分类3个步骤。通常的做法是在文本分词之后,结合情感语义词典选择文本的情感特征项,采用向量空间模型来实现文本语义内容的形式化描述,然后基于Apriori,FP-树等分类方法进行情感分类器的训练、情感类别判定和文本情感分析,从而实现学习者的情感建模。

2.3 学习系统

该系统存储了学习模型的适应性规则,如定义了如何根据学习者的知识状态、学习者选择的知识点、学习者的学习风格以及学习者的情感状态,从领域知识本体中选择出合适的知识点,并包括导航学习的过程的内容。

2.4 个性化服务

主要用于对学习者实现个性化推荐,如根据学习者的学习风格和情感状态向学习者推荐难度匹配和类型恰当的学习资源,根据学习者的知识状态和情感状态推荐学习内容。还可以进行学习者社区的挖掘,为实现知识的共享提供支持。

3 结语

个性化学习模型是智能学习系统的核心组件。在大数据环境下,融入文本情感分析的个性化学习模式能够实现全面地记录、跟踪、掌握学习者的不同学习特点、学习需求、学习基础和学习行为,为学习者建立个性化学习模型,打造个性化的学习路径,推荐个性化学习资源。因此,融入文本情感分析让教育变得千人千面,暗合了“因材施教”的理念,适应个性化和人性化的学习变化,使学习者在学习过程中真正找到幸福感。本研究重点讨论文本情感分析的过程,并未探讨学习者知识状态及学习风格等内容的存储和识别,未来的工作将进一步完善个性化学习模型的内容。

猜你喜欢

分词语义个性化
分词在英语教学中的妙用
坚持个性化的写作
语言与语义
结巴分词在词云中的应用
结巴分词在词云中的应用
批评话语分析中态度意向的邻近化语义构建
上汽大通:C2B个性化定制未来
“社会”一词的语义流动与新陈代谢
“吃+NP”的语义生成机制研究
同桌宝贝