基于情感挖掘的学生评教系统设计及其应用
2018-05-14罗玉萍潘庆先等
罗玉萍 潘庆先等
摘要:学生评教是高校普遍实行的一项管理制度,评教结果的有效性,即评教的质量受到教师、学生、教学管理者的高度关注。该文利用语义分析技术对学生留言进行情感挖掘,建立基于知网的情感词库,并设置词的极性权重;以3GWS工具进行分词与词性标注;对留言的情感褒贬程度进行计算,形成教师的评价摘要。以烟台大学评教数据为实验数据,验证该方法科学、有效。
关键词:学生评教;情感分析;学生留言;数据挖掘
中图分类号:G434 文献标识码:A
随着我国高等教育的大众化,《国家中长期教育改革和发展规划纲要(2010-2020年)》明确指出提高质量是当前高等教育的核心任务,是建设高等教育强国的基本要求。如何保证和提高高等教育教学质量已成为高等学校深化教育教学改革的焦点和全社会关注的热点。教育部《关于深化高校教师考核评价制度改革的指导意见》(教师[2016]7号)文件,对师德考核、教学业绩、科研评价、社会服务在职称中的作用、教师自身发展等提出了一系列具体措施。学生评教是教学工作考核评价的重要维度之一,是学生依据一定的评价指标对教师的教学态度、教学方法、教学内容、教学效果等方面做出定性或定量的评价。“评价最重要的意图不是为了证明,而是为了改进”,学生评教已经成为高校普遍采用的教学评价与管理制度,成为了各高校内涵发展的重要措施之一。
在我国,学生评教自20世纪七八十年代出现起,便受到学术界的广泛关注,研究者们对学生评教的作用、中外比较、价值取向、评教工具、评教结果的有效性等展开了深入研究,其中结果的有效性被认为是研究的焦点,得到教师、学生、教学管理者的高度关注,研究者主要对学生的客观评价进行统计与分析,而对学生评教中学生主观留言的分析与挖掘基本没有涉及,本文提出了基于情感挖掘的学生主观留言倾向性分析模型,建立了基于知网的情感词典库,利用3GWS工具对留言进行分词与词性标注;通过对留言的情感褒贬程度计算,形成教师的评价摘要,并通过烟台大学评教数据验证其有效性、科学性。
一、学生评教的研究现状
上世纪20年代初,美国在高校中开始学生评教活动。1984年,北京师范大学通过问卷的方式对教师的教学质量进行评价,学生评教一度成为国内外研究的热点,并取得了丰硕的成果,对学生评教的研究基本分为基本理论研究和实践研究两个方面,基本理论的研究主要关注学生评教的权利、作用、意义、价值取向、中外比较与本土化等方面,其中梅萍等研究了近十年我国高校学生评教有效性问题;韩天学等研究了美国高校学生评教体系,并通过实例证实本土化的可行性;罗玉萍等研究了在普通高校开展学生评教的必要性及具体方法。实践研究主要是关于学生评教的有效性研究,包括指标体系设置、评教工具的设计、评教结果的统计分析方法、结果的应用等。其中潘庆先等利用关联数据挖掘技术对学生评教的评价指标体系的权重进行设置;马秀麟等从大数据挖掘的视角分析学生评教的有效性;谭征、潘庆先等利用中文文本挖掘技术建立了中文评教文本分类模型;傅龙等通过听评课的方法实证研究了新教师与经验教师评价的方法;郑燕林等分析了美国利用大数据分析技术进行教育评价的方法和路径;罗玉萍等对学生评教工作的动员、分类评价、数据处理、结果与反馈等过程进行了研究并以烟台大学为例证实其有效性。
随着学生评教工作的普及与深入,评价结果的有效性越来越受到广大教师、学生、教学管理者的关注。纵观对学生评教结果有效性的研究,大部分都集中在客观性评价的统计与处理上,其中潘庆先等采用了课程分类、学生分年级的方法,利用标准偏差来纠偏的数据处理技术对学生评教中客观评价部分进行处理,并成功应用于烟台大学,得到了广大教师的认可。
但對于学生主观留言部分的研究很少有所涉及,学生留言是学生在评教过程中对教师的主观评价,其中有褒奖之词也有中肯之建议,作为学生评教中重要的组成部分,学生留言也是教师与学生进行交流的重要方式。对于学生留言的处理方式大部分高校将留言直接反馈给教师本人,并没有对学生留言进行任何处理,也没有在留言中挖掘有效信息。烟台大学每学期学生留言约16万条,期初采用人工过滤的方式,工作人员将所有留言进行分类,把留言分为:正常、不适合给老师看、上课迟到、接听电话、要求换老师、普通话不标准等类别,分类后再将相关留言反馈给教师本人,发现异常情况后及时与相关学院主管教学领导联系,这种做法保证了教师对教学的积极性,保护了教师不受学生不恰当言辞的伤害,也能够发现教师教学过程中的优点和不足,但这种做法所需人力较大。后来利用关键词过滤技术将学生留言进行筛选过滤,这种做法虽然提高了效率,但容易受到关键词库的影响,容易遗漏有用的信息。
本文提出了对留言进行情感分析的方法,通过情感分析技术对每条留言进行情感计算,把学生留言以定量的方式表示其情感强度,设置强度阈值,达到阈值时,自动形成教师的评价摘要。
二、情感分析相关技术
情感分析又称意见挖掘(Opinion Mining),旨在利用计算机技术研究人们针对物体、个人、事件、主题及其属性的主观意见和情感,对文本的观点、情绪、情感极性做出判断。情感分析是自然语言处理领域的一个重要话题,旨在对无结构的主观性文本进行分析、处理和归纳,最终形成方便机器理解和用户使用的结构化数据。情感分析是一个多学科综合的领域,涉及语言学、统计学、心理学、机器学习、人工智能等领域的理论与方法。内容涉及多层语言分析技术,如分词、词性标注、命名实体识别、句法分析、社会网络构建等。
文本情感分析分为两个步骤,首先需要对文本来源进行处理,对文本进行主客观分类,从主客观混合的文本中将描述事实的客观性文本与表达意见的主观性文本区分开来,将主观语言的文本抽取出来,过滤掉不带情感色彩的文本。下一步是对主观性文本的分析,主要包括文本情感极性分析和文本情感极性强度分析。
由于学生评教的留言基本都为中文,中文文本的情感分析过程包括了分词、词性标注、情感词提取、情感词典的构建、情感极性判断等过程。
(一)中文文本的分词
中文分词是指将组成句子的汉字序列用分隔符加以区分,切分成一个个单独的词,它是中文文本处理的基础。经过学者们三十多年的研究和探索,中文分词已取得了长足的进步,分词的准确率得到大幅提高,特别是在使用了机器学习和基于统计的方法后,中文分词效果有了显著的进步。
本文采用第三代智能分词系统3GWS,3GWS是飞嘉华公司智能分词系列的产品,它是在继承优秀研究成果ICTCLAS自由源代码的基础上,综合统计方法、语义网络、模式推理与语言进化论等领域的最新研究成果。其主要功能有汉语智能分词、命名实体与新词识别、词性标注以及支持用户自定义词典。分词界面如图1所示。
(二)情感词抽取
情感词又称极性词、评价词语,特指带有情感倾向性的词。一般情感词有褒义和贬义两类极性。情感词抽取是情感分析的基础,因此引起了学者的广泛关注和研究。情感词抽取目前主要分为基于语料库和基于词典的两种研究方法。基于语料库的情感词抽取和判别主要是利用大语料库的统计特性,优点在于简单易行。基于词典的方法具有获取情感词全面、准确的优点,但是由于存在一词多义现象,构建的情感词典往往含有较多的歧义词。
本文提出了基于词性的情感词抽取方法,提取留言中所关心的词性,比如:形容词、副词、程度词;为了形成自动摘要,本文把相关名词和动词与进行提取,建立了关心词性表(见表1),表的内容可以根据不同领域自行增减。
(三)词语的情感极性
判别词语的情感极性是文本情感分析的基础,为了定量表示词语的情感程度,通常用[-1,1]之间的某个小数作为情感权重,来表示词语的褒贬程度。如果权重大于0,则表示词语为褒义词;情感权重小于0,则表示词语为贬义词。情感权重的绝对值越大则意味着词语的褒贬程度越大。
词语的情感极性判别主要有基于语料库和基于词典两种方法。基于语料库的方法主要是利用词语之间的连词以及统计特征来判别词语的情感极性。基于词典的方法是利用中文词典知网提供的语义相似度或者层次结构来判别词语的情感极性。
本文采用基于知网的情感极性标注方法,褒义词赋权为1,贬义词赋权为-1,程度副词按强度不同分别赋予2、1.5、0.8、0.5的权重,名词、动词赋权0,否定词为“-1”。
(四)留言的情感分析
在情感分析的典型应用中,产品评论的情感分析、新闻评论的情感分析、电影影评的情感分析被广大研究者所关注,这些研究具有一定的商业价值和社会价值。产品评论的情感分析主要任务是获取产品的特征或属性,定位用户的主观性评论,抽取评论词,判别用户评论的褒贬。新闻评论的情感分析是对评论人的评论进行挖掘,可以了解民众对新闻人物和新闻事件的总体评价,及时掌握当前的舆情信息,特别是热点事件的舆情信息,在舆情控制中起到了重要作用。
本文提出了基于表达式的留言情感分析方法,将褒义词、贬义词的运算符设置为“+”,将程度副词的运算符设置为“*”。留言的情感褒贬强度计算公式为:
其中qi为情感词的权重,Ti为词的运算符,o为学生留言的词集合,“&”为字符连接运算符。通过上式得到留言褒贬强度的计算表达式,然后执行表达式得到此留言的褒贬强度。
三、自动摘要技术
随着互联网的普及以及Web2.0技术的发展,数据量爆炸式地增长,海量的信息以及丰富的网络应用改变了人类的生活和生产方式。怎样在过载的数据中挖掘出有用的信息,在成千上万条文本数据中,提炼、精简出关键信息,已经成为文本挖掘中研究的热点。章彦星等提出了一种基于特征的用户评论自动摘要方法,能够自动生成简洁、全面的摘要。指出自动摘要过程主要包括4个步骤:(1)特征识别,从用户评论中识别出被用户评价的商品特征;(2)评论句分类,将用户评论的句子按其评价的特征进行分类;(3)特征过滤,根据句子分类的结果过滤特征;(4)摘要生成,使用句子抽取的方法生成摘要。
目前文本自动文摘的研究对象主要是科技文献和新闻等具有严谨的语言风格和文档结构、陈述客观事实的文本,而学生留言往往是结构松散、语言风格多样化、内容带有主观性的文本。本文借助情感分析方法与技术,提出了基于阈值的自动摘要方法,该方法通过记录学生留言中词的位置,当留言的情感程度达到阈值时,通过位置反推而形成评价摘要。
四、学生评教主观留言的情感分析系统设计
本文以烟台大学学生评教系统为实验平台,烟台大学自2003年开展学生网上评教活动,每学期积累学生留言近16万条,为该系统的分析与设计提供了有利保障。本系统以情感分析为基本理论,建立了基于情感挖掘的学生留言分析系统,系统框架如下页图2所示,系统以SQL2008为数据库管理系统,建立了基于知網的情感词库,整个处理过程分为数据提取与预处理、分词与词性标注、倾向性分析、自动摘要等四个过程。
(一)基于知网的情感词典
词典是情惑分析的基础,本系统采用知网的正面词、负面词、程度副词为基础,建立了情感字典表,表结构如下页表2所示,其中权重表示情感词的褒贬程度,运算符在生成留言的情感计算表达式时来连接不同词的权重。为适应时代的发展,本系统建立了自适应的字典库,用户可以根据应用领域的特点自动增删情感词,其词典维护界面如下页图3所示。
(二)留言提取与预处理
从数据库中提取学生对教师的主观留言,形成分词软件可识别的文件格式。对留言进行预处理,去除噪音能够提高留言情感分析的精度,在预处理中一般去除重复性留言,去除没有真正含义的留言比如“……”等,合理处理如“好好好好好好好”等类似留言。
(三)分词与入库
利用3GWS分词系统,对学生留言进行分词,并进行词性标注。针对感兴趣的情感词性,比如:形容词、副词、名词、动词等入库,并记录该词在评价中的位置。
(四)情感程度计算
利用字典库中词性的权重和运算符,根据分词结果生成计算表达式,下面用一具体实例说明处理过程。
实例:学生留言为“老师教的很好,课程学得也轻松有趣”;
分词后数据为:“老师/n教/v的/udel很,d好/a,/wd课程,n学,v得/ude3也/d轻松/a有趣,a”;
提取关心的词人库后如表3所示,其中教师编号为教师的唯一标识,行号代表学生留言的具体行号,词语位置为该词在留言中的位置,为自动摘要的反推提供依据。
生成的留言傾向性程度表达式为:Q=0+1.5*1+1+1+0,结果为3.5,表示此留言的情感强度为3.5。当超过阈值时,此留言就被当作自动摘要的候选项,可以通过表3中的词语和位置反推摘要为:“老师教很好,课程学也轻松有趣”。
五、结束语
随着高等教育大众化的普及,内涵式发展是各高校发展的内在要求,提高教育教学质量是促进内涵发展的重要内容;学生评教作为各高校普遍采用的教学评价方式,其结果的有效性将直接影响教师的教学积极性和教学管理的服务水平。本文提出了对学生主观留言的情感分析方法,建立了基于知网的情感词库,通过对留言分词、词性标注、赋权等过程计算留言的情感褒贬强度,以烟台大学学生评教数据为例,验证了该方法科学有效。
学生评教是一多元化的过程,其中受到学生、教师、课程、环境等多种因素的影响,比如:同样的“好”,不同学生可能表达不同的情感,对于评价严格的学生表达的是褒奖的程度很强的情感,而对于评价宽松的学生表达的是一般的情感;因此在今后的研究中要考虑评价用户的情感信息,探索神经网络等机器学习的方法,以使评价结果更加客观、科学、有效。