APP下载

浅析情感认知计算在社交媒体中的应用

2018-02-23陈昕悦

新闻研究导刊 2018年3期
关键词:小冰表情符号舆情

陈昕悦

(苏州大学 传媒学院,江苏 苏州 215123)

情感分析(Sentiment Analysis)也称为意见挖掘,是一个分析人们对产品、服务、组织、个人、事件,还有主题和属性等实体的观点、情感、评价、态度、情绪的研究领域。1997年,MIT媒体实验室的Picard教授最早提出了情感计算(affective computing)的概念,她指出情感计算是与情感相关并来源于情感或能够对情感施加影响的计算。虽然语言学和自然语言处理(NLP)历史悠久,但在2000年之前人们很少进行情感认知计算方面的研究。从2006年开始,情感分析研究进入快速增长期并逐渐成为学术研究热点,后来的学者将情感分析研究继续细分为情感识别、情感表示、情感建模、情感交互四个方面。

社交媒体(Social Media)是指互联网上基于用户关系的内容生产与交换的一种新兴媒介。社交媒体上的信息由Web2.0平台产生,一般是在200个字符以内的网络文本。微博博文如新浪微博和Twitter博文,即时通信如QQ和微信消息,网络评论如京东和携程评论等。报告显示,新浪微博每秒发帖量在2500条以上,Twitter每秒发帖量甚至达到14300条,汇集成了一座巨大的意见图书馆,具有极高的研究价值。

本文将从兴趣挖掘、舆情分析和人工智能三个角度深入探讨情感认知计算在移动互联网社交媒体中的应用,同时也着眼于社交媒体这一新的媒介和随之而来的网络新词、流行语给情感认知计算带来的新挑战。

一、兴趣挖掘

随着移动互联网的兴起和社交媒体的普及,在这个伟大的Web2.0时代,每个人都是发声者和信息员。在商人和行业专家的眼中,人们的情感和言论是一座金矿,而情感认知计算就是其中的钥匙。科学家也借助各种各样的模型来研究人们大量、快速、多变的意见,其中最著名的模型之一叫作Plutchik’s情绪心理模型。心理学家罗伯特·普鲁契克关于情绪的心理进化理论是对一般情绪反应最具影响力的分类方法之一,他认为有八种主要的情绪——愤怒、恐惧、悲伤、厌恶、惊讶、期待、信任和快乐。后人也将这一模型应用于情感认知计算之中。通过情感认知计算,商家能结合用户个人的意见数据判断他们的情感和兴趣偏好,从而推荐商品,更能判断群体面对某一产品的情感和兴趣,从而预判行业的未来。这两点在某些领域已经有了广泛且成功的应用。

二、舆情分析

随着社交媒体(如评论、博客、微博、社交网站)的爆炸性增长,这些媒体内容成为越来越多的个人和组织作出决策的依据。现在人们不再局限于向朋友和家人征求意见,因为在网络公共论坛上有许多用户的评论和讨论。近年来,我们见证了社交媒体对舆情产生的深刻影响。根据人们在Twitter上发表的评论,媒体甚至可以预测美国大选的最终结果。因此,社交媒体、情感分析也与政治舆情紧密结合在一起。

比如一些学者对埃博拉病毒蔓延时期的舆情研究,及时发现了谣言,觉察到人们的恐慌情绪,从而采取行动遏制谣言,稳定了局势。他们以新浪微博埃博拉热点话题为数据源,建立了微博舆情传播态势模型,在用编程和网络爬虫的方式获取数据的基础上,使用SPSS进行统计分析,基于实证研究结论,从实践角度提出相应的网络舆情引导和管控策略,为新媒体环境下的网络舆情传播研究提供了新的研究视角和分析方法,在实践层面对加强新媒体环境下微博舆情引导和管控具有重要意义。

三、人工智能

另外,情感认知计算对相关学科也有一定的促进作用,如机器学习以及最近几年大热的人工智能。微软亚洲互联网工程院在2014年5月29日发布一款人工智能伴侣虚拟机器人,并取名“微软小冰”。“微软小冰”集合了当时我国近7亿网民多年来积累的、全部公开的文献记录,凭借微软在大数据、自然语义分析、机器学习和深度神经网络方面的技术积累,精炼为几千万条真实而有趣的语料库(此后每天净增0.7%),通过理解对话的语境与语义,实现了超越简单人机问答的自然交互。自然人机交互就是让机器变得更自然,学习人的沟通方式以及语音、手势、表情、触摸等交流方式,这些技术是移动互联网快速成长的基础。“微软小冰”更容易理解人的思想和意图,这种人工智能和以前的AI概念不同。它更多的是通过云计算、大数据、深度神经网络等技术,让机器逐渐具备一种基于数据相关性产生的基本智能。

“小冰是一个聊天机器人,但不仅仅是一个聊天机器人”微软全球执行副总裁沈向洋表示,“聊天只是用户的一个体验,但我们设计产品理念的真正核心在于打造一个情感计算框架,同时拥有许多生存空间、辅助设备及相关设备,令小冰能够与人类在任何地点及场景进行交流”。新媒体时代,“微软小冰”引发了新一轮人工智能热潮。和过去单纯强调效率和有用的工具型人工智能不同,“小冰们”更强调情感连接,这一改变终将重新定义人和人、人和机器之间的关系。

四、情感认知计算面临的挑战

但不可否认的是,在社交网络中的数据与传统的文本数据有很大区别,这给情感认知计算带来了很大的难度。以新浪微博为例,它有文本短(只有140个字)、噪声大、非正规等特点。

最大的困难在于语言的不规范。微博中大量出现错字、别字组成的词汇,如“卧槽”等,还有网络新词“蛋碎”“么么哒”。另外,在不同的语言环境中同一个词的意思会发生变化,如“杯具”(悲剧,带有负向的情感倾向性),“油菜花”(有才华,正向的情感倾向性)等。这些不规范的词组导致基于传统长文本训练出的词典在社交网络中并不适用。但是在微博中有大量的文本表情符号,如微博自带的GIF表情图片以及从日本传入的颜文字。这些表情符号不同于文字或者一般符号,在认知上人们更倾向于将它看作一张图片。这一特点使得人们在表达情绪的时候更倾向于加入这些符号,以表达一种更强的额外情绪。但是传统的文本情绪分析方法并没有抓住这一特点。所以,社交网络环境下语料的特点使得传统的构造情感词典方法并不适用。而结合社交网络短文本自身的特点,训练出新的社交网络的情感词典成为一个急需解决的问题。本文首先论证了在新浪微博中表情符号可以作为情绪分类的依据,然后利用表情符号这一社交网络短文本中特有的特征作为标志,采用跨媒体共现的思想生成了一个面对社交网络的情绪词典。

或许一些学者提出的利用情感表情符号来提取文本情感词典的方法有一定的可行性。未来将结合短文本论文的语料特征,完善网络新词的自动化扩充以及短文本情绪分类工作,建立新的网络情感认知分析数据库也是大势所趋,但做好社交媒体中的情感认知与计算仍然任重而道远。

五、结语

笔者列出来的兴趣挖掘、舆情分析和人工智能只是情感认知计算在移动互联网社交媒体中应用的冰山一角,前仆后继的科学家和研究者也致力于攻克社交媒体给情感认知计算带来的新挑战。总而言之,笔者认为情感认知计算是未来相关领域值得研究的一个课题,并对它的发展保持乐观的态度。与此同时,人们也应该谨慎使用这一技术,不可成为技术的奴隶,也需警惕不能越过法律和道德的底线。

[1]黄发良,冯时,王大玲,于戈.基于多特征融合的微博主题情感挖掘[J].计算机学报,2017,40(04):872-888.

[2]马秉楠,黄永峰,邓北星.基于表情符的社交网络情绪词典构造[J].计算机工程与设计,2016,37(05):1129-1133.

猜你喜欢

小冰表情符号舆情
微信表情符号写入判决:你发的每个表情都可能成为呈堂证供
世界表情符号日
第六代微软小冰正式发布
小冰在“浙江24 小时”干了些什么活
钱江晚报来了“小冰”——一张都市报在“Al+新闻”上的探索和突破
舆情
舆情
这个表情符号,你用对了吗
舆情
表情符号玩上瘾 时尚爱尝鲜