基于用户心理的网络舆情指标体系构建研究
2019-11-19石川马铭君胡琳梅
石川,马铭君,胡琳梅
(北京邮电大学 计算机学院,北京 100876)
一、引 言
信息时代的蓬勃发展,使得互联网成为社会舆论的放大器,越来越多的网民通过网络来表达自己的观点和态度。突发事件爆发后,网民和媒体的主动行为或随机行为会使网络上随之出现各种消息,从而引起公众的不断讨论,并逐渐产生具有影响力的公众情感倾向,进而形成网络舆情[1]。如果不能准确把握网络舆情传播规律,采取有效管理方法,将给社会舆论安全乃至国家稳定与和谐带来一系列消极影响[2]。因此,合理构建舆情指标体系,准确分析舆情发展趋势,及时对负面消息进行干预至关重要。
近些年来,国内外关于舆情指标体系的研究呈现逐年递增的态势,相关研究热点主要集中在舆情分析、舆情监测、舆情监控、舆情预警和舆情传播五个方面[3]。构建舆情指标体系是研究舆情的一个重要方法。在该领域中,很多学者从不同角度开展研究,以解决不同的实际问题。早期的研究多数只是提出指标体系的内容并解释含义,而没有在实例上验证其可靠性。随后,机器学习方法不断兴起,学者们开始着重对指标体系的量化进行研究,并结合机器学习方法给出具体的实验验证,使得指标体系的构建更加有理有据。但是,现有指标体系多数只是从舆情事件的角度提出,而没有考虑参与到舆情事件传播过程中的舆情发布者与受众。基于此,笔者从用户心理角度出发,提出一套指标体系,试图更全面捕捉用户与舆情事件在传播过程中的变化细节。该体系采用经典的态度三要素理论,即基于情感、行为、认知为一级指标,构建一套完备的层次指标体系。从这三个角度出发恰好吻合人的心理结构,三者相辅相成,可以更好地刻画用户对舆情事件的感知,具有较强的说服力。本文单独将指标体系的末级指标用于把握舆情事件的发展态势,即通过单个末级指标量化值的变化,达到有效监测舆情事件从发生到逐渐消退的过程的目的。另外,为了更好地应用指标体系进行舆情事件分析,准确地预测舆情热度及进行舆情干预等工作,将指标体系末级指标量化为模型特征,构建了基于逻辑回归的舆情热度分析模型。
二、研究现状
随着互联网技术的不断发展,我国的网络舆情研究取得显著进展。其中,构建网络舆情指标体系是研究舆情的一个重要方法,它是一种将抽象的舆情内容及其传播过程中的相关信息转为可以量化的指标的方法,从而为舆情研究提供便利。
关于舆情指标体系的构建,冯江平等[4]从政府、网媒、网民三个角度出发,构建了包括政府舆情应对能力、网媒舆情热度、网民心理特征在内的网络舆情评价指标体系。戴媛等[2]12深入挖掘互联网上所体现的舆情演变规律,构建了网络舆情信息在传播扩散、民众关注、内容敏感性、态度倾向性四个维度的安全评估指标体系。陈建敏等[5]提出具有5个一级指标的涉军网络舆情安全评估指标体系,包括发布者指标、受众指标、激体指标、本体指标和传播指标。Lin等[6]构建了舆情早期阶段预警的指标体系,并利用层次分析法计算不同指标的权重。瞿志凯等[7]在研究暴恐事件及网络舆情影响因素的基础上,构建了包含暴恐事件、信息特性、媒体报道、网民反应四个维度的暴恐事件网络舆情的风险预警指标体系,并对其进行权重计算。Zhao等[8]对微博用户行为、信息传播和趋势进行实时监测和特征分析,以达到全面深入评估的目的。早期关于指标体系的研究多数只是给出了指标体系的内容及相关含义,很少对指标体系内容进行量化分析或是对指标体系的合理性进行实验验证。
随着机器学习的兴起,一些学者开始针对舆情指标体系的量化进行研究。张一文等[9]基于贝叶斯网络建模对网络舆情预警进行研究,通过将指标体系内容离散化来构建网络节点,并对参数学习,最终用得到的贝叶斯网络来预测舆情处于态势高、中、低的概率。李耘涛等[10]从网络警兆指标体系的灰色特性出发,提出网络舆情灰色预警评价的具体方法,计算了指标的评价系数,并进行实例验证。徐旖旎等[11]利用层次分析法构建指标体系,并用马尔科夫链模型建模,为舆情的研究提供新思路。邢云菲等[12]构建了基于信息熵的新媒体环境下负面网络舆情监测指标体系,并给出舆情的影响力级别,实现对舆情的监测。覃玉冰等[13]利用层次分析法构建网络舆情评估指标体系,然后通过聚类将网络舆情分为5种类型,最后使用决策树分类方法构建网络舆情类型识别模型,精确识别处于潜伏期的网络舆情的类别。
三、基于心理认知的网络舆情指标体系构建
(一)指标体系构建思路
互联网是一个为用户提供交流服务的平台,用户的心理活动与整个网络空间息息相关。因此,准确把握互联网背后用户的心理、掌握舆情发展动态至关重要。基于此,笔者从心理学角度出发,提出一套以情感、行为、认知为一级指标的层次网络舆情指标体系。相比于现有指标体系,本指标体系的提出角度覆盖面更广。有研究表明,人类心理结构最重要的三个系统分别是情感系统、行为系统和认知系统[14],且三者之间相互影响,相互作用。由此可见,从情感、行为、认知三个角度提出指标体系,可以全面覆盖并捕捉用户态度和舆情本体信息,进而更好地对舆情事件进行分析。此外,为了对舆情进行更细致的衡量,该指标体系还引入深度转发率、直接扩散率、互动率、发布形式等衡量指标。
(二)指标体系内容
本文以情感、行为、认知为一级指标,提出一套层次指标体系,具体内容如表1所示。情感是指人类对于客观事物所产生的态度,本文将其划分为舆论内容情感倾向和受众评论情感倾向。舆论内容情感倾向通过现有情感词典计算舆论内容本身的正负情感词频来获得,即对于中文文本,先通过分词技术对评论的文本进行分词处理,根据分词的结果与情感词典中提供的正负情感词进行匹配来获取相应的词频。受众的评论情感倾向通过正负评论在总评论中的占比来衡量。
表1 基于心理认知的网络舆情指标体系
行为是指人类产生的举动,本文全面考虑舆情传播过程中的参与者,即博主与受众,将行为划分为受众参与行为、博主发布行为以及受众与博主之间的互动行为。受众参与行为主要包括受众基本信息、转发量、深度转发率、直接扩散率、点赞量和评论量。受众基本信息包括受众的年龄、性别、地域、微博等级等。其中,年龄、地域和微博等级采用区间进行表示,受众的群体不同,对于舆情传播的兴趣也是不同的。转发量、点赞量和评论量分别定义为舆情研究时间段内被转发、点赞、评论的数目。通常情况下,带有文字的转发会加入舆情受众的个人思想,对舆情的传播和搜索具有一定辅助作用。因此,将深度转发率定义为带有文字的转发数目占转发总数目的百分比。直接扩散率定义为在评论中@特定用户的评论数目占评论总数目的百分比。@某用户,说明阅读当前消息的受众希望被@的用户看到此消息,这种方式可以使舆情的传播精准到目标受众,将传播的过程变得更加高效。博主发布行为主要包括发布时间区间、发布形式、发布地域以及博主权威度。发布舆情的时间会在一定程度上影响舆情的传播。比如同样的一篇舆情,由于受众活跃时间的限制,通常情况下在黄金时间段发布会比在凌晨发布具有更快的响应。根据微博上的实际情况,可将发布形式分为三类,即纯文字、文字+图片和文字+视频。不同的形式对于舆情的传播具有不同的影响,相比于纯文字的博文,受众会更加关注带有图片或视频等视听信息的博文。发布地域同受众基本信息中的地域表示方法相同。本文通过发布微博的博主粉丝数、博主发布微博总数、是否有微博认证、微博等级以及博文质量[15]5项指标的加权求和来计算博主权威度。受众与博主之间的互动行为通过总互动率、正向互动数与负向互动数来衡量。互动是指博主与受众就舆情本身进行的讨论。互动率定义为评论中博主参与讨论的评论条数占总评论条数的百分比,可以在一定程度上体现博主的活跃程度;而正向互动数和负向互动数则体现博主与受众观点的异同。
认知是一个相对抽象的心理学概念,它是指人类在收到某种外界的输入后,经过大脑处理,从而在行为上进行体现的过程。本文将认知划分为博主认知与受众认知。博主认知分为舆情中体现的认知和后续行为中体现的认知,包括继续发表言论、保持沉默、删除言论等。受众认知分为评论中体现的认知和后续行为中体现的认知,包括与其他受众的讨论、保持沉默、删除言论等。认知这一新指标的提出,可以有效监测舆情参与者(包括舆情发布者和受众)的心理动态,实现全方位捕捉细节。
(三)指标体系应用
指标体系具有广泛的应用,比如应用于舆情监控、舆情预警等方面,或者利用指标体系对舆情进行评分来及时干预具有负面影响的新闻。本文提出的指标体系旨在实现舆情分析和热度预测两方面的应用。
1.舆情态势分析
该层次指标体系层层细化,层层深入。众所周知,大多数舆情的发展是一个先经历公众的高度关注,之后随着时间推移,热度逐渐退去的过程。本文利用提出的网络舆情指标体系的末级指标量化值随时间变化情况来分析舆情的发展趋势,以有效监控舆情走向。
2.舆情热度预测
本文将末级指标单独作为舆情事件的特征,用于构建基于逻辑回归的热度预测模型,进行舆情事件热度分析。热度预测模型的输出值为0到1之间的数值,表示该舆情为热点事件的概率。若输出值大于0.5,则判断此舆情为热点事件,标为hot;若输出值小于0.5,则判断此舆情为非热点事件,标为not hot。舆情为热点事件的概率
(1)
式中,x为抽取的舆情特征向量,w为特征的权重向量,b为偏置,参数通过最小化目标函数来学习获得。该热度预测模型目标函数
(2)
式中,xi表示第i个样本的特征向量,h(xi)为模型输出的预测结果,yi表示舆情样本的真实标签(yi=0时表示非热点事件,yi=1时表示热点事件),L为交叉熵损失函数。
四、实验分析
本部分主要介绍数据获取、数据形式和实验结果,并通过具体事例详细展示指标体系对舆情事件发展变化规律的描述,以及热度预测分析的结果。
(一)数据集介绍
本文的数据爬取自新浪微博,主要来自央视新闻、新浪新闻、江苏网络电视台等博主。选取了2018年7月发生的26个舆情事件,包括“泰国游船倾覆”“袁隆平团队沙漠种水稻”等事件。对于每个事件,将爬取的数据分为四大部分,即博文本身数据、转发数据、评论数据和基本信息数据。对26个舆情事件进行专家人工标注,结果得到21个热点事件以及5个非热点事件。专家人工标注即选择该领域的三名研究者同时对同一舆情进行标注,只有当三者的结论一致时,才最终确定舆情的标签。另外,根据舆情的传播特点,实验中对舆情的分析时长为自舆情发生起的10日内。
为了验证模型的可行性,对数据集进行随机划分,其中18个为训练集(包括热点事件15个,非热点事件3个),8个为测试集。
(二)实验结果分析
本部分基于所获取的舆情事件,利用指标体系,在舆情态势分析和舆情热度预测两个方面进行实验验证。实验结果表明,该指标体系在上述两方面均表现出很好的效果且具有一定的应用价值。
1.舆情态势分析
以“袁隆平团队沙漠种水稻”为热点事件,以“千万不要随便调戏Siri了”为非热点事件进行对比分析,研究末级指标在舆情态势分析方面的应用。首先,选择部分随时间变化的末级指标(如转发量、评论量和直接扩散率)进行分析(如图1(a)、图1(b)和图1(c)所示)。总体来看,三者的变化规律都与事件的发展变化规律相吻合,即经历了从事件发生到逐渐升温再到平稳的状态,且热点事件相比于非热点事件具有高转发、高评论和高扩散的特点。另外发现,热点事件自发生到稳定状态经历的时间要长于非热点事件,指标体系的变化更加平缓;而非热点事件在刚发生的第一天会升温,但事件发生的第二天之后,对于该事件的转发、评论、扩散等的值几乎为零。由此可见,根据末级指标的变化范围与变化趋势,可以初步判断出舆情的走势情况。其次,分别分析指标体系在情感、行为、认知三个方面热点事件和非热点事件的不同,具体情况如图1(d)、图1(e)和图1(f)所示。在情感方面,热点事件具有正负向评论占比高等特点。在行为方面,通过将指标体系转化为热度的形式,用雷达图表示它们之间的关系,从图中可以看出,热点事件具有高转发、高点赞、高评论等特点。此外,相比于评论和转发,点赞行为的产生方便且耗时少。因此,无论是热点事件还是非热点事件,点赞热度都高于评论和转发热度。在认知方面,将博主认知和受众认知转换为1~5之间的数值,并以散点的形式将热点事件和非热点事件展示在坐标轴上。从图中可以看出,热点事件具有高博主认知、高受众认知的特点。
图1 指标体系分析
2.舆情热度预测
为从整体角度考察指标体系热度预测效果,将18个舆情事件作为训练集,其中15个为热点事件,3个为非热点事件。舆情事件的标签由人工进行标注。模型的输出结果是该舆情为热点事件的概率,范围为0~1,通过预测的概率可以判断预测的标签。这里选择8个舆情事件进行热度预测,其中3个事件来自央视新闻,两个事件来自新浪新闻,其余3个事件分别来自封面新闻、江苏网络电视台和新华视点。逻辑回归的实验结果如表2第一行所示。表格中的概率为模型输出值,即模型预测该事件为热点事件的概率,括号内的数字为事件的真实标签:1为热点事件,0为非热点事件。同时,将逻辑回归模型与朴素贝叶斯模型进行对比,朴素贝叶斯实验结果如表2第二行所示。表2中,LR预测为逻辑回归的输出值,NB预测为朴素贝叶斯的输出值。对于8个事件,逻辑回归均预测正确,而朴素贝叶斯在事件5和事件8的预测中出现了错误。由以上实验可见,逻辑回归模型具有较高的准确性,且模型性能稳定。通过特征数据,可以发现有些特征具有较大的区分度,即可以明显区分出舆情的类别,例如评论数目等。相反,还有一些特征对于舆情是否为热点事件这一分类问题具有相对较少的贡献度,如舆情本身的情感倾向等。这一发现将为后续研究带来帮助,也就是说,可以通过调整指标体系末级指标在模型中的权重来侧重舆情研究的不同方面。例如,研究负面舆情的传播及干预问题,就需要着重考虑舆情情感倾向指标,对其赋予更高的权重。
表2 逻辑回归与朴素贝叶斯对比实验结果
五、总结与展望
舆情的发展变化规律可以通过一系列指标体系进行衡量,只要准确抓住舆情发展的特征,就可以实现对舆情的预测和干预。本文提出了一个全新的基于用户心理的指标体系,考虑情感、行为、认知三方面,从不同粒度出发,提出层次舆情指标体系,并将其应用于网络舆情态势分析和热度预测。研究发现,该层次指标体系末级指标可以很好地刻画舆情事件的特性,吻合舆情事件发展规律,并且能够实现对舆情事件的热度分析。
近些年来,舆情分析已经成为研究热点,本文从一个全新的角度提出一套指标体系,将其应用于舆情态势分析和热度预测,并进行实验验证。未来指标体系的构建可以针对不同任务进行,并结合多种舆情受众与舆情本身的互动要素。针对不易准确衡量的认知指标,可以采用通过神经网络学习隐变量的方式来获得相应的表示,从而使舆情研究更加具有个性化和针对性。