APP下载

网络舆情社会影响力研究综述

2020-11-02王淼刘家委朱鑫奕刘树林余爱玲

电脑知识与技术 2020年25期
关键词:用户画像舆情

王淼 刘家委 朱鑫奕 刘树林 余爱玲

摘要:互联网用户发表观点具有传播能力强、范围广的特点,对其他社交用户的影响极大,研究用户的社会影响力意义重大,已成为当前舆情研究的热点。通过用户画像和文本情感分析的方法,从不同维度对社会影响力进行细致梳理,揭示了研究社会影响力的不同方法,并总结了各类方法的特点与发展趋势,最后给出研究社会影响力的相关启示。

关键词:用户画像;文本情感分析;社会影响力;舆情

中图分类号:TP311文献标识码:A

文章编号:1009-3044(2020)25-0071-02

网络通信平台是当前人们获取信息的主要方式,通过微博、微信等社交平台人们不仅获取讯息而且可以发表自己的观点,这些平台使用门槛低,传播能力强且范围广,每天会有百万以上的评论产生,通过这些媒体平台发表言论,可能对相关事件造成一定影响。当公共事件发生时,往往伴随着声音出现在评论中,有利有弊,当某一个评论流量达到足以改变公共事件发展方向时,舆情便从中产生。而当今社交平台又是影响政务、商业、信息的平台,每一次的舆情控制都是对相关政务机构、商业机构、信息机构的宝贵财富。

1文本情感分析与社会影响力

1.1文本情感分析概述

文本情感分析作为自然语言处理的重要分支,是统计学、人工智能、语言学等领域的深度交叉融合。文本情感分析是利用计算机技术对文本进行主客观分类与意见挖掘的理论与方法,以分类、判断文本的情感倾向性为主要目的。文本情感分析首先需要对源文本进行分类处理,分类处理的对象是主观性文本与客观性文本[1],目的是抽取出主观性文本进行下一步情感分析工作。在得出主观性文本后,需要对其进行情感极性分析和情感极性强度分析。

广义文本情感分析,被称为意见挖掘、情感分析等 [1],主要对文本中表现出的态度、情感、倾向等主观性内容进行辨别、分类、标注、分析等处理,从而生成新的情感总结和傾向性分析。广义文本情感分析将情感分为多种不同元素,包括个人的情绪状态、心理思想和主观倾向性等,通过提取自然语言文本中的情感元素来挖掘文本中的主观倾向、立场、态度等。

狭义文本情感分析则与之相反,将情感倾向性分为正面、反面或中性,主要对文本情感进行分类、对情绪与倾向性进行分析。当前,对狭义文本情感分析的主要研究方法主要有基于深度学习的方法、基于语义情感规则的分类方法,以及融合的分类方法。

1.2文本情感分析方法

文本情感分析可以分为词语、句子和篇章三个层面的分析[2]。其中,情感分析的基础是词语,词语的情感分析可以依赖情感词抽取、建立语料库和情感词典等方法来实现。句子的情感分析是在词语的基础上,直接得出文本中某一整句的情感分析结果,是词语情感分析的综合,也将直接决定篇章级别情感分析的好坏。篇章级别的情感分析是文本情感分析中的重难点,受多种分析因素的综合影响,分析结果难以稳定在理想范围。

文本情感分析应用的方法[3],主要有机器学习和词典两种方法。基于机器学习的方法以监督学习的方法为主,主要有决策树分类器、线性分类器、规则分类器和概率分类器。其中,线性分类器包括支持向量机与神经网络,概率分类器包括朴素贝叶斯、贝叶斯网络和最大熵。基于词典的方法分为基于字典方法和基于语料库方法。其中,字典方法即构建情感词典,基于语料库方法包括统计方法和语义方法。

当前,文本情感分析工作更多使用机器学习算法去完成。同时,融合的方法成为未来发展的趋势和突破方向,算法的融合、字典与机器学习算法的混合使用等往往比单一处理方法更加高效。

1.3文本情感分析与社会影响力的应用实例

社会影响力是用户或商家在互联网中发表观点、评论和文章所带来的舆情影响,社会影响力分析对舆情监控、虚假评论、情感倾向性判断等工作具有重要参考价值。目前,国内外学者已经成功将文本情感分析广泛应用于各类与社会影响力相关的场景中。

罗昌银等基于用户状态和行为,利用机器学习算法应用于虚假评论识别[4]。具体提出一种虚假评论方法,结合PU学习算法完成识别工作,并运用SVM分类器和逻辑回归模型完成主观分类和情感分析。此方法能够成功识别虚假评论,但没有具体呈现出虚假评论与正常评论两者之间的异同。张凌等基于特征分析与机器学习方法具体分析负面微博特征[5],同时提出负面微博识别的不同思路。首先分析了负面微博的具体特征,并通过正面微博运用机器学习方法对识别工作进行验证。此研究在负面微博识别中,将不同主题的负面微博分类,以负面词为研究核心,为微博情感分析提供了新思路。但实验中微博样本数量不足,同时对句子与篇章级别的负面微博识别研究较少。

崔彦琛等基于情感分析具体研究了消防突发事件网络舆情情感词典构建工作[6]。此研究基于情感分析中的词典方法,分析情感词典构建工作之后,综合了消防情感词典、网络用语词典和通用词典三种词典,构建了新的消防舆情情感词典。构建的消防舆情情感词典可以准确、高效地应用于突发消防事件的舆情监控,是情感分析应用于舆情和社会影响力的成功案例之一。伍静等提出一种结合文本情感的微博僵尸粉识别模型[7],首先定义了微博用户的11个特征,然后对微博文本进行情感分析,最后对实验模型进行评价。此模型实现过程完成了对微博僵尸粉识别工作,但不能完成对僵尸粉和不活跃用户的区分。

2用户画像与社会影响力

2.1用户画像分析概述

用户画像,作为一种刻画目标用户、联系用户,和发现用户的意向趋势的需求工具,用户画像在各领域行业与领域得到了广泛的应用。宋美琦,陈烨,张瑞认为在单个用户画像和群体用户画像的分类的基础上用户画像的内涵有三个要素:用户属性、用户特征,用户标签具有标签化、时效性、动态性三个属性,针对用户社会影响力用户画像的构建需要根据具体的场景来进一步细化才能产生精准的使用价值[8]。

2.2用户画像分类

不同的用户需求则需要这需要不同的用户画像构建方法。刘海鸥,孙晶晶,苏妍嫄,张亚明提出了4种模型与方法:基于用户行为的画像方法、基于用户兴趣偏好的画像方法、基于主题的画像方法、基于人格特性与用户情绪的画像方法[9]。

基于用户行为的画像方法,本类数据大多都是动态的,用户在社交平台上或是现实中会留下自己的一些行为痕迹,这些行为痕迹数据的实效性较短,所以针对动态收集的时间间隔要求较高,且通常常见的有效数据有用户浏览记录,用户日志记录,购买记录。从此类数据中可以提取出一些有效标签例如:周期行为规律,行为动态速度,变化过程等。此类数据产生价值对数据采集与数据分析的速度要较高。

基于用户兴趣偏好的画像方法,此类数据部分是动态的,用户的兴趣爱好可能会持续很长一段时间,目前用户画像普遍是运用这类方法来提供推荐或是意向分析,同时根据直接的兴趣爱好数据通过主观分析计算,可以获取一些潜在的用户兴趣偏好。但当用户的兴趣较少时,提供价值的精度则会变低,并且挖掘此类数据,会从情感分析入手,所以难度的偏向性也比较大。若需要提供有效的价值需要较复杂的数据采集和数据分析手段。

基于主题的画像方法,此类用户画像主要针对的是群体用户,用户多,特征广是他的主要特点,若主题单一数据来源比较单一,有降低收集、分析的要求的特点,但是主题与主题之间的无关联,很容易导致此类数据无价值。

基于人格特性与用户情绪的画像方法,此类数据具有很大的主观性,一般通过用户的问卷调查,当面访问获得数据,可以通过人格、性格、情绪、行为分类来预测出用户的情感偏向。并且目前的网络环境,用户的情绪比现实中的情绪更加丰富,所以获得此类数据的来源很多,但是由于此类数据的主观性很强,通过欺骗等手段,获取数据的正确性会下降。所以导致数据的不真实性很大,从而导致用户画像刻画不清晰。

2.3用户画像构建流程分析

高广尚论述了三个主要步骤:收集用户数据,研究用户信息,细分标签[10]。同时他也根据不同的用户需求总结了6种不同的构建方法:基于设计与思维,基于本体或概念,基于主题和话题,基于兴趣或偏好,基于行为与日志,基于多维或融合。社会舆情本是一个复杂的且杂质信息比较多的环境,所以在社会影响力分析时可以针对不同的平台环境来改变用户画像的构建方法或是多个用户画像构建方法同时使用。

用户画像的构建分为静态和动态,静态用户画像刻画后不会改变,对于目前大多数用户画像的使用环境来说,用户的信息以及环境是会随着时间改变的,静态的构建方法有局限性,所以动态的用户画像构建更为适用,所以大多数特定的用户画像需要一定时间间隔定时的去更新标签。

3结束语

针对用户在社交平台的影响力分析,国内外均缺乏针对性的研究,目前研究大多将研究重点放在信息本身的传播过程,研究舆情的传播过程而非研究社交平台的用户影响力对信息传播的影响力。而目前的用户画像算法大多也着重于将用户画像用于推荐算法当中,缺少将其用于信息传播判断当中。在传统的针对网络社交平台用户画像的研究当中,常用基于用户行为的画像用于研究用户的在社交网络的行为,从而分析用户在社交平台当中的行为,进而判断用户的社会影响力。而在有关文本分析的研究中,文本分析常用于文本情感研究,用于研究用户的对事件的情感倾向,或者用于对文本内容进行分类研究,而对研究用户发表的文本对社会的影响力方向,还缺乏实际应用研究与应用场景。

后续研究可以结合用户画像与文本分析,将用户特征与文本信息进行关联,研究某一类的用户在当前环境下,其表达的内容具有怎样的社会影响力。

参考文献:

[1] 杨立公,朱俭,汤世平.文本情感分析综述[J].计算机应用,2013,33(6):1574-1578,1607.

[2] 杨开漠,吴明芬,陈涛.广义文本情感分析综述[J].计算机应用,2019,39(S2):6-14.

[3] 魏韡,向阳,陈千.中文文本情感分析综述[J].计算机应用,2011,31(12):3321-3323.

[4] 谭荧,张进,夏立新.社交媒体情境下的情感分析研究综述[J].数据分析与知识发现,2020,4(1):1-11.

[5] 罗昌银,但唐朋,李艳红,等.基于虚假评论识别的微博评论情感分析的研究与应用[J].计算机应用与软件,2019,36(4):55-62.

[6] 张凌,谭毅,朱礼军,等.负面微博特征分析研究[J].情报理论与实践,2019,42(7):132-137,170.

[7] 崔彦琛,张鹏,兰月新,等.消防突发事件网络舆情情感词典构建研究[J].情报杂志,2018,37(10):154-160.

[8] 宋美琦,陈烨,张瑞.用户画像研究述评[J].情报科学,2019,37(4):171-177.

[9] 刘海鸥,孙晶晶,苏妍嫄,等.国内外用户画像研究综述[J].情报理论与实践,2018,41(11):155-160.

[10]高广尚. 用戶画像构建方法研究综述[J].现代图书情报技术,2019(3):25-35.

【通联编辑:梁书】

猜你喜欢

用户画像舆情
数字舆情
舆情
舆情
舆情
微博的舆情控制与言论自由