基于在线产品评价的网络舆情情感分析策略
2023-08-09严长虹
摘 要:针对当前情感分析中存在精确度不高、细致程度不够、适用范围狭小等问题,文章结合层级分类思想与情感分析,为不同情感倾向类型划分多层级,在确定领域中进一步扩大与提升情感分析的角度和精度。同时,以发散树结构分支的方式增强情感倾向类型在深度和广度等方面的扩展力,使其更符合人类大脑对客观的情感倾向,为构建针对 APP 零售平台中在线产品评价信息的消费者意见挖掘及情感分析模型等提供技术支持。
关键词:产品评价:情感倾向:情感分析
中图法分类号:F713文献标识码:A
1 引言
随着APP 及其平台技术的迅猛发展和电子商务的普及,网络消费已常态化。线上与线下相结合的网上消费过程产生了大量的在线产品评价信息,对这些信息进行情感分析,既可以为消费者在后续的网上消费中提供参考,又能帮助产品企业提升商品和服务质量、优化商业决策。当前,在线产品评价信息的情感分析已取得了一定的研究成果,但现有的许多研究在情感倾向及其属性的分析和预测中依然存在精度不高、细致程度不够、适用范围狭小等问题[1]。因此,如何从中挖掘出有价值的关键信息,最大程度地帮助企业提升判断力,因地制宜地提升商品和服务质量,进而科学地制定营销策略、把握流行趋势,已成为极其热门的一个研究课题。
2 情感分析
2.1 情感分析概述
作为一种分析方法,情感分析也叫做观点挖掘,它通过对信息文本进行内容挖掘,并对人们在特定情感背景下所表达的评价、观点、态度等内容下的情感倾向进行分析和预测。在早期的情感分析研究中,它被看作单一的情感分类,这是一种从基于主题的文本分类任务出发所衍生出的针对情感这个特定主体而进行的文本分类任务[2] ,随着研究工作的不断深入,情感分析已成为自然语言处理领域文本挖掘方向一个持续的重要研究课题。
2.2 网络舆情与情感分析
情感分析是網络舆情分析中的关键方法[3] ,主要依靠自然语言处理和文本语义挖掘来实现,通过对网络舆情信息中评价主体所发表的观点、评价等文本内容进行语义挖掘,进而分析和预测出人们对某些情感属性方向上所潜藏的含有个人情感色彩的主观性倾向。
3 层级情感分析方法
3.1 层级情感分类情感分类是情感分析领域的一个经典任务。现实环境中存在一类比较特殊的情感分类信息,这类情感信息在分类处理操作中通常被归纳为由多个层级子标签组合而成的情感类别标签。将层级情感分类下的各子层级类别标签看作拓扑型树结构或有向无环图结构等,在树结构或图结构中每一条有向路径上的层级子标签之间均含有一定的关系依赖。通常情况下,层级情感分类算法能从层级类别树结构中找到一条或多条有向层级类别路径。为解决当前主流情感分析研究深度和广度不足等问题,也为了更好地利用不同情感倾向间复杂丰富的依赖关系,可尝试结合层级分类思想与情感分析[4] ,为不同情感倾向类型划分多层级,从而细化情感分析的角度和精度。
3.2 层级算法结构与流程
本文提出的层级情感分析算法将情感信息设计成层级树形结构,这更加契合层级化的情感倾向类别。通过层级树形结构来实现相邻层级之间的信息传递,使用神经网络挖掘各层级情感倾向的特征信息,同时结合多种机制提升算法模型整体性能。层级情感分析的算法结构与流程如图1 所示。
舆情输入模块主要依靠中文预训练模型实现,负责对舆情信息进行预处理。紧接着,舆情信息的语义文本表示被传递到语义情感理解部分,如图1 中左侧含省略号的实线框体部分为契合层级情感类别。设计分层树状结构,层级的具体数量由舆情信息中的最大层级情感类别层数所决定。每一层级均由两种信息处理模块构成,分别实施情感特征获取和层级信息传递操作。情感特征获取模块采用了神经网络结构机制,负责从语义文本表示中挖掘出本层级的情感倾向类别信息,层级信息传递模块主要负责汇总本层级的语义文本、层级情感倾向类别信息及本层级的情感分类结果,并传递给下一层,进而传递层级间的依赖关系及信息。图1 中右侧含省略号的实线框体部分是局部情感分析部分,该部分由每层的层级情感分类模块及情感分析结果构成,这个模块的主要作用是汇总本层级情感特征获取模块和信息传递模块的输出信息,并预测本层级的情感倾向性,同时将结果回传给本层的信息传递模块,及时地将分析结果及其他依赖信息传递给下一层。另外,全局情感分类模块与层级情感分类模块的不同之处在于它还负责汇总、整合每层挖掘出的情感倾向信息,并从整体视角预测分析。在计算得出各层和整体情感倾向分析结果后,汇总并整合层级分析结果并输出最终结果。
4 层级情感通信模型
4.1 层级子网络构建
在各层级通信网络中起到信息接收和传递作用的主要是各层级信息传递模块,它们不仅在本层级组成本层级的通信网络,还和各层依托树形结构形成层级通信子网。层级信息传递模块的作用,主要是接收上一个层级传递过来的情感倾向类别、分析结果等信息;同时结合本层级的情感语义等信息进行整合;根据本层级的情感倾向分析和预测的结果来构建本层级对应的情感倾向信息,并传递至下一层级。层级通信子网络模块构建如图2 所示。
4.2 各层级子网络内部映射关系
层级通信网络主要通过各层级的信息传递模块实现。从整个算法模型来看,层级信息传递模块构建不同层级之间的情感信息及相互依赖的关系,如图2所示,层级情感分析的过程中不同层级各自的情感倾向类别之间存在深厚的依赖关系,深层级的情感倾向类别依赖于其所属的浅层级情感倾向类别,这种依赖关系是树结构中的父子关系。
各层级通信网络的一个重要作用是接收上层级的情感倾向类别信息,在整合本层级信息后形成本层级内层级情感分类模块的输入内容。
D(n)= V?Sn-1 (1)
A(n,c)= softmax[C(n)?tanh [W(n,D)?[D(n)]T ]] (2)
V(n,c)= avg[A(n,c)?D(n)] (3)
式(1)、式(2)、式(3)是第n 层本层的信息传递模块的主要计算过程。其中,式(1)中V 为所输入的舆情文本产生的情感语义表示,Sn-1 为上一层传递过来的信息矩阵,之后通过矩阵对位乘法得到新的情感语义表示D(n)。再据式(2)计算情感倾向类别权重,其中C(n)为第n 层的情感类别表示向量集合,A(n,c)是参数范围在0~1 之间的情感倾向类别权重矩阵,N(n,c)为第n 层级情感倾向类别数量。式(3)使用本层级新的情感语义表示D(n)与权重矩阵A(n,c)做矩阵乘法,即当前第n 层在接收了上一层(第n-1层)传递过来的情感倾向信息后,结合本层情感倾向的语义表示,得到本层的情感分析结果V(n,c)。
各層级通信网络的另一重要作用就是整合本层第n 层的情感倾向信息和本层层级情感分类模块输出的分析及预测结果,并构建本层与下一层间的依赖信息,然后将其传递至下一层(第n+1 层)进行处理。U(n)= transmit[max[P(n,L)]?A(n,c) (4)S(n)= transmit[avg[U(n)]] (5)式(4)就是用于传递本层依赖信息至下一层的核心公式。对当前第n 层的情感倾向结果P(n,L)做最大化处理,并保留第n 层的关键情感倾向预测信息。基于此,将当前第n 层级内所有预测出的可能结果全部捕捉,可让下一层(第n+1 层)的处理操作更关注此情感倾向类别的子类别,以实现层级情感分析中相邻层级间的父子关系。然后,它还将该情感信息结果与权重矩阵进行矩阵对位乘法,得到权重矩阵U(n),该权重矩阵中的每一个参数综合了本层不同情感倾向类别的不同贡献度。最后通过式(5)传递至下一层(第n+1 层)的情感倾向信息格式。
5 基于产品评价的层级情感分析策略的应用
5.1 产品评价情感与商品竞争力
通过对消费者在线产品评价信息进行提取及分析,可深入挖掘出消费者消费信息或者某些特征的需求、情感、主观性等信息。通过情感分析,如果得到的多数是正向反馈,说明消费者对产品某些特征的认可,也说明产品的这种特征得到了市场的认可。反之,则说明产品的某些特征市场的认可度低,可根据评价信息分析及完善。若一个产品的多特征的市场认可度均高,则其市场竞争力强、份额很多、销量高。反之,如果一个产品的多特征均没有得到市场认可,那么其市场竞争力弱、份额少、销量低[5] 。由此可见,对消费者在线产品评价信息中所含有的消费者情感倾向和产品特征情况进行情感分析和预测,充分体现了该产品是否具有一定的市场竞争力。
5.2 产品评价情感与企业竞争力
与其他渠道相比,由消费者自愿输出的在线产品评价信息蕴含着广大消费者对产品的使用体验、意见、建议等信息,是企业完善产品和服务质量、提高产品竞争力的重要信息来源,特别是以消费产品为主要导向的实体企业。由于在线产品评价信息数量巨大,而且大多数都是以非结构化文本进行存储的,同时由于消费者受教育程度、地域文化、表达习惯等方面的差异,对产品同一特征往往会有不同的表示。因此,利用层级情感分析机制对产品特征关注度与消费者的情感倾向按照权重矩阵进行计算,可以进一步得到加权特征情感倾向,从而得到消费者对商品多个不同特征的关注度。同时,可以从不同的维度对在线产品评价信息进行层级情感分析,以挖掘消费者对产品的一个或多个特征更为精细的情感倾向表达,从而为企业制定生产、销售等策略提供更准确、更可靠、更有针对性的信息支持。
6 结束语
本文提出的层级情感分析方法虽然在分析角度上具有更强的扩展性等优势,但毕竟是轻量级的系统设计,如果网络舆情信息十分庞大,那么从数据库设计到系统架构再到前端显示的方式必须进行相应的改进,这才能保证系统能够承受足够的压力。总之,随着APP 及其平台技术的飞速发展,消费者在更丰富的网络渠道乐于发表自己对某个产品某特征的情感倾向。网络舆情分析的核心是情感分析,值得我们深入研究探讨。
参考文献:
[1] 王安宁,张强,彭张林,等.在线评论的行为影响与价值应用研究综述[J].中国管理科学,2021(12):46?50.
[2] 李铁.面向大规模电商评论的情感分析与兴趣挖掘研究[D].成都:电子科技大学,2018.
[3] 黄思源.网络舆情分析与辅助决策系统设计与开发[D].成都:电子科技大学,2019.
[4] 刘文甫.基于混合语义学习的短文本表示与分类关键技术研究[D].郑州:战略支援部队信息工程大学,2022.
[5] 王忠群,王族,钱寅亮,等.基于超网络和在线评论的产品竞争力分析[J].情报理论与实践,2022,45(4):113?119.
作者简介:
严长虹(1980—),博士,高级实验师,研究方向:信息管理、计算机基础应用。