APP下载

基于弹幕文本挖掘的猪肉价格上涨舆论研究

2023-09-25陈朝昱刘贺彭子欣

计算机时代 2023年9期
关键词:弹幕

陈朝昱 刘贺 彭子欣

摘  要: 弹幕作为一种新的交互方式,能直观反映猪肉价格上涨时间对公众舆论产生的影响。本文以弹幕文本信息为研究对象,利用词频、语义网络分析、LDA主题挖掘和SnowNLP情感分析模型等方法,进行了内容分析与情感解读,实现对网络舆情弹幕的情感分类和主题分析。在此基础上建立了物价预测模型。该项研究可为相关政策的调整提供一定的参考。

关键词: 价格上涨; 文本发掘; BP神经网络模型; 弹幕

中图分类号:TP391.1          文献标识码:A    文章编号:1006-8228(2023)09-129-03

Public opinion research on pork price rise based on bullet chat text mining

Chen Zhaoyu, Liu He, Peng Zixin

(School of Business, Guilin University of Electronic Technology, Guilin, Guangxi 541000, China)

Abstract: As a new interactive way, bullet chat can directly reflect the impact of pork price rise on public opinion. In this paper, taking the bullet chat text information as the research object, using the methods of word frequency, semantic network analysis, LDA topic mining and SnowNLP sentiment analysis model, we carried out the content analysis and sentiment interpretation, so as to realize the sentiment classification and theme analysis of the online public opinion. On this basis, a price prediction model is established, which can provide certain reference for the regulation of relevant policies.

Key words: price rise; text mining; BP neural network model; bullet chat

0 引言

據国家统计局11月9日发布数据显示,10月份全国CPI环比上涨0.1%,其中,猪肉价格环比上涨9.4%,涨幅比上月扩大4.0个百分点。全国各地猪肉价格上涨幅度明显,国家发展改革委甚至拉响全国猪肉价格过度上涨的“一级预警”。

网络媒体时代下,社交媒体关注更是放大了猪肉价格上涨事件的影响[1]。而弹幕作为一种用户在信息时最为直观的反馈,能有效地反映出是否用户的情感表达以及关注倾向[2]。因此,本文通过对该节目的弹幕文本进行分析,讨论“猪肉价格上涨”事件发生时网络舆情的态势走向,寻找弹幕背后所蕴含的情感倾向和舆情热点,为稳物价、保民生做出贡献。本文试图回答以下问题:

问题1:“猪肉价格上涨”事件对网民来说意味着什么?

问题2:“猪肉价格上涨”事件所引发的舆论最终走向何处?

1 文献综述

目前,随着物价波动频繁出现,越来越多的研究者开始关注物价对公众舆论的影响。研究者从分析微博、新闻报道等多个角度进行研究。邵小彧等人通过对微博中关于物价的讨论进行文本挖掘,揭示了物价与公众舆情的影响机制[3]。刘苗等人则发现消费情感指数与传统消费者信心指数走势具有较强相似性[4]。除此之外,戴又有等人发现经济较热时,公众更在意网络上有关物价讨论的热度,而当经济较冷时,公众更在意网络上讨论物价的情绪[5]。郭秀峰等人基于棘轮效应理论建立了VAR模型[6]。

因此,物价对公众舆论的影响是一个复杂的问题,需要综合考虑多个因素的作用。本文将进一步深入探究物价与公众舆情、情感和态度的关系,寻找更加有效的研究方法和模型,以更好地了解物价对社会和民众的影响。

2 数据处理

本研究数据来源为以“猪肉价格上涨”为检索词所搜索到的热度排名前五名的B站视频弹幕文本。采集时间为2022年11月2日。采集字段仅包含评论内容,并经过删除空白字符和无效信息等数据清洗操作。最终,本文采集到有效弹幕数据共计643条。

3 数据可视化分析

3.1 弹幕内容分析

词频分析通过统计和分析文献正文中关键词的出现次数,可以深入了解文本的主题和内容[7]。如图1,猪肉涨价上涨后人们首先想到的是工资是否随价格上涨,同时还关注其他日常生活必需品的变化情况。

3.2 弹幕情感倾向分析

为了进一步探究猪肉价格上涨舆论与时间的关系,本研究通过SnowNLP进行训练生成关于针对猪肉物价上涨的语料库, 便于后续精确的情感分析预测。

本研究使用SnowNLP情感分析对弹幕文本数据进行了情绪评分,结果在0到1之间[8]。图2展示了网友对于猪肉价格上涨所发表的正面和负面评论的分布情况。结果显示,积极弹幕和消极弹幕之间的分布差异不大。

整理弹幕关于猪肉价格上涨情感得分的区间分布可知(图3),网友对于猪肉价格上涨持中立态度较为明显,结合上面词频分析可以猜测,网友们可能短期认为猪肉价格上涨影响不大,又或者网友在此问题上更关注其他的问题。

基于以上假设,本研究进一步分析了弹幕情感与时间的关系(见图4)。结果显示,情感得分整体呈现起伏较大的分布趋势,且随着时间推移并未明显改善。该结果一方面表明情感得分的均值趋于0.5,说明网民对该事件的看法存在较为严重的两极分化;另一方面,这也说明随着时间推移,网友对该事件的态度并未发生显著的变化。

实验说明以“猪肉物价上涨”为主题的相关网络舆情,整体情感倾向较为稳定,网络舆情态势起伏相对较大。同时,也为研究提出了一种可能性,即网友在猪肉物价上涨事件中关注的可能不仅仅是物价上涨。

3.3 主题聚类识别

本研究通过LDA进行主题词提取,由此获得了弹幕数据主题聚类表(表1)。结果验证了上述可能性,“物价、工资、理财产品、生活必需品”四个主题是网民真正的关注焦点。

4 预测模型构建

4.1 量化标准

本研究将在上文核心主题词的基础上进行量化处理,详细文本量化及对应关系如表2所示。

4.2 建立模型

4.2.1 模型参数

本研究的数据集来自于前面步骤的整理,前70%的数据作为训练集,后30%数据作为测试集。具体参数如表3所示。

4.2.2 模型评估结果

结合上述模型参数,对各因素对物价的映射关系进行预测,通过对比实测值与预测值的多组数据可知(见表4),测试样本的模型预测值与现场实测值相近,说明该模型具有较好的性能,对于物价及其相关因素的预测有一定的参考意义。

4.3 数据预测结果

根据模型预测2022年第四季度的物价相关数据与实际相差并不大,可以一定程度上证明该模型合理性和有效性。同时,从表5数据可以发现,物价总体并不会一直上涨后续将呈下降的趋势,但工资水平也在短暂提高后迅速下降,但并不同步。

5 结论

5.1 研究結论

弹幕文本数据相较于传统评论具有更强的时效性与参与性,本文通过对弹幕文本数据的挖掘和情感分析探索隐藏在弹幕背后的网络舆情信息,最终对物价走势进行了预测,得出以下结论:

⑴ “猪肉物价上涨”事件引发公众热议,本质上是公众对未来物价、工资、理财产品和生活必需品等多方面的担忧;

⑵ 根据BP神经网络模型的预测结果,2022年下半年可能达到今年物价指数的峰值,情况在明年将会有所缓解,但是工资水平可能小幅度的下调,其他相关主题均有不同程度的变化,整体形式较为乐观;

⑶ 为了避免“猪肉价格上涨”事件带来的负面影响,有关部门应该全面落实价格监测和市场巡查制度,并采取实质性措施来保障市场供应,全力维护后疫情时期的市场稳定。

5.2 研究局限和展望

本研究具有一定的代表性,但受限于数据来源仅来自于B站用户弹幕,存在局限性。此外,本研究还受到时间和设备等客观因素的限制,因此神经网络数据集中的样本量相对较少。

未来研究将进一步统计更多数据,优化所构建的网络,以提高物价预测模型的准确度,让已经取得的社情民生数据发挥出更大的价值,形成网络舆情评估新方法,并在社情民生相关政策的设计和实施中得到更多应用。

参考文献(References):

[1] Gale F. China's Pork Imports Rise Along with Production

Costs[M]. United States Department of Agriculture,2017.

[2] 张真,马梅.传统服饰文化节目的受众满足与发展可能——

基于《衣尚中国》弹幕文本的研究[J].视听界,2022(1):71-74.

[3] 邵小彧,李冬梅,刘云强.新冠肺炎疫情阶段特征、公众情绪

与农产品价格——基于微博文本挖掘的实证研究[J].四川农业大学学报,2021,39(5):688-696,704.

[4] 刘苗,李蔚,朱述政,等.基于互联网文本情感分析的消费情感

指数构建[J].统计与信息论坛,2018,33(8):31-38.

[5] 戴又有,蔡定洪,张翼.网络搜索与居民通货膨胀预期的关系

研究——基于储户问卷与百度指数的实证分析[J].上海金融,2020,484(11):42-51.

[6] 郭秀峰.政府消费、物价波动与居民消费棘轮效应分析[J].

商业经济研究,2020,805(18):54-56.

[7] Popescu II. Word frequency studies[M].De Gruyter Mouton,

2009.

[8] 杨嘉怡,李晓英,何首武.基于手机评论文本的用户情感分析

研究[J].大众科技,2022,24(9):22-24,21.

猜你喜欢

弹幕
HOLLOW COMFORT
“弹幕”防御大师
一大拨弹幕正在向你袭来……
银屏戳笑点,弹幕知我心
脑内弹幕
搞笑弹幕一箩筐
拜托了,弹幕君
弹幕礼仪考卷
当四大名著遇上弹幕
弹幕小能手养成攻略