APP下载

基于社区团购微博话题评论的文本分析

2021-09-22李春林孟令爽

商场现代化 2021年14期

李春林 孟令爽

摘 要:社区团购由于新冠疫情的出现而得到迅猛的发展,本文基于新浪微博的评论数据对社区团购进行舆情分析。统计话题评论的前50个关键词构建词云图分析得到社区团购对传统零售行业会造成垄断等负面影响,不利于市场的正常运转。从评论的文本数据中提取成对关键词和权重数据构建语义网分析得出:社区团购因其营销模式而得到媒体的抵制,但社区团购的优势也是不可否认的,且消费者在一定程度上倾向于把社区团购与滴滴、外卖的发展作对比。从评论数据中抽取前四个主题,构建LDA主题模型得到社区团购的市场现状、发展手段扰乱市场、市场潜力价值、市场竞争性四个主题,分析得出:社区团购作为“新零售”出现具有很强的市场竞争性,市场潜力巨大,但其发展手段扰乱市场。社区团购的发展应明确其市场战略目标,若可以做到与实体店和商超等的融合发展、品牌化发展,以此达到共赢,将会走得越来越远。

关键词:社区团购;词云图;语义网;LDA主题模型

一、引言

社區团购是社区内居民团体的一种购物消费行为。从2016年开始小有发展,到2020年新冠疫情的出现,由于其不同于其他零售行业的运营模式——送货到社区内,使得社区团购得到了爆发式增长,极大地解决了疫情所带来的购物难问题。社区团购是疫情影响下一种生活趋势。也正因为如此,滴滴、美团、拼多多、苏宁、京东各大企业也纷纷参与进来,布局社区团购。根据艾媒咨询的调查数据显示,社区团购在2022年将达到千亿级别的规模。在如此迅猛的发展情况下,市场监制尚没有完善的状态下,如何更好地规制社区团购的发展成为了政府、企业和人们热切关注的问题。

现下的研究方法多侧重于问卷调查,研究内容多侧重于营销模式和消费者行为,如王桂琦(2020)采用问卷调查的形式提出“去‘微信化,注重APP开发”、“规范团长管理,“建立内容营销职能部门,探索结构性营销路径”等模式优化建议与营销策略。李琪,李欣和魏修建(2020)通过构建社区团购消费者参与行为理论模型及调查问卷,统计分析了消费者的社区团购行为。谭涛(2021)作为新事物,野蛮生长与蓬勃发展往往相伴而生,因此管理部门应该加强监管约束,守好社区居民的“菜篮子”,让其成为便民惠民的利器。本文不同于传统的问卷调查或政策分析的形式进行研究,而是利用Python从微博中爬取有关社区团购的话题评论数据构建词云图、语义网和LDA主题模型等进行文本分析,提取当前社区团购所存在的问题且更多元地了解消费者的真实想法。

二、基于爬虫技术的数据采集

利用Python编程获取对应话题的链接,爬取微博的社区团购话题,并保存到文件中,模拟二维码登陆微博。登陆过程的语句如:

此过程可以模拟二维码登陆的过程,并且为扫码登陆预留了时间。然后开始遍历话题,等待网页响应,获取评论回复,加载更多回复数据的代码如:

coms_reply_more = html.find_all('div','list_li_v2')

最终获取评论内容、评论回复、评论时间、评论昵称、评论时间,然后将数据保存到文本中。最终爬取了有关社区团购的9个热门微博话题,共计5000多条,30万字的文本数据。

通过爬取到的评论时间及评论频次数量,绘制如图1所示的微博热度演化图可以看出:从2020年2月份新冠疫情期间,社区团购话题开始显现,到2020年12月份,关于社区团购的话题热度持续居高。社区团购话题热度所带来的舆论倾向到底是什么,值得我们深入研究。

三、基于文本挖掘技术的社区团购微博评论分析

1.基于微博评论词云图的社区团购特征分析

本文使用Python中的jieba分词包对文本进行分词,建立特征词词典和停用词词典代码如:

过滤掉停用词和单字词,留下对分析有用的词语,提取了微博评论有关话题的前50个关键词构词云图,从图2所示的词云图可以看出,以社区团购为核心所衍生出来的词汇有:买菜、便宜、方便、补贴等词汇,这些词汇所体现出来的是目前社区团购给消费者所带来的益处,也是社区团购在新冠疫情期间迅猛发展的原因。对于资本、垄断、菜市场、企业、资本家等词汇,这些词所体现的是对传统零售行业所带来的负面影响,不利于市场的正常运转,也是政府需要出台政策进行制约的原因。

图2 词云图

2.基于微博评论语义网的社区团购核心要素分析

在进行语义网构建的过程中,同样进行分词处理,并创建词组统计组频,代码如:

最终将统计的词组和组频保存到文件中。将Python从文本中提取出来的成对关键词和权重数据导入Cytoscape软件中构建出来的语义网如图3所示。

图3 基于词对的语义网分析

通过语义网可以发现,高频关键词的分布呈中心扩散特征,以出现频率最高的企业为中心节点,以吞并、扰乱、垄断为二级节点,以市场、互联网、菜市场为三级节点,通过语义网可以发现媒体关注的焦点。故通过语义网各节点之间关联度的稀疏程度从如下角度进行分析:

(1)从负面影响来看,以企业为核心所展现出来的关键词有:企业、吞并、扰乱、垄断。企业通过补贴、降价等方式来吸引消费者,扰乱、垄断了市场,造成了实体店和一些小商小贩的经营状况下降,而导致关闭店面。当企业对整个市场形成了垄断之后,所带来的后果是不言而喻的。

(2)从正面影响来看,以社区团购为核心所展现出来的关键词有:便宜、方便、喜欢、菜市场、超市。目前大多数用户认为从社区团购购买生鲜蔬菜是便宜的,购买便捷,这也是社区团购的优点。另外可以看出社区团购并没有直接影响到菜市场,有相对一部分人是喜欢去菜市场买菜的。这与我国人口分布和居住模式有一定关系的,我国已经进入老龄化社会且在我国以老人和孩子同住的情况居多,老年人口占据买菜的一大群体。

(3)以互联网为核心的关键词有:互联网、滴滴、外卖、公司。以互联网为载体所兴起的产业如滴滴打车、外卖平台等。评论者趋向于与滴滴、外卖的对比来看社区团购的发展,从这几大互联网产业中吸取经验教训也更加有利于社区团购的发展、社会的规范。

3.基于微博评论LDA主题模型的社区团购主题分析

LDA模型是利用概率生成模型对文本集合进行主题分析的无监督学习方法。假设话题是单词的多项分布,文本是话题构成的多项分布,特别假设文本的话题分布的先验分布是狄利克雷分布,话题的单词分布的先验分布也是狄利克雷分布。在此简单介绍一下狄利克雷分布,若多元连续随机变量θ=(θ1,θ2,…,θk)的概率密度函数为

其中θi = 1,θi ≥ 0,αi > 0,则称随机变量θ服从参数为α的狄利克雷分布。多项分布是广大学者所熟知的,不做过多介绍。本文根据LDA主题模型的原理,构建词频矩阵,训练LDA模型,代码如:

构建的主题模型如下表所示。

主题1——市场现状的高频词有:补贴、团购、价格、便宜、方便等词汇,分析看出社区团购的现状是以补贴、低价促销、方便的形式吸引到了消费者的眼球;

主题2——发展手段扰乱市场的高频词有:垄断、资本、菜市场、老百姓等词汇,分析看出虽然社区团购现阶段以其优惠的价格让部分消费者受益,但其低价促销行为在不加控制的情况下给部分小店,菜市场带来了极大的损害,最终损害的仍然是老百姓的利益;

主题3——市场潜力价值的高频词有:价格、便宜、团购、互联网、平台等词汇,分析看出社区团购以互联网为载体,得益于其平台的价值,节省了物流成本、供货成本,并且本身食品是高消耗品,客户源不断。因此,社区团购具有非常大的市场潜力;

主题4——市场竞争性的高频词有:买菜、垄断、菜市场、团购、老百姓、超市等词汇,分析看出虽然社区团购有一定的垄断行为,但由于我国老年人口偏多,菜市场、超市仍然是大多数老年群体所喜欢的购物场所,这也是社区团购市场需要考虑在内的。

四、结论与建议

传统零售企业的增长步调在逐渐放缓,已经满足不了人们的需求,社区团购作为以社区为单位的“新零售”出现具有非常强的竞争力。随着互联网的快速发展,消费者能及时关注到不同商品价格,消费者变得更加理性,对性价比、服务、安全等也更加关注。以社区为单位设立的团购,消费群体基本固定,这样能够方便各位商家去进行更加精准地推荐和维护,而且消费者一般都存在一些共性,社区团购能很好的利用客户黏性增加销售量。社区团购因其经营模式可以就近调货,具有物流、供货源和成本低的优势,并且在一定程度上能解决当地菜农的销路问题,具有非常好的商业价值。

社区团购作为一个出色的商业创新模式,其发展方式却存在很大不足。它以补贴、低价促销、便捷的形式吸引到了消费者的眼球,虽然社区团购现阶段以其优惠的价格让部分消费者受益,但其低价促销行为在不加控制的情况下给超市、实体店、菜市场等带来了极大的损害。倘若造成资本垄断,最終损害的仍然是老百姓的利益,社区团购也必将得到遏制。

随着人们生活水平的提高,安全、健康、品牌成为市场关注的重点,现今的消费者更加理性,对性价比也更加关注,高频商品成为商家争夺的重点。因此对于一个“新零售”产业来说,若想走的长远,不能急于求成。综合上述分析,故提出以下建议:一、明确市场定位。社区团购企业过度补贴吸引消费者,造成行业垄断、扰乱市场。因此社区团购的市场竞争和平台监管需要有效政策的扶持与管制。二、发展多元化。社区团购在一定程度上可以做到融合发展,与实体店、商场、超市、菜市场进行合作,以此达到共赢的目的。三、品牌化。安全、健康、品牌成为广大消费者的关注重点,商品品牌化,打造出属于社区团购自己的专属价值,赢得消费者的认可,社区团购的发展才会走得更加长远。

参考文献:

[1]王桂琦.社区团购平台消费者使用意愿影响因素研究[D].中央民族大学,2020.

[2]李琪,李欣,魏修建.整合SOR和承诺信任理论的消费者社区团购研究[J].西安交通大学学报(社会科学版),2020,40(02):25-35.

[3]谭涛.社区团购,行稳方能致远[N].湘潭日报,2021-03-15(003).

[4]周俊颢,朱巧明,蒋峰,褚晓敏,李培峰.基于语义和主题模型的宏观篇章关系识别方法[J/OL].山西大学学报(自然科学版):1-10[2021-05-04].

[5]胡振华,舒行钢.基于语义网的社区团购媒体舆论情感倾向分析[J].财经理论与实践,2021,42(02):119-124.

[6]Zareie A,Sheikhahmadi A,Jalili M.Identification of influential users in social networks based on usersinterest[J].Information Sciences,2019,493:217-231.

[7]张柳,王晰巍,黄博,刘婷艳.基于LDA模型的新冠肺炎疫情微博用户主题聚类图谱及主题传播路径研究[J].情报学报,2021,40(03):234-244.

[8]肖舒翔.为何美团、蚂蚁、抖音都潜入社群团购?[J].销售与市场(营销版),2021(04):21-26.

作者简介:李春林(1963- ),汉族,河北任县人,博士,教授,研究方向:市场调查、数据挖掘、文本挖掘