社交网络商业意见领袖用户画像研究
2020-08-20赵晓罡副教授耿紫珍副教授通讯作者
赵晓罡 副教授 王 越 耿紫珍 副教授 通讯作者
(西安外国语大学商学院 西安 710128)
本文选择快时尚企业中具有代表性的ZARA和H&M,以其微博粉丝中的商业意见领袖为研究对象,构建用户画像模型,收集、分析在线用户数据,比较ZARA和H&M微博商业意见领袖群体的用户画像差异,并提出结论与建议。
研究现状概述
(一)用户画像模型的构建研究
用户画像理论最早起源于美国,由Alan Cooper(1999)首次提出,他认为用户画像(persona)是一种从海量数据中获取的、由用户信息构成的形象集合。D Travis(2002)等将用户画像应用到电子商务领域,并从基本性、移情性、真实性、独特性、目标性、数量和应用性七方面确定了用户画像模型的构成要素。随后,相关学者补充了基本素养、学历和社会关系等构成要素。
我国研究进程可分为3个阶段。初始阶段(2006~2009年):以魏士靖(2006)等为代表的学者,研究集中在用户行为分析方法和手段、数据挖掘技术应用;起步阶段(2010~2014年):郑宝鑫、周雪松(2010)等正式提出基于我国用户特点的用户画像模型,指出了推动大数据发展的重要性。发展阶段(2015年至今):2015年国务院印发的《促进大数据发展行动纲要》,针对推动大数据的发展和应用提出了新要求。刘海、卢慧等(2015)从营销学角度构建了基于用户画像挖掘的精准营销细分模型。学者开始关注如何加强用户的在线数据分析和推广个性化精准服务。
目前,用户画像模型的应用研究最广泛的是图书馆学和情报学领域。尽管学术界对用户画像模型构建没有统一的标准,但建模思想具有相对一致性。张钧(2017)等为代表的学者从用户的年龄、性别等基础信息、行为和心理特征以及社会网络等方面构建用户画像模型,并根据行业特性进行适应性调整,如增加用户活跃度等要素。
(二)社交网络用户画像及影响力相关研究
社交网络媒体起源于美国,Twitter和Facebook是全球应用最广泛的媒体平台,也是学术界的重点研究对象。Peluchette(2008)指出不同性别的Facebook用户具有不同的信息获取倾向,Quinn等(2011)发现用户年龄差异会影响使用社交媒体的行为,包括好友数量及功能使用。
社交网络用户及社群影响力已成为我国相关研究的热点方向。仲兆满(2017)认为微博用户的兴趣可从自填标签、简介等背景信息和用户发文内容等获得。刘玲(2017)提出了用户影响力可从“用户质量指数”进行构建,该研究加入了对用户质量的考量,分析结果更具合理性和真实性,为本研究提供了有力支持。
综上,本文采用融合用户兴趣的画像模型,增加用户影响力指标,旨在帮助企业更好地识别和了解社交网络中的商业意见领袖,实现精准的网络社群营销。
模型构建与研究设计
(一)模型构建
用户画像也称为用户角色,是基于一系列真实数据建立的目标用户模型,同时也是能描述如年龄、性别、居住地、工作地点等用户特征的形象集合。本文采用融合用户兴趣的画像模型构建方法,所构建的社交网络商业意见领袖的用户画像模型包括两类标签,分别是基础标签和兴趣标签,如图1所示。除基础标签和兴趣标签外,考虑到用户影响力比较分析能反映企业营销活动中商业意见领袖用户画像差异的原因,本文接下来将分别从基础标签、兴趣标签、用户影响力三方面针对社交网络商业意见领袖的用户画像进行数据收集、比较和差异原因分析。
(二)样本选择
行业报告显示,在快时尚行业中,ZARA和H&M的品牌定位高度相似,品牌影响力位居前两位,截止至2019年3月,ZARA和H&M官方微博粉丝数分别为850552人、898486人,为保障数据质量,选取其中更具代表性和影响力的社交网络商业意见领袖作为研究对象。
依据微博官方对社群主题的划分结果,选定其中人数占比且与服装相关度均最高的三类商业意见领袖用户,即时尚、美妆和娱乐明星类。根据占比值(依次为28.40%、13.52%和7.12%),分别在品牌粉丝群体中选取样本758个(其他类型均小于2%,代表性不足不予选取)。其中包括关注ZARA微博的时尚类商业意见领袖237名、美妆类106名、娱乐明星类33名;关注H&M微博的时尚类商业意见领袖202名、美妆类103名、娱乐明星类77名。
(三)数据收集
本文通过网络爬虫技术,共计抓取758位商业意见领袖于2019年12月发布的全部微博文139917条。经数据去重筛选后,剔除掉无效商业意见领袖1位,重复和无效博文17663条,剩余总文字量达18963948字。
1.商业意见领袖个人信息。搜集到全部757位商业意见领袖的个人信息包括昵称、所在地、性别、生日、简介、注册时间、标签、认证、关注数、粉丝数和全部微博数。
2.商业意见领袖博文内容。共抓取757位商业意见领袖于2019年12月发布的全部发文信息122254条,以及每条微博的点赞数、转发数、评论数、发表时间、被转发理由、是否为原创内容、是否带有图片视频。
(四)分析方法
基础标签数据采用描述性统计方法分析,兴趣标签数据则采用语义分析。基于抓取到的ZARA和H&M的文本数据,利用ROST NEWS ANALYSIS软件对文本数据进行语义分析,包括文本预处理、词频统计和分类聚类分析,从基础标签、兴趣标签、用户影响力三个方面研究ZARA和H&M微博商业意见领袖群体的用户画像差异。
研究结果
(一)基础标签比较分析
1.性别。ZARA和H&M的三个类型商业意见领袖均以女性居多,占比在60.29%~88.68%之间。但相比H&M,ZARA的男性商业意见领袖占比均较低,两者的占比差值在5%~10%之间。
图1 微博商业意见领袖的用户画像模型
图2 三类社群的兴趣词集表
2.年龄。从年龄分布上来看,80%的ZARA和76%的H&M商业意见领袖年龄集中在21~40岁间。21~30岁用户群体比例ZARA为67%,明显高于H&M的52%;31岁以上ZARA为17%,明显低于H&M的30%,说明H&M商业意见领袖年龄大于ZARA。
3.所在地。总体来看,两个品牌间用户的所在地差距并无明显差距,主要集中在北京、上海、广东和海外地区。而从社群类型来看,ZARA时尚类的所在地以上海和海外地区为主,占比各为19%,而H&M占比最高的城市为北京和上海,各占21%。两品牌美妆类的所在地占比最高的城市均为上海,比例为29%~30%。两品牌娱乐明星类占比最高的城市均为北京,但所占比例差距较大,ZARA为46%,H&M为26%。
4.微博注册时长。微博注册时长是指商业意见领袖的微博注册日期到2019年4月的时长。所有商业意见领袖的注册时长均集中在7~9年,即均属于较成熟的商业意见领袖,微博运营经验丰富。
(二)兴趣标签比较分析
本文利用ROST News Analysis Tools工具对所爬取的用户自我简介、自填标签、认证信息和微博文四类文本内容分别进行语义分析。由于博文文本中前60位特征词出现频次占总数量60%以上,其它近10万特征词出现频次仅占总数的近40%,不具有研究价值,故选取前60位特征词进行提取。经过人工筛选,包括去重合并、剔除无意义词和停用词后,对四类文本的词频统计进行文本聚类分析。
数据研究发现,ZARA和H&M各自的三类商业意见领袖在静态、动态兴趣上的差异不大,此处将三个社群类别做合并处理,并根据高频特征词分类,按照词频高低从中筛选出ZARA和H&M商业意见领袖群体的兴趣标签词集,如图2所示。两个品牌的静态兴趣在职业和社会属性上差异较为明显,ZARA商业意见领袖中具有差异性的群体是专家、母婴育儿、媒体,而H&M的差异性群体为辣妈、教师、影评人。动态兴趣差异主要体现在六个方面,即服装类型、服装质地、服装风格、美容产品的质地和效果、价格和明星类型。
(三)用户影响力比较分析
考虑到用户影响力比较分析能够反映企业营销活动中商业意见用户画像的基本标签和兴趣标签产生差异的原因,本文借鉴刘玲等人提出的用户影响力分析模型(如图3所示)和公式,计算和比较相关指标,针对社交网络商业意见领袖的用户影响力进行比较分析,以进一步剖析两家企业的微博意见领袖的用户画像产生差异的原因。
各项指标计算公式如下:
用户影响力指数=用户质量指数×近期用户活跃度 (1)
用户质量指数=微博平均转发率+微博平均评论率+微博原创丰富度 (2)
近期用户活跃度=最近30天内所发微博数量/30天(3)
微博平均转发率=被转发总数/所发微博总数/微博总粉丝数 (4)
微博平均评论率=被评论总数/所发微博总数/微博总粉丝数 (5)
微博原创丰富度=(原创微博数+带图片和视频的微博数)/所发微博总数/微博总粉丝数 (6)
本文研究重点为两个品牌的三个社群用户画像比较,故将每一类微博商业意见领袖看作一个整体,进行汇总加和后,计算相关的数据指标,以此方法所得到的结果偏差对研究结论影响较小,可忽略不计。
通过上述公式计算结果如表1所示。
表1 ZARA和H&M三类商业意见领袖用户影响力指数
图3 用户影响力分析模型
图4 ZARA和H&M用户画像比较分析总结
从单个品牌来看,ZARA的时尚类意见领袖的用户影响力最强,娱乐明星类意见领袖影响力最弱;H&M则表现为娱乐明星类意见领袖的用户影响力最强,美妆类商业意见领袖用户影响力最弱。从三个类别分别来看,在时尚类商业意见领袖中,ZARA的意见领袖用户影响力高于H&M。在美妆类中ZARA的微博商业意见领袖用户影响力低于H&M。而在娱乐明星类中,两个品牌之间差距悬殊,H&M的微博商业意见领袖影响力约为ZARA的26倍。
(四)用户画像差异总结及其原因分析
上述分析结果显示,ZARA和H&M的三类微博商业意见领袖在用户基础标签上H&M年龄明显大于ZARA。在兴趣标签方面,静态兴趣差异较小,且不同类别微博商业意见领袖之间几乎无异;差异主要体现在动态兴趣上,不同类别微博商业意见领袖之间具有明显的兴趣差异,针对上述分析的总结如图4所示。该结果在一定程度上能够帮助企业判断其社交网络的商业意见领袖的基本特征和兴趣倾向,但难以帮助企业精准识别更有利于品牌传播的社交网络商业意见领袖,具有局限性。因此,本文将进一步分析两个品牌不同类别社交网络商业意见领袖影响力之间的差异,从而帮助企业识别出本品牌粉丝群体中影响力最高的社交网络商业意见领袖类别。
结合原始数据分析,可以发现两个品牌的三类意见领袖的基本标签和兴趣标签出现差异各自的根本原因:时尚领域方面,H&M的意见领袖群体在总粉丝数量上虽占据一定优势,但所发布的微博数量相比ZARA较少,失去了大粉丝集群的优势,从而降低了其意见领袖的用户影响力。美妆领域方面,ZARA微博的意见领袖群体虽然拥有较多粉丝,但其被评论和转发总数显著低于H&M,且微博内容缺乏吸引力,难以刺激其粉丝参与到话题中来,导致了该类意见领袖群体的用户影响力较低。在娱乐明星领域中,H&M在各层级的指标都优于ZARA,且对比后发现,对H&M而言,娱乐明星类意见领袖群体的影响力最强,更容易传播和产生热点话题,能够帮助H&M在该类社群中的信息传递。
总结与建议
第一,从基础标签来看,ZARA和H&M的商业意见领袖间除年龄特征外均差异较小,都具有女性居多、一线城市为主以及微博使用年限较长等特点,说明两个品牌的客户群在实际生活中具有较大的重叠性。H&M商业意见领袖在31-40岁年龄段的比重明显大于ZARA,说明两个品牌的目标消费群体年龄差异较为明显,企业可以根据这些特征,并结合本企业的目标市场定位挖掘新的潜在市场。
第二,从兴趣标签来看,基于对文本数据的语义分析,发现静态兴趣特征的差异主要表现在职业和社会属性方面,在动态兴趣特征上的差异则主要体现在服装类型、质地、风格,美容产品的质地等方面。所以两个企业可以根据各自微博商业意见领袖群体的兴趣倾向,改进本品牌的产品设计、宣传方式和渠道等策略。例如,ZARA的微博意见领袖在动态兴趣中更倾向“复古”风格的服装,与H&M的意见领袖偏好“优雅”“青春休闲”以及“可爱”的风格差异显著,尤其是结合H&M较ZARA微博意见领袖年龄偏大的事实,会发现年龄偏大的群体倾向于“年轻”的风格;年轻的群体却倾向于“成熟”的风格。因此H&M和ZARA可以在服装产品设计上,可以更加迎合消费者的倾向,满足消费者的需求。
第三,从用户影响力来看,微博商业意见领袖的微博被转发率、被评论率和原创丰富度是影响其用户影响力的主要因素。因此,微博商业意见领袖应不断增强其发文内容的吸引力,以促进其影响力的提升。例如,娱乐明星类微博商业意见领袖用户影响力较弱的ZARA可以通过举办线上、线下相结合的营销活动,调动这些意见领袖参与线下体验、线上分享及转发、评论的积极性,从而增强其影响力,提高企业知名度。