弹幕视频网站用户持续使用行为的影响因素及其可解释性分析
2023-12-18李伟卿汪文涛黄炜等
李伟卿 汪文涛 黄炜等
关键词: 弹幕视频网站; 感知价值; SHAP 可解释模型; 用户持续使用行为; 哔哩哔哩网站
DOI:10.3969 / j.issn.1008-0821.2023.12.006
〔中图分类号〕G252.0 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 12-0063-10
截至2022 年6 月, 我国网络视频(含短视频)用户规模达9.62 亿, 占网民整体的91. 5%[1] 。观看与分享视频已成为人们获取信息、交流、娱乐、学习的主要方式, 人们的生活方式和社会结构也因此改变[2] 。研究网络视频传播的机制及影响因素, 有助于优质信息的传播及增加用户的粘性, 具有重大的经济价值和现实意义。如Yan H 等[3] 通过对多个视频网站用户行为的挖掘, 发现用户既表现出一致的跨站点兴趣, 也表现出不同站点的特定兴趣。Ye LL[4] 通过问卷调查探讨了视频弹幕的感知价值对用户持续参与行为的影响, 发现弹幕的信息价值、娱乐价值对用户的持续参与行为有积极影响。孙晓宁等[5] 通过对Bilibili 网站用户弹幕与评论信息的交互特征的研究, 发现在多元场景下用户弹幕使用频率呈现显著差异, 且在总体情况下, 弹幕情感较评论情感更为积极与强烈。现有研究多聚焦于视频本身(如视频的满意度、弹幕数量、弹幕情绪)对用户持续使用行为的影响, 变量之间存在一定的内生性问题, 且少有对各影响因素重要性和正负性的探索。
因此, 本文使用Bilibili 弹幕网站中的视频特征数据和用户行为数据, 基于感知价值理论, 采用多元回歸分析和基于机器学习的SHAP 可解释方法,探讨视频用户持续使用行为的影响因素及其影响的重要性及正负性。本研究主要有以下创新和贡献:使用基于机器学习的SHAP可解释方法, 探索了视频用户持续使用行为的影响因素的重要性及正负性, 验证与补充了现有研究的结论, 并为弹幕视频网站的用户行为研究提供了思路与方法; 探讨了不同维度感知价值对视频用户持续使用行为的影响大小, 研究结论有助于视频制作者从多维度把控视频的质量, 从而提高视频制作者的竞争力, 增强用户持续使用意愿, 有利于优质信息内容的传播。
1相关研究与研究假设
感知价值理论在营销和信息系统研究领域得到了广泛验证与认可, 视频的感知价值对用户的持续参与行为具有正向影响[6] 。产品感知价值直接影响用户的购买意愿, 通常包括质量因素、价格因素、社会价值和情感价值[7] 。信息感知价值正向影响用户对信息的采纳行为, 信息采纳行为是用户有目的地选择、分析、评价、接受和利用信息的过程[8] 。目前, 关于信息感知价值的研究主要基于技术接受模型(TAM)和信息采纳模型(IAM)。技术接受模型认为感知有用性、感知易用性共同作用于用户采纳行为, 感知有用性主要指用户主观上认为信息或者技术能提高其工作绩效的程度, 感知易用性主要指用户主观上认为理解信息或者使用新技术需要付出的努力程度[9] ; 而信息采纳模型提出信息质量和信源的可信度正向影响用户的感知有用性, 从而影响用户的信息采纳行为[10] 。
对于视频的感知价值及参与行为, 还未有较成熟的理论模型。现有研究多从视频的内容价值(信息质量)、社会价值和情感价值(满意度)探讨用户对视频信息的采纳行为和持续使用意愿[11-13] 。如张帅等[14] 基于扎根理论探索了视频网站用户使用行为的驱动因素, 发现情感需求(娱乐、情感归属、释放压力)、社交需求(表达自己的感受、交流爱好、了解别人的看法)以及认知需求(理解视频内容、弹幕有趣、获取知识)是驱动视频网站用户持续使用的核心因素; YeLL[4] 在弹幕视频中对用户持续参与行为进行研究, 从信息价值、娱乐价值、社会价值3 个方面探讨视频用户持续参与行为的影响因素。基于此, 本文将从内容感知价值、情感感知价值和社会感知价值3 个维度来探讨视频用户持续使用行为的影响因素。
1) 内容感知价值。在营销领域, 产品的质量感知价值显著正向影响消费者的购买意愿。而视频的质量感知价值, 通常体现在用户对视频信息内容质量的感知。Pagan N 等[15] 探索了社交媒体上的“显著影响者(网红)” 的产生和被关注机制, 发现用户始终在追寻UGC 质量更好的网红, 即内容为王。视频的内容质量, 即视频信息内容的准确性、一致性、时效性和全面性, 还包括视频的字幕内容、视频的画面内容(动画质量的好坏或者真人的动作、语速、语气等)。在实证研究中, 通常难以对信息的客观内容质量进行有效衡量, 基于用户视角的信息质量评价是国内外学术研究的主流范式[16] 。如史伟[17] 在基于内容分析的微博转发行为研究中, 证实内容特征对微博转发有着显著的影响。张瑜等[18] 研究发现, 在以内容为主导的社交媒体中, 内容质量本身是吸引个体进行点赞的主要因素。陈明红等[19] 在对弹幕网站的用户行为进行研究时, 发现视频弹幕数、视频点赞数、视频评论数和视频转发数均对播放量产生显著正向影响。弹幕视频网站上的用户行为, 如点赞、投币、收藏、转发等直观地反映了用户对视频内容质量的主观评价。基于此提出以下假设:
H1: 点赞数量正向影响用户的内容感知价值,从而影响视频用户的持续使用意愿
H2: 投币数量正向影响用户的内容感知价值,从而影响视频用户的持续使用意愿
H3: 收藏数量正向影响用户的内容感知价值,从而影响视频用户的持续使用意愿
H4: 转发数量正向影响用户的内容感知价值,从而影响视频用户的持续使用意愿
2) 情感感知价值。即用户使用或体验产品时的感觉或者情感状态。研究表明, 在弹幕视频网站的使用过程中, 弹幕更多地反映用户在观看视频时的情感状态。如孙晓宁等[5] 在多元场景下对弹幕和评论的比较研究中发现, 弹幕比评论具有更强烈的情感色彩; Ma X 等[20] 和Lee Y C 等[21] 发现, 弹幕相对评论较短, 更能促进用户即时交流以分享事实、想法和感受, 激励用户的社会沟通和情感表达。王敏等[22] 对视频弹幕与字幕进行情感分析与比较研究, 发现单从情感词数量考虑, 视频弹幕与字幕的情感强度无明显差异, 弹幕与字幕的情感种类分布规律大致相同, 即视频字幕与弹幕有一定的相似性, 弹幕的情感价值在一定程度上反映视频字幕的情感价值; 弹幕数量也能反映用户的情感强度。如袁海霞等[23] 在研究弹幕对在线消费行为影响时发现, 弹幕数量正向影响用户的观看行为与消费意愿。综上, 弹幕体现了用户在观看视频时的情感体验, 这种情感体验对用户持续使用行为具有显著的正向影响。视频的情感感知价值主要体现在弹幕情感和弹幕数量两个方面。而对于弹幕数量, 在不同时长的视频中, 使用弹幕数量会导致量纲不统一,因此, 使用弹幕密度=弹幕数量/ 视频时长, 以弹幕密度替代弹幕数量。基于此提出以下假设:
H5: 弹幕情感正向影响用户的情感感知价值,从而影响视频用户的持续使用意愿
H6: 弹幕密度正向影响用户的情感感知价值,从而影响视频用户的持续使用意愿
3) 社会感知价值。即产品对社会的意义或价值, 具有一定的主观性。网络环境下, 社会价值的表现形式一般为在线评论与打分[24] 。用户在进行消费决策之前通常会寻找并查看在线评论, 以此评估此次消费的感知利得与感知利失, 所以, 在线评论会形成相当程度的社会价值[25] 。在视频领域,在线评论反映了用户对视频价值的评价, 评论多在全部观看视频之后产生, 表达的是对整个视频内容的看法, 由此内容更为完整, 也更趋于理智[3] 。评论可有效支持用户之间的直接互动, 并帮助其开展深层次的知识交流[26] 。如Duan W J 等[27] 发现,在线电影评论内容对电影票房收入无过多影响, 但在线电影评论数量对电影票房收入有显著性影响。郝媛媛等[28] 分析了在线影评的文本特征, 发现评论的正负情感、表达方式、平均句子长度等都会影响评论信息质量。基于此提出以下假设:
H7: 评论平均长度正向影响用户的社会感知价值, 从而影响视频用户的持续使用意愿
H8: 评论数量正向影响用户的社会感知价值,从而影响视频用户的持续使用意愿
2研究方法
2.1变量描述与表示
根据前文3 个维度感知價值的构念及其含括的视频与用户特征因素, 构建视频用户持续使用行为影响因素模型, 具体如图1 所示。
然后采用LightGBM、XGBoost 模型, 对数据进行建模, 并利用SHAP (Shapley Additive Explana?tions)解释方法, 对LightGBM、XGBoost 模型进行可解释分析, 探讨各维度感知价值对于用户持续使用行为的影响大小。SHAP 解释方法是由Lundberg S等[30] 提出的用于解释黑箱模型的一种基于归因分析的解释方法, 将SHAP 值作为特征的归因值, SHAP值的作用主要是用于量化每个特征对模型预测所做的贡献。SHAP 方法认为一个特征对于输出变量的效应强度应该为: 使用该特征的预测结果与不使用该特征的预测结果之差[31] 。与传统的特征重要性方法相比, SHAP 解释方法具有更好的一致性, 可以呈现各特征因子相对于目标变量的正负关系, 可用于局部和全局解释[32] 。对于局部解释, 每种特征都有自己的一组SHAP 值(即该特征的每个样本都有1个SHAP 值), 因此, 可用来解释每个样本每个特征对预测的贡献; 对于全局解释, 将所有样本中该特征的SHAP 值取平均作为该特征的重要性值。SHAP模型最大的优势, 是能反映出每一个样本中的特征影响力和该影响对于最终预测结果的正负性。
3实验与结果分析
3.1研究数据
对于不同内容的视频, 用户更关注的特征会有所不同, 因而本文仅选用Bilibili 网站知识区up 主的视频作为研究对象。选取粉丝量分别为50~150万、150~300 万、300~600 万的up 主各5 个, 利用Python 语言编写爬虫程序, 根据表1 爬取并计算这些up 主视频的相关数据, 共获得1 166个样本。获取的视频样本时间跨度为2018 年11 月3 日—2022年1 月8 日。其中, 采用基于情感词典的情感分析方法(SnowNLP)计算视频的每一条弹幕情感值, 取其均值作为该视频的弹幕情感; 对于往期视频数量n, 当n = 10 时, 模型拟合效果达到最佳, 所以,采用待研究up 主近10 期的视频的数据表征各维度感知价值。各数据变量的描述性统计如表2 所示。
3.2回归分析结果分析
3.2.1相关系数分析
变量间的相关系数如表3 所示, 点赞数量、投币数量、收藏数量、转发数量、弹幕密度、评论数量、评论平均长度与观看数量均存在正相关关系,仅有弹幕情感与观看数量存在微弱负相关关系, 表明内容、情感、社会感知价值对视频用户持续使用行为存在正向影响。
3.2.2多元线性回归分析
多元线性回归分析的结果如表4所示。3 个模型的拟合曲线差异不大, 其中VIF 值均小于10,说明变量间不存在多重共线关系。以模型二为例,粉丝数量对观看数量的影响不显著。点赞数量(β =0.424, p<0.001)、转发数量(β =0.106,p<0.001)、评论平均长度(β =0.122,p<0.001)、评论数量(β =0.14,p<0.001) 与观看数量呈显著正相关关系;投币数量(β = -0.214, p<0. 001)与观看数量呈显著负相关关系; 收藏数量(β =0.026, p<0.12)、弹幕情感(β =-0.012, p<0.2)、弹幕密度(β =0.042,p<0. 47)与观看数量没有显著相关性。
综合回归分析的结果, 点赞数量和转发数量对用户的观看行为具有显著正向影响, 知识区视频的内容感知价值显著影响视频用户持续使用行为。投币数量和收藏数量对用户的观看行为不具有显著正向影响, 可能是因为大部分知识区的视频是up 主对某些领域内容的加工与分享, 更具科普属性, 少有用户收藏反复观看; 而投币行为是Bilibili 网站的特色, 可能很多用户并不能知晓并使用此行为,亦或是认为需要花费一定的金钱才能使用此行为对up 主表示支持, 故很少使用。评论平均长度和评论数量对用户的观看行为具有显著正向影响, 知识区视频的社会感知价值显著影响视频用户持续使用行为。而弹幕情感和弹幕密度对用户的观看行为影响不显著, 知识区视频的情感感知价值对用户持续使用行为影响不显著。分析其原因, 一方面, 知识区的视频, 更多的是内容的加工、解读与分享, 少有情感的共鸣与宣泄; 另一方面, 可能是因为用户在观看知识区的视频时更关注视频内容的信息获取与分析, 而在观看完视频后再进行思考、探讨与交流。为进一步验证各维度感知价值对视频用户持续使用行为的影响, 将采用基于SHAP 的可解释机器学习方法验证各特征对用户观看数量的影响。
3.3基于机器学习的SHAP 可解释模型
3.3.1单个样本的特征SHAP 值分析
采用SHAP 方法, 基于已经完成训练的机器学习模型, 对每个样本的特征贡献度进行计算, 得到相应SHAP 值。一个样本所有特征SHAP 值之和即该样本在模型观看数量预测值。以其中一个视频样本(标题为“年轻人不生孩子, 中国未来何去何从?”)为例, 使用XGBoost模型, 在SHAP 方法下,可视化其各项特征对于此视频观看数量的贡献度,结果如图2 所示, 其中蓝色表示该特征对观看数量具有负向影响; 红色表示该特征对观看数量具有正向影响。因而对于此视频, 除评论平均长度对观看数量具有负向影响, 其余特征均正向影响其观看数量, 其中, 弹幕密度对观看数量的正向影响最大,收藏数量次之。另外, 在所有特征的综合影响下,此样本的观看预测值为172.97万, 说明所有特征的综合影响对观看数量有正向作用, 且与该样本的实际观看数量182.15 万接近。一定程度上, 证实了本文所选特征的正确性和SHAP 方法的有效性。
3.3.2总体样本的特征SHAP值分析
1) 特征重要性。将样本数据按粉丝数量分为3 组, 基于SHAP 方法, 使用XGBoost 和LightGBM模型, 计算每个样本的特征贡献度并求均值, 得出每个特征对于观看数量的平均贡献度(SHAP 值),作为该特征的重要性。XGBoost 和LightGBM 模型的结果基本一致, 仅展示LightGBM 模型的结果并分析, 具体如图3、图4 所示。图3 为不同粉丝数量up 主视频的各项特征对观看数量的贡献度, 图4 为视频各维度感知价值对观看数量的贡献度, 其中“综合” 是3 类粉丝数量up 主视频的各项特征SHAP 值的算术平均值, 以作为对各项特征重要性的综合参考。
如图3 所示, 50~150 万粉丝数量up 主视频的播放量, 点赞数量和转发数量的贡献度显著高于其他特征; 150~300 万粉丝数量up 主视频的播放量,点赞数量、弹幕密度、弹幕情感的贡献度显著高于其他特征; 300~600 万粉丝数量up 主视频的播放量, 点赞数量、评论数量、收藏数量的贡献度显著高于其他特征。结合图4 所示, 在3 类粉丝数量的up 主视频中, 内容感知价值的SHAP 值均为最高,说明内容感知价值对观看数量的贡献度最大。在粉丝量为50~150 万的up 的视频中, 情感感知价值与社会感知价值对用户持续使用行为的影响差别不大; 在粉丝量为150~300 万的up 的视频中, 情感感知价值对用户持续使用行为的影响高于社会感知价值; 在粉丝量为300~600 万的up 的视频中, 社會感知价值对用户持续使用行为的影响高于情感感知价值。分析其原因, 对于粉丝数量相对较少或还处在快速增长的up 主, 除点赞以外, 转发行为更能促进其视频的播放, 此时视频的新增播放量可能更多来自非粉丝群体; 对于粉丝数量较高的up 主,其视频的情感感知价值更能促进视频的播放, 可能是因为对于此类up 主的视频, 更多的是在粉丝群体内播放, 而更多的情感交流与共鸣更能促进用户观看up 主的新视频; 对于粉丝数量最高的那一类up 主, 其视频的内容质量必定较高, 往期视频的评论数量和收藏数量对于up 主新视频的播放量影响较高, 说明这类up 主的粉丝更注重视频的内容质量, 收藏以便反复观看, 看完后有更多的思考且与作者或者其他粉丝进行交流。
2) 特征影响的正负性分析。将各项特征在所有样本上的取值以不同颜色来表示, 并构建特征——SHAP 值的散点图, 以进一步探究各项特征对于观看数量影响的正负性。如图5~ 图7 所示, 红色表示此样本点上相应特征的SHAP 值较高, 蓝色表示此样本点上相应特征的SHAP 值较低。某项特征如果与观看数量为正相关, 则此特征在散点图中的表现为以SHAP 值零点为分界线, 左边为蓝色, 右边为红色, SHAP 值零点附近为紫色; 反之, 若为负相关, 则表现为左红中紫右蓝。
如图5~图7 所示, 点赞数量、转发数量、评论平均长度、评论数量与观看数量正相关, 投币数量与观看数量负相关, 弹幕情感与观看数量的关系不明显也不明确, 这与回归分析的结果一致; 收藏数量、弹幕密度与观看数量正相关, 而回归分析的结果中, 收藏数量、弹幕密度对观看数量具有正向影响但不显著, 在图7 中可以发现, 300~600 万粉丝数量up 主的视频, 其收藏数量显著影响用户持续使用行为, 而图6 则显示, 150~300 万粉丝数量up 主的视频, 弹幕密度显著影响用户持续使用行为, 因而认为收藏数量、弹幕密度正向影响视频用户持续使用行为。综合以上数据分析的结果, 本研究认为点赞数量、收藏数量、转发数量、弹幕密度、评论平均长度、评论数量显著正向影响视频用户的观看行为, H1、H3、H4、H6、H7、H8 支持;而投币数量负向影响视频用户的观看行为, 弹幕情感对视频用户的观看行为影响不显著, H2、H5 不支持, 具体如表5 所示。
4结语
4.1研究结论
本研究采用视频与用户特征数据, 基于感知价值理论, 从内容感知价值、情感感知价值、社会感知价值3 个角度, 利用多元线性回归及基于机器学习的SHAP 可解释模型的方法, 对用户持续使用行为的影响因素进行分析。主要有以下研究结论:
1) 在Bilibili 网站上, 感知价值显著正向影响视频用户持续使用行为。其中, 视频的内容感知价值影响最为显著, 这与现有研究结果一致[15] , 视频内容是否优质, 决定了用户的观看意愿。点赞数量对用户持续使用行为的影响远超其他特征[33] ,可能是因为点赞行为被使用在各种网络场景中, 用户对其熟练度较高, 且相较于其他行为, 点赞行为更为便捷与“廉价”, 因而点赞数量可以在很大程度上代表一个视频的内容质量以及大部分用户在观看视频后对up 主的认可程度, 这与文献[19]的研究结果一致。而与现有研究结果不同的是, 本研究发现在不同粉丝数量的群体中, 转发和收藏行为对用户持续使用行为的影响大小不同[17] 。当up 主的粉丝数量较少或者仍在快速变化时, 转发行为对用户持续使用行为影响更大, 视频播放量的增长更多来自于用户的转发使非粉丝群体观看, 而当up 主的粉丝数量较高且趋于稳定时, 收藏行为对用户持续使用行为影响更大, 视频播放量的增长更多来自于用户的收藏以便反复观看。投币数量对用户持续使用行为有负向影响, 这可能是因为用户不太了解Bilibili 网站特有的投币功能, 误认为投币类似于直播中的打赏, 需要付费。而在具有不同粉丝数量的up 主中, 情感感知价值和社会感知价值对用户持续使用行为的影响不同。
2) 现有研究的结论普遍表明, 视频的情感感知价值对用户持续使用行为具有显著正向影响[23,34-35] , 而本研究的數据分析结果显示, 整体上, 情感感知价值正向影响用户持续使用行为但不显著, 仅在150~300 万粉丝数量up 主的视频中,弹幕密度正向影响用户持续使用行为。可能是因为数据选择的偏差, 本文研究的是知识区的up 主的视频, 这些视频本身更多的是up 主对一些领域信息内容的加工与分享, 少有强烈的情感表达, 用户可能更注重视频的观点、信息是否正确或有价值,观看时更注重对新信息和知识的获取、理解与分析, 而非情感的表达。
3) 视频的社会感知价值正向影响用户持续使用行为, 与现有研究结果一致[36] 。在线评论可以反映视频的电子口碑, 有利于用户之间的交流、沟通、讨论, 对视频的二次传播有积极意义, 进而影响了用户持续使用行为。其中, 评论数量和评论平均长度均对用户持续使用行为具有显著正向影响,参与讨论的用户越多, 评论的长度越长, 说明该视频引起了更多用户的思考与交流, 可以促进用户持续使用行为, 这与文献[27]的研究结果一致。另外, 本文发现, 在粉丝群体数量最多的up 主中,视频的社会感知价值对用户持续使用行为影响更大, 可能是因为, 当up 主的粉丝数量很高且趋于稳定之后, 此时的用户更多是老观众, 对此up 主视频的质量具有一定程度的认同, 会更耐心地看完视频, 通过评论表达自身的思考与看法。
4.2研究贡献与管理启示
本文使用Bilibili网站的视频与用户行为特征数据, 研究分析了视频用户持续使用行为的影响因素。从信息感知价值视角构建了视频用户研究的理论模型, 并采用多种方法进行试验, 验证并发现了一些新的结论; 其次, 本文结合传统回归分析与可解释的机器学习方法, 对视频用户持续使用行为的影响因素进行了全面细致的分析, 为基于大规模网络数据的视频用户行为研究提供了思路与借鉴; 最后, 本研究为up 主如何提升视频质量、如何提高视频的播放量, 以及弹幕视频网站如何从多维度把控视频的质量, 提供了理论参考。对于知识区的视频, 视频的内容是视频质量的重中之重, 优质的内容可以持续、有效地提高用户的观看意愿, 弹幕视频网站应该鼓励视频制作者更加专注于视频内容的凝练、打磨, 并为内容质量高的视频提供更多的流量、推荐; 其次, up 主初期在制作出优质的视频的同时, 可适当引导用户帮助自己点赞与转发, 以获得更多的推荐与非粉丝群体的观看; 而在粉丝增长到一定数量时, 需特别注意视频评论区的反响,评论对用户理解视频有较高的帮助, 同时, 可以引起用户之间的有效互动, 视频制作者可以有意识地引导用户在评论区进行深入交流。
4.3局限与展望
本研究的数据来源仅限于Bilibili 网站知识区视频, 后续可有针对性地扩充数据样本, 如在不同的视频网站、不同的视频类型中, 感知价值如何影响用户持续使用行为。视频用户持续使用行为受到多种因素影响, 本文主要从视频的内容感知价值、情感感知价值、社会感知价值3 个角度进行研究, 未考虑视频网站的分发与推荐, 以及用户的偏好是否会对研究结论产生了一定影响, 需要进一步研究验证。