APP下载

网络社区信息预测与引导
——基于Tobit模型的实证研究

2022-10-15钟磊

现代信息科技 2022年15期
关键词:回帖帖子领袖

钟磊

(新疆财经大学 信息管理学院,新疆 乌鲁木齐 830012)

0 引 言

根据中国互联网络信息中心第49次中国互联网络发展状况统计报告显示,截至2021年12月,中国网民数量达到10.32亿,互联网普及率达到73%,网民使用手机上网的人数比率为99.7%。网络已经成为人们表达个人想法、交流和共享信息的不可或缺的手段。用户几乎每天二十四小时不间断在网络社区中发布海量信息。网络社区中信息传递的双方互动性和对称性很强,信息可以进行实时的反馈。网络论坛就是一种网络社区的典型代表,是很多网民集中参与讨论、传递信息、发布意见的虚拟空间。一般都按话题进行分类,信息具有很强的针对性,社区成员间通过“发帖—回帖—跟帖”的行为序列进行互动或者通过收藏、点赞、关注等行为进行双向或单向的互动。某些小的话题经过网络空间的放大之后,可能会形成汹涌的网络舆情浪潮。因此,有必要研究网络社区一般信息传播特点,寻求其中的普遍规律,提出相应的信息管理方法。为进一步识别网络热点信息,监控和引导网络舆情等工作奠定基础。

周杨、张会平依据微博数、关注数和粉丝数等信息,把用户划分为游离型、信息获取型、活跃型和名人型4种用户类型,构建了微博用户偏好模型,并进行了相关实证研究,最后提出了舆情用户分类识别和引导的相关建议。曾润喜、徐晓林采用内容分析法对新浪网某新闻样本的跟帖进行了多维度分析,从网络舆情的时间分布情况、网民的使用媒介、网民的态度和指向类型等行为属性进行了相关实证研究,相关结论开辟了网络舆情传播规律研究的新视角。张思源等人通过循环迭代不断移除社会网络中相异性最高的边,从而获得新的社区结构,从社区发现的视角进行了网络社区用户群体分类。识别具有影响力的用户,即网络意见领袖,也受到广大学者的关注。识别具有影响力的“博主”,识别学术社区中具有影响力的学者等,从已有的研究可以看出,意见领袖和非意见领袖对网络社区发帖行为有重要的影响。此外,很多研究认为,网络社区中的帖子的质量和类型对平台的活跃度也具有重要的影响。如果一个网络平台充斥着重复的、无用的或者低质量的信息,那么该平台可能会很快走向消亡。在已有的大部分研究当中,很多学者采用传播学、信息学和管理学等理论进行定性的研究。在定量的研究当中,基本采用分类、聚类和社会网络分析等方法进行,鲜有选用计量模型进行相关研究的前例,因此,本文使用Tobit模型进行数据分析,希望从中得到不同的启示。

1 网络空间信息传播实证分析

1.1 研究变量设置和模型建立

Tobit模型由经济学家、诺贝尔奖获得者托宾在1985年提出。Tobit模型可以很好地解决观测数据或者因变量取值受限或被截断的一类回归问题。如果样本中有一些数据无法被观察到,而是以一个特定的值代替,则称为受限回归;如果范围内的部分观测值被舍弃,则称为截断式回归。

选择某网络社区用户回帖数量作为因变量。影响网络社区用户回帖数量的因素主要有:发帖的类型、质量,精英型用户即意见领袖的参与程度,发帖内容的认可程度等。因此,本研究在解释变量的构建上,选取了四个主要变量。第一个解释变量为帖子的类型,分为原创帖和转载帖。第二个解释变量为主帖字数,代表帖子的长度。第三个解释变量为意见领袖参与的程度,用意见领袖的人数来代表,这里定义粉丝数为50 000以上的用户为意见领袖。第四个解释变量为主帖的被认可程度,以帖子的点赞数来度量。具体的变量设置如表1所示。使用这些数据建立Tobit模型。

表1 变量设置说明

在网络论坛中,回帖的数量不可能取负值,回帖数最小为零,回帖数量的观测值总是被截取为大于等于零的形式,建立Tobit模型如下:

其中和分别表示正态分布的概率密度函数和概率分布函数。将(y) 对第个解释变量求偏导数,可得第个变量的边际效用:

1.2 估计结果及分析

文章使用爬虫工具,从某知名技术类论坛中获取了186个帖子,主题帖的数量为36个,每个主题帖所对应的回复帖子数量的均值为4.16,回复帖数量最大值为11,最小值为0。用Python简单计算了每个主题帖的字数,人工统计出每个主题帖的类型、点赞数以及其下参与讨论的意见领袖的人数。将统计得到的数据代入Tobit模型进行分析,具体结果如表2所示。

从Tobit模型结果看出,Lx未通过显著水平5%的卡方检验,这说明帖子的类型对其回复数的影响并不显著,论坛用户不会根据帖子是原创帖还是转载帖来决定回复或者不回复。因此不同类型的帖子对论坛用户的注意力吸引没有太多差别。

表2 Tobit模型分析结果

Zs也未通过显著性检验,因此认为,对于一个帖子而言,是否能吸引其他论坛用户的注意力,其长度并不太重要。一个主题帖如果想吸引网民的注意力,仅仅靠发长帖是不够的,关键在于帖子实际包含的信息点是否足够吸引人。某些时候仅仅是一个标题,比如“五分钟看懂谱聚类的原理”,一个标题就能吸引很多用户的关注。再比如某些帖子虽然字数不多,或者仅仅是一张图片,但是抓住了“痛点”,引起了其他用户“共情”,就能迅速得到很多回帖。

Yjlx通过了显著性检验。这说明对于一个主题帖而言,意见领袖的参与非常重要。由表2可知,帖子讨论过程中每增加一个意见领袖,回帖数将平均增加2.6个,因为意见领袖的人气和威信总能吸引大量的论坛用户参与讨论和回帖,因此要加强网络信息的传播,最好邀请尽可能多的意见领袖参与讨论。

Dzs也通过了显著性检验,说明主题帖的点赞数会对其回复数产生显著影响。点赞数可以理解为论坛用户对帖子的评分,自然评分越高的帖子越受关注。从表2可知,点赞数每增加1,回帖数平均增加1.28个。

随后,从论坛中随机抽取了10个主题帖,将数据代入模型,进行了预测,并将预测的回帖数量与论坛中的实际值进行了比较。结果如图1所示。模型具有一定的参考价值(红色曲线为实际值,蓝色为预测值)。

图1 预测值与真实值对比

2 关于网络空间信息的引导策略

首先,正如前面分析的,虽然帖子的类型和帖子的长度对于信息的传播没有实质性的影响,但是帖子实际包含的信息点却对网络信息影响很大。帖子往往可以通过标题“博人眼球”或者通过某些信息点吸引用户“共情”。针对这一情况,要加强帖子的分类管理,虽然现在的网络论坛等媒介都基本实现了帖子按主题的分类管理,但管理还不够灵活,论坛管理者应该根据实际情况的需要,有意识地引导网民的讨论内容。网站应该建立更加灵活的板块分类功能,甚至可以动态、自动化完成个性化的信息分类和版块生成工作,让板块细分尽可能多的覆盖网民的兴趣点。同时利用技术手段自动将帖子进一步分为科普帖、求助帖、灌水帖等,增强帖子的针对性,更容易获得网民的响应。

其次,培养网民的自律意识和诚信精神。目前的技术手段可以实现对帖子内容一定程度的过滤功能,但是遇到深层语义方面的过滤则力不从心。因此,仅靠技术手段是行不通的,除了依靠人工监管,还要提高网民自身素质。比如不用“别有用心”的标题来“哗众取宠”,自行保证帖子“文题一致”等等。提高网民网络素质,规范网民行为,增强网民规范上网意识,才能使网民自觉抵制错误取向,自觉维护网络空间的道德和秩序。

最后,培养网络“意见领袖”。从前面的实证可以看到,网络意见领袖对信息的传播具有重要作用,网络意见领袖能促成网络信息和舆论最终的形成。因此,意见领袖应该在网络信息传播过程中,承担起更多的社会责任与社会义务。在敏感的网络信息传播过程中,应主动正确发声,减弱网络上的“杂音”。发表对事件的客观的、理智的观点,以此营造网络正向氛围,使舆情向正确的方向发展。尤其是现在的政治宣传类网站,更应该积极培养“红色意见领袖”,让他们定时定向地发声来引导主流舆论,增强网络正能量。

3 结 论

网络言论开放,舆论分散,给网络信息的控制和引导增加了难度。虽然网络空间的自由与引导总是矛盾的,但是可以通过技术或者非技术的手段,在保证网络空间自由度的同时进行网络信息的有效引导。

猜你喜欢

回帖帖子领袖
中国工人运动杰出领袖林伟民
THE JAZZ AGE
暴力老妈
2015中国最具影响力10位商界领袖
善意回帖:韩国教授的民间努力
续写传奇
爆强回帖集锦等
高手是这样拍马屁的
我是怎样在坛子里堕落的