微博评论幂律特性实证研究
2018-01-02金跃强钱皓琛南京工业职业技术学院公共基础课部江苏南京00江苏中创市场调研咨询有限公司公共事业研究部江苏南京009南京航空航天大学金城学院江苏南京056
金跃强 张 莹 钱皓琛(. 南京工业职业技术学院 公共基础课部, 江苏 南京 00;. 江苏中创市场调研咨询有限公司 公共事业研究部, 江苏 南京 009;. 南京航空航天大学 金城学院, 江苏 南京 056)
微博评论幂律特性实证研究
金跃强1张 莹2钱皓琛3
(1. 南京工业职业技术学院 公共基础课部, 江苏 南京 210023;2. 江苏中创市场调研咨询有限公司 公共事业研究部, 江苏 南京 210029;3. 南京航空航天大学 金城学院, 江苏 南京 211056)
微博是重要的信息传播和交流根据,在舆论生成和传播中发挥了重要的作用。通过分析名人微博的两条微博评论记录,实证研究评论数随时间的消亡以及评论时间间隔分布的幂律特性。实证结果为:两条微博的评论数随时间消亡的幂律指数分别为0.579和0.537,对应的两条微博的评论时间分布的幂律指数分别为1.579和1.537。结果表明,两条微博的评论符合人类行为的幂律分布特征,且属于幂律指数为1.5的普适类划分,从而为仍处于争议阶段的人类动力学机制幂律分布提供了新的证据。
微博评论; 评论时间; 幂律指数; 普适类
人类自身的行为纷繁复杂,对人类行为的研究主要是观察其统计特征,发现潜在的规律。长期以来,人类行为的发生被认为是均匀的,因此可由齐次泊松过程来刻画[1]。2005年学者Barabasi通过研究发现人类行为的时间规律表现出高度的非均匀性,具备“爆发”等非泊松特性,并自此开创了“人类动力学”的新研究方向[2]。近年来,研究表明即时通信、在线服务、网页浏览、电影点播等人类行为发生的时间间隔均服从幂律分布, 并且幂指数大多分布在1 至3 之间;Vzquez等[3]将人类动力学划分为幂律指数为1和1.5的两个普适类。作为Web 3.0时代的标志性产物,微博已逐渐成为一种重要的信息传播和交流工具。如新浪微博2016年的月活跃人数高达2.97亿,存在着巨大的应用潜力,微博成为人类行为研究的热点。郭进利通过实证研究发现人们对于某个博客话题的兴趣逐渐消失且评论的时间间隔服从幂律分布[4],但幂律指数呈现多样性并不适用幂律指数为1和1.5的两个普适类划分。吴联仁分析了380天内175名用户的微博评论数据,发现用户连续评论时间间隔分布幂指数α与平均评论数消亡指数θ线性相关,关系为θ=α-1[5]661。微博评论作为新兴的评论模式,其强大的传播活力在网络舆论生成和传播中扮演者重要角色。此外,微博评论是微博用户对微博内容的感受表述与评定,以及对他人的评论作出自己的评论,微博评论以发表时间的逆序排列,从而阻滞了微博信息传播力的衰竭。名人微博因为名人效应,往往拥有大量的粉丝而广受关注,发挥着普通人无法达到的信息传播力和影响力。因此,拥有巨大影响力的名人微博,其用户评论数随时间消亡情况是否同样具有幂律分布特征,以及其幂律指数是否适合上述两个普适类还有待于进一步研究。基于此,本文选取特定样本,对名人微博评论的幂律特性进行实证研究,以进一步揭示网络信息传播规律。
1 研究样本选取与数据描述
演员姚晨被称为“微博女王”,其新浪微博注册于2009年8月28日,拥有关注用户数(粉丝数量)高达8 000多万,拥有微博粉丝数量位居全国之首,在全球微博用户粉丝数量排名中列第3位[6]。 由于微博发布内容通常具有时效性,随着时间的流逝,微博内容显得陈旧,公众的关注度逐渐减弱。但较普通用户的微博,姚晨微博从发布到消亡,具有漫长的生命周期。鉴于此,研究姚晨微博评论数的消亡情况,必须选择较长时间之前发布的微博作为研究对象。截至目前(2017年3月31日)姚晨微博共发布了9310条博文,关注用户为8056万人。由于近期的姚晨微博关闭了粉丝评论,且考虑到微博的评论数量(评论数量过小,统计特征不明显),本文抽取了姚晨2015年1月16日17∶34发表的悼念歌手姚贝娜的博文“一路走好,美丽的姑娘,愿你在天堂里继续自由地歌唱” (文中简称“一路走好”)和姚晨于2015年1月31日18∶15发布的“看嘴识人”两条微博为研究对象。“一路走好”微博的首条评论时间为2015年1月16日17∶34(与微博发布时间同时刻),评论截止时间为2016年8月8日18∶29分,共收到5796条评论。由于微博时间设置最小单位为1分钟,因此必须剔除与微博同1分钟发出的评论(因为该段时间不足1分钟)。本文抓取微博发布后1分钟即从2015年1月16日17∶35分开始的评论,共抓取了5420条有效评论信息。限于篇幅,表1给出姚晨2015年1月16日17∶34发表微博的前10分钟评论数。从表1可以看出,评论数存在集中爆发的情况,该微博发布后的第1分钟的评论数高达443条,且随着时间的推移评论数越来越少,逐渐消亡。前10分钟占总时长不足万分之一,但评论数却占全部评论数的36.1%,表现出名人微博评论行为的非泊松特性,与经典的理论假设“人类行为时间间隔服从泊松分布”完全不同。同时也应看到,该条微博评论时间极长,直至微博发布后的第826615分钟(2016年8月8日18∶29分)微博评论才截止,表明名人微博有着较长的生命周期且存在明显的胖尾特征,具备幂律分布的典型特征。
表1 “一路走好”微博前10分钟评论数
第二条微博“看嘴识人”微博的首条评论时间为2015年1月31日18∶15(与微博发布时间同时刻),评论截至时间为2016年6月26日11∶48分,总共收到469696条评论。本文从微博发布的下1分钟即18∶15开始,抓取了4629条评论,表2给出了该微博前10分钟的评论数。由表2可以看出,仅仅10分钟微博评论数已占到全部评论数的24.4%,存在评论的爆发现象,同时与第1条“一路走好”微博一样评论时间较长,存在胖尾特征。但与第1条微博评论数陡降不同,该条微博自微博发布的第3分钟以后即从18时19分开始,微博评论数降幅比较平缓。
表2 “看嘴识人”微博前10分钟评论数
2 微博评论的幂律特性实证研究
微博的生命周期一般是指自微博发布到其最后一次被评论之间的时间长度;在微博的生命周期内,单位时间获得的评论数是衡量微博信息传播的重要指标。在微博的生命周期内,设N(t)表示某条微博在第t分钟新产生的评论数,θ为评论数随时间消亡的幂律指数,α为评论时间间隔的幂律指数。那么有如下结论成立[5]659:若个体行为时间间隔服从幂律分布P(τ)~τ-α,则微博信息传播速度的消亡形式服从幂律分布N(t)~t-θ,且θ=α-1。根此,第t分钟内产生的新的微博评论N(t)应满足:N(t)~t-θ,且θ=α-1。下文就选中的样本数据给予实证研究,以探究名人微博信息传播力随时间消亡的幂律特性。图1给出了本文选择的样本姚晨发布的“一路走好”微博评论数随时间消亡情况,由图形可以看出:在微博发布后的第1分钟评论数就高达443条,存在明显的“抢沙发”现象,评论数量存在明显的“爆发性”现象,实证了微博信息传播过程中的时间异质性;随着时间推移,评论数陡降,到微博发布后的第100分钟,评论数降为9条。根据刘晓娟等人的实证研究结果[7],微博的寿命最长不超过36 000分钟(25天),平均为5 000分钟;而本文选取的样本微博评论时间持续了826 615分钟(约574天),表现了名人微博不同于普通人微博以及热点时间微博的特点。在双对数坐标下,微博评论数和评论时间呈现明显的线性关系,如图2所示。采用最小二乘法拟合,得到斜率(同时也等于幂律指数)θ=0.579。在拟合效果方面,本次线性拟合后相关系数R2=0.6175,但由于需拟合的点数达826 615个,表明拟合的效果较好。因此,可以得出姚晨发布的“一路走好”微博评论数N(t)~t-0.579,即微博评论数随时间以幂律形式消亡,且幂律指数为0.579。由此可得,该条微博评论的时间间隔α=θ+1=1.579, 这恰好与Vzquez等将人类动力学划分为幂律指数为1和1.5的两个普适类的研究结果相符,但与吴联仁等人的研究结果有较大不同。吴联仁等人的研究结果为:微博评论N(t)随时间以幂律形式消亡,但幂律指数达1.5,评论时间间隔分布幂律指数达2.5[5]658。幂律指数均远高于本文的结果。幂律指数越大,表明微博评论数随时间消亡的速度越快。吴联仁等人的研究样本是175名用户微博,且研究样本为最具人气的姚晨微博,相较其他用户微博,姚晨微博有着更高的关注度和流行度,更长的微博周期,此外姚晨微博评论的消亡速度也缓慢得多,从而存在更长期的信息传播效果。
同理,对姚晨发布的“看嘴识人”微博的评论数随时间消亡的情况,如图3和图4所示,在双对数坐标下呈现一定的线性特征。因此,拟合得到评论数N(t)~t-0.537,即微博评论数随时间以幂律形式消亡,且幂律指数为0.537,该条微博评论的时间间隔α=θ+1=1.537。由此可见,该微博评论数随时间的幂律形式消亡指数、评论时间间隔与“一路走好”微博评论大致相等,同样属于幂律指数为1.5的普适类划分。
图3 姚晨发布的“看嘴识人”微博评论数消亡曲线
图4 双对数坐标下“看嘴识人”微博评论数消亡曲线
3 结语
本文选择了微博女王姚晨的两条不同微博为样本,研究了评论数随时间消亡的幂律形式;进一步利用评论数随时间消亡的幂律指数与评论时间间隔的幂律指数之间的关系,计算出了两条微博评论的时间间隔的幂律指数。实证结果表明,两条微博评论的时间间隔均在1.5左右,符合人类动力学的人类行为的两个普适类划分,从而为人类动力学机制幂律分布提供了新的证据。名人微博因为有着巨大的关注度,从而引发长时间的、大量的评论,信息传播力较强。特别是在微博发布后不久就会引发大量的评论,存在评论“爆发”现象;随着时间的推移,评论数以幂律形式衰减,并有着明显的胖尾特征。因此,微博的评论时间持续较长,微博有着较强的生命周期。本文选择的两条微博,发布的内容完全不同,发布时间也相差近两周,但评论数消亡的幂律指数、时间间隔的幂律分布指数却大致相同,表明名人微博的信息传播可能存在某种共同的规律,还有待于进一步地探索。关于人类行为学的幂律特征研究,学界还有较大的争议,相关理论的实证研究相对偏少。此外,通过本文的实证可以看出:名人微博在发布之初,评论数随时间的推移迅速地减少,在双对数坐标下,呈现较好的线性特征。这表明,在微博发布的初期,评论数以幂律形式消亡。但在一段时间以后,评论数随时间减少的趋势相对平缓,在双对数坐标下表现出一定程度的震荡。这在一定程度上说明,随着时间的推移,网民评论的兴趣渐渐消失,评论时间间隔与兴趣驱动的幂律形式有着一定的差别,还需要进一步研究。
[1] 樊超,郭进利,韩筱璞,等.人类行为动力学研究综述[J].复杂系统与复杂性科学, 2011(2):1-17.
[2] Barabasi A-L. The origin of bursts and heavy tails in human dynamics[J]. Nature, 2005(435):207-211.
[3] Vzquez A,Oliveira J G,Dezs, et al. Modeling bursts and heavy tails in human dynamics[J].Phys Rev E,2006,73 (3) :36-127.
[4] 郭进利.博客评论的人类行为动力学实证研究和建模[J].计算机应用研究,2011,28(4):1422-1433.
[5] 吴联仁,李瑾颉,闫强.基于时间异质性的微博信息传播模型[J].电子科技大学学报,2015,44(5):657-662.
[6] 万菁,郑智斌.从姚晨微博看微博兴盛的动力[J].今媒体,2011(11):86-88.
[7] 刘晓娟,王昊贤,张爱芸.微博信息生命周期研究[J].图书馆情报工作,2014,58(1):72-78.
AnEmpiricalStudyonPowerLawCharacteristicsofMicro-blogComment
JINYueqiang1,ZHANGYing2,QIANHaochen3
(1. Public Foundational Courses Department, Nanjing Institute of Industry Technology, Nanjing 210023, China; 2. Public Services Department, Jiangsu Precision & Creativity Marketing Pesearch Co.,Ltd, Nanjing 210029, China; 3. Jincheng College, Nanjing University of Aeronautics and Astronautics, Nanjing 211056, China)
Micro-blog is an important basis for information dissemination and communication, and plays an important role in the generation and dissemination of public opinions. Based on the analysis of two micro-blog records of celebrities, this paper empirically studies the number of comments with the death of time and the power law characteristics of the distribution of comment intervals. The results are as follows: the number of the comments of the two micro-blogs demise with time, and the the power-law index were 0.579 and 0.537, cohich shows that the power-law index of the two micro-blog corresponding comment time distribution are respectively 1.579 and 1.537. Which means that the two micro-blog comments conform with human behavior of power-law distribution, and belongs to the power law index 1.5 general categories, which provides new evidence for human dynamics mechanism of the power-law distribution being in the dispute stage.
Micro-blog comment; comment time; power law index; universal class
2017-07-19
2014年江苏省“青蓝工程”优秀青年骨干教师项目;江苏省大学生实践创新训练计划项目“基于时间统计的微博评论行为建模与实证”(2015049)
金跃强(1981— ),男,安徽来安人,副教授,研究方向:科学评价与决策。
10.13750/j.cnki.issn.1671-7880.2017.05.012
TP 391
A
1671-7880(2017)05-0049-04
责任编辑刘法虎