广州天气微博信息生命周期研究
2023-10-30石伟伟李毅恒符靖茹吴振鹏张毅
石伟伟,李毅恒,符靖茹,吴振鹏,张毅
(1.广州市突发事件预警信息发布中心,广东广州 511430;2.中山市气象局,广东中山 528400;3.湛江市气象局,广东湛江 524000)
气象服务的本质是信息服务。气象部门履行气象防灾减灾和气象公共服务的职能,主要通过网站、电视、短信、传真、新媒体、文件报告等各种渠道向社会各界传达天气预报、预警等各类信息实现[1]。当前微博渠道气象服务蓬勃发展,作为一种新型信息传播方式,其便捷迅速、多向性、互动性、能动性和时效性的特征使其成为气象部门发布各类气象服务信息的主渠道之一。以广州天气微博为例,其采用自动发布和人工采编相结合的方式,每天在相对固定的时间发布内容、主题相对固定的微博,并有天气小编实时互动,解答公众问题。在微博渠道气象服务领域,广州天气微博具有一定的影响力和代表性[2-3]。本研究以广州天气微博为样本,通过分析不同预报时效的天气预报类微博的信息生命周期、微博评论半衰期等,期望得到微博渠道不同预报时效的气象信息价值随时间变化规律,从而为天气类微博运维策略提供理论指导,也能对其他渠道气象信息理论研究有所启发。
1 相关研究
信息资源是一种有生命周期的资源,其生命周期由一系列逻辑上相关联的阶段或步骤组成[4]。信息的有效价值和受众关注随时间的流逝而衰减普遍存在,信息计量学称之为“老化”。信息老化速度的测度指标有半衰期、生命周期等。刘晓娟等[4]将微博生命周期,或称微博寿命,定义为微博的存活时间,即自微博发布到其最后一次被评论的时间差,并使用评论数和转发数作为微博信息生命周期的表征量;段宇峰等[5]认为,半衰期是指网络信息资源的基本构成元素有半数发生变化所需要的时间;江燕青等[6]使用微博转发半衰期和评论半衰期对微博信息老化进行研究,微博评论半衰期指一条或者一批微博达到总评论数50%的时候,距离微博发布时的时间差。
天气预报类信息自产生始,就自带信息可用期限,亦即预报时效。超出预报时效,预报类信息就无法再提供其信息价值。在微博渠道气象服务实践中,天气预报类信息往往在其达到预报时效之前,就不再被网友关注、利用和互动,信息效用价值提前归0,表现为阅读量、转发、评论、点赞数停止增长。当前对信息生命周期的研究多集中于社会新闻类微博,对气象类微博的研究尚未有人进行。本研究借鉴相关研究成果,针对气象类信息的特殊性,以微博信息生命周期、微博评论半衰期为切入点,对不同预报时效的天气预报类信息开展拓荒性研究。
2 资料和方法
江燕青等[6]、梁芷铭等[7]的研究表明,内容类型、原创性、用户行为、发布时间等会影响微博信息老化,而广州天气微博发布主题微博的内容类型、发布时间相对固定,可以避免内容类型分类、发布时间分类的繁琐。
广州天气微博每天自动发布的主题固定的微博包括广州上班天气、广州今日天气、广州午间天气、广州下班天气等;人工采编的主题固定的微博包括早安广州、天气剧透、七天天气预报、晚安广州等[8-10]。各主题微博发布时间、具体内容等情况见表1。对广州天气2014—2020年度发布的这7类微博、评论时间数据进行采集分析,共抓取微博15 306条,网友评论285 450条。
表1 各主题微博情况及其评论半衰期、平均生命周期
3 数据分析
3.1 各主题微博生命周期及半衰期
绘制各主题微博信息生命周期分布盒须图(图1)。由图1可以看出,网友评论时间介于微博发布后的0 min~30 968.55 h之间。时间跨度1 d以上的评论819条,占比0.003%。绝大部分评论发生在微博发布的1 d内。各主题微博平均生命周期为32.76 h,中位数4.23 h,75%的微博生命周期在16 h以内。不同主题微博的生命周期差别较大,其中广州上班天气、广州今日天气、广州午间天气、广州下班天气4种主题微博生命周期较短,一般小于8 h,且大部分集中在1~5 h;而早安广州、天气剧透、晚安广州3种主题微博生命周期较长,且样本之间差异大,中位数在7 h以上;七天天气预报微博生命周期中位数在1 d左右,表明人工采编微博比自动发布的微博有更长的关注时间。
图1 各主题微博信息生命周期分布
根据微博评论半衰期的定义进行计算,可得全部微博的评论半衰期为46 min;各主题微博评论半衰期介于20~137 min之间,集中在30 min左右(表1)。在刘晓娟等[2]的研究中,“临武小贩之死”、“小时代”等社会新闻类微博评论半衰期介于1 251.99~3 762.4 min;江燕青[4]选取的高校官方微博样本评论半衰期介于136.88~787.99 min,都大于天气预报类微博评论半衰期,体现出天气预报类微博的特殊性,生命周期更短。
对比各主题微博评论半衰期和平均生命周期数据发现,7 d天气预报的评论半衰期及平均生命周期整体大于1 d天气预报;1 d天气预报的评论半衰期及平均生命周期整体大于短时天气预报,随着预报时效的增加,信息老化速度变慢。微博的半衰期和平均生命周期、平均每条微博的评论数呈一定的正相关关系。另外,七天天气预报评论半衰期和平均生命周期明显长于天气剧透以及其他主题微博,这是由于七天天气预报每天16:00发布后,运营人员会将其置顶,直到第2天的16:00才会取下替换为新的七天预报,说明微博置顶对微博生命周期的延长有明显的促进作用(表1)。
微博置顶作为稀缺资源,利用好了对单条微博服务效果会有很大提升。进一步分析七天天气预报评论数据可知,七天天气预报在发布约10 h后,其评论数趋近于0,但在约15 h后,评论再次活跃,这是由于16:00发布后,经过约10 h大部分网友均已入睡,而15 h后网友逐渐起床,打开广州天气微博主页面后就会浏览到置顶微博,故评论数有所回升,这也是其生命周期明显长于其他微博的一部分原因。七天天气预报发布约16.5 h后,也就是第2天08:30值班开始,微博评论数已经达到总评论数的85%,已经发挥其绝大部分信息效用价值,因此可以将七天天气预报置顶在第2天上午取下,更换置顶微博,合理利用置顶资源。
3.2 微博评论时间分布曲线
绘制不同预报时效微博评论占比随时间变化曲线(图2)。整体来看,各主题微博发布后第1~3 min即达评论占比峰值,微博评论呈初始爆炸性,其后评论数迅速下降;在约30min后曲线斜率迅速降低,评论数渐趋0。
图2 不同预报时效微博评论占比时间分布
分析图2a发现,上班天气和下班天气变化曲线比较相似,而午间天气的评论占比峰值相对较小,下降曲线的斜率也更小,表明午间天气具有比上班天气、下班天气更长的生命周期,信息老化速度更慢。一方面可能是由于午间天气预报时效比上班天气、下班天气长1 h;另一方面可能是因为中午休息时间较长,公众有较多的时间浏览微博信息,且运营人员在午间天气发布后,往往会进入午休时间,未来2 h较少更新微博,而上下班天气分别发布于06:30和16:30,公众大部分还未上班或下班,且微博发布后很快有新的微博更新,分散公众注意力,导致其生命周期相对较短,信息效用价值迅速减弱。上班天气的评论峰值以及发布后30 min内评论数较其余两种更高,体现出上班天气微博具有更集中的活跃期,原因可能是上班时间集中,上班路上公众有较强的需求和充足的时间关注天气并评论。
从图2b可以看到,广州今日天气、早安广州、晚安广州的评论占比曲线重合度较高且峰值较为接近,其微博评论半衰期分别为34、31、30 min,相差不大。尽管评论占比的峰值较其余二者小,但广州今日天气在发布后的第25~100 min区间评论占比较高,相应地延长了其评论半衰期。
从图2c可以看到,天气剧透和七天天气预报评论占比时间分布曲线分离度较大,七天天气预报评论占比峰值明显小于天气剧透,也明显小于短时天气预报和1 d预报时效微博,具有更加平滑的下降曲线,这体现了七天天气预报的特殊性,印证了长预报时效和微博置顶对微博生命周期的提升作用。
3.3 微博评论时间分布曲线拟合
通过3.2节分析可见,无论是整体微博的评论数,还是各类主题微博的评论数,在经过初始的迅猛上升后,均呈现出相似的下降曲线。本研究使用matlab对全部主题微博以及各主题微博的下降曲线进行函数拟合(图3),发现均适用类型y=axb+c的幂函数。
图3 广州天气2014—2020年发布的各主题微博评论拟合曲线
各参数及拟合优度评价指标见表2。各类主题微博评论占比下降曲线都呈y=axb+c的幂函数形态,指数项b均处于-0.2~-0.45之间,因子项a在0.2~0.6之间,偏移量c在-0.003~-0.018之间,形态差异不大。R2普遍在0.97~0.99之间,表明函数拟合效果很好。其中全年所有主题微博以及今日天气、早安广州、晚安广州、天气剧透、七天天气预报的R2均超0.98,拟合效果极佳;但对于短时天气微博(上班/午间/下班天气),R2<0.98,略低于其他主题,最低的午间天气只有0.935;对比表1的数据,R2较小的主题微博,其平均评论数也较少,这可能意味着微博热度,亦即微博评论量对函数拟合效果有影响,评论量越大的微博,评论数随时间的分布曲线越符合其本有的内在规律。
表2 各主题微博下降曲线拟合函数参数及拟合优度评价指标
从拟合之后的曲线可见,基本上符合峰值越高,下降速度越快,也越早到达微博生命周期上限的规律。上班和下班天气其曲线最陡,主要评论出现在发布后的50 min以内,信息价值迅速降低,因此其生命周期越短。与此相反,七天天气和天气剧透虽然峰值低,但其评论曲线延伸到较长时效,表明其不断被人关注,信息效用价值衰退速度慢,体现出另一种微博生命周期模式。
对于各种类型的微博评论数随时间变化函数的拟合,可以用于对该微博评论数随时间变化规律进行预测或对微博服务效果进行提前评估,比如在微博发出后的数分钟之内,即可通过评论数以及该类微博评论的变化函数,得出这条微博最终的评论总数,以对服务效果进行评估。另外,如果微博评论不是网友自然形成,而是有人工干预例如发动水军评论等现象,也可以采用对微博下降曲线拟合函数进行对比评价的方式识别。
4 结论
1)天气预报类微博评论半衰期介于20~137 min之间,主要集中在20~40 min,远远短于高校官方、社会新闻等类微博。体现了天气预报类信息的特殊性,信息生命周期更短。
2)随着预报时效的增加,信息老化速度变慢,微博预报时效、评论半衰期、微博评论数和微博生命周期三者存在正相关。在微博渠道开展气象服务时,可以多发布预报时效长的微博,以提升微博生命周期长度和服务效果。微博置顶手段可以显著降低微博信息老化速度,目前广州天气微博将七天天气预报单独置顶24 h的措施,可能未能合理利用该功能,适时更换置顶微博可能有更好服务效果。
3)各主题微博评论数随时间变化均符合如下规律:一开始评论数迅猛上升,在第1~3 min达到峰值,其后评论数迅速下降,且下降曲线高度符合类型y=axb+c的幂函数型分布特征,R2在0.97~0.99之间。短时天气预报类微博拟合效果不如1和7 d预报时效微博。