基于社交网络的自媒体舆论传播趋势研究(数据分析篇)
2017-08-22陈煜军
陈煜军
摘 要 本文是基于社交网络的自媒体舆论传播趋势研究的下篇,有别于传统趋势传播研究,所做的趋势分析完全来自于真实的微信朋友圈二次传播样本数据。通过系统所建立的数据模型,对朋友圈二次传播的新闻、活动、直播、投票等特定传播样本进行数据记录。在此基础上,本文还通过11个典型传播模型,尝试性通过系统图表、传播趋势图等方法对数据记录进行初步的数据挖掘,分析基于社交网络的自媒体舆论传播趋势。
关键词 社交网络自媒体;二次传播;数据挖掘
中图分类号 G2 文献标识码 A 文章编号 1674-6708(2017)191-0051-02
为了使基于社交网络的自媒体舆论传播趋势研究更加科学,我们将前文所论述的基于社交网络化舆论传播监测系统接入泉州本地知名媒体、协会等微信公众服务号(或媒体订阅号)的后台,公众号触达用户在1.2万~43.9万之间分布,整个用户池总数为78.1万人,通过在指定区域内持续的、多平台、大容量、跨行业、多类型的样本记录以及异常数据综合比对剔除来保证统计数据的有效性、无偏性以及一致性,同时在数据挖掘上综合采用聚类分析(Cluster Detection,分类比较基础数据)、OLAP分析(On-Line Analytic Processing;OLAP,运用图表分析基本趋势)、连接分析(Link Analysis,生成传播拓扑图进行综合分析)等几种数据模型分析方法。
1 基础数据
1.1 综合数据
截至发稿前,系统已经连续工作了662天,记录传播样本764个,转发核心人数1.5万人,转发次数2.7万人次,传播受众19.8万人,传播次数29.8万人次。
1.2 样本(模型)传播数据
根据朋友圈传播实际以及传播数据综合比对,我们剔除了部分异常传播样本,取得有效样本650个,单样本最大传播49 201人,去权平均传播398.99人,传播数量达到平均数的传播样本42个,占样本总数的6.25%。在此,我们尝试性的将投票类剥离,发现非投票类达平率为14.77%,而非投票类高达45.45%,因此,样本内容和类型对于样本传播效率的影响极大,投票类样本传播效率较为平均,其他样本受巴莱特定律(二八定律)影响,两极分化。
1.3 核心传播数据(用户效率)
系统共取得有效个体传播核心11 504人,受众26.8万人次,最大传播5 039人次,平均传播22.99次,传播数量达到平均数的个体核心1 401人,占样本总数的12.18%,其中非投票类达平率18.01%,投票类12.78%,同理可见,对于用户效率来说,关键的决定因素是个体传播能力,活动内容和类型的影响相对较小。
1.4 典型样本模型
为了更有针对性地进行连接以及趋势分析,笔者在各个传播数量级上随机挑选了内容具有代表性的6种类型11个样本模型,进行针对性分析,经过归类分析比对,最终得出的典型样本模型的综合达平率是22.57%,统计数据参见图1。
2 关联图表
运用图表分析方法,系统生成了24小时分时传播图、周传播图以及周-时关联传播图(图2)。从几张图表来看,周传播的高峰期在每周二、周四和周五,周三有所回落,周日是传播低谷;每天的7点到24点是自媒体传播正常覆盖时段,其中12点到14点是全天高峰期,另外两个小高峰分别在10点和20点左右,转发高峰相对传播高峰基本吻合或者略有提前,这些传播特性和目前互联网上已经可以查到各类统计数据基本一致。值得一提的是,从图2来看,整体数据峰值发生在周四的12~14点左右,而周五的18到22点这段时间形成了另一个特殊的小高峰期,这个小高峰的形成和自媒体传播的生活化特征相关联,也是现有相关资料数据报告尚未正式提及的。通过关联图表整体分析,可以发现,自媒体传播的“生活化”“碎片化”特征,在工余时间的传播力最高,但在完整的周六、日休假时间反而大幅降低。
3 传播拓扑图
传播拓扑图是典型样本传播趋势分析的重要工具,图形化地体现信息传播方向以及趋势,可以综合运用聚类分析、连接分析、OLAP分析等多种分析方法。在系统篇我们已经提到过信息传播拓扑图的设计原理和表现形式,并发布了D模型传播拓扑图,限于篇幅所限,本文只再发布一张加宽核心边距后的样本模型E传播拓扑图(图3),并简要分析下传播拓扑图所集中体现的基于社交网络的自媒体舆论传播趋势。
1)有效期和关键期:对于非持续性传播(非直播类,如新闻、图文事件直播等样本模型),二次传播的完整生命期是信息发布后的72小时,但是绝大部分的传播行为都在内容发布后的48小时以内产生,部分内容在24小时内就达到高峰,如果以样本的传播覆盖总量为基数,则24小时的平均传播率是47%,48小时是84%,而72小时达到93%。简单说,对于大部分的传播内容,舆论传播的关键期就是信息发布后的24小时内。
2)高效个体核心价值:基于社交网络的自媒体舆论传播的关键是个体传播核心的影响力,在传播过程中覆盖高效个体核心至关重要。统计数据表明,自媒体传播的核心平均传受比在10以上,也就是一次分享平均增加10次访问,90%以上的传播来自核心的分享转发,来自于类似微信朋友圈的自媒体分享传播。
3)传播的自我修复特性:传统的传播因为到达时间、路径以及个体原因等问题,在传播过程中可能存在“边界”和“断线”的问题,但是在社交化传播过程中,因为社群式分布式中心的存在,社交圈中的传播个体核心相互关联和相互交错的传播树将通过多径传播自动修复“断线”的问题,并自然拓展“边界”,但是即便是理论上,排除内容的影响,这种传播也并非类似“六度分隔”理论所阐释的那样无边无际,实际上其传播严重受限于传播平台的用户容量(比如微信的用戶群)、一次传播的到达率以及传播的72小时有效期。
4)传播爆炸和关键因子:在本次数据分析过程中,我们发现一个有趣的现象,比如一个内容传给A,A分享后只有B、C、D三个人访问,但是其中的B却有200多人访问,因此,B是传播爆炸的导火索,但是A却是传播的关键因子。在基于社交网络的传播架构中,由于传播爆炸和关键因子的存在,对应自媒体舆论传播的舆情研判也将更为复杂和不可预见。
5)分布式社群中心化特征:大量的数据和调研都指出自媒体的“去中心化”特性,但是传播拓扑图却体现出社交化自媒体舆论传播正在形成另一个核心,就是基于社交圈的社群化分布式中心会在传播图中自然形成,这个核心构筑的基础是作为传播关键因子的高效个体核心之间的社群关联性。当然,同传统社交圈相对应的,在传播圈的边缘,也必然有一部分“离群”传播孤岛的存在。
4 结论
本文笔者在工作中针对基于社交网络的自媒体传播研究构筑了一套信息系统,并通过系统分析工具以及数据挖掘分析方法进行传播趋势研究的尝试,系统还有改进空间,数据分析也可能存在地区性特征,但是所建立的数据模型、监测系统以及分析算法、结果具有较强的现实意义和实用价值,可供业内同行参考。
参考文献
[1]企鹅智酷.2017自媒体趋势报告.
[2]企鹅智酷.微信2017用户研究和商机洞察.
[3]侯斯特.2017微信公众号数据报告大数据解读用户阅读习惯.