政务微博网络结构特征研究
2017-08-25蹇洁张英培刘雪艳叶芯彤
蹇洁+张英培+刘雪艳+叶芯彤
[摘要]通过引入复杂网络理论,对政务微博网络结构进行基于社会网络分析方法的研究。以重庆市地区的917个微博账号为研究对象,应用Matlab分析软件对重庆市政务微博账号的关注关系进行分析,从度、聚类系数和平均路径长度3个维度分析其关注系数情况和网络结构特点。研究表明,政务微博关注关系网络入度符合幂律分布,具有重尾分布的特点,其网络结构具有较好的聚集特性,符合小世界网络基本特征。此外,本文就分析得到的结果对政务微博的发展提出针对性建议。
[关键词]网络结构;特征;政务微博;电子政务;社会网络分析;复杂网络;重庆市
基于web2.0技术的信息发布和传播媒介——微博有“短、灵、快”的特点,逐渐成为互联网信息发布和传播最重要的新渠道。其作为一种传播形态出现在政治生活中,起源于2008年美国的总统竞选,目前在国内也得到了广泛的应用。人民网舆情监测室提供的《2014年上半年新浪政务微博报告》指出,目前中国政务微博演化出一种集群化的发展趋势。信息在微博中的传播呈现网核状、裂变式的传播模式,这种传播模式可以在短时间实现信息的几何级数扩散,其影响可从个人生活延伸至社会层面。政务微博在信息发布与传播中发挥重要作用,但同时也存在单向交流、缺乏互动等问题,其传播效率仍有提升空间。
隨着政务微博的数量迅速增多,发挥着越来越重要的作用,国内外学者在各方面进行了研究。比如从立法角度或政治学角度研究政府使用新型社会化媒体的规范问题和其对政府官员的监督效果,如Dawes对美国当前的社会化媒体使用立法情况进行了详细的分析,认为政府应加强微博的转发及民众的使用立法;Brito、John、Shim等认为微博网络可以促进媒体对政府的监督和提升反腐力度,但非常依赖于较强的微博反腐文化氛围;英国政府对于政务微博的监管始于2009年出台的《政府部门Twitter使用指南》;以及John Carlo Bertot提出政务微博中的大众协作和参与、效率的自主和及时特性有利于反腐。目前也有学者对微博网络结构进行了研究。杜杨沁等研究了关系网络的整体和局部网络的静态微观结构,并对结构洞指标体系进行了数据测量;平亮、姜鑫等从不同角度分析了微博舆情网络结构和信息传递方式;赵洋等对社会化网络结构进行研究综述,并对网络结构的特点和关键节点进行更深入的研究;Newman检测并定量分析了网络结构中的群落结构,对了解网络结构动态变化过程具有重大意义。国内外对有关政务微博的价值与传播的研究较多,但目前许多研究还局限于简单统计分析或实际案例,极少能清楚指出政务微博的网络结构和特点。
本文在现有的研究成果基础上,从社会化网络的视角切入,探索政务微博的网络结构特征。本文结合社会化网络理论对政务微博的网络结构进行实证分析。第一,对社会网络的参数,如对网节点个数、节点之间的距离、节点可达性、中心度、聚类系数等进行估算,通过这些参数的分析判断网络中点与点之间的关系是否紧密、哪些节点在网络中占优势地位、哪些节点具有某种相似性从而可以归为一类等问题;第二,对社会化网络结构及特征进行分析,对较关键的结点进一步深入研究。本研究将以917个重庆市政务微博为研究对象,通过挖掘其关注关系数据,并使用Matlab仿真软件对数据进行指标体系测量,捕捉政务微博的网络结构特征,结合社会化网络分析和复杂网络理论,探讨目前政务微博网络结构中的不合理之处,为政务微博的进一步发展提供科学的指导意见。
1复杂网络理论及测量方法
1.1复杂网络理论
钱学森对复杂网络(Complex Network)有着较为严密的界定:复杂网络即是包含自组织、自相似、吸引子、小世界、无标度中部分或全部性质的网络。其基本特征如下:小世界:对于大量网络的巨大规模之中任两个节点之间有最短路径;集聚程度(clustering coefficient):社会网络中会形成大大小小的圈类群体,圈内成员与成员之间彼此熟识;幂律(power law)的度分布:度指一个节点和其他节点关系的数量,度的相关性表示节点与节点之间的相关关系的大小;介数是一个重要的全局几何量,节点的介数表示的是网络内所有的最短路径之中经过该节点的数量,描述了节点的影响程度;无标度网络(Scale-freenetwork)的特性从总体来说体现了集聚的集中程度。复杂网络的主要统计特征包括度和度的分布、中介中心度、度相关性、平均路径长度和聚类系数。
1.2社会化网络
社会化网络(Social Network Service,简称SNS),即抽象化的网络中每个社会单元,以它们的相互关系和活动的产生为基础,为实现一些共同目标或有相同兴趣而不断组成了大大小小的社区,进而形成了网络状结构的社会化网络。其理论认为“社会网络”是社会行动者(SocialActor)及其相互关联的总合。其中社会行动者为抽象节点,行动者问的相互关联描述为节点之间的连线。
社会网络分析法(Social Network Analysis,简称SNA)是由美国社会计量学家莫雷诺于1934年在《谁将生存》一书中首次提出,SNA的提出初步体现出“结构性思维”、“系统的经验资料”、“图形”及“数学和计算模型”4个主要特征。SNA是以社会行动者的相互关系为视角研究其内在结构和属性特点,采用对点度中心度、接近中心度等和小世界效应、小团体研究、凝聚子群等的重点研究分别对个体属性及网络整体属性进行探讨。信息在微博中的传播依赖于“社会网络”,因此,可以采用社会网络分析法对微博中的信息传播进行实证研究。
依照前述的社会网络分析方法,根据政务微博网络结构特点进行几个概念的描述:
1)节点:将政务微博用户抽象为网络中的节点。
2)边:将政务微博用户问的“关注—被关注”关系抽象为网络中的边,由于实际中用户与用户问的关注关系是有向的,所以该网络中的边也是有向的。
3)网络:将政务微博用户网络抽象为一个由点集v和边集E组成的图G,G=
4)度:政務微博网络为一个有向图,度分为出度和入度。对于微博网络上的节点,出度是指从该节点指向其他节点的边的数目,在政务微博网络中即表示一个用户“关注”其他用户的数量。入度是指从其他节点指向该节点的边的数目,在微博网络中即表示一个用户被其他用户“关注”的数量。
1.3网络结构的测量指标
网络结构特征的考察因素有很多,本文结合复杂网络理论,利用社会网络分析法,通过分析网络结构的度、聚类系数和平均路径长度3个方面,考察政务微博网络结构是否符合幂律分布等,进而得出政务微博网络结构的特征结论。
1.3.1度分布
度是和某节点连接的边的数量,度分布是某一网络中节点度数的总和,即P=(k1)(1,2...k)。其中,P(k)为节点k的度数,网络的度分布p为网络中所有节点的度数累加而得。
1.3.2聚类系数
聚类系数描述网络的聚集度强弱,即网络中节点之间关系的紧密性。聚类系数的值等于和某节点相连的所
1.3.3平均路径长度
平均路径长度是指网络中任意两个节点相距的距离,是连接两节点到最短路径上的边数,网络的直径长度为网络中任意两点间距离的最大值。定义网络中的节点i、j,则其平均路径长度为d,该网络的直径为D,且D=nlax(d)。网络的平均路径长度又称作特征路径长度,其值等于网络中所有节点两两之间平均路径长度的平均值,即L=为网络平均路径长度,N为网络中的节点总数,d为任意节点i和j之间的平均路径长度。
结合复杂网络理论的阐述和社会网络分析法的介绍,认为政务微博作为一个社会网络,可以通过复杂网络理论对其网络结构特征进行分析,并能通过政务微博网络的节点之间的关联关系和整体网络结构判断网络中的关键节点及拥有控制舆情信息的力量。
2数据选取与收集
由于腾讯微博开放平台向第三方提供的编程接口API对数据获取类型、数量和抓取的频率限制非常宽松,故本研究选择腾讯微博提供的开放平台获取数据,以保证数据完整性。因政务微博网络的特征所致,获取数据量较小的样本不具有代表性。尤其是以复杂网络理论为基础,要求样本网络节点众多且节点问关系复杂。所以,本研究尽量获取了较多的政务微博网络节点关系。
本研究以腾讯微博平台上所有活跃的重庆市政务微博节点及节点问的关系为研究对象。从2014年10月8日到2014年12月31日,本研究在Eclipse平台上使用Java语言进行编程,通过腾讯提供的API接口首先获取了地址为重庆,且通过腾讯政企认证的账号列表共计1020个。通过人工筛选删掉非党政机关账号、“僵尸”账号得到有效的腾讯微博平台上重庆市政务微博账号共计917个。最后根据得到的重庆市政务微博的列表获取了重庆市政务微博间的相互关注关系,绘制了关注关系矩阵,该矩阵共有“关注——被关注”关系数据1040400个。各政务微博用户列于横纵两个维度,具有“关注——被关注”关系的单元格赋值1,否则赋值为0。
通过Matlab进行网络的连通性检验发现,该网络并非连通图,经过筛选发现孤立的节点有161个。通过对这些账号的粉丝及关注列表发现这些账号与重庆市的相同职能部门几乎没有关系,而对其他地市的相同职能部门关系相对密切。不难看出这些账号所属部门的工作对于这些政务微博账号所属部门在本地域内的政务信息传播不具有正面效应。
由于这部分账号在重庆政务微博关系网络中对信息的传播几乎没有作用,所以在本研究中,将这部分账号做剔除处理。所以,最后形成的网络有756个节点。
经过分析得到重庆市政务微博网络关系数据基本统计如表1所示:
3政务微博网络结构特征分析
3.1网络的度分析
本研究对网络度的分析主要探究政务微博网络的度分布是否符合幂律分布。幂律分布也称为无标度分布,因此符合幂律分布的网络也称为无标度网络。无标度性是复杂网络的重要特征之一,检验政务微博网络结构的度分布可以初步判断其是否为复杂网络结构。
用累积分布函数求得了网络中所有度大于或等于K的节点的概率分布,并且在双对数坐标系中生成了具有较好识别性的图像。利用Matlab软件分析腾讯微博平台上重庆市政务微博关注关系网络的出入度平均度数,绘制度的累积分布函数曲线如图1所示:
该曲线基本分布在一条直线上,可以明显看出重庆市政务微博关注关系网络入度基本符合幂律分布,并且具有重尾分布的特点。即在重庆市政务微博账号群中,大部分账号的度都不是太大,而极少数账号的度确比其他账号度高出很多。这在现实生活中表现为:极少数度很大的重庆市政务微博账号在信息传播时比其他账号占据更大的优势。
再对度较大的账号进行进一步分析,绘制出重庆市政务微博的入度分布折线图,如图2所示:
可以看出,入度较高的节点相对较少。通过Matlab进一步分析发现,入度最高的前十个节点编号及所对应的政务微博账号为:1重庆微发布、19微沙坪坝、7重庆市气象局、2重庆环保、145南岸环保、326云阳县政府新闻办、74重庆江北红旗河沟派出所、397忠县人民政府新闻办、776微播南川、850垫江发布。其中第1、19、326、397、776、850都为政府宣传部门的官方微博,在入度前十的账号中占据了大部分,其余有3个环保气象部门,1个派出所。入度在实际生活中即为“粉丝”数,政府宣传部门具有较高的入度符合实际工作需求,从这点来看,重庆市政务微博的运营具有一定的合理性。
对重庆市政务微博出度进一步分析,并绘制各节点出度如图3所示。可以看出所有节点中有3个节点出度数明显高于其他节点,此外的节点相对较小且处于同一水平。通过使用Matlab分析发现,3个出度很高的节点分别为:276巴南共青团、756重庆市大足区回龙镇政府及889奉节煤管局。对这3个政务微博的入度进行考察,发现这3个账号的入度均位于所有节点的前一百名,处于较高水平。即说这3个账号入度和出度均处于较高水平,表现出与其他账号较强的交流意愿,也换得其他账号对自己的交流意愿。但是由于微博功能的客观条件,关注过多的账号会造成该账号接收信息的效率下降,错过重要信息的可能性越大,这在某种程度上会对信息的传播起负面影响。所以,较为合理的情况为较多的粉丝数,与合理地关注列表,即关注那些更可能发布对本部门工作相关信息的微博。
3.2聚类系数分析
在网络中的聚类分析中,C=0表示所有节点不与其他任何节点有关系,即该网络中没有边;C=I表示该网络中任意一个节点都与其他所有节点直接相连,这样的网络称为全局耦合网络。
通过Matlab软件分析计算得出重庆市政务微博关注关系网络的聚类系数C为:0.4610。而同规模的随机网络聚类系数为:1.301x10-5,与之相比,明显重庆市政务微博关注关系网络聚类系数大得多,这说明现实中重庆市政务微博关注关系网络并不是完全随机的,它具有较好的聚集特性。
聚类系数越大表明网络中任意政务微博账号之间获得某种关系的可能越大。例如A政务微博与B政务微博相互关注,B政务微博与C政务微博相互关注,那么A与C之间存在相互关注关系的可能性较大。重庆市政务微博关注关系聚类系数较大,说明重庆市政务微博账号问趋向于形成某种组织形式的群落。
3.3平均路径长度分析
通过Matlab软件分析计算得出重庆市政务微博关注关系网络的网络直径为10.620,平均路径长度为2.9955,与同规模的社交网络平均路径长度基本处于同一数量级。即是说重庆市政务微博任意两个账号问进行信息传播,平均经过2.9955个账号即可实现。可见该政务微博网络结构在一定程度上有利于某一信息在政务微博账号问的共享与传播。而政务微博账号问的有效传播能使信息更好地对公众进行传播。信息的有效传播在突发事件发生后,政府需要迅速引导舆论倾向时,显得尤为重要。
通过Matlab计算分析得出腾讯微博平台上重庆市政务微博网络特征如表2所示。
平均路径长度与聚类系数是小世界效应的两个重要衡量统计量。经过以上分析可以看出该政务微博关系网络具有较小的平均路径长度和较大的聚类系数,表明该网络符合小世界网络基本特征。政务微博关注关系网络的小世界特性说明大部份政务微博账号间并没有直接的联系,但可以从其他账号经少数几步到达。在具有小世界效应的网络里,信息传递速度快,并且改变少许几个连接,就可以显著地改变该网络的性能,如对现存在的政务微博网络进行调整,改动很少的几个关注关系,就可以显著提高信息传播效果。4结论及建议
本研究引入复杂网络理论,基于社会网络分析法对政务微博的网络结构进行分析,以重庆市政务微博为研究对象,运用分析软件Matlab从度分布、聚类系数和平均路径长度3个指标分析政务微博形成的整体网络结构特点和网络中的关键节点,提出以下结论:首先,政务微博关注关系网络入度基本符合幂律分布,并且具有重尾分布的特点,入度较高的微博大多具有政府宣传作用,出度较高的微博也有较高的入度;其次,政务微博关注关系网络聚类系数比随机网络聚类系数大得多,说明现实中政务微博关注关系网络具有较好的聚集特性;最后,政务微博任意两个账号间平均经过2.9955个账号即可实现信息传播,可见其网络结构在一定程度上有利于某一信息在政务微博账号问的共享与传播。
结合对政务微博网络结构的研究,本文提出几点建设性意见:
通过增加出度可以换取更多的入度,使微博的出入度都处于较高的水平。提高微博的度值使其高出其他账号的度值,有助于政务微博获得信息传播过程中更大的优势。
增大政务微博网络聚类系数,使各微博账号间容易形成某种组着形式的群落,有利于微博账号与不同群落的政务微博关注关联。
缩小政务微博网络结构平均路径长度,有利于信息在政务微博账号间的共享与传播和更好地对公众进行传播。
本文收集和筛选重庆市政务微博的关注數据,通过Matlab对数据进行了包括度分析、聚类系数分析和平均路径长度分析3个方面的分析,发现政务微博关注关系网络结构具有复杂网络特征。但是在整个研究过程中仍存在许多不足,如在数据收集过程中,仅收集了腾讯微博平台的数据,在数据来源方面稍有欠缺。数据分析过程中可能会因为数据源的局限而对结论产生一定的影响。未来研究会针对以上不足进行改进和完善,尽量确保结论的准确性和全面性。