虚拟社区中的参政议政群体挖掘研究
2011-02-20陈京民
陈 鹏, 陈京民
(河海大学商学院, 江苏 南京 211100)
0 前 言
互联网由于其信息发布传播的快速、便捷、隐匿性,成为许多民众表达自己真实想法的重要场所,也逐渐成为了许多民众参与政治活动的重要场所,这些以相同兴趣聚集起来的参政群体正成为推动行政决策民主化、科学化的一支重要力量,而且这些参政群体随着网络参政交流时间的延续,政见相同的参与者会逐渐聚集在一起,形成类似现实世界中的党派.因此,对这些网络参政群体的结构进行分析,成为网络参政研究中一个值得关注的问题.
社会网络分析方法主要用于描述和测量行动者之间的关系,构建出由这些关系建立起的整体结构,然后对其结构进行进一步分析,研究分析者所关注的社会问题.使用社会网络分析法进行虚拟参政群体分析时,需要采用参政群体之间的关系数据进行分析.这些关系将多个参政者联系成为一个更大的参政关系系统,反映了整个参政群体之间的关系的特性.
社会网络分析可以从两个不同特色的研究取向进行:整体网络分析方法和自我中心网络分析.从数据收集上来看整体网络分析方法主要使用提名选择法、参数选择法与循环选择法等各种选择方法;从数据整理上来看,整体网络分析主要采用社会矩阵方法与社会图示法.社会矩阵是一个N×N的(0,1)矩阵.N代表群体的人数,横行代表参政选择者,纵行代表参政被选择者,在选择者与被选择者交叉的地方标出选择结果,最后就可以得到参政群体的整体网络矩阵.通过解剖由这些整体网络结构所表示的群体基本结构,可以了解群体中的网络分布情况,区分群体在网络中的不同地位.
1 虚拟社区中的参政特点分析
人民网的强国论坛是中国网络媒体创办的第一个时政论坛,也被誉为“最著名的中文论坛”.注册用户总计超过110万,最高同时在线人数突破214万.因此,选取强国论坛具有代表性与典型性,有助于我们研究当前网络参政的群体结构.
在这个虚拟参政社群中存在ID会员和游客这两种角色类型,并以发帖、看帖和回帖3种行为方式互动.发帖人根据自己的政见发帖分享其对时政热点的看法建议;看帖人根据自己的兴趣浏览相关主题,有时根据自己的政治观点来评价发帖人所表述的观点,而回帖人的观点有时候可能也会被另一回复者评判而被回复,从而产生深层次的互动交流.随着交流时间的延续,政见相同的参与者会逐渐聚集在一起,形成较为紧密的小群体.例如,以2007年10月12日的陕西“周老虎”造假事件为例,网友在社区发帖,指出这组照片有PS过的嫌疑.随即网民们针对照片的真假展开了讨论.很快,网络言论分为旗帜鲜明的“打虎”和“挺虎”两派,双方成员分别阐述自己的理由,驳斥对方的观点.由此,可以推测在长期的参政探讨中,各成员也会形成类似现实世界中的党派群体.
虚拟参政群体的党派特征信息都隐藏在以平均每月大约6 000左右的帖子串为存在形式的文本数据之中,为分析这些虚拟参政群体的结构,就需要挖掘出参政群体中各个派系的成员和核心领袖.借助社会网络分析方法,通过基于整体视觉的网络分析,可以得出由全部会员及其相互间各种不同的联系所组成的网络结构和派系分布,进而结合各个成员的不同属性进行具体构成元素及其特点的挖掘.
2 虚拟参政群体挖掘
2.1 虚拟参政网络的总体构建分析及可视化
整体网络资料的收集必须有一个明确的边界.然而,BBS虚拟社群的成员总处于或增或减的流动变化中.通过对不同时间段的成员间互动关系作横截面的考察,可以揭示互动网络结构的发展状况,由此抽取了从2009年10月1日至2010年1月1日共3个月的样本数据作为分析来源.
图1 整体网络的可视化展示
以围绕一个主贴所形成的帖子串为单位,进行互动关系的资料,最后得出规模为101×101的关系矩阵.将数据输入UCINET6.20社会网络分析软件,得出参政网络的总体概况分析:整体规模为101,整体密度为0.157 0,网络中关系的标准差为0.535 0;网络中两点间的平均距离为2.198,建立在“距离”基础上的凝聚力指数为0.417.由此,可以看出整体网络的参与者之间的联系不太紧密,整体凝聚力比较弱.借助UCINET软件进行可视化描述,可以形象地展示出参政群体的整体概况(图1).
2.2 虚拟参政群体的派系挖掘
社会网络意义上的群体是指在既定目标和规范的约束之下彼此互动、协同活动的一群社会行动者,而凝聚子群是指整体结构中由一小群具有相对较强、直接、紧密和经常关系的行动者组成的次级群体.在参政网络中,成员间相互联系构成了不同的参政群体;具有相同政见的成员通过频繁互动的强关系构成不同的次级小群体,类似于现实中的不同参政团体,但是这些小群体却隐匿在整体参政网络的轮廓下.如图1所示,具体的派系群体就隐藏在这个整体网络之中,无论从文字信息还是关系矩阵都无法直接得到群体的分布及特征信息.
借助网络分析方法,可以快速地找出这些参政小群体,并勾勒出群体的具体面貌.社会网络分析中对这种子群体的处理有多种方法,如根据关系的互惠性、根据成员之间的可达性或接近性等,不同的方法根据不同的网络属性对群体的凝聚性进行量化处理:
(1)派系分析.派系是建立在互惠性基础上的凝聚子群,是最基本的凝聚子群概念.但派系这一概念有4个缺点:首先是派系的定义太严格,其次是派系的规模受到点的度数的限制,再次是现实社会中出现的派系规模都比较小,最后是不能反映出派系中的成员之间在地位上的区别.而且在网络参政中,成员间的关系未必是直接的,很多时候都是间接的.因此,在具体分析中采用由派系推广出来的n-派系分析方法.
由前面的整体网络数据及派系分析可知网络参政者之间的联系相对比较松散,所以首先进行小群体的2-派系分析.载入数据,结果得出205个小派系,派系数量太多,不具有实际意义.同时,派系的成员之间存在着大量的重叠,隐藏了具体凝聚子群的结构.针对这种情况,阿尔巴(R.D.Alba)等人提出了社会圈的概念,利用滚雪球的方法降低派系数量,从而得到较为明确的结构特征.在UCINET中利用共享成员方法按等级进行深入的聚类分析,其结果如图2所示.
图2 共享成员的层次聚类图
图3 派系共享成员表
该结果给出了101个行动者共同隶属于派系的聚类分析表,然后利用派系-派系共享成员矩阵方法分析每一对“派系”共同拥有的行动者数目,结果如图3所示.
针对“派系共享成员”矩阵再次进行聚类分析,并基于不同显著性水平的比较得出整体网络中存在着3个凝聚子群(每个数字代表参政者的编号):
第一个子群成员有:8,18,88.
第二个子群成员有:5,41,44,47,79,92,99,100.
第三个子群成员有:6,9,13,17,23,24,25,27,28,29,31,32,35,36,38,39,45,50,51,53,54,58,59,60,61,63,64,66,68,69,70,71,72,74,78,80,85,87,93,94,101.
由此,可以初步看出网络中比较活跃的成员及互动比较频繁的小团体.其中第三个子群体的成员太多,还可以从其他属性作进一步的分析,但是分析结果已经给出了参政团体的基本概况.由于不同概念的子群在对互惠关系的要求上各有不同,在实际分析时也就有了各自的优劣,为此需要借助其他概念的子群分析方法来对比验证以上分析结果.
图4 共享成员的层次聚类图
(2)k-丛分析.与派系不同,k-丛的概念建立在以度数为基础的凝聚子群之上.这种凝聚子群是通过限制子群中的每个成员的邻点个数而得到的,在一定程度上反映了群体中个人与其它人联系的紧密程度,弥补了n-派系不稳健的缺点,更加体现了凝聚力的思想.
网络参政者之间的联系相对比较松散,但是在子群体内部的凝聚力相对较大.设定k值为2,最小规模为3,分析结果给出了199个小规模的k-丛,同样利用共享成员方法进行等级聚类分析,其方法同上所述,其聚类结果如图4所示.
基于不同显著性的比较,将参政群体分裂为4个凝聚子群(每个数字代表参政者的编号):
图5 参政网络中的派系图
第一个子群成员有:8,18,88.
第二个子群成员有:5,23,24,29,31,35,38,41,44,47,51,53,60,63,92,99,100.
第三个子群成员有: 6,9,25,32,39,59,70,74,78,80,85,93.
第四个子群成员有: 13,17,28,36,50,54,58,61,66,68,69,71,72,87,94,101.
对比以上两种方法的分析结果,可以发现两次分析的结果大致一致,相比较而言k-丛分析的分裂层次更深,将n-派分析中的大群体分解成为了两个联系更为紧密的子群体.通过子群体内部关系的紧密型和可达性的综合比较,借助可视化分析,可以确定在网络参政群体中存在着4个联系紧密的参政团体,其成员间的联系如图5所示.
3 结论
通过对人民网强国论坛讨论版中的虚拟参政者之间由发帖、回帖形成的社会网络的实证研究,得出了以下结果:
(1)从3个月内参政成员的约15 000条发帖信息中,运用社会网络分析方法得出了由所有参政者联结构成的网络关系结构图.通过整体关系的研究,把个体间联系、“微观”网络与大规模的社会系统“宏观”结构结合起来,可为参政关系的深入分析提供基础.
(2)在虚拟社群中,存在大量边缘的、流动性的以IP标注的网络参政者,无法管理.社群中主干则为一稳定的会员,他们参与度高,在与社群成员长期大量的广泛互动中积累了一定的声望,具有更大的影响力.
(3)在整体的虚拟网络参政社群中存在两种结构并行的状态,即既存在一个松散的、扁平化的、去中心性的总体结构,也存在很多个联系较为紧密的、权力集中的核心子群.
(4)通过实验分析论证,社会网络分析方法能够对一个错综复杂的参政网络进行细致分析,挖掘出其中具体的特点. 社会网络分析方法还可以获取参政群体的整体结构及一些基本特征.以此为基础,可以更深入地挖掘具体参政子群体中的领袖、重要成员、参政效率等信息,以进一步对网络参政议政群体进行分析.
参考文献
[1] 罗家德.社会网络分析讲义[M].北京:社会科学文献出版社,2005.
[2] 刘 军.整体网分析讲义[M].上海:上海人民出版社,2009.
[3] 丁连红,时 鹏.网络社区发现[M].北京:化学工业出版社,2008.
[4] 刘 军.社会网络分析导论[M].北京:社会科学文献出版社,2004.
[5] 陈向东,方 群.Blog虚拟学习社区的社会网络研究[J].电化教育研究,2008,(1):40-44.
[6] Tracy, C.R, &Joy, K.Prestige. Centrality and learning:a social network analysis of an online class[J].Communication Education, 2005,10(2):56-60.
[7] Dinah M Boyd,Nicole B Ellison. Social network sites:definition, history and scholarship[J].Journal of Computer-mediated Communication,2008,13(1):210-230.
[8] Hopcroft J,Khan O, Kulis B,etal. Tracking evolving communities in large linked networks[J]. Proc.of the National Academy of Science, 2004, 101(1):5 249-5 253.