社交网络意见领袖“同心圈层”:现象、结构及规律
2022-01-17徐翔
徐 翔
(同济大学艺术与传媒学院,上海 200092)
一、引论与问题提出
微博等社交网络具有用户生成内容 (UGC)的自媒体与社会媒体(social media)属性,不同的用户具有多种多样的内容特征与亚文化表征。 较为常见、也拥趸较多的观点强调社交网络时代的用户或意见领袖的多样性与“去中心性”。 一些理论支持社交网络的用户多样性和“人人时代”[1]的去中心性或多元亚文化,认为网络所带来的是“双向的去中心化的交流”的“第二媒介时代”[2]。 不少学者认为,网络UGC 带来广泛的“草根”崛起和“众声喧哗”[3],从精英化到大众化的各种类型和各个细分领域的用户似乎都在广泛融入到新媒体“人人都有麦克风”的“参与文化”[4]中。 微博用户在发布的内容上存在着多样的类型,相互之间具有较大的内容差异性[5]。但是本研究要指出的是,过度强调用户“去中心性”、多样化的结构模式,会屏蔽其中的同质性。 “多类型化”或“去中心性”的观点虽注意到用户的内容碎片生产表现出的差异性,但是对于用户之间在内容上的相似关系及其结构却仍然缺乏足够实证,而这会导致用碎片多样性来代替潜在的用户同质性。
一部分观点虽然并不明确反对微博用户的同质化,但是在根本上还主要停留于局部用户的“部分同质性”的现象,而未充分上升到关注全局用户的“全局同质化”的趋势[6][7](P79-87)。 社交网络中存在着社群内容的同质化和“意见隔离”等机制,用户的“选择性接触”或“选择性关注”等会加强用户和内容同质个体、群体的连接以及这些内容的进一步同质化的偏向和震荡[8],并可能形成“回音室”等现象。 围绕某些特定用户或者某些特定范围内的社会连接,会产生用户内容同质性的扩散和内容同质群体的加强,这是对于同心圈层继续展开研究的必要基础。但另一方面,需要强调的是,较多地关注于社交网络用户内容同质化、相似性的研究,主要着重于局部、中观、微观、人际传播的社群和用户所形成的同质性连接与相似性传导,而其中关注不足的环节则是:如何从这种局部同质性上升到对宏观、全局层面的同质性进行分析? 很多情况下,后者甚至有可能反而是与前者矛盾的,也即网络局部的“巴尔干化”[9]可能带来的是全局的分裂、隔离,而非全局作为同一整体的“巴尔干化”。 而社交网络全局整体性的“巴尔干化”则是本文对于“同心圈层”趋同所关切的内蕴与后果。
较多研究指出社交网络意见领袖具有多样性和差异性[10][11]。 但是这其中容易忽略的是:如果低影响力的用户差异更大,那就不能得出意见领袖群体的差异化的趋势;相反,用户随着其“意见领袖”程度的提升,可能反而是在不断消减差异性、并增强同质性。 也即同质性的强弱是相对的而不是绝对的,需要在比较的参照系中进行考察,而不是单纯的某个切片的孤立判断。 多数对于用户的类型与差异的研究基本上都是对某种特定影响力程度的用户(例如意见领袖、大V、微博人气榜用户)进行抽离切片后的描述[12][13][14](P69-75),而缺乏纵向比较的维度。 虽然意见领袖或高影响力用户的确具有重要性,但如果把他们简单归到同一静态大类中,会忽略了这类用户内部依然是有着其影响力高低的程度差异。 本研究结合“同心圈层”结构要强调的是:通过用户的影响力程度的从低到高的变化,考察用户在趋同性上的对应变化规律。
对于全局性的意见领袖“同心圈层”趋同结构的探讨具有进一步推进的必要。 “圈层”的相关概念在不同的学科中有着各自的使用,其原意主要涉及到空间方面的构造描述[15][16]。 伯吉斯等提出城市功能区从内向外分布的“同心圆”模式[17]。 一些学者关注并分析了区域经济的“核心-外缘”间的关系及其圈层[18]。 对于社交网络“同心圈层”趋同结构而言,中心的存在和作用、各区位到中心的距离及其影响因素以及中心-边缘的渐变是须考虑的基本要素。 社交网络的在线社会或在线空间的用户关系中,随着意见领袖用户的影响力程度这个重要尺度的高低变化,原来看似杂乱和多样的亚文化“部落”表现出中心化的有序渐变结构,形如中心到边缘的逐步演变的涟漪圈层。
社交网络意见领袖在内容上的相似网络所表现的“同心圈层”趋同结构的基本轮廓简陈如下(代称E):E1 指趋同中心的存在和作用。 如果把用户作为一个个内容聚合体的点,则社交网络的结构是“中心化”的,存在着作为趋同中心的“心”,各点朝向这个中心发生用户的趋同,而不是去中心化或多中心化的,由这个中心形成扩散后的“同心”结构;E2 指各区位到中心的距离及其影响因素。 把所有的用户作为具有自己的位置的点,对于这些用户而言,越是挨近中心,表明着他们的影响力程度越高,同时他们和中心用户的“内容距离”越小(也即用户内容“长得越像”);反之亦然,用户如果越是远离中心,表明着他们的影响力程度越低,同时他们和中心用户的“内容距离”也越大。 用户在此过程中,随着影响力程度的高—低而和趋同中心发生内容上“似同—差异”的内容距离的变化。 E3 指中心—边缘的渐变。 从中心向外缘,如果根据该圈层距离中心的“半径”距离分为一层一层的“圈层”,则越是靠近中心的圈层,用户之间的内容距离越小,用户之间越是紧密和相似化;而越是远离中心的圈层,则用户之间的内容距离越大,相互越是稀疏和差异化。也即,从中心圈层到边缘圈层,圈层根据内部的用户“相似距离”的大小,从稠密变得越来越疏离;而且这个疏离的程度与该圈层距离中心的半径成正相关。
以用户作为点,纳入分析的基本要素包括以下:Ma:中心的存在;Mb:各点到中心的距离;Mc:各点本身的大小;Md:结合Mb 和Mc,各点到中心的距离与该点自身大小之间的关系;Me:结合Ma 和Mb、Mc,具有相类似的大小的点形成的从中心内向边缘逐步辐射出的圈层结构。 为了便于直观理解,对E的内涵及其基本要素简陈如下(图1):
图1 社交网络意见领袖“同心圈层”趋同结构简示
上述阐述(E)只是对于社交网络“同心圈层”趋同结构的形象化简描。 后文将基于同心圈层的内涵,延伸出 4 条假设(后文的 H1、H2、H3、H4)进行检验与支撑。
二、社交网络意见领袖“同心圈层”趋同结构的内涵
本研究所提的同心圈层结构,首先聚焦于“趋同中心”角色所产生的“社会样板”效应的可能,继而在“社会样板”效应的基础上,延拓和表现为“同心圈层”的总体结构。 S1 是指全体用户朝向某种中心用户的趋同化。 在社交网络中,每个用户ux和最中心的用户的内容相似度,线性地对应于该用户ux的影响力程度:与“趋同中心”用户越相似,则其影响力越高;用户ux与“趋同中心”的内容距离越大,则其影响力越低。 用户在对“社会样板”的趋同过程中,随着影响力的提升会越来越消减多样性和异质性,增强同质性。 这部分关系到前文所述的要素Ma。 S2 是指趋同过程中的“影响力程度-社会样板程度”的同构化。 用户作为意见领袖的影响力程度与该用户作为“社会样板”的程度成正相关。这部分关系到前文所述的要素Md。 S3 是指趋同的单中心化。 在“同心圈层”结构中,所有的社会样板应该是趋同的,是处于同一个中心,或者靠拢于同一个中心,而不是多个中心。 如果不满足这个条件,那么即使社会样板效应存在,它也不是“同心”圈层,而只是“多心”圈层。 用户越来越朝向单向度的“单面人”演变,社交网络社会中的用户也由此而趋于“单向度化”。 这部分关系到前文所述的要素Ma。 S4 是指趋同过程中的圈层分化。 在同心圈层中,分为从内到外的一圈圈、一层层。 从中心到边缘的各个圈层是影响力从高到低的各个“意见领袖层级”。 越是靠近“趋同中心”或“社会样板”的高影响力层级,其内部用户越是相似;反之,越是远离中心的低影响力层级,其内部用户越是差异化,从而形成从中心到边缘的由密到疏的各个圈层,越是中心的用户圈层,其内部的用户距离越紧凑狭窄,也即圈层越是稠密;越是边缘的用户圈层,其彼此内容距离越大、越是稀疏。 这部分关系到前文所述的要素Me。
上述 S1、S2、S3、S4 不是割裂的,而是具有内部联系与整体关系。其中,S1 是具有基本性的,同时也是在以往的社交网络研究中易被忽视的一种现象。而正是在S1 的现象成立的基础上,蕴藉着S2、S3、S4 的可能,才由此形成全体围绕“趋同中心”或者“中心社会样板”的同心圈层结构(参见图2、图4)。H1、H2、H3、H4 是分别对应于 S1、S2、S3、S4 的更为具体化的形式)。
图2 社交网络“同心圈层”趋同结构子假设的关系
(一)用户“同心圈层”结构的趋同中心(S1→H1)
社交网络“同心圈层”结构的重要要素之一是前文所提的“中心的存在与作用”(参见E1、Ma)。对于“同心圈层”结构而言,一个基本问题是(Q1):是否存在着同化各点的“趋同中心”用户,使得全局各用户随着自身影响力的提升而提升与“中心”相似的程度?
1.“趋同中心”的角色与传播作用
尽管较多观点不认可意见领袖的趋同化,但是一部分研究却指出了高影响力用户、意见领袖在用户相似性网络中具有更高的中心性与同质化作用。社交网络一部分用户尤其是意见领袖等高影响力用户,较之普通用户具有更强的内容扩散力,从而产生对于其他用户的更强的同化。 Matsumura 等提出的识别意见领袖的影响力扩散模型(Influence Diffusion Model, IDM)[19], 通过用户对博主内容评论及转发的语义相似度,描述博主的内容扩散及其对其他用户的影响。 这反映了意见领袖在内容上对其他用户的扩散力和扩散深度。 Bravo 等考察推特中的政治意见领袖,分析了他们在推特中被追随、转推、提及的扩散能力[20],同样反映出意见领袖在内容上处于更强的扩散中心地位。 王晓光将博客用户分为核心博客与普通博客,博客用户的关注对象常常集中在特定的核心博客上[21]。 Weng 等对Twitter的研究指出,用户和她/他的直接粉丝之间存在着信息内容和主题上的同质现象[22]。 Weng 的研究结果也意味着更高粉丝数的用户会呈现比其他用户更强的内容或主题同质现象。 这些因素影响着用户内容朝着有限性的特质趋近,出现某种具有强同化能力的用户的可能;高影响力用户在相似度网络中具有更强的中心性,形成内容同质性的扩散。
意见领袖带来的同化作用使其他用户在意见、观念、内容上出现朝向意见领袖的趋同。 李根强、方从慧运用计算实验法分析意见领袖对网络集群行为主体观点演化的影响作用,分散的群体观点最终朝向意见领袖所持的观点逐渐偏移[23]。 李卫东、彭静发现个体的社会网络中心性与意见强化现象有明显的正相关关系,个体越处于中心地位,意见强化现象越强[24]。Yoo 等使用Twitter 数据分析了意见领袖所产生的内容级联,具有较大网络的生产者贡献的内容的扩散更有可能被相似内容的扩散所放大,并对其他内容的扩散产生抑制,也即网络中的内容主要被意见领袖的内容级联所主导[25]。 这些分析中,意见领袖的观点同化能力使得更大范围的用户围绕高程度意见领袖的趋同成为可能。 尽管这些研究多只是局限于单条的意见或观念,但是给作为“意见集合”的用户内容趋同研究提供了有利基础与方法借鉴。
社交网络媒介平台自身的话语特质会带来平台中用户内容生产的模板化和同一化。 Mikal 等认为社交网站具有沟通行为和话语内容的某种特质和标准,网民受到网站中公开沟通行为“标准”的行为修正,在发帖时相应地修改自己的内容而趋同于网站内容[26]。 Lee 等在对 MultiLDA 与 Twitter-LDA的主题模型评估时指出,虽然许多主题可以在社交媒体平台上共享,但用户通常会对某些主题显示出某些社交媒体平台的偏好,这种平台偏好甚至可以在个人层面上找到[27]。 社交网络用户内容传播中的受众期待与市场因素带来的高影响力用户的内容生产趋同。 Masson 建立与博弈论模型相似的动态模型,假定用户只会发布其认为可能非常受欢迎的内容,证明了发帖行为的收敛性[28]。 用户的内容生产受到以召回率为目标的推荐算法影响,带来内容选题、类型和风格的系统化倾向,直接影响到内容生产者的旨趣,这促使内容生产活动变得愈加标准化[29]。 社交网络用户在发帖和分享时,会受到“想象的受众”及其同质性的影响和塑造,使得自身内容增强特定的同质性[30]。 尽管媒体内容生产者面临着很大的自主空间,但是趋同被作为一种效益高的战略以促进低成本和有高传播效果的新闻生产[31]。 意见领袖是对于其所处的社交网络媒介平台具有高适应性的用户,他们更需符合该种社交平台中来自受众期待、注意力市场约束与收敛、话语生产模式等的各种模式要求。换言之,在不同的社交网络中,意见领袖的模式、特点、主题是不同的,高程度的意见领袖是社交网络内容生产模式、需求、内容特质等各种规约性的体现;他们之所以在某个社交网络媒介平台中取得成功,某种程度上是适应这种媒介平台的产物。 这也使得意见领袖更为减少内容生产方式中的“随心所欲”与多样性,比该种社交网络中的边缘用户、非中心化用户更为“标准化”与有限化。
社交媒体用户体现出优势内容、高热度内容的特征有限化和类型窄化[14](P69-75)[32],部分优势用户吸引着用户朝向特定方向与优势模式的生成、发展,用户的内容生产减少了丰富性,而模板化的意味得到加强。 社交网络的UGC(用户生成内容)过程中,用户具有朝向相同标的、模式而发生的同化,在这种过程中,一些更为贴近这种同化“标的”的用户显现出作为成功样板或模板的角色。媒介内容生产中的受众期待使得信息生产者的选择标准相似、强调策略接近、表达方式单一,带来信息生产中的内容趋同[33]。 由于受到平台需求、算法机制、用户偏好等多种影响,高热度内容及其生产者呈现出明显的“窄化”现象[34]35][36]。 个体的信息生产在多样性和碎片化的表层之下,受到社会信息场的深层制约,成为社会外部具有典范性的声音在个体的不同程度的“回响”。 传媒发展过程中存在的“合法性危机”及其“强迫机制”、“模仿机制”、“社会规范机制”相互作用,使得传媒出现相当程度的同质化[37]。 在社交网络的用户内容生产中,尽管具有“人人都有麦克风”的自主性,但是实际的信息生产却受到来自于媒介、受众、市场等多种“看不见的手”所带来的同质化作用,这些隐形的力量也在塑造着样板化的内容生产典范。 而在社交网络中具有优势地位与成功流量的用户,既是这种力量塑造的结果,同时也进一步催化其他用户朝向有限的用户样板发生趋同的传播效应。
若假定存在着同心结构中的“趋同中心”(E1、Ma),并由此发生全局辐射作用,影响到 E2、E3 以及Mb、Md、Me 的方面,从而关系到全局的同心圈层构造,那么这种“趋同中心”及其中心化是可以检验的。 对于意见领袖用户而言,这种“趋同中心”用户的基本特征为(C0):与中心越是内容相似(也即内容距离越短)的用户,影响力越高;与中心越是内容不相似(也即内容距离越长)的用户,影响力越低;任意用户与中心的内容相似度与该用户的影响力程度成正相关。 该特征(C0)同时也是对于这种“中心”用户是否实存的基本检验方式。 这种处于趋同中心位置的“社会样板”角色和作用,是对于社交网络中的用户影响力、意见领袖研究中所容易忽略、关注不足的方面,但却是同心圈层中具有关键性的用户角色和作用。
用户作为趋同中心、“社会样板”的角色有程度高低之分(测量方式见下文C1),本文把具有最高程度的“社会样板”用户简称为“中心社会样板”。社交网络用户在相似性上,不是“人人都有麦克风”式的多样化、去中心化,也不是简单的同质化与偏倚化,而是对于全体任意用户ux而言,存在着朝向某种“中心社会样板”趋似化的态势;并且这种趋似的程度与ux的影响力程度正相关:ux越是在内容上相似于“中心社会样板”,则影响力越高;反之,ux越是在内容上远离、不相似于“中心社会样板”,则影响力越低。
对于用户“社会样板”以及社会网络趋同中心用户角色的论述,来源于对网络实践结构的理论推断,也具有实践可检验性与实践效力。 这种角色的提出对于提炼、检验“同心圈层”趋同结构具有核心作用。 同时,后文也将显示,“社会样板”的用户现象和角色并非纯粹的理论臆构,而是可在社交网络实践中得到确证并对用户相似结构产生着重要作用。
2.用户作为社会样板程度的测量方式
基于社会样板的内涵,我们可提出对于任一用户(设为M)作为“社会样板”程度的测量方法(C1):对于用户M 而言, 设其他任意n 个用户构成序列U=[u1,u2,u3, ……,un],U 中每个用户和 M 的内容相似度依次标为序列 S=[s1,s2,s3, ……,sn],U 中每个用户作为意见领袖的影响力程度依次标为序列H=[h1,h2,h3,……,hn],其中序列 U 和 S、H 中的每个元素顺序是严格一一对应的;那么可知,如果序列S 和序列H 的正向相关、对应程度越强,则表示用户M 作为“社会样板”的程度越强。 用常用的线性相关系数即可以简单而有效地反映S 和H 这两个序列之间的正向相关程度。 本研究采取皮尔逊相关系数,其值在[-1,+1]之间。 如果该相关系数不显著,则表示S 和H 缺乏明显的正向相关性,此时可将相关系数值替换为0,表示S 和H 无相关,也表示M 无任何社会样板作用。
对于任一用户M,其社会样板程度的测量方式见下图(图3)。 任一用户都可以最终得到一个用于反映其“社会样板程度”的数值Px,这个数值介于[-1,+1]之间。 它显示的是用户作为“完全社会样板”(也即社会样板程度为1)和“完全不是社会样板”(也即社会样板程度为-1)这个“两极”之中的游离。该值越大,表示用户对于全体任意用户所体现和发挥出来的“样板效应”越强烈。 当Px=1 时,用户此时会产生必然的、完全线性对应、完全可精确预测的社会样板效应,而不会带有“时灵时不灵”的波动与误差。
图3 对于用户M 的“社会样板程度/样板度”(Px)的测量方式
3.社会样板和社会样板程度的关系
我们要厘清的是“社会样板”和“社会样板程度”之间的关系。 任一用户,经由C1 的测量方法,都会有一个或低或高的“社会样板”程度值。 对此值,我们虽然可以划定一个“阈值”作为界定“社会样板—非社会样板”的门槛。 但是这样做定性分类处理的潜在问题是:即使是低“社会样板程度”的用户,也是有区分的,意味着他远离最高程度社会样板的远—近。
因此,我们采取另一种处理方法,也即不再切分一个门槛值去硬性地区分“是不是社会样板”,而是以“社会样板程度”来标识各用户。 这个介于[-1,+1]的社会样板程度值的高/低反映着用户距离成为最完全的社会样板(也即社会样板程度值=1 的用户)的近/远。 越是高值,表明用户作为“社会样板”的角色越强烈、越鲜明,越是接近于最高意义上的、最完全的社会样板;反之,越是低值,则表示着用户距离成为一个“完全社会样板”就越远。
4.同心圈层的趋同中心与社会样板:从问题Q1到假设H1
针对基本问题Q1 以及本节对于趋同中心、社会样板的分析,我们提出:
假设(H1):社交网络中存在着某种高程度“社会样板”用户,它处于社交网络“趋同中心”的位置与角色,使得对于任意用户ux,ux和topuser 内容相似度与ux的影响力程度之间具有线性正相关关系。
H1 变换后的形式H1.1 为:社交网络中至少存在着某个用户um,使得对于任意用户ux而言,ux和um之间的内容相似度与ux的影响力程度两者是线性正相关。
对于H1.1 的检验,我们可以尝试的方法包括:对全部样板用户,逐个计算其社会样板程度,寻找至少一个具有um功能的用户。 如果存在,则表明,全体用户会发生以下现象:朝向居于“趋同中心”的用户发生趋同;用户和该“中心”的内容相似度越高,则其自身的影响力也越高。 这会使得高影响力用户的内容不是任意的、发散的,而是趋向于某种中心发生收敛、约束和塑造。
在H1 和H1.1 的基础上,我们继续把H1.1 转换为直接可操作化的假设方案H1’:设社交网络现有的用户中选取“社会样板”程度最高的那1 个用户为topuser,其他 m 个用户记为Y=[y1,y2,y3,……,ym]; Y 中每个用户与topuser 的内容相似度,依次记为S=[s1,s2,s3, ……sm]; Y 中每个用户的影响力程度依次为I=[i1,i2,i3,……im];则I 和S 之间具有显著的线性正相关。
(二)社交网络用户“同心圈层”结构由内向外的辐射:用户“影响力程度—社会样板程度”的同构化(S2→H2)
在Q1 和H1 的基础上,接着的问题Q2 是:用户作为社会样板的身份和作为意见领袖的身份,两者是否有程度上的正向相关和对应?
从H1 可得知,影响力越高的用户和趋同中心的内容越相似。 从社会样板的内涵(C0)即可推得,社会样板不是由粉丝量、影响力、线上线下身份等外在因素决定的,而是由其内容特征所限定的,是用户在内容上的“模板”与范式。 因而,与这种样板越是内容相似的用户,其等价于或近似等价于“样板”的程度也就越高。 如果把最为理想的“样板”比作一个雕塑作品,那么高影响力用户则是对这个作品的“高仿”,而低影响力用户则是对这个作品的“低仿”。 而“中仿”或“低仿”的用户其实也部分地反映出“原版”的面貌,对于这些仿品的趋同也会部分地反映出对于“原版”的趋同,只是对于原版的复刻效果会差一些。 用户的影响力越高,因为其和中心社会样板的内容相似度越高,所以作为社会样本的程度和属性也越强烈,也即可以推测,用户的影响力高低和其作为社会样板的程度高低具有正相关。同时从另一个角度,某用户(设为ux)越是趋同于原版的“完全社会样板”,则自身也会具有部分的“社会样板”的属性与轮廓。 从而由社会样板的内涵C0 及其测量方式可得,对于该用户ux而言,任意其他用户y 越是和自己相似, 则y 的影响力可能越大,只是这种可能性不那么高。由此,用户在趋同于完全社会样板或中心社会样板的过程中,自身也成为不同程度的社会样板。 对此,如果假设H1 的效应存在,那么则可以预期以下的假设H2:社交网络用户的影响力程度和他作为社会样本的程度之间具有显著的正相关。
把H2 转为可操作化的形式H2’:设社交网络中全体用户集合为Y=[y1,y2,y3,……,ym];Y 中每个用户的影响力程度依次记为D=[d1,d2,d3,……dm];Y 中每个用户的社会样板程度依次记为I=[i1,i2,i3,……im];则I 和D 之间具有显著的线性正相关。
(三)社交网络用户“同心圈层”结构的单中心化而非多中心化:社会样板趋同的单中心化(S3→H3)
此处是对于H1 的更强烈的命题,同时也可视作“同心圈层”结构的必须特征:存在单中心,而非多中心。
虽然在H1 中已经验证存在着某个被趋同的社会样板。 但是如果多个社会样板之间,本身差异很大乃至相互远离呢? 这样,整体结构就不会表现为一个“同心圆”,而可能是多个同心圆,抑或成为多中心的结构。对此,在C0、Q1、H1 的基础上接着需要考察的问题是Q3:社会样板随着其样板程度的提升,是否趋于多样化,亦或趋于单一化、同一化?
结合H1 的分析,社会样板程度最高的某个用户为topuser。 这里可能会让人产生质疑的是:其他也拥有非常高“社会样板程度”的用户(设为topuser’),也可以成为“芸芸众生”们趋同的目标和“模板”,此时,岂不会导向趋同的“多极化”或“多中心化”?
但答案是否定的,从两个层面可予以否定。(1)只要所有用户满足了假设H1,则我们不需要去关心在H1 中的最高的“那1 个”样板topuser 之外还存不存在其他的另1 个、另2 个乃至另n 个高程度样板。 即使存在其他再多的高程度样板,也无法否定H1 中的事实:也即所有用户在发生朝向“这1个”(topuser)的趋同。(2)即使存在着那另 2 个、另 3个乃至另n 个的社会样板,但根据H1,这些其他的高程度样板虽然看起来和H1 中的那一个最高样板(topuser)可能“长得不像”,但却潜藏着一个事实:样板程度越高的用户,就必须和最高程度的样板(topuser)“长得越像”。 因为,根据 H2,社会样板程度越高的用户,其影响力程度也越高;继而,根据H1,影响力越高的用户和“中心社会样板”(也即H1 中的topuser)就长得越像;从而可得,社会样板程度越高的用户和“中心社会样板”(topuser)就长得越像。 通俗地说,所有用户都“走在朝向‘最高社会样板程度用户’的大道上”,社会样板程度越高的用户离这个目的地就越近;反之,社会样板程度越低的用户则离这个目的地越远。 但是后面的人朝向排第2、第3 的人方向前进,并不等于他没有同时朝向排第1 的“排头兵”前进,因为所有的人前进的是相同方向。
由此我们可以提出假设H3:设社交网络中社会样板程度最高的某用户为topuser,对于任意用户ux,ux的社会样板程度和 ux与topuser 之间的内容相似度,两者是线性正相关。
把H3 转换为可操作化的检验形式H3’:设社交网络中社会样板程度最高的某个用户为topuser,其他 m 个用户记为 Y=[y1,y2,y3,……,ym];Y 中每个用户与topuser 的内容相似度依次记为S=[s1,s2,s3,……sm];Y 中每个用户的社会样板程度依次为I=[i1,i2,i3,……im];则I 和S 之间具有显著的线性正相关。
H3 中涉及的社会样板的同一性使得同心圈层结构确立了关键的前提:所有的用户朝着同一个社会样本趋同,而不是朝着多样的模板演化乃至分裂。这里蕴含着的是,所有的模子都在变得像同一个模子;根据模子复刻出来的人,也都越来越像同一个人。
(四)社交网络用户趋同过程中的圈层分化:随着影响力层级的提高,层内用户异质性越来越弱、同质性越来越强(S4→H4)
如果存在H1、H2、H3 中的相关现象,那么我们可以预期以下方面:(I)由H1,由于用户的影响力越高则和“中心”社会样板越相似,所以高影响力用户群中的多样性、异质性越来越消减;反之,越是低影响力的用户群受到的“趋同于中心社会样板”的束缚力更弱,所以可以保留更多的多样性和异质性。(II)a,由 H2,越是高影响力的用户群,他们的社会样板程度越高;(II)b,又由 H3,越是高社会样板度的用户就越是相似于中心社会样板,也即越是消减自身的自由多样性与异质性。 这样,由a→b 继而可以推得:越是高影响力的用户群,越是消减其自由多样性与异质性,从而越是增强相似性与同质化程度。
基于(I)和(II),当我们把社交网络社会中的用户按照影响力分层为一个个从高到低的“影响力层级”,则提出假设H4:越是高影响力的社会层级,其层级内的用户群体的内容相似度越高; 越是低影响力的社会层级,其层级内的用户群体的内容相似度越低。
对于假设H4.1,有两种备选的操作方式:一种是把用户按照影响力高低,切分成若干层,然后计算每层内用户的相似度; 另一种是对全体用户,逐个取与他的影响力最为相同或相近的k 个用户,然后把这(1+k)个用户视为一层,计算每层用户的相似度。 后一种的检验条件比前一种更为严苛,因此本研究选取后一种,将H4 转换为H4.1:对于每个用户ux,他和其影响力相同或最为相近的k 个用户组成一个“影响力层级”(层级中包括ux自身,因而层级人数为1+k);则用户的影响力程度越高,那么其影响力层级内用户的平均相似度越高,两者具有正相关。
进一步把H4.1 转为可操作化的形式H4’:设社交网络中全体用户集合为Y=[y1,y2,y3, ……,ym];对于Y 中每个用户,将其和影响力相同或最为相近的k 个用户组成一个“影响力层级”(每层级人数选定为30 人); 这样Y 中用户的影响力依次为DL=[d1L,d2L,d3L,……dmL],YL中每个层级的层内用户内容的平均相似度依次为SL=[s1L,s2L,s3L, ……smL]; 则DL和SL之间具有显著的线性正相关。
(五)各子假设的详细内涵与逻辑结构
结合前文“同心圈层”结构(图1)所示,我们可以鲜明见到上述4 个假设的直观意义。 进一步结合 S1、S2、S3、S4 进行阐述,S1’指所有点趋同的中心,是“中心社会样板”(居于中心社会样板的位置的既可能是完全中心、社会样板程度等于1 的完全社会样板,也可能是挨近中心、但并非完全社会样板的高程度社会样板);假设H1 指向“中心社会样板”的同化作用,也即用户和“中心社会样板”的内容相似度与该用户的影响力程度之间正相关。 S2’指所有点越是接近中心,则表示影响力越大,同时该点由于和中心社会样板的内容距离越小从而社会样板程度也越高,表现出假设H2 指向的任意用户“影响力程度—社会样板程度”之间的正相关;S3’指社会样板程度越高,则和中心的内容距离越小,表现出假设H3 所指向的社会样板趋于同一种“标的”的单中心化与单向度。 S4’指用户分为由内圈到外圈的差序格局,内圈用户的彼此相似度高,外圈用户彼此相似度低,显现出假设H4 所指涉的圈层分化。而这四点虽然并非出自“同心圈层”结构的预设与逻辑起点,却在结果上形成对于“同心圈层”趋同结构的支撑(参见表1)。
表1 “同心圈层”结构的支撑假设
结合 H1、H2、H3、H4 的问题提出及内涵,各子假设与社会样板、用户内容相似关系、用户影响力的联系图示如下(图4):
图4 社会样板-同心圈层结构及其子假设的内在关系
结合 H1、H2、H3、H4 四个子假设和图 2、图 4 内涵,各元素相互联系如下(详见图5,该结构亦用于后文的“路径分析”):
图5 “同心圈层”趋同结构的变量关系及其对应的子假设 H1、H2、H3、H4
三、研究方法与实施过程
(一)研究中的关键概念与指标界定
社会样板,见前文C0。
用户作为“社会样板”程度的测量方式,见前文C1。
用户内容相似度C2:本研究中,用户内容相似度指的是用户作为一个个“内容聚合整体”,每个用户都具有其整体上的内容特征,把这种特征提炼出来之后,从而可以考察两个用户在内容特征上的相似程度。 用户内容相似度的反面是用户的内容距离,也即用户在内容上“不相似”的程度。 尤其要强调的是,这种内容特征不是具体的一条条帖子的相似度,而是所有帖子对于个体的整体内容特征的表现。 通俗而言,是“以其文、察其人”,也即考察的基本单位,不是零碎的帖子和帖子的内容相似度,而是整化之后的用户和用户之间的内容相似度。 之所以选择这样的方式,是因为本研究的基点不是研究帖子、讯息的扩散与相似关系,而是研究在社会样板、同心圈层中的用户和用户之间的相似关系。
用户内容相似度的测量C2.1:用户内容相似度的实际计算中,把某个用户发布的n 条帖子作为一个整体,选择向量空间模型(VSM)+潜在语义分析(Latent Semantic Analysis,LSA),向量化每个用户的内容特征,进而由余弦相似度计算两个用户之间的内容相似程度。 此外,本文中的用户相似度,如无特别说明,都是指代用户基于内容的相似度。
用户影响力的测量C3:采用最为直接的指标也即“粉丝”的规模反映一个用户的影响力。 追随者、关注者的多少是用户得到的社会认同、社会关注与在社交网络中的话语地位的最为直接而原始的体现。 对于社交网络意见领袖、大V 的诸多研究,突出“粉丝数”指标的重要性[38]。 用粗糙集理论发现,“粉丝数对能否成为意见领袖至关重要”[39]。 张玉晨等直接通过粉丝数的规模,作为区分“大V”、“中V”的唯一依据[7](P79-87)。 本文的实际计算中,由于社交网络用户的粉丝量分布悬殊太大,从寥寥几个、成百上千到数千万不等,因此采取对数函数转换后的形式,x 为用户粉丝量的原始值, 则偶像程度为xnew=log2(x+1)。 该指标合理、直观,易于计算。
(二)样本选取与数据预处理
选择典型的社交网络之一新浪微博为样本。根据新浪微博数据中心最新发布的《2018 微博用户发展报告》,新浪微博月活跃用户4.62 亿,月阅读量过百亿领域达32 个[40]。 再采取广覆盖、成本相对较低的多阶段抽样。 从新浪微博首页47 个内容版块(分别是:社会、国际、科技、科普、数码、财经、股市、明星、综艺、电视剧、电影、音乐、汽车、体育、运动健身、健康、瘦身、养生、军事、历史、美女模特、美图、情感、搞笑、辟谣、正能量、政务、游戏、旅游、育儿、校园、美食、房产、家居、星座、读书、三农、设计、艺术、时尚、美妆、动漫、宗教、萌宠、法律、视频、上海)中,获取其发布者和评论者共3 501 153 个用户的初始数据库,从中最终抓取到具有有效个人资料、发帖数不少于500 条的88 739 个用户; 对这些有效用户,采取整群抽样抓取每人的前5页关注者。由于不同的用户其关注的人可能有重复,经过选取发帖数不少于500 条、去重以及具有相匹配的个人资料等清洗环节,从中选取到有效用户130 082 个。
我们对这些用户统一采用横向的比较口径。一是对时间段予以统一,帖子一律选取在2018 年1 月 1 日到 2018 年 12 月 31 日这 1 年间的。 二是对帖子数量予以统一,每个用户一律随机选取在上述1 年间所发布的500 条帖子。 如果对每位用户抽取的帖子太少,则难以“据其言、察其人”,尤其是微博博文都是短文本,更增加了“察人”难度,无法更为充分地进行用户彼此间的相似度计算。
经过上述取样和有效数据清洗,最后我们得到的样本用户为24 779 个。 这些用于计算的用户分布有广泛性与代表性,其粉丝量、发博量、关注数等各主要指标都包含从数十到数万乃至数千万的大范围,各种重度/轻度用户、活跃/不活跃用户都有良好覆盖(参见图6)。
图6 样本用户的特征分布柱状图
(三)用户内容的特征提取与向量化表示:VSM+LSA
把单个用户的各条帖子拼接为一个长文本,先通过向量空间模型(VSM)得到每个用户的词频矩阵。 词频矩阵的获取采取常用的数据挖掘模块sklearn 中的CountVectorizer()函数,其中最低词频数 min_df 设为 50,max_df 设为 0.2,ngram_range 设为(1,1),也即只采用一元词。 得到词频矩阵后转为经L1 规范化的TFIDF 矩阵X,转换函数为sklearn.TfidfTransformer(norm=l1)。
对于矩阵X 采取潜在语义分析(LSA)进行降维和内容特征的提取[41]。 LSA 利用奇异值分解(SVD)技术,可把数十万以上的高维、稀疏的词频矩阵降到只有数千、数百的低维表示。 降维工具选择目前广泛应用的开源模块scikit-learn 中的Truncated-SVD()函数。 对矩阵X 降到各维数时的误差变化情况见图7。
图7 潜在语义分析对用户内容降维的解释方差比
对于用户的内容特征,我们选择降到700 维时处于“肘拐点”的位置。再增加维度保留原信息的增幅平缓;TruncatedSVD()计算得到的解释方差比值(explained_variance_ratio_)已达 0.76,保留了原有的11 余万维矩阵的大部分信息。 总体而言,我们用尽可能精简的维度提取和高效表示用户内容特征,并过滤掉了较大噪音和扰动,保留了用户的主要信息特征。
(四)用户的内容相似度计算
本文所有的用户相似度,如无特殊情况,都指称用户在内容上的相似度。 结合C2.1,并对每个用户根据其内容提取为700 维的向量之后,就可以进行用户内容相似度计算。 选择文本挖掘中常用的、稳健的余弦相似度计算方式,任意两个用户Um和Un之间的内容余弦相似度表示为:
在上述式(1)的基础上可以进行扩展,从“1 对1”的用户相似度扩展到“n 对n”的两组用户(每组中用户数量n≥1)之间的相似度。任意一组用户G1(包含n1个用户)和另一组用户G2(包含 n2个用户)的内容相似度表示为:
式(2)是在式(1)的基础上,采用衡量两组对象间的平均距离所常用的“类平均法”(或称“簇平均法”,average group linkage)扩展得到。其中 G1或 G2都可以有且仅有一个用户。 如果H(G1,G2)的值越大,表明G1、G2这两组用户之间两两的趋近程度越高。
当 n1=1 而 n2>1 时,式(2)用于计算一个用户和一组用户之间的平均相似度,此时也用于计算后文中个体和群组的相似度。
式(2)中,当G1=G2时,且组内用户数量大于1个时,则为计算组内用户的两两之间彼此相似度的平均值,此时采取式(2)的微调形式,因为不能包含个体和自身的相似度(因为该值=1),微调后如下:
(五)微博用户“社会样板”现象与程度、分布的预调研
作为趋同中心的社会样板用户的存在是形成“同心圈层”趋同结构的准备基础。 实证检验之前,需计算每个用户的社会样板程度(C1)。 首先,从中寻找社会样板程度最高的用户(也即H1、H1’中的用户 topuser,或 H3、H3’中的用户 topuser),并考察其是否具有较为显著的“社会样板”属性和效应;其次,每个用户基于C1 计算得出的社会样板程度,作为变量参与到H2、H3、H4 的后续计算与检验过程。各用户的社会样板程度计算结构和分布特征如下(见图 8,表 2)
图8 用户社会样板程度分布的柱状图
表2 用户社会样板程度的分布特征
结果表明,微博用户中存在着正向的“社会样板”,其比重占到了63.4%。 总体来说,微博所有用户的社会样板程度的均值为0.08、中位数为0.10,都是正值,表明微博中总体上以正向的社会样板效应为主,而非负的样板效应,也非“无样板效应”。微博中存在着社会样本程度大于0.4 的用户,说明微博中存在着有一定强度的“社会样板”。 这些都表明,“社会样板”不是一种纯粹的理论构造或概念游戏,而是有其现实性,并且社会样板的强度、差异成为后文分析的进一步基础。
四、假设 H1、H2、H3、H4 的检验结果
把前文 H1、H2、H3、H4 的假设内容及其转换形式简列为下表(表3):
表3 支撑假设及其朝向可操作化形式的转换
这些假设中所涉及到的计算方式如下:用户的社会样板程度的计算方式见C1;用户的影响力程度的测量方式见C3;任意两个用户的内容相似度计算见式(2);H4’中各影响力层级内的用户内容平均相似度计算方式见式(3)。
(一)H1 的检验
H1 的检验结果中,I 和 S 的相关系数为: 皮尔逊相关系数 0.407(p<0.001,N=24779),斯皮尔曼相关系数 0.386(p<0.001,N=24779)。 H1 得到支持,表明所有用户会朝着某一个中心“样板”发生趋同;并且这种趋同程度线性正相关于各用户自身的影响力。
(二)H2 的检验
H2 的检验结果中,I 和D 的相关系数为:皮尔逊相关系数 0.544(p<0.001,N=24779);斯皮尔曼相关系数 0.537(p<0.001,N=24779)。 H2 得到支持,而且相关系数表示“影响力程度-社会样板程度”的同构化是一种较为稳定的现象。
(三)H3 的检验
H3 的检验结果中,I 和 S 的相关系数为: 皮尔逊相关系数 0.778(p<0.001,N=24779),斯皮尔曼相关系数 0.806(p<0.001,N=24779)。 H3 得到支持。 这个正相关的程度高,也表明H3 中社会样板趋于同一中心的现象具有足够稳定性(参见图9)。
图9 社会样板的趋同化
(四)H4 的检验
H4 的检验结果中,DL和SL的皮尔逊相关系数0.742(p<0.001,N=24779),斯皮尔曼相关系数 0.677(p<0.001,N=24779)。H4 得到支持。经常发生“误以为”的是,高影响力的意见领袖是多样的;或者另一种容易产生的误解是:影响力底层和顶层的用户在多样性、同质性方面不会有太大区别。 而H4 显示了随着影响力层级的提升,用户表现出的收窄化和同质化。 同时,H4 在前述个体趋同性的基础上,反映的是层级、群体的趋同性(参见图10)。
图10 用户因影响力层级提升而增强的层级内同质化
五、社交网络“同心圈层”结构的路径分析
同心圈层结构的各变量间关系及其蕴藉的各子假设如前文图5 所示。 对于图5 中所述的4 个变量(也即:用户的影响力程度、用户的社会样板程度、用户趋同于中心社会样板的程度、用户与同影响力层级的用户相似度)形成的“同心圈层”趋同结构关系进行“路径分析”。 四个变量通过Blom 公式进行正态化预处理, 估算方法采取最大似然法(maximum likelihood)。 路径分析结果见图 11,其中的各条路径系数全部符合显著性要求。
图11 “同心圈层”整体结构趋同的路径分析
对模型品质的判断有多项指标, 如RMSEA、NFI、CFI、IFIz、RFI 等。 “评价模型时,应多个拟合指数结合应用”[42][43]。 模型的拟合结果主要指标见表4。 主要拟合指标均优良,显示模型的拟合程度较佳。
表4 “同心圈层”结构的路径分析模型拟合优度主要评价指标
图11 中的各路径均显著,它们一一对应于本文所论述的 4 个子假设。 其中:(a)与假设 H1 对应的是,“用户的影响力程度”作用于“用户趋同于中心社会样板的程度”。 两者得到的标准化路径系数为+0.36。 (b)与假设 H2 对应的是,“用户的影响力程度”作用于“用户的社会样板程度”,两者得到的标准化路径系数为+0.27。(c)与假设H3 对应的是,“用户趋同于中心社会样板的程度”作用于“用户的社会样板程度”, 两者得到的标准化路径系数为+0.64。 (d)与假设 H4 对应的是,“用户的影响力程度” 作用于 “用户与同影响力层级的用户相似度”。 两者得到的标准化路径系数为+0.65。 上述4个路径系数的p 值全部小于0.001。
本研究并不排斥其他更为优越的路径分析模型。 但至少此处的路径分析是对于前文4 个假设之间的内涵和关系予以的进一步实证支撑。 结果也显示了H1、H2、H3、H4 的内在联系与有机作用,表示着意见领袖用户“同心圈层”趋同结构的整体性作用。
六、结 语
文章的主要价值与创新之处在于:(1)提出社交网络中的意见领袖“同心圈层”趋同现象与结构,并结合实证分析显示其合理性。 以往的研究中,对于微博或类似的社交网络往往强调其多样化、去中心的结构,这与“同心圈层”结构强调的同质化、中心化具有冲突;或者强调局部或小范围的同质性,而忽视全局性的同质化与中心性。 同心圈层结构强调隐藏的中心及其中心化结构,构成用户相似性网络的组织和演化。(2)在“同心圈层”的形成中,明确提出用户作为趋同中心的“社会样板”角色,并详细阐述、检验“社会样板”在社交网络结构中的重要作用。(3)通过 4 条具体的假设,对“同心圈层”趋同结构进行展开。 以意见领袖趋同中心的 “社会样板”效应与作用为基础(假设H1),它构成“社会样板-同心圈层”中居于“同心”的核心,并形成和辐射到3 个方面的支撑:也即用户“影响力程度-社会样板程度”的同构化(H2);社会样板趋同的单中心化而非多中心化(H3);随着用户的影响力层级的提高而相应地增长同质性的圈层渐变分化(H4)。
根据 H1、H2、H3、H4 以及 S1、S2、S3、S4,社交网络“同心圈层”趋同结构可以被概括为“一核心、三支撑”。 一核心是指:在用户内容相似/差异的结构中,全体用户对于某种“趋同中心”用户的趋同化(也即S1、H1);在此趋同过程中,不同影响力的用户表现出趋近于“中心”样板的相应程度的内容距离。 三支撑是指:一是在用户围绕“趋同中心”的趋同过程和分布中,用户影响力程度和其社会样板程度正相关、共同趋近于中心的同构过程(见H2);二是社会样板程度越高就越相似于中心社会样板,形成单中心化而非多中心化(见H3),这个方面是尤其容易产生误解的,会有较多观点误认为用户趋同于多中心而非单中心,但实际上即使表现出多中心,也是从低程度的单中心趋向更加高程度的单中心,这种背后的趋势不加以实证的分析则难以细致察验; 三是用户形成从中心社会样板向外辐射的格局,随着影响力从高到低的用户社会层级的分析,表现出宏观的从中心向边缘、层级从高同质性向低同质性、层内用户彼此之间内容距离越来越大、圈层内部越来越稀疏的同心涟漪式的分化结构与差序格局(见H4)。 对社交网络意见领袖的趋同结构在上述4 条假设的基础上予以整合,笔者提出“同心圈层”的整体结构并对其进行路径分析,结果显示该结构的良好拟合度,并回过来对4 个子假设及其内在整体关系提供支持。
强调社交网络用户去中心、多中心的理论模式比较常见,但它们忽视了全局性的用户同质性与同心圈层的演化过程。 意见领袖用户不是“去中心”的,而是“有中心”的;不是“多中心”的,而是“单中心”的;不是小范围、局部的“中心化”,而是全局意义的“中心化”。 其一,“多中心”的理解来自于一些实证研究,但是对其辨析的关键在于:用户随着影响力程度或社会样板程度由低到高的变化,尽管依然表现出可能的多中心,但是其中的用户异质性会越来越低,而用户同质性则越来越高,并形成向单中心的逐步演化(见H3、H4),从而实现多中心和单中心的连续过渡谱系与有机统一。 其二,关于社交网络局部中心化和局部同质化的研究同样较为多见,包括网络“巴尔干化”、网络“回音室”与用户同质性网络连接的分析都强调这种同质性的社群或用户关系。 但是这种局部化的同质性容易忽视全局中的同质化,甚至可能用分裂的网络“巴尔干化”来反对某种全局性的“巴尔干化”;也即社交网络是一个大的“信息岛”,而不是一个个小的、局部的“信息岛”的叠合。 结合 H1、H3 分析可知,对于局部的趋同和对于全局的趋同并不矛盾;在趋同于局部的社会样板的过程中,这些局部也在同样的演化尺度上趋同于中心的社会样板,形成整体化而非隔裂化的趋同网络空间。
霍克海默、阿道尔诺曾对于作为“文化工业”的大众传媒进行反思与批判,指出在规模化的大众文化生产和流通中,文化逐渐地同一化、非个性化[44]。马尔库塞提出“单向度的人”与“单向度的社会”[45],同样反思着现代社会中主体的重复性和单一化。这些批判思想在媒介实证分析中遭遇到了种种阻力和抵制。 对于社交网络而言,对于同一化、相似化的“主体”的再生产,容易被内容表层的多样性和用户表层的差异性所迷惑。 然而,同心圈层结构要求将这些局部的、浅表的差异性纳入到从同质性到差异性的连续谱系中,并深刻挖掘在多样性现状背后的同一性和统一性。 “同心圈层”结构强调多样性的社交网络用户所发生的“中心化”且朝向“单向度”的趋同。 而且这种复刻程度的高低关系到用户的影响力高低并进而表现出趋于单中心的演化结构。 在此过程中,重要的问题不只是这种“同心圈层”是否以及如何成立,而是它在更深层次对于意见领袖角色的限定性具有何种意味。 社交网络媒介和社会化结构尽管具有多样性、离散性乃至去中心性的表层现象,但在深层次上蕴藉着“再中心化”和“单向度”趋同的理论可能与实践表征。 用户表现为同一种“标准件”的不同程度的复刻与趋同,诚如社交网络作为“文化工业”机器对于用户主体性的再生产。