社交媒体时代网络意见领袖筛选和测量方法研究*

2013-12-05庄晓东

中国出版 2013年22期

文/李彪庄晓东

网络逐渐成为整个社会重要的舆论场域，在社会意见的整合等方面越来越发挥重要的作用，但社会舆论在网络场域中传播的规律目前还处在摸索阶段。在传统的舆论学研究视域中，意见领袖是研究舆论传播的重要概念和节点。关于传统舆论学意义上的意见领袖的筛选和测量，不同的学者提出了不同的测量方法，但由于网络的信息海量和匿名性等特性，网络场域中的意见领袖的筛选和测量方法目前还处于摸索和争论阶段，不同学科的研究者表现了不同的学科路径依赖。另一方面，网络意见领袖是网络舆情传播中的关键节点，是网络舆情监测中最为重要的一环，因此有效地测量和筛选网络意见领袖具有重要的意义和价值。

一、测量方法的不同研究取向

目前对网络意见领袖筛选和测量的方法主要有两种研究取向：一种用传统方法研究现代问题取向，将传统意见领袖测量方法结合网络特性直接移植到网络，相关的研究很多；二是用现代方法研究现代问题，在这一方面目前国内关于网络意见领袖目前还没有太明确操作性定义和测量方法，但是有一些研究还是比较有借鉴意义。从使用的方法论来看，主要分为定性研究和定量研究，其中定量研究的比重较大。

在定性研究中，最常用的是直接认定法，这是一种极为简便，将版主或者发帖量最高的ID 等直接默认为意见领袖，某些研究[1]直接将论坛的版主等同于天然的“意见领袖”。黄敏等[2]认为意见领袖主要来自以下群体：一是评选的人物，如强国论坛综合专家和网友意见，曾评选出 “十大网友”；二是版主；三是网络名人，如一些著名学者、社会名流、明星等，将现实中的影响力带到网上；四是网络知识分子。

二、网络意见领袖测量的定量研究方法

1.主观量表法

这一方法直接源于传统意见领袖测量和识别方法，通常沿用传统意见领袖测量表让所有研究对象进行自我判断和回答，要么根据一定比例划分将研究对象分为意见领袖和追随者，要么将得分在某个阈值之上的认定为意见领袖。研究者通常利用网下发放问卷、网上发布问卷以及线上和线下调查相结合等三种方法来获取资料，例如林建邦[3]在以病毒行销的观点探讨如何让电子邮件成为更具爆炸性的传播工具时，通过网上问卷调查，使用金与桑莫斯（King & Summers，1970）及柴德思（Childers，1986）发展的意见领袖量表，取总分前30%作为意见领袖；芭芭拉·里昂（Barbara Lyons）等[4]在探讨网络意见领袖及其跟随者使用电子商务的差异时，通过网下问卷调查方式，也使用了柴德思（Childers，1986）量表将样本二分为意见领袖及其跟随者，意见领袖被指定为得分等于或高于平均值（3.07）的受访者；韩国学者孙永俊（Sohn Youngju）[5]在比较线上、线下两种环境中意见领袖和寻求意见者的行为和特征的差异时，通过网上问卷的方式，采用的是佛林（Flynn）量表来测量网民的意见领袖特征以及寻求意见的水平。以上研究确定网络意见领袖的方法也都是基于传统意见领袖概念和测量方法，将网络人群二分为意见领袖及其追随者，采用网上问卷调查、电子邮寄问卷调查或者网下问卷调查方式收集数据并对数据进行分析得出结论。

自我报告法自诞生起，其有效度一直受到许多研究者的质疑和猜度。该方法最大的问题在于自我判断有效性，认知心理学研究表明自我对自己的评价一般要高于别人对自己的评价，因此，自我可能过高地估计自己对他人的影响，尤其是那些试图寻求社会表扬和认可的人，这样就可能导致一些自认为是意见领袖的人实际并不是意见领袖。另外，自我报告法依据得分或一定比例直接把所有研究对象进行二元划分，这种一刀切的方法并不一定真实地反映网络社会复杂的成员结构。另一方面，识别意见领袖的重要目的是为了进一步研究这些人的特性，使意见领袖能有效地推动网络社区发展、舆论引导或促进创新扩散，然而自我报告法所识别出来的仅仅是“自在的”意见领袖，他们虽然心理特质得分较高，但是否具备线上意见领袖的行为，还是值得商榷的。

2.网络行为的统计测量方法

网络行为统计测量方法是指利用网络海量数据及获取可得、方便的特点，对欲研究的所有对象进行某些代表意见领袖特征的指标特征进行抓取和统计分析，从行为的性质来筛选意见领袖，以此实现筛选的目的。安珊珊等[6]以网络ID 的行为为对象，通过发表的网络主帖的数量、主帖的回复数量等行为维度和内容的认同度等三个维度测量网络意见领袖。瑞伊（Rhee）等[7]在对网络政治讨论中心讨论者的社会政治特征和个人差别进行考察时，根据注意力和影响力两个指标将在线参与者分成意见领袖、安静的说服者、注意力收集者和一般公众四个群体。意见领袖被定义为受到其他讨论者注意，并且对其他讨论者实施影响的一群人，信息的浏览量被用来作为衡量注意力的指标，平均值作为区分高低注意力收集水平的标准，影响力利用信息获得的积极反应的数量减去消极反应的数量来测量。帕克（Park）等[8]为了识别公共关系中作为重要目标公众的有影响力的博客，使用了一个PIIPM 模型，通过调查问卷（量表）测量博客的公共问题参与行为和传播行为，以此为指标识别意见领袖，然后使用博客声望以及发起公共讨论的行为两个指标来证明模型的有效性——公共问题参与行为指博客中涉及的是私人问题还是公共问题——该研究认为在线意见领袖应该是积极实施政治参与的行动者和积极表达自己政治观点的媒介使用者，因此将积极的信息生产作为判断传播行为的指标。

网络行为统计测量方法操作简单，对研究者的统计知识要求不高，这种方法仅仅通过统计成员或博客的基本特征信息来识别网络意见领袖，忽视了个体发挥影响力的生存环境以及其社会网络关系。另一方面，用来识别意见领袖的指标也表现出研究者主观判断的特点，影响了意见领袖筛选的准确性，例如仅仅将议题的浏览量作为衡量发帖者受到注意的指标，忽略了议题本身的吸引力。

3.社会网络分析法（SNA）

社会网络分析是基于社会关系的一种定量分析方法，利用社会网络分析方法来识别意见领袖首先需要收集相关关系数据，目前所采用的方法主要有调查法和内容分析法。调查法是通过调查方法（如问卷）询问成员间的关系，对群体中的所有成员进行调查，然后计算每个成员被选择的次数及选择他人的次数，得出关系数据。内容分析法是利用网络中存储的信息，如发帖、回帖数量等数据作为成员之间交往的关系数据，进行社会网络分析，进而转化为可以使用社会网络分析软件（如UCInet 等）分析的数据，使用社区图、中心势、中心度等指标来进行分析。例如高俊波、杨静[9]以在线论坛为研究对象，建构一个以论坛作者为节点，他们之间的回复关系为边的社群网络，发现其具备小世界网络的特征，然后通过比较原有的社群网络CN 的平均路径长度L 与没有第i 个节点的社群网络CNi 的平均路径长度Li 来找到代表意见领袖的关键节点，L-Li 值最大的为意见领袖；项方产[10]在挖掘基于通信关系的意见领袖时，按照通信关系网的性质，将规模巨大的网络使用层次聚类方法划分成可分析的通信子网，然后利用最短路径计算得到密切度和中间度，再结合节点广泛度计算综合中心度，以综合中心度判断意见领袖节点。

使用社会网络分析方法甄别意见领袖具有天然的条件和优势，从社会网络分析的观点研究个体行为，保留了个体间互动模式的完整性，能够从原本的社会关系结构中分析出个体所处的结构位置、关系以及互动模式。另外，网络分析是建立在非概率方法的基础上的，它的数据不是由样本的随机选择获得，而是通过最大甚至是全部的群体成员获得，因此能够提供更正确和更真实的分析。当然，社会网络分析方法也不是万能的，受研究者最为诟病的是它只关注成员之间的关系数据，忽略了成员之间信息交流的具体内容。

4.运用数学建模等筛选网络意见领袖

数学建模方法是近几年一些研究者基于信息科学的数据挖掘技术研发出的新测量方法，它是基于现代信息科学与数据挖掘技术相结合的综合性方法，需要具备一定的数理基础和信息技术理论，门槛相对较高。如胡勇等[11]在分析网络舆论话题参与者基本属性的基础上，构造了话题参与者的“属性矩阵”——话题参与者(Agent 的) 发言频率、辩论能力、影响力和自我坚持力等基本属性，并通过属性取值加权排序得到领导力综合值，为网络意见领袖的发现提供了实用的方法。毛波、尤雯雯[12]以BBS 中知识共享型版面为主要研究对象，利用数据挖掘技术，根据成员所发表帖子对社区整体知识形成和共享过程的贡献率，进而将社区的成员归纳为领袖、呼应者、浏览者、共享者和学习者等五种类型。

使用影响力扩散模型是目前数学建模筛选意见领袖的主要方法之一。日本学者松村直弘（Naohiro Matsumura）等[13]提出“影响力扩散模型”（Influence Diffusion Model），该模型主要从文本内容、交往网络等方面测量网络角色类型筛选意见领袖，该模型认为在基于文本的计算机中介交流环境下，人们通过发回帖来表达观点，词语是组成帖子的基本单位，论坛交流通过词语来表达和传播，论坛对话链体现影响力的传递结构，ID 影响力是在一段时期内某ID 所发全部帖子（主帖或回帖）的影响力之和，高影响力的ID 被认为是意见领袖。余红博士[14]采用数据挖掘方法，借鉴松村直弘（Naohiro Matsumura）、恩泽幸雄（Yuhio Ohsawa）、石冢满（Misuru Ishizuka）的“影响力扩散模型”，基于中日论坛中一定时期内488 个讨论串、几千条讨论，计算出中日论坛参与者的论坛影响力，分离出中日论坛活跃分子；再以中日论坛活跃分子的“论坛声望”作为分类指标进行聚类分析，将ID 号分为四类：意见领袖类ID、靶子类ID、议题扩散类ID 和焦点类ID，从中筛选出论坛意见领袖，并对筛选效果进行了效度评估。石矛[15]认为影响力扩散（IDM）模型中公式的分母项导致了最终影响力的计算失误，而分母项对影响力的计算又没有实际意义，因此主张通过省去公式中的分母项来改进IDM 模型的影响力算法。

影响力扩散模型最大的贡献，是把内容引入到对行为的研究中，采用严格定量的方式，从网络论坛帖子立体结构和内容相关性两个维度来识别意见领袖，重视了社会网络关系。

但该模型也存在着一些不足之处。首先，策略比较简单，可以考虑加入文本相似度计算对已有的影响力传播模型进行改进。该模型在中文环境下的有效性，简单地利用BBS 中成员发表言论中的词语传播比率，来确定人物行为是不完善的，尤其是讨论社会民生、政治问题的帖子，这种方法没有考虑到主题之间的关联关系、人物之间的互动关系等，简单的计算词语传播的比率并不足以反映真实的影响力传递关系。其次，该模型的有效性也值得商榷。再次，该模型还忽略转载媒体新闻的帖子也可能被大量回帖，在影响其他人观点方面并不一定是意见领袖自身在发挥作用。同时，模型中也忽略了同一篇文章被不同的人回帖，影响力会随着回帖者本身在网络中的不同地位有所不同。

5.运用网页排名（Pagerank）思想甄别网络意见领袖

网页排名（PageRank）是一种由搜索引擎根据网页之间相互的超链接计算的网页排名技术，对网页的重要性进行客观的测定。网页排名（PageRank）技术会将网页A 上指向网页B 的链接解释为，由网页A 对网页B 所投的一票，而不是计算直接的链接数。这样，网页排名（PageRank）根据网页收到的投票数来评估其重要性。也就是说，在实际计算网页排名（PageRank）值时，除了考虑网页得票数（即链接的纯数量）之外，还要分析为其投票的网页的重要性，一个网页本身的PageRank 值越高，则它对其链出网页的推荐能力就越强。同时一个网页的链出网页越少，那么它对其中一个链出网页的推荐程度就越高。也就是说，PageRank 还会根据页面链出总数平分一个页面的PR 值。目前已有研究者将Google 公司的PageRank 思想运用到识别网络意见领袖的研究中。

宋晓丹（Song Xiaodan）等[16]运用影响力级别（InfluenceRank）算法来识别博客圈中的意见领袖，这种影响力级别算法根据两个方面来分类博客：博客在网络中有多重要，博客提供的信息有多么新颖。在测量博客在网络中的重要性时，宋晓丹等运用了PageRank 的核心思想，在评定A 博客的影响力时考虑了被A 博客吸引的那些博客本身的影响力水平。翟忠武（Zhongwu Zhai）等[17]在使用基于兴趣领域的算法来识别BBS 中的意见领袖时，首先提出了两种将用户聚类到不同兴趣领域的算法：基于板块的算法（FieldPR_Board）和基于文章链的算法（FieldPR_Chain Cluster）。基于板块的算法认为在某种程度上，BBS 每一个板块就是一个兴趣领域。而基于文章链的算法认为一个用户回复文章链是由于他对文章链中的文章感兴趣，因此可以将文章链用来作为兴趣领域的基本单位。得出兴趣领域后，然后将GlobalPR 算法应用到每个领域。GlobalPR 不仅考虑了每个用户的回复数，而且也考虑用户跟随者自身的显著度。显然，GlobalPR 就是一个加权的PageRank。

运用网页排名思想的识别方法，很好地利用了互联网现存的海量信息来挖掘意见领袖，相比自我报告法等传统方法更具有科学性。这种方法最大的特点是在识别意见领袖时，不仅考虑了意见领袖在社会网络中被关注的程度，而且也考虑了跟随者本身在这个网络中的重要性。另一方面，这种识别方法还强调了意见领袖的跟随者在社会网络中关注的人的数量，因为每个人的精力是有限的，一个人关注的人过多，那么分配给其中之一的关注度也必然大打折扣。

当然，任何一种方法都像硬币的两面，也存在着一定的缺陷，和社会网络分析法一样网页排名法忽视了信息交流的内容——拥有高回复数的ID 并不一定就具有高影响力，不应将用户间的回复关系简单地理解为支持关系，需要具体分析。

三、网络意见领袖测量的综合方法

1.现有网络意见领袖甄别方法存在的问题

与传统意见领袖相比，对网络上新兴的网络意见领袖的研究无论从方法还是对其特征的把握上都有些匮乏。一个比较直观的表现就是目前国内对网络意见领袖的定义和概念还不明确和统一，很多文章上提到的在线论坛意见领袖、网络舆论领袖、意见领袖等概念也是网络意见领袖的概念。

从以上的网络意见领袖的甄别的方法来看，不论是定性方法还是定量方法，都存在一个共同的问题，即对于网络意见领袖的筛选，具有一定的模糊性，缺乏具有操作性的定义。既然没有一个操作性和可考察的维度，那么判定网络意见领袖的方法就会产生偏差。现有的筛选多半从传统意义的意见领袖而来，但是由于网络媒介的特殊性，将意见领袖的已有成果搬套在网络意见领袖上并不一定适合。

从现有的网络意见领袖的文献来看，主要集中在对网络意见领袖的特征等问题的探讨上，议题的狭窄化也导致了筛选网络意见领袖在范围和方法上的局限性。

从方法上看，不论是定性还是定量，都有其自身的缺陷。定性的直接认定法，无论是自我报告、观察法还是深度访谈，都有很强的主观性，在筛选意见领袖时，容易受个人主观意志的影响而产生偏差。而定量的方法，则亦有自身的不足。比如社会网络分析法是近几年比较新的研究方法，该方法是一种研究人们社会关系特征和群体特征的测量方法，主要测量的是人的关系属性而不是个人属性，是将人置于社会交往或互动网络中来思考，通过绘制社会图（Sociogram）、社会矩阵（Socio matrix）或进行威望、受欢迎度、中心势等指数分析来筛选意见领袖的方法。

2.综合法——网络意见领袖指数构建法

在以上方法的基础上，本文采用中国人民大学舆论研究所使用的方法。该研究方法在对所有研究网络意见领袖的方法基础上，吸取已有的研究成果，以网络意见领袖的外显化特征——网络行为为基点，糅合自我报告量表法、社会网络法、建模思想和网页排名思想等方法所具备的优点，通过构建相对科学、合理、全面的网络意见领袖指数评价指标体系，计算出每一个ID 的网络意见领袖指数，使每一个ID 都表现出来一个数值，使之直观化、数量化呈现，进而进行横向的量级比较。该方法主要由主观指标和客观指标构成，主观指标主要使用上面提到的量表法，测算不同ID的网络意见领袖的主观指数，客观指标主要是行为特征值（不仅是主动发言行为还包括反馈情况），进而根据特尔斐专家赋值法对每个指标进行赋值，进而形成每个ID 的网络意见领袖的舆情指数。

以上的文献综述对目前国内外学术界主要的甄别和测量意见领袖的方法进行了梳理，在梳理的过程中可以发现，任何一种测量和甄别方法都存在这样那样的缺陷，要么仅注重主观指标，要么注重行为指标，要么只注重质化指标，要么只注重量化指标。基于此，笔者在对已有研究的基础之上，结合自己对网络意见领袖的观察，建立一个既包含直观指标又包含行为指标、内容指标以及既包含质化指标又包含量化指标的网络意见领袖指数评价指标体系，初步拟建的结果如下表所示（见表1）：

从表1 中可以看出，本评价体系包括主观和客观两维指标，主观指标中包括意见领袖主观特质和人格特质两个维度；客观指标又包括行为指标和内容指标，通过以上四个维度的指标基本上可以对意见领袖的基本情况进行廓清。

当然，本研究方法不是万能的，由于网络的隐匿性等特点所限，对于个别网民以“马甲”多面孔呈现在网络上的行为无法有效甄别，除非对IP 和两个ID上网时间进行监控，这些研究已不在本研究的研究范畴之内，因此本研究构建的体系一定程度上只反映的是网络ID 的网络意见领袖指数，而不是网民个体的网络意见领袖指数。

表1 网络意见领袖指数评价指标体系一览表

四、相关结论

通过以上的分析，可以看出目前在网络舆情监测中对网络意见领袖的甄别方法都具有一定的科学性，但甄别出来的结果会存在些微的差异，科学和普适的筛选和测量方法还在探索之中，这说明任何研究方法本身都不是完美的，在解决了一定问题的同时都存在一定的缺陷。在具体的操作过程中，以上三类方法无所谓优与劣，研究者可以根据不同的研究目的和研究假设对各种方法进行选择性使用。

注释:

[1]佚名，BBS 版主的构成研究[EB/OL].http://www.zijin.net/njunews01/liuyang/text/xuexi5.htm，访问于2013年4月1日.

[2]黄敏等.网络意见领袖特征及其舆论影响[J].新闻世界，2009（7）：77-78.

[3]林建邦.打个喷嚏大家都感冒-以病毒营销观点探讨电子邮件之散播[D].静宜大学硕士学位论文，2004年

[4]Barbara Lyons et al.Opinion Leadership in a Computer—Mediated Environment.Journal of Consumer Behaviors，Iss.5: 319-330.

[5]Sohn,Youngju.Opinion Leaders and Seekers in Online Brand Communities: Centered on Korean Digital Camera band Communities.A Thesis for the degree of Master of Florida State university.

[6]安珊珊.多样性议题偏好与有限议题影响——互联网中文BBS 论坛意见领袖舆论参与特征研究[J].中国传媒报告，2009（3）：84-95.

[7]Rhee,J.et al.Exploring Online Opinion Leadership: A Validity Test of the Concept in the Digital Age.Paper presented at the annual meeting of the International Communication Association,TBA,San Francisco,CA,2007.

[8]Park,Nohil et al.（2008）Who Are the Power Bloggers as Potential Target Public in PR?: Public Issue Involvement-Production of Messages Model.international public relations research conference,2008.

[9]高俊波，杨静.在线论坛中的意见领袖分析[J].电子科技大学学报，2007，36（6）：1249-1252.

[10]项方产.基于通信关系的意见领袖挖掘与应用[D].上海交通大学硕士学位论文，2007年.

[11]胡勇.网络舆论形成过程中意见领袖形成模型研究[J].四川大学学报（自然科学版），2008，45（2）：347-351.

[12]毛波等.虚拟社区成员分类模型[J].清华大学学报（自然科学版)，2006，46(S1)：1069-1073.

[13]Naohiro Matsumura,Yukio Ohsawa and Mitsuru Ishizuka(2002).Mining and Characterizing Opinion Leaders from Threaded Online Discussions.http://miv.t.u-tokyo.ac.jp/papers/matumuraKES2002.pdf.

[14]余红.网络时政论坛意见领袖研究——以强国社区中日论坛研究为例[D].华中科技大学博士论文，2007年

[15]石矛等.IDM 模型分析及其影响力改进算法[J].成都信息工程学院学报，2008，23（1）：69-72.

[16]Song,X.et al.Identifying Opinion Leaders in the Blogosphere.In CIKM '07.2007: ACM

[17]Zhongwu Zhai et al.（2008）Identifying Opinion Leaders in BBS.IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology.

展开全文▼