指标构建与核心流程:社交媒体内容传播效果的综合评估*
2022-06-15汤景泰徐铭亮
汤景泰 徐铭亮
传播效果长期以来都是新闻传播领域研究的核心对象之一。人类的绝大多数信息传播行为都具有目的性,即借助媒介对他人的观念、态度、情感、认知、行为等造成短期或长期的影响①,而该影响在多大程度上与传播目的相符便是传播效果研究的核心问题。经过长期的摸索,效果研究最终将其主要问题框定在“效果测量”与“成因分析”两个层面上。通过单一路径回应上述两个问题并不困难,但如何整体、全面、多维地评价整个传播过程及其最终形成的复杂效果,又如何对比多个对象之间的效果差异,成为了学界和业界长期关注的难点问题。传播效果的综合评估法是解决这一问题的重要方法路径。该方法优势在于可以依托现有的成熟理论将评估对象拆解为多个部分、环节、层次,然后进行模块化分析,并对评估对象的不同方面构建一套评估指标体系,最终通过计算各指标综合得分来评估对象之间的相对差异。
但是随着社交媒体的迅猛发展,传播效果研究所要面对的场景、环境、主体、渠道、内容都愈发复杂与多元化,数字治理的难度也随之增加。②20世纪90年代的计算机中介传播研究(Computer-Mediated Communication,简称CMC)已经指出,媒介形式带来的变化会影响社会的信息交换模式。③而基于社交媒体的传播,信息生产者与消费者的定位不再固化,人人都有可能成为新型的“产消者”④。这无疑为效果评估带来了更多不确定性。评估对象、背景、目的的不断变化,意味着评估系统内部的要素、权重也必须随时更新。显然,固定的指标体系不可能一劳永逸地服务于评估实践,而针对每一类特定场景去重新构造系统的成本又过高,那么如何针对社交媒体传播环境提出一套更具科学性、灵活性与应用性的传播效果综合评估方法,无疑具有重要的理论意义和应用价值。
一、研究述评
如今不少商业化媒体平台已经建构了用于评估媒体、账号、网站影响力的排名系统,也有很多研究者在经典理论的指导下构建出了多套指标体系。然而不同学科之间以及学术与应用之间,都存在一定的方法“鸿沟”。例如,学界与业界显然遵循着两套不同的评估逻辑:一方追求理论完备性与合法性;另一方则追求与现实数据、商业需求相适应。从已有研究成果来看,评估逻辑差异主要表现在体系构建思路与操作标准上,且呈现出理论与应用两个不同的面向。
第一类研究强调评估系统的理论性与全面性。这类研究关注如何在理论上对评估对象的概念、属性、要素、环节进行合理地划分、拆解,并基于此组建一套多层次、多指标的评估体系。例如,传播影响力评估研究在影响力理论的接触、接受、保持、提升这四个环节的基础上提出了针对媒体渠道与意见领袖的传播广度、深度、强度、效度四维因子模型,以及针对社交媒体的覆盖度、交互度、认知度、满意度、忠诚度五维影响力模型,并发展出多套综合评估指标体系。⑤又如,针对突发事件网络舆情的评估研究以危机管理理论为基础,根据事件爆发至平息过程中的主体行为与反馈,构建舆情热度评估体系。⑥还有的把舆情传播的主体、受众、传播、内容四个要素作为一级指标构建舆情监测系统。⑦总体而言,这类评估研究大多围绕“5W”经典传播理论,将传播过程按用户、平台、内容、互动等方面进行要素拆分,并依此构造评估指标体系。这类研究的科学性立足于评估系统对于理论的阐释度与契合度,追求将经典理论“模块化”后套用在现实分析中。但这类研究的不足也非常明显,即忽略了从理论到实证之间的研究设计与测量操作过程。换言之,这类评估体系并不能即拿即用,而是需要使用者进行更为细致的操作化定义后才能应用到实践中。
第二类研究强调评估系统的效率与实用性。这类研究通常针对实际问题设计一套适用于特定评估目标、特定数据的排序系统。例如,有研究基于社交媒体的用户行为时序、话题参与及个人属性特征等因素构建影响力排序系统⑧,以及诸多针对热门话题、网站链接的排名算法。除学术研究外,诸多媒体平台构建了服务于商业应用的评估榜单,用于分析各类媒体、平台、网站、企业在行业中的影响力与广告效果,例如清博大数据、百度指数、新榜指数、微信指数等。总体而言,这类研究或应用重视算法开发与工程完善,在方法运用上较为灵活、多元,并无固定的步骤与流程限制。其科学性立足于评估系统对数据与方法的合理搭配以及系统的整体效率,而评估的最终目的则是依据评估对象的得分进行排序或将评估结果应用到其他研究分析中。但这类研究的问题在于过分追求评估排序结果,缺少了对结果成因以及对象间差异的考察与解释,最终可能使研究落入“盲目排序”的陷阱之中。
在评估的流程与路径方面,综合评估法是应用最为广泛的策略。综合评估法(又称综合评价法)源于统计学科和管理学科,目前已经被广泛应用于各学科领域的评估排序。综合评估方法的操作流程是根据评估目的将多个从不同方面描述评估对象的绝对统计指标,转化为无量纲化的相对统计指标,并通过特定的权重分配方法将这些指标综合为一个评估体系。⑨其中,“构建指标体系”与“选择赋权方法”是系统构建流程中最为核心的两步:前者决定了该系统的整体性与科学性,后者决定了该系统的目的性与针对性,且这两个步骤之间存在相互影响。
目前学界虽然在综合评估流程上达成共识,但对于上述两个核心环节的具体实践路径却有着不同的看法,其主要表现在认识论上“理论先行”的主观性路径与“数据先行”的客观性路径之间的差别。主观方法遵循自上而下逻辑,倾向于定性地选择指标与分配权重。例如,通常依据理论、专家经验或主观判断构造并筛选指标,并使用常见的权重分配方法,如层次分析法(AHP法)、模糊综合判断等来分配权重。坚持主观路径的研究者普遍认为,指标选取与权重分配本质上是指标评估“评什么(目的)”以及“怎么评(方法)”的选择问题,而这种选择必然带有主观价值判断。而客观方法则遵循自下而上的逻辑,倾向于定量地选择指标与分配权重。例如,在计算数据的现实分布基础上通过判断指标之间的相关性与变异性来筛选指标,并用灰色关联度法、主成分分析等方法分配权重。坚持客观性路径的研究者认为主观方法无法观察数据本身的固有特征,构建出的指标与权重无法对应现实世界中的真实情况,缺乏对数据客观分布的针对性。值得一提的是,有不少计算机领域与数据科学领域研究者试图使用某些机器学习算法来实现综合评估的指标确立、赋权、排序等流程,这类方法也偏向定量方法,但由于相关研究并未成熟,此处不多做赘述。
总体来看,当前的传播效果综合评估研究虽已取得了诸多显著成果,但在社交媒体复杂传播环境与多元评估需求下也面临着更多的挑战。特别是传播效果评估系统需要将评估重心转移到线上,而评估研究的单位与时效性受到公众注意力周期缩短的影响,在这种情况下如何提升评估的数据质量、平台互通性与指标精炼度就成为研究的难点。
二、社交媒体内容传播效果综合评估的指标体系构建
综合评估系统包含一套指标体系以及其前后的数据计算、处理流程。其中指标体系是综合评估系统的核心内容,承载着评估的目的与价值取向,内蕴着评估的理论基础与前提假设。指标体系的设置首先取决于评估的对象。由于公众注意力在不同事件、领域间快速切换,对宏观单位的评估难以在特定领域奏效,而对微观单位的评估又需要增加其迭代频率以应对快速的信息流动与环境变换。简而言之,公众注意力周期缩减的同时也在增加综合评估结果的偏差。因此,舍弃“传播效果常态化”的评估思路,并在宏观与微观之间选择“议题”作为中观的内容单位可以有效地提升传播效果评估的科学性。议题及其衍生出的讨论空间好比一个“容器”,可以容纳公众注意力消长、内容信息更迭以及传播主体流动。基于这一思路,评估者无需考虑容器内部特定信息或个体属性,只需测量容器内部的具体现象以及容器自身的演化与结构即可。
(一)议题传播的理论基础
议程设置(agenda setting)理论与其发展而来的议程融合(agenda melding)理论是理解议题传播机制与效果的基础。早期议程设置理论认为大众媒介有能力影响受众对公关议题的关注,并通过媒体信息发布数量变化控制受众对于议题重要性的认知排序,即第一层议程设置。研究者还发现议程设置除了影响受众对事物本身重要性认知以外,还会影响受众对议题属性、要素的重要性以及这些关键概念之间的关联模式的相关认知,即第二层属性议程设置与第三层网络议程设置。
但议程设置理论无法解释受众对议程的“逆向塑造”现象,议程融合理论便应运而生。该理论认为议程为个体提供了某种接入社群的渠道,即承担了某种社会整合功能,而个体也会有意识、有目的地选择议题内容,从而进入与自身关注事物相关、价值观念接近的社群中。总的来说,议程融合理论的提出使得议程设置研究从传统的信息单向传播模式转向了多元化交互传播模式,并承认了受众的能动性,这使得相关研究的对象也从个体拓宽到了群体。
在议程设置与议程融合理论视域下,议题的传播过程可以被理解为:围绕某个议题持续讨论所形成的讨论空间激活了一个关注事类似、价值观念接近的社群,传播者与受众会进入该社群开展信息交换等互动行为。这为议题传播效果的界定提供了三种视角:首先,对于议题形成的讨论空间而言,其内部的传播者与受众都具有能动性,信息数量和受众的主动、被动反馈也都是以往效果评估研究的重要效果指标;其次,对于议题激活的社群而言,其规模与结构特征是评判议题传播效果的重要群体性指标;最后,对于议题而言,其本身具有时效性,议题的生命周期以及该周期的演化模式有助于从宏观视角评估议题传播质量。
1.议题传播过程中的受众反馈
议题传播过程中受众是否产生反馈、是否跟随传播者对此议题展开进一步讨论,是衡量内容传播效果的关键。讨论声量越大、内容与议题越吻合,那么传播的效果就越显著。议程融合理论认为议题形成的讨论空间中传播者与受众都具备能动性,因此传播过程中的反馈行为也变得更加复杂。一方面,CMC理论认为在以信息技术为载体的传播过程中传播者与接收者的定位被模糊化。有研究指出信息传播除了影响受众也会对作为传播者的一方形成影响,这种影响效果被称为“表达效果”(expression effect)。表达效果的作用类似于选择性接触,即通过强化表达调节自我认知,使自身信仰、态度和行为保持一致性。另一方面,市场营销研究领域也同样关注用户、消费者与品牌的互动关系,并称之为“消费者参与”(customer engagement)。参与度影响着用户的品牌认知与情感活动,并被视为衡量品牌价值与品牌营销效果的核心要素之一。综上所述,“表达效果”与“参与度”这两个概念所归属的研究领域虽然不同,但都在强调信息传播过程中信息接收者反馈的主动性与能动性。因此,社交媒体影响下的传播效果评估有必要从主动与被动两个层面对受众反馈进行细分:被动反馈意味着信息触达了受众,使得受众产生了某些与信息接收有关的行为,例如阅读、点击、收藏等;而主动反馈则意味着信息不仅触达了受众,还激起了受众的能动性,使之产生进一步互动或表达的意愿与行为。
2.议题社群与社会网络分析
议程融合理论视域下群体内部的复杂多元信息传播模式已成常态,剥离群体研究个体的思路不可取,而如何通过群体性指标测量社群内部信息传播的结构特征成为评估重点。社会网络相关理论与方法所提出的网络指标是分析社群内部结构特征的重要路径,议题讨论所形成的议程激活了网络社群,而网络社群的性质与结构可以被复杂网络理论与方法所量化。在复杂网络研究视野下,社交媒体可以被理解为一个由信息传播节点与信息传播关系所构成的大型整体网络,而被议题所激活的社群或圈层则是整体网络中的“子群”(sub-group)。当社群围绕着某个议题进行持续性的讨论并形成了某种相对稳定集中的态度或价值观念后,不同社群会在网络结构上表现出特征差异,而我们可以通过社会网络分析方法对社群表现出的规模、链接、分布以及分隔等特性进行分析,从而挖掘不同议题所激活的社群的性质、特征以及社群间的差异、互动能力。
3.议题演化与生命周期
对议题的讨论不会无止境地持续下去,议题生命周期与议题演化研究是从一种“历时性”角度分析议题生命力与受众活跃度的重要视角。议题生命周期问题源于对公众注意力演化问题的相关讨论。公众注意力被视为一种有限资源,由于信息过载与议题竞争,公众的注意力无法长期集中在同一个议题上,而是会在不同议题之间进行切换。因此,议程设置的过程也可以被理解为各种议题争夺媒体与公众注意力的“零和博弈”过程。然而,现有的效果评估研究往往忽视公众注意力的转移与消逝,而将效果与影响误认为常态化的存在。社交媒体中的传播活动并非处于连续、平稳的状态,而是一个短暂、具有时效性的过程。所以,议题效果评估既不是对当前传播状况进行横截面分析,也不仅是对传播结果的汇总呈现,而应从“历时性”的角度考虑当前公众注意力骤变环境下的议题演化规律与生命周期问题。
综上所述,我们明确了评估体系中的五个一级指标:曝光、触达、互动、社群、演化。每个一级指标代表了议题传播效果评估的一个核心维度,而每个维度下还包含了一系列二级指标(如表1)。具体指标内容解释与操作定义将在下文中展开讨论。
表1 议题传播效果评估指标体系
(二)议题传播效果评估的指标体系内容
1.曝光指标
曝光指标衡量议题相关信息的数量与扩散程度。对于议题传播而言,信息的曝光数量是产生传播效果的必要条件,信息与传播者的基数越大意味着该议题被其他社交媒体用户发现并关注的概率越高。曝光度指标类似于影响力评估研究中的“广度因子”与“覆盖度”指标,其评估目的在于测量议题传播过程中那些主动传播的主体数量及其传播行为所带来的扩散效应。一个议题是否被有效曝光主要考虑如下因素:第一,议题传播的数量,包括议题相关内容与传播者的基数,数量是议题形成声量以及议题传播产生反馈的基础条件;第二,议题传播质量,包括议题相关内容中原创内容的比例、传播效率等,高质量的传播有利于议题后续“发酵”。由此设计曝光度下属的二级指标包括:(1)信息总量,统计各平台中涉及该议题的信息或文章的数量总和,例如微信公众号中相关文章数量、知乎中的相关问题数量等;(2)传播者总量,统计议题相关传播主体、用户的总数量;(3)原创性,统计各平台中信息唯一值数量除以信息总数量;(4)传播效率,统计议题相关传播者每人平均传递的信息数量。
2.触达指标
触达指标衡量议题相关信息在多大程度上被受众所接收且转化为被动反馈行为。被动反馈意味着信息触达了受众,并且引发了受众的兴趣与认可。在接收信息后,受众可能会有意或无意产生反馈行为,例如某些平台对于阅读量、点击量的统计就属于受众的无意识反馈,又如某些平台的点赞功能则代表了受众的有意识反馈。因此,触达指标的评估目的在于测量议题传播过程中接触到相关信息的主体数量以及这些信息触达后各类反应程度。触达度下属的二级指标包括:(1)触达总量,统计接受到受众反馈的信息总数量;(2)触达比例,统计触达总量与信息总量的比值;(3)阅读量,统计各平台中议题相关信息被阅读、观看或点击的次数,例如微信公众号文章下方的阅读量、微博文章的阅读量等;(4)认可度,统计各平台中议题相关信息所受到的认可性反馈,例如点赞、投币等;(5)留存度,统计各平台中议题相关信息被用户保存、收藏或下载的次数,例如微信的收藏数量等。
3.互动指标
互动指标衡量议题相关信息在被接收后多大程度转化为主动反馈行为。主动反馈区别于被动反馈的核心差异是信息接收者在受到信息刺激后是否产生二次表达行动或参与到讨论当中。若议题传播的影响使得受众呈现出强烈的表达与互动欲望,则表明该议题具备了更强的内容自我生产能力与二次传播能力。互动指标的评估目的在于测量议题传播过程中活跃度和参与度的整体水平与峰值表现。互动指标下属的二级指标包括:(1)参与度,统计议题传播过程中参与者产生的讨论数量,例如回复数量或评论数量;(2)分享度,统计受众接收信息后所产生的分享行为或二次传播行为的数量,例如转发数量等;(3)活跃率,统计所有触达信息中产生互动参与以及分享行为的信息占比;(4)互动频率,统计议题传播过程中单位时间内的平均参与度与平均分享度;(5)互动峰值,统计议题传播过程中单位时间下参与度与分享度的最大值之和。
4.社群指标
社群指标测量议题所激活社群的结构特征。当社交媒体中的传播模式具有网络结构,这意味着可以通过构造社群网络与网络指标对议题社群的规模、分布、链接、分隔等网络社群性质进行测量。而上述几类社群结构特征分别代表了议题传播形成的不同类型效果:其一,社群规模表示议题传播激活的社群中拥有的节点数量,即形成社群的体量大小;其二,社群密度表示议题激活的社群内部主体链接的紧密程度与联通效率;其三,传播能力表示社群内部节点具备的媒介属性,其中包括了横向与纵向传播能力,横向传播能力表示社群中的节点传播信息的广度,纵向传播能力则表示社群中节点传播信息的层级数量与深度;其四,社群集中度测量社群受意见领袖控制的程度;其五,群际传播能力测量社群信息流与其他社群的关联能力,即社群在多大程度上可以与外部群体产生链接。社群指标下属的二级指标包括:(1)社群规模,统计社群网络的节点总数;(2)社群密度,通过计算社群网络的密度指标获得;(3)传播广度,通过计算社群网络节点的平均中介中心性获得;(4)传播深度,通过计算社群网络中信息传播的平均层级数量(最短路径)获得;(5)社群集中度,通过计算社群网络中度值排名前10%节点的度值总和与整个网络中所有节点度值总和的比例获得;(6)群际传播能力,通过计算本社群网络链接到其他社群网络的连边占本社群网络总连边的比例获得。
(说明:gjk表示任意节点j到k的最短路径;gjk(i)表示任意节点j到k最短路径经过节点i的次数)
5.演化指标
演化指标测量议题演化周期与演化模式特征。议题传播效果与其对公众注意力的吸引力有关,而公众注意力会在多个议题之间快速切换,对相同议题的讨论与关注不会无止境地延续,这使议题具备了生命演化的性质。议题生命周期可以根据公众注意力周期阶段划分为前问题阶段、公众意识议题阶段、议题解决阶段、议题兴趣消退以及后议题阶段。一般而言,议题传播效果强弱表现在前期爆发的增长速度、中期议论最激烈峰值高度以及议题整体持续时长等几个方面上。议题演化指标下属的二级指标包括:(1)爆发时间,通过计算议题从出现到升值热度峰值所需的时间占据其生命周期的比例得出;(2)爆发速率,通过计算议题峰值热度除以议题爆发时间获得;(3)峰值信息量,统计议题热度最高点的信息数量;(4)保持能力,通过计算议题从峰值衰落至消逝所花费的时间得出;(5)生命周期,通过计算一个议题出现至结束的完整存在的时间得出。
三、内容传播效果综合评估的核心流程
完整的综合评估系统还包含了在指标体系前后的数据挖掘处理、指标筛选赋权等流程,这是使指标体系得以落地的关键步骤。当前的传播效果综合评估方法存在着两个核心问题:其一是指标体系建成后的指标遴选与指标赋权方法存在主观性与客观性的分歧;其二是理论指导构建的指标体系并不能在实证分析中即拿即用,缺少从理论到实证的流程设计与操作定义环节,导致评估实践中出现数据质量堪忧、平台间数据互通性差以及指标精炼度低等问题。该部分将针对上述问题设计评估流程。
(一)内容界定与议题挖掘
议题是内容效果评估的基本单位,而如何挖掘舆论场中存在的核心议题并将其转化为可用于分析的评估数据,则是评估实践的前提基础。从传播特征来看,议题具有两个特点:一方面议题存在生长消亡的周期,也就必然存在于特定的时间段内,而其持续时长则取决于多大程度上吸引了公众的注意力;另一方面议题内容具有聚集性,微观上呈现为一系列关于某个事件、对象相关的信息集合体。因此,在实证分析中我们可以将议题量化地定义为网络数据中存在于某个特定时间段内的一组文本集合,其呈现出特定的内容特征。这一思路便是当前议题挖掘的核心假设。
基于这一假设,学界开发了多种方法从海量数据中进行议题挖掘:第一类方法是主观设置议题分类。研究者根据自身对网络舆论的观察与个人研究志趣形成主观判断,并预先设定好议题的内容特征,通过关键词检索的方式来获取相关数据。这类方法的优势在于得到的数据符合研究者的预设,数据大概率是研究者希望呈现出的结果,而其劣势在于需要研究者提前对舆论场中的议题涌现进行敏锐的观察与收集,否则很可能会出现遗漏。第二类方法是借助算法的议题聚类。这类方法借助文本挖掘与主题建模算法对海量文本数据中的内容特征进行学习并自动划分类别,例如经典的LDA主题模型以及基于相关性、时序或针对短文本的主题模型等。这类方法的优势在于无需研究者预先对数据进行深入解读,只要借助算法便可快速高效地获取数据中客观存在的内容特征分布以供参考;但其劣势也相当明显,由于算法对于文本内容的理解远不及人工观察来得完整与准确,且聚类结果存在较大的不确定性,最终算法得到的议题分类结果很可能与研究者希望分析的方向相距甚远。第三类方法是融合方法。研究者们在意识到信息归类过程中的主客观矛盾后,提出了计算扎根理论,认为在数据挖掘的过程中研究者可以对无监督机器学习得出的结论进行阅读、解释,并基于此对计算结果进行调整与重构,依此循环直至结果符合研究目的。该过程并非篡改数据结果,而是通过人为介入将计算机分析结果中的偏差与无关事项剔除。换言之,融合方法是一种汲取了算法高效、便捷与研究者主观判断的方法,避免了算法聚类结果难以解释与偏离目标的困境,但融合方法考验研究者主观判断的准确性以及对算法过程和结果的理解能力。
(二)数据筛选与特征工程
经过上述流程可以得到一份记录了议题与关键词的多组对应关系的词典,每一组关键词集合表示了特定议题所具备的内容特征。那么如何在得知内容特征的基础上筛选关联的数据材料并计算指标数值?这需要包括数据关联、匹配、统计汇总等流程在内的特征工程。特征工程(feature engineering)是机器学习与深度学习实践领域的重要概念,指的是将原始数据转化为模型训练可用的数据之间的一系列数据处理、数据计算流程,其目的是将原始数据通过特征提取、指标计算、归一化、降维等流程处理为评估体系可用的数据,这是综合评估系统与现实数据对接的必要环节。
特征工程首先任务是在议题内容特征基础上匹配关联内容文本并标记议题编号,即相似文本检索与标注。值得注意的是,特征工程在匹配数据的过程同时也伴随数据筛选的过程,评估者所设置的匹配标准(如相似度阈值、概率阈值)同时也是筛选数据条件。该标准的设置并没有固定规范,若标准过于宽松则不利于数据质量优化、提纯,若标准过于严苛则可能导致评估对象无法匹配足够数据材料、指标无法计算等问题。因此,如何设置筛选条件阈值,需要评估方在不损害数据代表性、可用性以及尽可能排除无关杂项的原则基础上自行权衡。
特征工程的另一项任务是对各类指标、数据进行无量纲化处理。在评估实践中不同指标、不同平台之间的数据来源与规格相差甚远,例如微博中的千万转发量与微信的十万阅读量之间便出现了百倍的数量级差,综合评估要求数据在进入指标体系计算结果之前都统一规格。无量纲化处理便是将指标综合评估中不同量级、规格的数据转化为相同量级的比值数据,通过某种数学方法将各类原始数据映射到共同的适合比较的区间中。主流的无量纲化方法可以根据特征变换后数据分布是否受到影响而分为线性变换与非线性变换两类。线性变换会尽可能保留数据分布规律,而非线性变换则会改变数据分布规律。线性变换方法是更为常用的无量纲化思路。而在线性变换方法中,根据特征变换后数据所保留的变异信息量又可以进一步做出划分。归一化方法(如Max-Min归一化)将数据特征变换后映射在0—1之间,由于该方法在数据变换的计算过程中仅对原始数据的某几个点进行取值,因此归一化方法保留的原始数据的差异信息较少;而标准化方法(例如Z-score标准分)则是将数据特征变换后映射在一个有正有负的区间内,但标准化方法在数据变换的计算过程中会对任何一个点进行取值,因此该方法保留的原始数据差异信息较多。总的来说,在考虑计算成本、结果差异以及适用场景等因素后,线性变换是首选的无量纲化方法,而基于原始数据的分布特征以及对原始数据变异稀疏需求,我们可以进一步在标准化方法与归一化方法之间进行选择。
(三)跨平台的数据整合
具体而言,表2整理了现有主流社交媒体平台的基础数据字段与评估指标之间的对应关系。可以发现,由于社交媒体平台的设计逻辑与功能偏重各有不同,其产生的数据字段自然无法与指标体系中的所有维度相对应,而由此导致的指标空缺现象成为了常态。例如,微信的功能设计偏向于个体实时互动,因此其社群指标都难以被记录和测量;微博的收藏功能仅用户自己可见,因此其留存度指标也无法计算。在跨平台渠道的评估实践中出现了指标空缺问题时,建议先使用均值填充的方法将同一议题下其他平台的计算结果对空缺指标进行均值填充,从而避免因指标空缺影响最终结果。然后,使用加权汇总的方式对所有平台的相同指标进行聚合,完成数据整合。
表2 平台数据字段与指标的对应关系
(四)指标遴选与权重分配
指标遴选的目的在于对指标体系进行精炼,调整体系中对现实数据适配性较差的部分。使用相关性分析与变异系数分析作为客观遴选方法,有助于解决指标体系与现实数据适配差的问题。其中相关性分析主要解决指标之间的重复性、关联性问题,若在计算真实数据后指标之间呈现出的相关性过高,说明指标之间所呈现的信息存在重叠,因此有必要对这些高相关指标进行合并或剔除;而变异系数分析则判断指标内部数值是否具备区分度的问题,若在计算真实数据后指标内部的变异系数过低,说明评估对象在该指标上并没有呈现出可区分的差异,因此这类指标的重要性就相对较低。值得一提的是,上述客观筛选指标的方法都需要在不影响指标体系目的性与全面性这一原则下展开。
图1 议题传播效果综合评估系统流程
权重分配的目的在于量化评估者对评估过程中各要素的重要性差异认知,这种认知映射在指标体系的权重数值上。指标权重反应了指标体系中不同指标的重要程度,而这种重要程度则需要综合评估者价值预设、被评估对象内在机理以及指标本身的区分度等因素共同决定。权重分配需要以评估方的目的优先,故选择主观指标权重分配方法更为合适。例如层次分析法(Analytic Hierarchy Process,简称AHP)就是比较典型的主观赋权方法。又例如德尔菲法(Delphi,又称专家评估法),通过对知识的描述与集成,将问题量化地呈现给专家,借助专家的专业知识、经验产生的主观判断确定不同方案(指标)的权重。经指标遴选与权重分配后,议题传播效果综合评估系统便已成型,可投入到实际应用当中。
注释:
① Valkenburg,et al.MediaEffects:TheoryandResearch.Annual Review of Psychology,vol.67,no.1,2016.pp.315-316.
② 赵曙光、张竹箐:《数字传播治理与新闻媒体的责任》,《现代出版》,2021年第5期,第42-50页。
③ Joseph B.Walther.Computer-MediatedCommunication:Impersonal,Interpersonal,andHyperpersonalInteraction.Communication Research,vol.23,no.1,1996.p.3.
④ [美]阿尔温·托夫勒:《第三次浪潮》,朱志焱等译,生活·读书·新知三联书店1983年版,第304页。
2.2 教练员情况 教练员队伍的学历、职称的高低、对文化教育的态度、对运动员学习的关心程度与运动员的学习具有一定的相关作用。因为运动员平时与教练在一起的时间相对较长,教练员对运动员个体的关注程度相对更高,思想意识未成熟的运动员更易直接受到教练员言行与意识思想的影响。
⑤ 郑丽勇、郑丹妮、赵纯:《媒介影响力评价指标体系研究》,《新闻大学》,2010年第1期,第121页;冯锐、李闻:《社交媒体影响力评价指标体系的构建》,《现代传播》,2017年第3期,第63页。
⑥ 张一文、齐佳音、方滨兴、李欲晓:《非常规突发事件网络舆情热度评价指标体系构建》,《情报杂志》,2010年第11期,第71页。
⑦ 陈新杰、呼雨、兰月新:《网络舆情监测指标体系构建研究》,《现代情报》,2012年第5期,第4页;高承实、荣星、陈越:《微博舆情监测指标体系研究》,《情报杂志》,2011年第9期,第66页。
⑧ 马俊、周刚、许斌、黄永忠:《基于个人属性特征的微博用户影响力分析》,《计算机应用研究》,2013年第8期,第2483页;刘威、张明新、安德智:《面向微博话题的用户影响力分析算法》,《计算机应用》,2019年第1期,第213页。
⑨ 胡永宏:《对统计综合评价中几个问题的认识与探讨》,《统计研究》,2012年第1期,第26页。
⑩ 虞晓芬、傅玳:《多指标综合评价方法综述》,《统计与决策》,2004年第11期,第120页。