算法推荐机制对用户议程的影响与反思
——基于技术与社会互动的视角
2021-11-10王军峰
王军峰
(陕西师范大学新闻与传播学院,陕西西安 710119)
随着算法推荐技术的崛起,传统媒体的议程设置权力开始向算法平台转移。“你能看见什么由平台的算法所决定,算法在影响你的立场,进而塑造你的价值观”。[1]算法颠覆了传统媒体议程设置的流程、机制,也制约了议程设置产生的社会效果。学者帕里泽发现,两位住在美国北部并且受教育程度相似的朋友在Google上搜索有关英国石油公司墨西哥湾漏油事件的消息,一位获得了其深水地平线漏油事件的信息,另一位获得的却是关于该公司的投资信息。[2]而在Google上针对“埃及”这一关键词的搜索结果也显示不同人的搜索结果页面存在很大不同。一位叫丹尼尔(Daniel)的人,在他第一页的谷歌搜寻结果里完全没有得到任何有关埃及抗议事件的东西。而另一位叫斯科特(Scott)的搜寻结果却满满都是埃及的抗议事件。[3]在国内,既有的实证研究也显示今日头条采用的算法分发系统会导致“没有两个人收到完全相同的新闻推送。”[4]这说明,算法正在为不同用户设置不同的议题,而这些议题最终会影响用户对周围环境的认知、态度甚至现实行为。显然,算法推荐给传统媒体的议程设置带来了新的问题,本研究重点分析算法对传统议程设置带来的新转向,探究不同算法推荐模型对用户议程产生的不同影响,并对其可能产生的社会负面效果进行校正,以发挥算法议程设置的正面社会效果,因而在理论与实践层面都具有重要意义。
一、文献回顾与研究创新
20世纪60年代,麦库姆斯和肖针对传统媒体提出议程设置假说,开启了传播效果研究的宏观范式,此后不同学者对该假说进行了实证研究,并逐步演化出属性议程设置、网络议程设置[5]和议程融合[6]等新的研究方向。随着媒介技术的迭代,议程设置研究从早期报纸、电视媒体扩展到互联网、社交媒体和新媒体等领域,重点关注新媒介下议程设置的效果和影响。如李婷婷认为新媒体环境下传统大众媒体议程设置的功能在弱化。[7]高宪春认为微议程已经成为议程设置不可忽视的显性影响因素。[8]他还认为,新媒体环境下议程设置呈现出“个体议程—社群议程—媒体议程—公众议程—政策议程”多向非闭合性特征,研究的重点应由“媒体”转向“社群”。[9]学者赵雅文等则具体研究了新媒体环境下信息流向与政治议程、媒介议程、公众议程之间的关系。[10]学者曾凡斌发现在某些事件上,中国的媒体议程难以很好地影响受众议程。[11]
以上研究说明,技术因素已成为学者研究议程设置理论的有效切入口。在算法推荐成为主要信息流通方式的社会中,探究算法推荐对议程设置机制和效果的影响既具有理论意义,也具有现实意义。目前,学者多聚焦于算法对新闻业态的影响、算法黑箱、信息茧房、算法偏见、算法焦虑、算法权力等,对算法与议程设置之间关系的研究较少,但也有学者在不同层面注意到了两者可能存在的关系。如张志安在研究算法正当性的问题中看到了算法具有新的议程设置效果。[12]赵双阁等认为算法分发对议程的设置影响公共权力,实际上体现的是商业公司的商业议程。[13]罗昕等发现算法传播有可能导致算法强国操控国际议程设置,[14]算法过滤机制也可能产生重大议程设置效果。[15]宋建武则认为“信息茧房”是算法时代的议程设置。[16]李林容则发现算法议程设置中蕴含着对人的主体性的遏制。[17]刘修兵和刘行芳关注到了算法议程设置可能存在强化“信息茧房”、加强“群体极化”和引发“沉默的螺旋”的风险。[18]宋嘉赓等从网络监管的角度认为应对算法议程设置进行重点监管。[19]
这些成果为本研究提供了有益借鉴,但也有进一步开拓的可能:一是现有研究都较少分析算法推荐如何对传统议程设置产生影响,以两者交叉为主题的研究似有欠缺;二是研究者多将算法作为一个整体术语,对其进行打包处理,较少关切不同算法推荐系统设计思路、原理的差异性和复杂性,这也导致对算法推荐的效果研究往往大而化之,难以深入;三是对算法影响议程设置的分析多从负面效应展开,忽视了其正面效应存在的可能性。因此,本研究从算法推荐和议程设置交叉的视角切入,探究算法推荐机制下传统议程设置的转向、算法推荐对用户议程设置的影响和效果等,以此为遵循重点解决以下几个问题:(1)与传统媒体的议程设置相比,算法推荐下的议程设置有哪些新的变化?(2)不同算法推荐下的议程设置效果具体如何?(3)从辩证思维出发,在算法推荐设置用户议程所产生的负面效果中探寻正向效果的可能性。
二、技术的可能:算法推荐下议程设置的新转向
与传统媒体设置议程不同,在用户向移动端迁移的情况下,新兴的算法型媒体平台和信息平台对算法推荐系统的广泛使用,导致了算法时代议程设置的新转向。
(一)主体:从“机构媒体”到“多元主体”
议程设置理论最初主要研究报纸议程与公众议程之间的关联性,后来研究逐渐拓展到包括电视媒体、网络媒体、社交媒体、新媒体等领域。而以大众媒体如报纸、广播、电视等为主体的议程设置也开始转向传统媒体与新兴媒体并存、主流媒体与商业媒体并存、中央媒体与地方媒体并存的局面,议程设置的主体呈现出丰富性和多元性。不同媒体基于不同立场形成了“众声喧哗”的局面,媒体之间议程设置、议程互动与融合现象更为突出。不同主体在算法的加持下,形成了不同的媒体形态和算法类型,这种多元主体和多元算法也导致议程设置更为复杂。
(二)动机:从“媒体公共性”到“商业利益至上”
随着新兴商业平台的崛起,它们开始利用算法主导用户议程。在国内,算法技术被今日头条、一点资讯、搜狐新闻、新浪新闻、网易新闻等市场化媒体平台所用,这类平台摒弃了传统媒体时代新闻的价值要素和公共利益原则,将用户作为消费者,因而更加注重信息的覆盖、频次、匹配、停留、转发等利于广告价值和价格计算的要素,呈现出明显的商业诉求。例如,百度的竞价排名机制就是基于商业利益考量的算法推荐系统,它将为用户设置议程的权力转化为具有严重资本偏见的排名方式,从而迫使议程设置商品化。[20]微博热搜榜也是一种“类竞价排名机制”,网络水军、粉丝等通过数据操控实现将目标对象推向“热搜”“榜首”的位置,而背后的资本逻辑显而易见。可以说,算法背后是一套试图增加用户黏性和提高点击量谋利的商业逻辑。[17]算法时代的议程设置具有技术逻辑与资本逻辑双重驱动的特征,资本的内在需求与技术的外在规律主导着算法平台对用户的议程设置,影响着用户的议题认知、意见表达和行为方式。
(三)手段:从“编辑把关”到“影子把关”
算法时代议程设置采用了技术化的手段,通过对用户的技术性测量来了解用户,并以技术化的程序介入到信息的生产、预测和分发环节,最终通过隐形化、后台化和黑箱化的方式为用户设置议程。尽管在技术中立理念的影响下,算法看似没有设置议程,却能通过不同的策略筛选信息,且通过不同模型将信息推送给用户,甚至能将具有不同叙事框架的内容推荐给用户,但用户对此难以察觉,因而基于算法的新闻推荐具有一定的隐蔽性。[21]可以说,算法推荐系统下的信息筛选与传统媒体时代的公共利益、新闻价值取向联系较弱,因而也被称作“影子把关人”。[22]
(四)对象:从“想象的受众”到“可测量的用户”
议程设置理论的核心是从一个议程到另一个议程的“显要性的转移”。[23]基于算法技术的议程设置目的也在于重新连接用户,实现议题“显要性的转移”。但传统的议程设置以大众媒体为主体,受众为主要对象,其传播具有较强的单向性,受众需要什么、喜欢什么媒体并不清楚,受众仍然处于大众媒体的“想象”当中。而算法时代,大数据和算法的使用使得媒体平台既能够精准把握信息特征,而且能够对用户进行精准画像。这意味着算法时代议程设置的对象从难以测量、无法进行画像的整体受众转向了可以进行测量、能够精准画像的个体用户。
(五)效果:从“整体效果”到“个体效果”
当用户从作为整体的“想象的受众”转向作为个体的“可测量的用户”时,基于用户的新闻传播就成为可能,以用户为最终效果衡量指标的“用户新闻学”就诞生了。[24]这意味着算法时代议程设置的效果从注重受众的整体性认知转向注重用户的个性化信息获取,即议程设置从为公众整体设置议程,转向为用户个体设置议程。算法通过对个人信息的挖掘,了解个人对某类信息的偏好,进而在推荐过程中赋予这类信息以“高显著性”和“高相关性”,由此实现信息与个人的精准适配。其中,从受众到用户的转型是前提,技术变迁是手段,因人而异的效果是最终目的。
三、技术的规制:不同算法推荐模型对用户议程的影响
算法绝非价值中立的技术,[25]综合一些学者的研究,当前主流的算法推荐系统包括基于内容的推荐算法、基于协同过滤的推荐算法[26]、基于时序流行度的推荐算法,[27]基于关联规则的推荐算法、基于效用的推荐算法和基于知识的推荐算法。[22]这些算法正在主导着智能时代的信息筛选机制,[28]而不同的算法推荐系统能够通过影响内容筛选与呈现,进而影响用户议程产生的效果。
(一)基于内容的算法推荐:兴趣偏好与个人议程
基于内容的算法推荐是一种以用户兴趣为核心的推荐方式,它直接建立在用户兴趣与内容特征的相似度匹配上。其基本思想是推荐的信息有自身的独特属性,用户对推荐的信息进行操作,就容易留下行为数据和历史记录,这些数据能够体现用户的个人兴趣,算法可以基于用户的个人兴趣为其形成推荐列表。[27]具体来看,算法依据用户以往对新闻的消费情况,首先对进入到平台中的新闻进行特征、属性上的抽取,为其制作标签,以此来表示新闻的基本特征;再通过机器学习利用用户过去的行为特征,如喜欢/不喜欢、浏览时间、时长、转发、评论、收藏等来对用户进行精准画像,抽象出用户特征;最后通过对新闻特征与用户特征之间的关联性进行信息适配,按照用户可能的喜好程度进行排序,生成推荐列表推荐给用户。这种推荐方式不依赖其他用户的行为数据,但基于个人兴趣推荐的信息也不可避免地阻碍了用户获取其他信息、对其他信息偶遇的可能性。[21]因此,一些新信息在算法平台中难以实现冷启动,也难以被算法呈现在用户信息推荐列表中。
同时,基于内容的算法推荐系统还内嵌着平台优先级算法,它决定了用户能够优先看到哪些平台的信息。如Facebook为用户呈现的信息流更倾向于优先呈现自己平台上的视频,而非YouTube等其他平台的视频。[29]今日头条也在内容推荐中采用平台优先级算法,其推送的内容更多产生于“头条号”本身。根据燃财经(ID:rancaijing)分别在今日头条新上线的搜索引擎和百度搜索上对诸如“保时捷女主”“台风过境”“鸿蒙问世”“哪吒电影”及“知乎完成新一轮融资”等热门信息进行搜索,发现头条的搜索结果主要以今日头条的内容为主,来源以新媒体居多;而百度搜索内容主要由百家号和外部网站组成。[30]可以看出,无论今日头条还是百度,都在优先推荐自家平台生产的内容。因此,无论是用户的被动接受还是主动搜索,当用户使用基于内容和平台优先级的算法推荐平台获取信息时,就难以避免“信息茧房”效应,用户也难以感知算法推荐的内容暗含的价值观偏向。
(二)协同过滤算法推荐:群体需求与圈层议程
与基于用户个体数据的内容推荐算法不同,协同过滤算法推荐充分利用了群体智慧,依赖大量其他用户(邻居用户)的数据。其基本思想是首先为目标用户寻找兴趣相似的邻居用户,然后把邻居用户感兴趣的内容推荐给目标用户。[26]其基本原理是“物以类聚”和“人以群分”(见图1、图2)。[27]协同过滤算法推荐基于用户的相似度、内容的共现度以及基于人口特征将用户划分为不同群体,为用户推荐内容。它利用与目标用户相似的用户行为(评分、点击、收藏、分享、点赞、转发等)推断目标用户对特定产品的喜好程度,然后根据这种喜好程度进行评分降序排列,最终进行相应推荐。[31]例如,微信“看一看”就可以通过“朋友在看”为用户推荐相关热点信息,用户能够直观看到哪些好友阅读了哪些文章,容易形成微信好友这一群体对某一事件的共同认知与感受。这种推荐实质上是基于用户所处同一兴趣群体、同一圈层的推荐,因而在推荐效果上呈现出“圈层化效果”。因为具有相同兴趣的用户群对某一话题或议题更感兴趣,用户群中最普遍的兴趣关注点将成为算法推荐中最大比例的推送内容,这些信息会被最大程度地凸显。[32]根据这一原理,算法就将该群体感兴趣的话题(议题)以外的其他议题排除在外,这也容易导致圈层化议程甚至圈层舆论的出现。
图示:表示“喜欢”,表示“可能喜欢”
(三)时序流行度算法推荐:热度导向与议程遮蔽
时效性是新闻信息的活力所在。基于内容的推荐和基于协同过滤的推荐都能提升推荐的精准度,但前者只考虑用户兴趣和爱好,后者重点考虑其他用户对某一内容的评价,而较少考虑时间维度的信息。因此,将时间维度引入到算法推荐过程中,就形成了基于时序流行度的算法推荐系统。它能够将单位时间的瞬时点击率等动态特征作为考量因素,将特定时间窗口内流行度较高的新闻或信息按照最多点击量、播放量、搜索量等指标进行排序并推荐给用户。[27]时序流行度算法考虑到了信息的时效性,也考虑到了信息的热度,因而能够为用户推送当前较热的信息,而这种信息热度、关注度与用户的行为相关。[28]具体原理为:新闻热度=初始热度值+用户交互产生的热度值-随时间衰减的热度值(见图3)。
图3 时序流行度算法推荐原理
当一则新闻进入平台数据库后,算法系统会为其赋予一个初始的热度值,该新闻就进入了推荐列表进行排序。随着新闻不断被用户点击、阅读、评论、转发、收藏,用户交互所产生的热度值就开始上升并增强新闻的热度,随着时间推进,热度开始衰减。这其中,初始热度值可以在算法中被赋予不同的权重,如娱乐类新闻权重比时政类新闻权重高,则娱乐类新闻初始热度值较大,该新闻被推送的可能性就大。而用户交互产生的热度值也是一大变量,用户对一则新闻的交互越多,则该新闻热度值也越高,也就越容易被推送。但用户交互产生的热度值数据是可以被操纵的。在这种情况下,基于时序流行度的算法推荐容易在商业利润的导向下,成为某些人牟利的工具。经由它呈现给公众的某些社会图景可能偏离甚至严重偏离客观现实,[22]从而遮蔽了更重要的社会公共议题。例如,公安部“净网2019”专项行动就打掉了“星援APP”这一流量造假平台。该APP可以在短时间内通过刷高评论量、转发量、点赞量等,实现信息热度和关注度的提升,进而在算法推荐下为用户设置议程。蔡徐坤与周杰伦之间的数据之战中数据操纵现象凸显:被质疑不做数据、没有影响力的周杰伦粉丝在经过了16小时打榜奋战后,最终让没有微博账号的周杰伦登上微博热搜榜2019年第29周排行榜首位,超越排名第二的蔡徐坤。笔者还于2019年8月16日14时左右在百度搜索引擎页面的时事热点信息推送中发现,其推荐的前15条热点事件中排在第4、7、8、13、14、15位的都为娱乐新闻。而关于香港修例风波、中美贸易战等央媒权威重点发布的议题,都没有出现在百度推送的热点中。可以看出,依赖时序流行度指标的算法,容易导致算法推荐走向“热度导向”的误区。[27]
(四)关联规则与效用算法推荐:需求导向与议程固化
议程设置理论研究发现,需求导向与媒体议程的效果有相关性,受众需求导向越高则受议程设置的影响越大。基于关联规则的算法和基于效用的算法都聚焦于用户需求、用户既有倾向和用户满意度,在用户较高的需求导向下,基于关联规则的推荐算法能够通过隐性的信息推荐,增强用户的既有议程。它能够充分发挥大数据对相关性的发现能力,以关联规则为基础,通过对相关数据库的挖掘,寻找不同物品在销售、使用过程中的相关性,然后根据相关性来预测用户的需求。[22]就用户的信息接收而言,在这种算法推荐下还需要与其他类型的信息加以辅助。如,在搜索引擎的推荐系统中,一般会按照用户搜索信息的关联度进行排序,将关联度较高的信息以排序方式呈现给用户。在算法推荐平台中,当用户对某类信息需求度较高的时候,算法会推出相关的信息。当用户接收到的信息具有某种特定价值观和立场的时候,基于关联规则的算法就倾向于为其推送与该立场和价值观类似的其他相关信息,导致用户固化、增强对某一事件的既有认知或者态度。
基于效用的推荐算法也具有固化用户既有议程的倾向性,其核心理念是为每个用户创建一个能够涵盖项目特征、使用户满意程度最大化的效用函数,该函数用以衡量消费者从消费既定的商品组合中所获得满足的程度。然后,算法通过计算不同项目的效用值,再把总效用值最高的项目推荐给用户。[22]这意味着,当用户在算法推荐平台上表现出对某些信息“满意”或“不满意”的时候,算法平台能够根据用户的反馈来计算最能满足用户需求的信息。而用户在特定时间段内的需求是相对稳定的,对这种需求的满足也能够强化用户的既定议程。
四、偏向与校正:算法推荐下用户议程社会效果的双重性
算法本身具有双重性,算法推荐暗含着技术逻辑和商业逻辑所遵循的工具理性原则,因而算法推荐下的用户议程具有其社会偏向性。如何发挥算法推荐对用户议程的正面导向,就需要为其注入价值理性进行纠偏,实现“工具理性”和“价值理性”的统一。
(一)算法容易造成用户议程与公众议程的偏离,但也能以公共传播理念进行校正
当前,算法时代不同个体和群体更容易形成不同的关注议题,这改变了以往大众媒体为公众设置统一的、同质化议程的局面,议程更加多元。算法在为用户推荐具有价值立场、观点、情绪的信息的同时,也无形中影响了用户的立场和态度,造成价值观的多元化。当算法推荐使高度个性化的用户议程和多元价值观成为可能时,容易导致与公共议程的偏离,引发不同用户、不同群体之间的共识割裂。但同时,个人议程、群体议程和社会议程之间的贯通与融合也因技术的介入而具有了可能性。如学者高宪春就认为,当前个人议程与社群议程成为不可忽视的影响社会议程的重要因素。[9]因此,在算法时代,要凝聚社会共识,就需要树立起公共传播的理念,为统合不同个体和群体的议程提供支撑。在操作层面,平台可以设置公共频道,传播公共信息,对具有公共价值的议题以较高的权重进行跨圈层推荐,为重构多元主体的社会共识提供条件。
(二)算法议程容易导致“信息茧房”,但也为凝聚社会共识提供了契机
“遮蔽现象构成了我们生存的基本现实”。[33]当技术(媒介)垄断了我们的认识,技术(媒介)所提供的世界图像就成为“真实”的图像,而真正真实的世界被(技术)媒介提供的图像所遮蔽。[34]在算法时代,这种遮蔽是由算法推荐系统在其黑箱化的操作系统下完成的。当我们越来越依赖于算法推荐,形成算法依赖,最终也导致算法对我们的控制。其中,“信息茧房”效应正是用户自主选择与算法推荐双重作用的结果。因此,有学者将“信息茧房”界定为个人或群体在信息消费过程中因自身或外界的因素而形成的信息窄化和观念极化现象。其中,外部因素主要是指算法推荐,而内部因素主要是用户的自我选择。[35]尽管算法推荐造成的“信息茧房”具有负面效应,但它对凝聚社会共识也具有积极作用。当“信息茧房”为公众所普遍认识的时候,如何突破信息茧房就成为个体寻求与社会连接提供了内在动力,进而增强我们在全社会范围内凝聚社会共识的紧迫感。[36]同时,在主流价值观融入到算法推荐的信息流当中时,“信息茧房”效应恰恰是主流价值观传播与深入的有效途径。因此,作为一种传播效应的“信息茧房”发挥正面效应还是负面效应,主要取决于算法推荐何种信息以及用户对信息的选择。
(三)算法议程在增加舆论引导复杂性的同时,也为精准的舆论引导提供了可能
算法推荐下的用户议程存在个体议程与圈层议程共存的现象,造成了舆论格局的复杂性:既有媒体议程所构建的舆论场,也有公众议程所构建的舆论场,还有个体议程和圈层议程所形成的舆论场。尽管不同舆论场的诉求不同,增加了舆论引导的复杂性,但算法对舆论引导也提供了新的可能。例如,可以充分利用算法推荐数据采集、信息追踪的功能,搜集网络舆情并科学分析研判,了解民情、听取民意、集中民智。[37]这就需要进一步优化算法,用主流价值观驾驭算法,将公共价值和新闻价值等主流价值注入算法平台中,在坚持以人民的利益为根本的基础上,为用户推送其感兴趣和重要的公共议题;针对不同群体的信息偏好,推送相关内容进行舆论引导。同时,要增加公共信息传播,打通不同圈层的信息传播,发挥主流算法在引导舆论中的重要作用。
五、结 语
身处算法时代,算法类信息推荐平台早已经成为我们获取信息的重要途径,也因如此,算法得以成为形塑用户信息获取、影响用户信息接收与认知的重要机制。在算法的影响下,传统议程设置也开始发生新的变化。基于不同的算法,其设置议程的机制与效果也存在不同之处。本文分析了不同算法对议程设置的影响,从技术维度对算法时代的议程设置进行了分析。同时,也从社会维度对算法推荐下的议程设置存在的社会层面效果进行了反思。笔者认为,算法推荐下的用户议程与公共议程有偏离的一面,因而需要通过公共传播理念对其进行校正;算法推荐下的用户议程具有形成“信息茧房”的可能性,但也为凝聚社会共识提供了契机;算法议程在增加舆论引导复杂性的同时,也为精准的舆论引导提供了可能。算法作为具有高度工具理性的技术,其社会功能如何发挥,还需要我们通过价值理性的注入实现工具理性与价值理性的有机统一。