我们怎样被算法控制?
2023-12-30刘海龙
刘海龙
算法,几乎可以说是我们生活里的隐秘法则。
只要打开手机看内容,今日头条、抖音、快手、小红书、微博、B站、微信……可以说,算法无处不在。除了内容分发平台,连外卖、打车、买菜这类生活软件,也都跟算法有深深的关联。
虽然这个词我们都不陌生,可“算法”到底是什么?今天,我们就从媒介和传播学的角度,深度探讨一下这个词汇的意涵及其影响。
什么是算法?
首先,到底什么是算法?其实早在计算机发明之前,就有“算法”这个概念了,顾名思义,就是用加减乘除等书面计算方法进行的计算。在计算机产生后,算法就专指一套用系统的方式解决问题的策略机制。简单来说,就是一套用计算机能够执行的命令自动运行的程序。
比如使用搜索引擎,输入一个关键词后,就会有一套计算方法,将与关键词有一定关系的网页按照相关性排列出来。这就涉及到不同的排列计算策略,是把访问量最大的网页排在前面,还是把引用量最大的网页排在前面,还是把关键词重复次数最多的网页排在前面?
所以算法本身具有一定的主观性,它显示出人们对解决问题的不同理解和价值优先排序。比如短视频网站,是优先推荐那些最热门的视频给用户,还是优先推荐那些新视频给用户,是优先推荐完全相似的视频,还是优先推荐相似但有一定差异的视频,这就取决于平台的价值观与判断。
像抖音和快手在算法推薦机制上就存在一定不同。比如他们都会把新发的视频放到一个池子里,给同样的机会测试。如果一个视频点击量非常大,抖音就会一直推荐它,让它一直留在这个池子里,让这个视频更加火爆。这样就会形成马太效应,热门的视频会更加热门。
但是快手就更“普惠”一些,一定时间之后,这个池子中的视频会更换。这样,一个视频虽然很热门,但可能就不会再持续推荐,而是会适当照顾一些不那么热门的视频。
也就是说,在抖音上你更容易刷到大家都在看的视频,而在快手上,则容易看到一些和别人看到的不一样的视频。
根据之前的一些计算,快手的头部内容流量占比约为30%,而抖音的头部内容流量占比为88%。这个数据并不准确,只是一个大概的估计,但是基本也能看出二者在流量分配政策上的差异。
算法的实质:社会层面的可见性
那算法的实质是什么呢?这个实质不是技术层面的,而是社会层面的。因为我们不是在学习算法技术,而是理解它的文化意义。从社会层面看,算法的实质就是可见性。
媒介的一个特性,就是将不可见的变成可见。算法作为一个媒介,也具有这个特征,它让某些内容变得可见,反过来,也会让某些内容不可见。
比如在微博上,你关注的账号内容更新不是按时间顺序排列的。也就是说,并不是最近更新内容就排在最前面,你经常观看的账号,或者与之有互动(点赞、转发、评论、私信)或者微博社会网络上关系比较近的账号,每次打开,就会出现在页面上方最容易被看到的地方。
反过来,那些你不太阅读和互动的账号,久而久之就会排在越来越后面,渐渐就从你的视野里消失了。算法让一些用户或内容变得具有可见性,另一些用户或内容变得不具有可见性。
这样看来,算法是不是也具有了建构世界和我们人际关系的作用?而且算法作为媒介或者传播的基础设施,它本身也具有透明的特征。普通用户在使用中,很难察觉到算法背后的价值观和框架正在影响着他们对世界的看法,以及和他人之间的关系。
那么算法是如何起作用的呢?它会先暗中搜集用户使用行为的数据,然后将这些数据放进它的计算公式里。这个计算公式非常复杂,我们常见到的公布出来的,只是一个非常简单的公式,但实际上使用的可能更复杂,是商业秘密,同时也是个黑箱。
这个黑箱不仅对用户来说是神秘的,其实对平台来说,也很难真正理解。因为它涉及的参数和数据太多,工程师只能设置初始条件,却很难控制实际的精确结果。所以经常牵一发而动全身,调整一个地方,可能会造成其他方面出现意想不到的结果。
有的学者把算法统治看成是一个福柯式的全景监狱,原本是边沁设想的一种理想的监狱建筑。囚犯的牢房围成一个圈,正中是监视塔。塔中的人可以清晰地看到每个房间里的囚犯在干什么,但是囚犯却无法看到塔中的情况,同时囚犯之间也无法交流。这样囚犯就会觉得随时都可能被监控,而遵守规矩。因此就能够用最少的人力,去监控尽可能多的囚犯。
社交媒体的算法也建构了一个类似的全景监狱,用户知道有算法存在,但是也不知道具体它是如何运作的。如果他们遵守平台的规则,他的信息就会被推荐,具有可见性,反过来,如果他们不遵守平台的规则,就会受到惩罚,不具有可见性。
公域流量与私域流量
这里说的可见性,主要体现在流量上。一般来说,流量被分成公域流量和私域流量两种。
所谓公域流量,就是平台首页推荐或者精选内容页面上获得的流量。像大家在B站首页上看到的那些推荐就是公域流量,这个流量分配的机会是非常稀缺的,一般是平台觉得非常有价值的内容才会这样主推。
在短视频网站,你一打开就会在显著位置推荐的视频或者播放直播,常常都是公域流量。由于具有一定的强制性,所以这个流量是非常可观的。
私域流量就是每个账号订阅或者粉丝关注产生的流量,也就是平台不推荐,也会有一些忠实用户会主动观看产生的流量。
这类流量平台一般控制权比较小,是账户的基本盘。当然,如果违反了平台的规则,它也可以通过限流甚至封号的方式来干预。哪怕有的时候内容审核拖一拖,可能发布的最佳时机也就过去了。
在公域流量与私域流量的分配上,抖音和快手也存在不同。比如一个账号新发了一个视频,抖音会更多地把它推荐给那些对这个内容感兴趣的用户那里,而不是订阅了这个账号的粉丝那里。而快手就相反,会更多地推荐给粉丝。
抖音分配给感兴趣的标签用户和粉丝的流量比是9:1,而快手则是3:2。这样做的结果就是在抖音上,不管你之前有多少粉丝,如果你发的单个视频质量不行,可能流量也不会太高。但是在快手上,只要你粉丝多,那么每个视频至少有一个比较高的保底流量。
这样看来,抖音又显得更公平一些,给好的视频以机会,但对大V来讲,就没法躺在之前的成就上安稳地生存了,如果不能推陈出新,大V也很快被淘汰。
平台分配流量,如何构成一种规训?
除了算法本身充满着主观性和规训色彩外,其实平台手中还握有大量机动的流量进行分配。如果平台要搞一些活动,创作者积极参加,就会被分配一定的流量。
短视频网站在直播时,也握有一定数量的流量。平台会给一些主推的主播,分配一些打开APP时默认进入的用户,这样一上来直播就很有人气,这些人气又会带来更多的看热闹从众的人。这个时候有背景、听话的主播就受到奖励,这也构成一种平台的规训。
甚至现在的平台还会把流量商品化,抖音有DOU+平台,用户花钱就可以给自己的内容配上流量。新浪微博也可以购买阅读量,让你的内容更有可见度。在平台之外,还产生了一个流量商品化的地下市场,这就是大家听说过的“网络水军”。
可以用付费的方式获得更多的观众、粉丝、转发和评论,甚至还可以用刷单的方式,制造虚假的销售量或者商品的好评。
这种数据工作最后的目标仍然是满足平台算法的要求,提高账号可见度。当然,如果你直播的时候买了很多流量,但是东西没卖出去,投入的流量费是否能够赚回来?這就具有一定风险了。
有可能“逆向破解”算法吗?
前面说过,算法是一个黑箱,这就出现了很多“逆向破解”操作。但是这种“逆向破解”充满着玄学。因为算法是由复杂的参数和数据构成,人脑并没有办法真正理解,只能根据输入和输出结果,去进行推测,建立因果关系。
这就像柏拉图洞穴寓言,那些被绑的奴隶,每天在墙上看见不同物体经过后产生的投影,于是就开始猜测其中的规律。但是这些不同的物体的出现其实并没有规律,可能歪打正着中了,就以为发现了真理。
柏拉图在这里本来是想嘲讽他认为的“民科”,但是通过这种方式,奴隶们也获得了对世界的解释与意义。
用户对算法的揣测与解释也是这样一个过程,有的学者称之为“算法想象”或“算法解码”,就是人们怎样用人类的意义去理解算法的逻辑,在这个过程中,用户之间还存在交流和协作,这个过程又被有些人称为“算法八卦”。
看这些概念,就会发现,学者们认为这些行为并不靠谱。这些算法想象也许有道理,或者偶然能中,但是并不能保证它一定科学。
因为这些所谓的“算法专家”,并没有一个科学的方法,仅仅是用神话式的解释,比如把算法看成是人格式的存在。还有的创作者会总结出一些提高被平台推荐和提高流量的方法,比如一段时间内连续发相同的垂直内容,或者增加直播的时长。
其实这些方法,很多时候是在用人的思维方式来推测算法。但是这并不妨碍人们去探索和赋予算法以一定的意义,甚至还有一些“算法专家”开班来讲解自己总结出来的经验。
除了去想象和顺应算法外,用户还会去抵制、颠覆甚至改写算法的意图,这也被称为“玩弄算法”。比如一些用户会有意去看一些自己不喜欢的内容,来干扰算法的推荐机制,打破信息茧房。
总之,技术和算法本身和之前讨论过的职业意识形态、惯例、宏观制度等因素一样,现在也参与到了内容的生产过程中,用户的行为与内容创作也受到算法的规训。
平台资本主义以一种看似中性的技术,更严密地控制着用户的行为,而用户也在积极地适应与反抗这个体制。从某种意义上说,算法作为一个行动者,也参与到内容的生产之中,加剧了内容的商品化。
(摘自微信公众号“看理想”)