用户感知模式中的算法认识论*
2022-06-15晏齐宏
晏齐宏
一、问题提出
从莫雷利(Morelli)、弗洛伊德(Freud)、福尔摩斯(Sherlock Holmes)开始,通过表面的线索来诊断深层的问题,成为认识事物、解决问题的重要路径。莫雷利用画作的细节特征来判断其出自谁之手并对其进行归类;弗洛伊德通过病人的症状来判断病人可能遭受的生理和心理创伤;福尔摩斯通过常人可能忽略的、不起眼的线索来破解悬疑大案。他们都采用了诊断的方法,即从显而易见的、常被忽略的、可观察到的细节,跳跃到较为复杂的现实层面。观察者将这些细节以特定的叙事方式排列,叙事顺序也反映了其思考模式或者推理模式。①这种认识事物、解决问题的方式,不同于传统基于专业知识的科学范式。它是通过日常经验(包括前人积累的经验),以仔细观察为基础,使观察者从表象切入到更深层的东西,这就是推测的知识。
基于迹象和零碎的证据来还原历史过程,在历史学中较为常见。针对算法这一黑箱技术,近来新闻传播学研究者也提出了类似的分析路径。研究者将普通人通过日常经验认识和感知算法运作及其影响的方式,称为算法感知。②例如,普通人可以通过素描、类比、提供假设和结果等方式来推测、猜想算法系统的运作逻辑。③这些感知模式,构成了人们理解算法的民间理论。人们在形成民间理论时,会从不同的信息来源或者线索中获取信息,并将其排列、序化、梳理、组织等,由此民间理论也比之前认为的简单线索更加复杂,具有多面性和可塑性等特征。④在民间理论中,重要的不是知识的专业性、正确性、科学性,而是实用性。⑤
随着以专业知识来破解算法黑箱的分析路径遭到批判⑥,并且很难为算法研究贡献更多的人类知识和智慧,民间理论这种分析方法悄然出现。近年来国外涌现出了一批基于民间理论开展的算法的相关研究,但是国内的实证研究还非常缺乏。基于此,本研究尝试从民间理论的视角,探讨普通用户在算法实践中所形成的民间知识,这也是对算法技术认识论的实证探索。本研究关注的是人们如何基于琐碎的、显现的线索而将其“排列”“组织”起来,从而呈现出对算法运作过程及其社会影响的理解。这些排列、组织模式,实际上就是人们的感知模式或思考模式。
二、算法感知中的感知线索和感知模式
算法民间理论的形成主要包括两方面内容:激发用户推测算法系统的感知线索(外显线索、内隐线索)和感知模式。
(一)算法系统的感知线索
人们决定依赖何种线索展开推测,取决于这些信息或线索在实现目标方面的潜在效用。⑦整体来看,在算法感知中,主要依赖的线索包括外显的和内隐的线索。
第一,外显线索激发算法感知。外显线索指那些外在的、明显能够激发人们感知的信号(signal)。从已有研究来看,系统设计或界面中的元素会激发用户的算法感知和推测,如技术系统中呈现的文章、广告、软件界面等。⑧除此之外,外显线索也包括用户的个人偏好和使用行为等。研究者通过民间理论发现,用户认为Spotify(音乐服务平台)之所以推荐特定内容,除音乐本身的特征(如音乐类型、风格、节奏等)外,还因为用户的使用习惯(如频率和收听习惯)。⑨Eslami等分析了Facebook Newsfeed的民间理论并发现,用户会以自己的方式推测和揣摩算法。例如,在用户的理解中,算法会基于个人与其他账号的互动、与内容的互动、朋友关系等而进行相应的信息推送。⑩同时,那些显要的系统功能及设置也会激发算法感知,如隐私设置、发帖时间、平台设置和定位等。
第二,内隐线索激发算法感知。内隐线索指的是用户个人的心理和状态,如个人对风险的感知、对技术系统的信任等。研究发现,对事物的态度和看法会影响对算法的感知。针对音乐平台,人们在使用实践中的情感体验也会激发算法感知。有研究从感知的角度分析用户对Facebook好友信息呈现背后算法逻辑的推测和猜想,提出了几种直觉理论,如被动消费、隐私感知、消费者偏好、错失帖子、期望违背。例如,期望违背指人们基于与结果(所接收信息)相关的假设及期待,来推理和理解技术系统。特别是,如果结果与自己的期待相违背,更可能激发人们的猜测和揣摩。例如,有研究对来自#RIPTwitter的推文进行分析发现,基于违背期望的算法输出结果,人们或多或少能够感受到隐性算法的存在,大多感受是直觉性的、琐碎的;当然也有一些理解确实上升到了专业层次,有些也的确与算法实际运作的逻辑相一致。
整体来看,激发人们进行算法感知的线索包括外显线索(如文本特征、用户特征、系统特征)和内隐线索(态度、情感、心理),具体有文本类、用户类(外在特征、内在心理)、行为类、系统类等线索。
(二)算法系统的感知模式
感知模式指的是,当用户注意到外显线索或内隐线索时,基于此而思考技术逻辑的方式或模式。较为常见的感知模式包括社交关系、因果推理、用户参与等。
第一,社交关系模式。Twitter、Facebook、微信等大多通过好友或社交关系进行系统功能设置。实证研究也发现,用户对这些平台算法运作的假设、期望等大多与群体、社交关系等有关,用户关系、用户与系统的交互等成为其思考算法运作的重要模式。第二,因果推理模式。从技术逻辑来看,算法是将以语言或者代码形式的输入进行运算而输出特定结果的程序。那么基于输出结果来反推输入及其过程也是最可行的理解模式。第三,用户参与模式。用户参与模式大多指用户及他人与系统的互动行为模式,如围绕信息浏览、转发、点赞和评论等展开的思考和推理。值得注意的是,这里的互动行为,不仅包括用户个人的,还包括其朋友的,甚至不认识的其他人的。
本质上看,技术系统的民间理论是一种意义构建框架,用户会调取某些线索来进行直觉的、非正式的技术推测,该想法可以用来解释技术系统的运作机制及其结果或影响。普通人将各种细碎线索进行排序、组织的逻辑结构,构成和反映了人们的思考路径,即感知模式。在算法问题中,目前国外研究对此给予关注,但国内实证研究较为缺乏。基于此,本研究尝试分析用户算法感知中的感知模式。
三、研究方法
本研究采用深度访谈的方法展开,访谈分为三个阶段。第一阶段招募北京某高校大学生25名,这些学生分布在各个学院和专业。第二阶段通过微博、微信招募职场从业者,17位被访者接受了我们的访谈,这些从业者涉及文化、政府、医疗、工程、媒体等行业。第三阶段通过微博、微信招募11位算法相关从业者,包括计算机教师、业界的计算机工程师、新媒体运营人员等(被访者信息表1)。每次访谈约40分钟—90分钟。获得访谈材料后,研究者侧重于通过寻找被访者提到的线索以及依据于此展开回忆、叙述的方式,从而获得人们的感知模式。在本研究中,感知模式主要指的是,用户在算法感知过程中形成的对系统如何运用算法推荐信息,以及算法推荐社会影响的理解和思考模式。值得注意的是,这里侧重于思考方式而非算法运作本身。而这种感知模式很大程度上依赖于感知线索。
表1 本研究被访者信息
四、数据分析结果
实证分析发现,对于不同的感知模式,可以依据感知线索来进行归类。具体包括文本类线索、用户类线索、行为类线索、系统类线索等。相应的,感知线索与感知模式具有一定的对应关系(见图1)。
图1 用户算法感知中的感知模式
(一)文本类线索:个性化与多元化模式
针对文本类线索,人们会从发展和抑制的角度进行思考,发展即顺应人类的需求、人性化体验等;抑制即在满足人类最低层次需求的基础上,从更高层次拓展多元内容,并且从技术可操作性方面给予更加理性的解释。这可以称为个性化与多元化模式。
第一,个性化满足模式。针对接收到的同质化信息,用户大多从该信息与个人的关系展开论述,特别从该信息是否能满足个人需求、是否能避开风险的角度进行思考。有被访者谈到:“我理想中应该是55开,50%是通过推荐算法构造自己喜欢的内容,剩下50%可能是热点内容,或者是随机推送的。……有可能大多数人觉得全部是自己喜欢的这样比较好,算法可能更偏向于这么做。”(ST11)人们也会以自我为中心,依据心理距离的远近来思考算法推荐。一般来讲,那些与自己相关的信息大多被认为是算法推荐的。“要是美食,我觉得基本上是通过算法推荐的,因为我喜欢呀。如果跟我远点的,如神州十三号载人飞船发射、中美对话或中外关系,这些应该是硬性传播的,国家重大事件嘛,自动置顶。”(CS2)反过来,人们也会从更广阔的视角思考不围绕个人兴趣进行推荐可能带来的问题。“我觉得现在的平台对探索新内容这方面不太重视,做得很差。于情于理,算法不喜欢探索新的兴趣点,因为探索本身存在很大风险。”(ST12)除了正反两方面的思考外,人们也会将同类内容归结为个人因素。(ST9)可以发现,无论是从正面还是反面,还是问题归因,人们对同质化信息引发的算法推测逻辑,均遵循了个性化需求是否得到满足这一规则。
第二,多元化探索模式。针对接收到的异常信息,用户会从系统试探以扩大视野的角度进行推理。当个性化需求理念深入人心,人们对于接收到的异常信息会感到惊讶,并基于已有社会经验进行推理。“有时候算法确实很匪夷所思,我从来不喜欢这个东西,但就给我推了。一是背后有人为操作;还有可能是它想探索我新的兴趣点。用已知的兴趣点探索其他兴趣点。”(ST7)从技术发展本身来看,在起初冷启动阶段,算法系统的确需要反复探索兴趣点。同时,系统也会从用户体验出发来进行推荐,人们除了具有个人偏好,也喜欢多元化内容,这是算法系统开发的重要标准之一。(ST2)针对内容异常情况,被访者认为可能存在更高一级的算法程序。“比如B站每天晚上推恐怖片和美食。因为我特别胆小,我有一次把所有恐怖片全都点了不感兴趣。但是过了一天之后,它依然每天都在推,它这个始终推的算法程序优先级应该比特定算法高。”(ST14)这是用户从技术必要性和可操作性角度进行的推理。
第三,人性化体验模式。针对接收信息的呈现方式等,人们从人性需求、人机互动、用户体验等角度推测算法。“算法推荐的信息是比较类似的,抖音上我爱看的是搞笑的和颜值类视频。很神奇奥,这两类不是说它一股脑儿全部给你推,而是那种交叉的,它不会让你有视觉疲劳,让你感觉刷不完。”(ST16)算法运行所需数据,取之于用户,也用之于用户,算法与用户的人性贴合,是用户推测的重要逻辑。同城热搜等也是顺应人们需求的一种算法存在形态。“我其实并不会特别在意同城(热搜),同城相当于新闻的接近性,大家可能天然地对比较接近的事物感兴趣。”(TM1)人们天生喜欢新奇的事物,对未知充满好奇和幻想。依赖于此,不确定性、随机性也是重要推荐机制。“抖音上刷视频是随机的,虽然大部分是根据个人偏好推,但你不知道下一条跟上一条是什么关系,特别是下一个具体推哪个是很随机的,你也不知道。”(C1)不同平台的平台基因以及对人性的理解有所不同,算法推荐模式也不一样。一位新媒体从业者谈到:“比如抖音把很多资源集中在非常头部的内容,高质量的信息就会被强推。但是快手不一样,快手不会强制推给你,只有你喜欢了才推给你。当然,现在各家算法推荐慢慢趋向于共同的逻辑,即摸索用户的偏好。”(NM6)如果说个性化满足和多元化探索,更偏向于硬性指标和客观指标,那么人性化体验更偏向于软性指标和主观指标。
(二)用户类线索:多利益主体模式
针对用户类线索,人们会将用户特征作为算法运作的基本物料,将其与信息、服务提供方直接相连;更进一步,也会基于个体的深层利益、个体与他人利益关系进行推理。这可以称为多利益主体模式。
第一,用户画像的物料化匹配模式。用户会将个人特征与所接收信息进行关联,以解释算法逻辑。人们感知到的用户特征线索,在计算机系统里是作为用户画像存在的。用户画像包括很多特征,如姓名(账号名称)、性别、购物记录、评论信息,还可能有地址、电话号码、工作单位、消费习惯、收入和支出等。(NM7)当获得这些个人信息后,后台会进行相应的匹配和推荐。“比如用户每天的消费数据,也要对文章、内容等打一些标签,然后内容标签跟你的个人信息匹配,觉得这个比较像你,应该你会喜欢,就推给你。”(ST22、ST23、ST24)一位有过互联网公司实习经历的学生谈到:“我们在发微博以及做宣传工作的时候,得给内容打上标签,如职业、女生、未婚、喜欢买包,这样它就可以判断你的特征。如果不打标签,B站是不会推荐到首页的。”(ST13)另一位被访者谈到,热搜也与人物画像相关。“热搜的关键也是人物画像,它统计了大部分人的关注点,然后去迎合大部分人。你关注科技,我关注民生,他关注体育,但是如果有80%的人都更爱看体育,那么热搜最开始最热的地方就是体育,它的引流机制就是把更多人关注的话题往前顶。”(ST25)基于这些数据,后台程序会进行模型建构和演算,以及进行不同设备的对比。技术从业者谈到:“模型演算,可能就是两个相近的用户模型,或者同一个人在两个不同设备上的用户模型,后台会进行筛选比对,得到的(用户画像)就更加精准了。”(NM3、NM4)当然在匹配中也会出现偏差。“广告等内容与用户特征的拟合度越高越好,另外一个(参数)好像是与偏差有关。这个值好像是为了保证信息检索的准确性,纠正偏差。”(BE3)这些用户特征就像物料一样,被不同的平台在不同情境下进行调取并分析。一位在外企电商网站从事数据分析工作的被访者谈到:“这些用户数据给到我们数据分析部门,我们根据这些数据计算出哪类人群可能喜欢看什么样的广告。有人(广告商)找我们投广告,我们就根据这些分析结论,觉得哪部分人需要这个广告,就把广告推给他们。我们相当于信息中介,用户就是我们的资源,广告商可以利用我们对资源的分析与挖掘来投放广告。”(C4)可以发现,算法系统的运作就像传统的企业工厂作坊一样,进行分工、合作、生产。在算法系统中,用户画像是原料,企业和技术人员是加工者,最终生产出面向消费者的产品或信息。
第二,用户直接利益相关模式。App使用是为了满足人们工作生活所需,这就非常有可能因算法而引发利益方面的获得和受损。被访者认为大数据杀熟主要是商业利益主导下的算法操作,为了企业利益而牺牲用户利益。“大数据杀熟,滴滴利用了用户对平台的依赖,知道你使用次数多了,对App产生了一定的依赖,它就用算法系统来抬高价格,获取更多利益。”(ST3、PI2)这种杀熟现象也存在于机票价格方面。“如果说你之前都没有搜过这个,你点进去可能价格是一样的,但是你搜过一回,下次这个价格就会变,这机票特别神奇。它觉得你想买,你已经再次逛回来了,说明你的需求比第一次搜的人高,它就会显示较高的价格。”(BE1)与此类似的还有外卖行业。(CE1)基于对新手的鼓励或者对老手依赖性的“拿捏”,平台运用这些获客、留存、转化的策略,并通过算法逐渐培养人们对平台的依赖,从而获取更多利益。“抖音快手的算法就是为了留住你,你要花费沉没成本在上面,才会对它的依赖度进一步提升。这样它才会有流量,才会有更多的合作。”(NM1)随着算法深入日常生活,特别是伴随着商业产品、服务、活动等悄无声息的进入各个领域,人们的商业思维和理念也逐渐形成。(ST18、PI1)用户会从个人信息的商业化运作角度进行思考,这也成为用户算法解释的“法宝”。(CE2)
第三,用户个体与利益群体的区隔模式。有些消费场景中,人们会基于个人与利益群体的区隔性关系来理解算法。在这方面,最有代表性的是算法广告。“在如何为我提供更好的服务方面,系统可能比较关注我的一些特征和兴趣。但一旦涉及从流量转化到盈利、推销广告时,它并不在乎我的个人特征和兴趣,而是它该推什么还是推什么,就是为了赚钱。”(ST1)由于广告这类产品在一定程度上离用户比较远,或者用户对其天生具有厌恶感,人们更可能从利益角度思考。“我觉得朋友圈有些广告位,是这样的,今天谁花钱了,就放谁家的广告。”(BE1、PI3)之所以经常收到与自己无关的广告,“比如汽车,跟我完全没关系呀,可能是广告商给微信太多钱了,他就是用来刷热度的,没有根据某些群体特征,直接向全部用户都推了。”(BE2)一位技术从业者谈到,从广告投放的角度来看,“在你点开(广告)的那一刻,广告商会有一个竞价,它会有一个算法在里边,谁的出价高,就会显示谁的广告。”(C2)同时,“不同广告位有不同的计算规则,有的只要点进去就算广告投放,有的只是浏览了就算一次广告投放。不可能只有购买了才算投放有效。”(C4)也就是说,人们会从个体以及个体与其他利益群体(如企业、广告商)等的关系,特别是区隔性关系来理解算法。区隔性关系,指的是在那些不顺应用户意愿,或者可能与其他利益群体产生物质、精神层面不协同、矛盾、冲突等现象的关系。
(三)行为类线索:输入—输出关联模式
算法系统的运作是技术系统与用户互动的结果,大数据和代码要起到作用,还需要人类从外部施加“输入”行为。这些输入行为也是人们感知算法的重要线索。针对行为类线索,人们会采用回溯和归因的方式来理解算法。这可以称为输入—输出关联模式。
第一,刺激—反应模式。用户的使用行为或者点击行为属于对系统的“输入”,系统会对其进行处理进而“输出”结果,即用户接收的信息。被访者也是这么理解算法运作逻辑的。如果用户点击某个内容较为频繁,或者在某个视频中停留时间越长,就越可能收到类似的信息。其背后的逻辑是,点击频繁或者停留时间长,可能代表用户对此类信息感兴趣。(CS3)针对哪个平台的算法依赖性较强这一问题,人们会从使用体验方面给出自己的回答,即抖音、B站、小红书、淘宝。“B站的算法还是挺强烈的,假如点击了一个东西或搜了一个东西,它推的非常精准,而且反馈非常明显。一刷就会刷出6、7张图片,点进去看了一会儿之后退出来,再重新刷新一下,会发现后面的东西都是与前边相似的。而且立竿见影,就是前一分钟和后一分钟的关系。……可能是因为前期已经有你的数据,你前一分钟刷的那个视频,相当于给系统一个刺激;实际上可能最后依据的并不只是那一个视频,可能是你之前几年都在点击的那些东西。”(ST5)这种逻辑也进一步被运用于针对不理想内容的“抵抗”方面,即采用特定的行为以达到理想的接收效果。有被访者提及,“我之前看过考研视频,但是现在考研结束了,并不需要太多(信息),但它始终推这些,那我就在我想看的美食或者娱乐信息中频繁点击,或者停留较长时间。……这个还是很有效的,几天之内就可以立马调整过来。”(ST20)
第二,多主体行为类比模式。刺激—反应是从单个个体的行为因果关系来展开的推理,除此之外,朋友的行为和其他人的行为也是人们进行推理的切入点。“显然我和父母收到的信息完全不一样,我爸妈整天关注的是怎么健身、怎么养生、怎么健康,还有导弹发射了、税务局发布了什么信息、国家出台了什么政策。我从来不会看这些。我的话,B站上也没有什么国家大事,有一些知识类的。因为我睡眠有点问题,我的B站上大部分是助眠的东西。”(ST15)当谈及为什么朋友圈会收到比较奇怪的广告,如日本、韩国旅游广告等,被访者认为可能与好友关注相关。(TM4)“我微信朋友圈收到的广告有美团优选、算法课程。我猜是不是我朋友圈有一些计算机专业的同事或同学,他们肯定经常关注这些,我也就收到了。”(CE3)一位被访者谈到:“类似于你的好友之间形成了一个信息网络,每个人都有自己的档案,计算机里应该叫数据库,它通过数据库(里面也有关键字)中的菜单列表,比如你们两个人的菜单列表里有相同项或者相似度很高,通过你们俩之间的好友关系,认为好友关注的或者感兴趣的,你可能也感兴趣从而推荐给你。”(NM2)也就是说,不同于传统的群体划分方式(如人口特征),算法语境下,App使用慢慢培养了同类群体相同的关注和浏览行为,培养了不同群体的不同习惯,这也成为划分群体的重要方式。在访谈中,人们经常以这种类比的方式来说明不同用户由于特定的使用、互动行为而接收到不同的信息,并基于此来思考算法运作逻辑。
第三,优先级及赋权模式。用户的多种互动行为,如点赞、转发、评论、搜索等,被赋予不同的地位。被访者普遍认为,搜索处于最优先的地位,被赋予最大的权重。只要用户主动搜索某个信息或人物,系统就会给予推荐等。同时,这种主动行为对算法的影响不容忽视。目前很多App都有搜索的功能。特别是对于有文化的用户,他们更可能直接搜索某类信息。搜索行为中,算法对不同的内容/信息会有不同的容忍度。“淘宝感觉比较智能,之前网上说,搜一个东西,后续它会推荐一堆这些东西,但我真的搜过不相关、我不太感兴趣的东西,它也没有推荐后续的东西,所以我感觉它会容忍(感兴趣)领域之外的一些东西,它了解你有时会有特殊需求。”(ST19)从信息接收者来看,用户针对不同推荐内容也有不同的容忍度。“比如我搜娱乐的,它就老爱推王者荣耀那些,还有其他的。但是我搜政治或者经济类的,它推的比较少,基本上我得重新再去搜一遍,而且没有相关问题的推送。可能像政治经济类的比较偏敏感、严肃话题,人们的容忍度不高,推送就少。”(CS1)这也得到了新媒体从业者的证实,“一般来讲,越小众的东西,(算法推荐)会越加谨慎。大家对娱乐内容的容忍度、接受度会比较高,所以系统推荐一些本来没有涉猎过的娱乐信息,用户也是比较能够接受的。”(NM6)除了搜索之外,对于其他的互动(如转赞评)行为,人们也会从优先级方面进行理解。“对我而言,‘喜欢’应该权重更大一点。我一般会把一些有用的、看着比较好的,或者是有收藏价值的视频收藏起来,以后会翻出来看。但是评论的话,看到想评论的才会评论。所以我觉得收藏的权重应该比评论大一点,评论稍微低一点,浏览的权重应该是更低。算法会根据我不同类型的使用行为进行不同程度的推荐。”(C4)也就是说,当多个行为并存时,人们会想到行为之间的优先性,从算法系统来说则是秉持了差异化的赋权原则。
(四)系统类线索:启发式及系统式信息处理模式
针对系统类线索,用户大多通过日常经验、平台基因、功能知识等进行思考,特别是针对系统中的不同类型信息,会运用不同的信息处理模式。这可以称为启发式及系统式信息处理模式。
第一,基于日常经验的启发式信息处理模式。目前较多平台推出了专门的算法推荐版块,如猜你喜欢、每日推荐、本地热搜等。这些版块字样已经表明内容是基于算法推荐的。“我后来发现抖音很神奇,它有几个版块,比如说本地、关注、推荐这三类,你可以选择这三类视频去刷。比如我连续几天都刷到这个人,自从我关注他之后,我就刷不到他了。我发现这个的时候也很震惊。可能是因为我已经关注这个人了,它觉得我可能后续会持续关注。或者我直接在关注列表里就可以看到这个人,它就不会给我推荐这个人了。”(ST8)也就是说,用户在长期使用中,已经具有一些约定俗成的经验,针对于此,人们更会采用启发式信息处理方式,来解释算法逻辑。除此之外,算法App界面也会有一些设计元素,这些较为熟悉的边缘信号也会激发人们的思考。“B站首页以长视频、搜索为主,它虽然有一些推荐,但是会把搜索(框)放得很显眼,就是为了让人们去搜索,它在召唤你。相比之下,抖音是短视频、竖屏的方式,它以信息流的方式呈现。它基本都是自己推荐,不会让用户有太多的选择空间,会弱化搜索。”(NM6)从交互设计的角度来看,界面上的按钮等配件,会召唤人们的相应行为。
第二,基于平台基因的系统式信息处理模式。对于特定的算法推荐场景,用户会从平台的发展历史、平台文化、平台基因等方面进行深度思考,这是系统性的信息处理。就平台逻辑来看,被访者大多认为微信视频号运用的是社交算法推荐的方式,依托于微信的熟人社交资源。“视频号的逻辑就是社交加算法的推荐,首先假如你的朋友点赞了这个视频,他的所有朋友都会看到该视频,包括你也会看到。”(ST4)“……为什么这么说呢,感觉微信算是熟人社交的一个巅峰,它借助了熟人社交这一资源。”(TM2、TM3)当谈到B站是否也采用基于社交关系的推荐,被访者认为:“应该是没有的,因为B站不像微博或者微信,它不是把现实生活中的社会关系转移过去的。B站上是一些不认识的网友,而且B站是粉丝导向的,用户关注的是内容生产者。”(NM4)同时,用户依赖媒介基因推理不同平台的算法逻辑。当谈及微博本地热搜,被访者认为:“本地热搜与地理信息系统相关,地理信息系统会采集用户的地理位置,然后根据点击量、讨论量等进行排序,排序高的就在热搜最顶部……这也传承了以往互联网的样态,传统门户网站,像网易、新浪等,它也有同城的部分,比如新浪云南、新浪四川等。”(ST2)
第三,基于功能知识的系统式处理模式。针对跨平台推荐问题,多数被访者直接从商业利益的角度,认为是监听或者平台贩卖数据造成的。(ST21)但个别被访者也提到了输入行为。背后的逻辑在于“我觉得这是唯一会关联上的、摆在明面上的东西。为什么微信里聊到的东西会在淘宝上推,我明面上能看到的微信跟淘宝关联的地方,就在于打字的键盘输入法(输入行为),输入法/行为从头贯穿到尾。里面可能会有什么关联,但是我看不到。”(BE1)这也得到了新媒体从业者的证实。(NM7)除此之外,很多平台开发了特定功能模块进行推荐。抖音平台会显示朋友的朋友的帖子,对于这种功能设置,被访者认为背后的逻辑可能是社交关系。“应该是抖音查看了通讯录或者什么的,它觉得可能是熟人,就推荐了。”(ST6)针对微信视频号,点赞相关视频,朋友也会看到该视频。“这个应该是好友联系表起了作用,只要它检测到你发了一个喜欢的视频,它就会把这条视频推荐给你所有的好友。”(C4)这种关系也可以是家庭关系或者亲属关系。“后台数据库可以监控家庭关系,比如通过IP地址等,找到家人的共同爱好,再推荐一些东西。”(C3)
(五)多类线索:统合性模式
除了四个感知线索分别主导诱发了特定的理解方式和感知模式之外,在特定情境下,用户也会调取多个线索进行推理。例如,文本线索与用户线索在很大程度上是关联的,因为文本不仅有客观的,还有主观的,主观类文本线索因用户而有差异,二者具有非常强的协同性。
第一,整体性思考模式。除了以个人接收到的信息为圆心或原点来由近及远地理解算法推荐逻辑之外,用户也会从宏观的、整体的、结构性的角度考虑。“我觉得抖音做的很好,但很初级,因为它的用户群体太广了,在年龄段、受教育程度方面要做到全覆盖,所以它推送的东西比较浅薄。比如我看一个影视剪辑,两三分钟讲完一个电影之类的,它疯狂地在每天这个时间段推送一堆。但是偏内容一点的平台,比如B站,我想学一下视频剪辑,我在B站点开达芬奇相关基础教程,等我下次再打开B站的时候,它给我推送了进阶的东西。”(NM4)也就是说,人们会将平台调性、平台用户、内容风格进行系统性、统合性的思考。针对不同平台算法推荐的内容有很大差异,被访者认为与平台调性有关。比如,“微信视频号,我看到正能量的东西比较多一点,搞笑的视频也多一点。抖音就是大家纯属的娱乐那种感觉。”(NM5)这种差异的原因可能在于两个平台的用户群体完全不一样。平台、内容、用户行为和动机等构成了一个连续系统,其起作用的方式是协同性的。
第二,平台管理模式。依托宏观平台、中观内容、微观行为和动机等之间的关系,平台运作实际上遵循了管理的思维,即进行资源的最佳优化配置和组合。随着UGC的崛起,普通用户也可能进行内容生产或者平台运营相关实践,他们也会以平台管理思维来理解算法。“我自己之前发过一个关于古筝的短视频,它(系统)会把这个视频推荐给100个对音乐感兴趣或者经常看音乐视频的人。如果这些人看的时间超过多少秒,这个视频会被往外扩散。比如说先推送给1000个人,如果超过百分之多少的人看完了并且点赞了,就推给10000人。反过来,可能最开始 90% 就推给这些(爱看的)人,10%推给其他人,它(系统)认为说不定其他人也会喜欢。然后看哪个群体点赞多,就会往那个方向扩大投放量。”(CE3)这种思考逻辑在内容生产者中更为常见。“我自己发视频,算法会帮助视频增加一些曝光……比如我在B站上发一个视频,如果在一定时间得到了一些点赞,系统会将这些内容推向更大规模的群体。它可能觉得我的内容比较好,就会给更多的曝光机会……这里算法的作用可能在于它根据已经点赞的用户画像,再去找那些比较类似的用户,让更多的人知道这个视频。”(ST10)平台管理思维最为关键的在于将不同线索或者资源进行有效整合。
可以发现,在四个感知线索分别诱发人们推测算法逻辑方面,用户大多采用顺应型、违背型的思考模式。而当四个感知线索合作诱发算法感知,用户大多采用协同型、整体型的思考模式。同时,用户在不具备专业知识的情况下,对算法逻辑的理解并不在于算法黑箱本身,而是从外部封装的角度,结合可见信息(如感知线索)以及非可见信息、个体及他人信息(如企业)、系统内要素(算法使用)和系统外要素(平台发展基因等)等来做出解释。这启示我们,在未来关于算法的研究中,破解算法黑箱并非唯一路径,而是可以从其他多重维度和方面来展开分析,对于算法的社会影响等议题,更是应该如此。
五、总结
对算法逻辑及其社会影响的理解或解释过程,实际上反映了人们认识事物的方式。“有关认识论的讨论必然会涉及知识的获得、检验、改进和传播,而这又进一步牵涉到个体的心理、行为、语言、逻辑乃至社会性。由此延伸开来,认识不仅是一个信息范围的拓展或扩容,而是一种对认知的结果及其规范所提供的某种担保。”由此,对于用户算法感知中感知模式的探索,本研究着重于分析用户的心理、语言、行为、社会性之间的连接、编排方式。
本研究针对普通用户算法感知中的感知模式这一问题,采用了不同于科学知识的民间路径展开分析。研究发现,用户针对不同线索会采用不同的感知模式。针对文本类线索,用户会从该信息是否满足个体需求、是否具有较好的用户体验,以及广义上该信息是否能够满足多元化的价值追求等角度进行思考。针对用户类线索,用户会将个人特征与商业运作的基本逻辑相勾连。同时,用户也会从利益角度进行思考,这种利益逻辑包括用户直接利益、用户利益和其他群体利益关系。特别是,不同利益者存在冲突或矛盾的思考逻辑,是较为常见的思考模式。针对行为类线索,用户会采用输入—输出的推理逻辑,与算法技术的“如果……那么……”的技术逻辑相一致。具体来看,用户会采用单个个体的刺激—反应模式、多主体的行为类比模式以及不同行为之间的优先级及赋权模式进行推理。针对系统类线索,用户通过两种信息处理方式来进行思考。一是启发式信息处理,即通过日常熟悉的、边缘信号等自然地认为信息是算法推荐的。二是系统式信息处理,即通过深度的思考和信息加工,甚至从历史、主体关系、功能设计及行为互动等来详细推理算法运作逻辑。用户也会基于以上的多种线索来感知算法,采用统合式的感知模式。人们对算法的解释逻辑具有一定的流转性。在特定情境下,基于不同感知线索,人们对算法的理解模式或感知模式有所不同。当然这也不是绝对的,在特定条件下,人们对算法的某种理解会弱化,而其他理解会强化。
算法是一种黑箱技术,其引发了人们应该如何认识新技术这一元问题,也对传统认识事物的方式提出了一定的挑战。研究者认为,对于计算为基础的智能传播活动的认识,应该力图阐释由问题本身所引发的实践战略与策略,探讨其意义的解读和做的方式。本研究通过用户在具体算法实践中的感知,将个人作为具有能动性主体这一方式,来更深入地探索用户认识这项技术的模式。本研究是一项探索性研究,研究也发现,普通用户能够基于特定线索建构出对算法的认识,这是一种新的建构知识的方法论机制,其中蕴含着人们在新技术环境下所生发的社会心理秩序。研究中所发现的不同感知模式,可以作为具体分析算法及其社会影响中用户认知和心理层面的思想资源。同时,该研究有助于建构算法技术语境下的用户主体性,也有助于为未来算法研究提供用户方面的探索维度和可能性。
注释:
① Carlo G.Morelli,FreudandSherlockHolmes:CluesandScientificMethod.History Workshop Journal,vol.9,no.1,1980.pp.7-10.
② Hargittai E.,Gruber J.,Djukaric T.,Fuchs J.,Brombach L.BlackBoxMeasures?HowtoStudyPeople′sAlgorithmSkills.Information,Communication & Society,2020.pp.8-10.
⑤ Keil F.C.TheFeasibilityofFolkScience.Cognitive Science,vol.34,no.5,2010.pp.834-837.
⑥ Kitchin R.ThinkingCriticallyAboutandResearchingAlgorithms.SSRN Electronic Journal,2014.pp.20-26.
⑦ Pirolli P.,Card S.InformationForaging.Psychology Review,vol.106,no.4,1999.p.643.