APP下载

计算传播学视角下的智能推荐系统建构与算法治理

2022-04-16党东耀

关键词:智能算法用户

党东耀 党 欣

(郑州大学 新闻与传播学院,河南 郑州 450001)

20世纪90年代以来,智能推荐技术应用已经成为当代社会生活的重要手段,担负搜索、推荐、评分和预测等功能。“在大数据和人工智能时代,通过应用智能推荐技术,用户不再是服务的被动接受者,而是成为主动的参与者,直接影响服务的方式和内容。”[1]许多在线系统都配备了推荐策略,从而为用户在获得信息、购买物品、欣赏音乐、观看影视、社交娱乐等日常生活活动中提供便利的服务。算法作为重要的智能推荐技术已经广泛应用于社交网络巨头Facebook(脸书)社交推荐、在线零售巨头Amazon(亚马逊)商品推荐、流媒体视频服务巨头Netflix(奈飞)影视推荐和搜索引擎巨头Google(谷歌)新闻推荐,这些不同行业的大型科技公司通过算法获得了全球影响力。

智能推荐技术直接改变了人们的生活和消费方式,智能推荐研究作为一个单独的问题受到关注,对于算法的运用尤其引起人们的担心。“在过去十年中,人们消费新闻的方式发生了许多变化。以前,消费主要是通过电视、报纸和广播。但近年来,搜索引擎、社交媒体和新闻聚合器等数字中介已成为新媒体渠道,其用户数量一直在稳步增长。尽管它们具有优势,但人们担心个性化算法的不利影响。最严重的问题是算法推荐的主题范围太窄,这可能会导致过滤器气泡和回声室问题。”[2]算法可以实现更高效的性能,但是信息茧房和算法偏见等一系列问题的出现,也带来社会上对智能推荐技术的担忧和对算法治理的要求,因此,从计算传播学视角对大型科技公司的智能推荐技术进行分析,进一步科学和准确地建构起智能推荐系统,厘清智能推荐系统的组成要素,才能有效地实施对智能推荐系统中算法的治理。

一、智能推荐技术的计算传播学解析

2009年,拉泽尔等提出了“计算社会科学”的概念,认为计算社会科学是一种“利用以前所未有的广度、深度和规模来收集和分析数据的能力,探索人们如何互动并提供关于人类集体行为的定性新视角的探究”[3]。计算传播学是计算社会科学的重要分支,主要关注人类传播行为的可计算性基础,大规模地收集、分析人类传播行为数据,挖掘人类传播行为模式,分析这些模式背后的生成机制与基本原理。

(一)智能推荐技术的算法特点与原理

Facebook、Amazon、Netflix和Google等大型科技公司是世界上最有影响的新媒体公司,也是当今互联网上最主要的流量形式,他们的智能推荐技术依据自身的业务特色和自身的技术优势各有千秋。

Facebook是著名的社交网络服务及社会化媒体网站,使用EdgeRank算法来预测用户最有可能关注以及感兴趣的内容。作为新鲜事排序算法的EdgeRank针对的是当前用户关注的人或好友对其信息流产生影响的行为,Facebook使用EdgeRank创建新闻提要,主要是通过附加分数、边缘权重和时间衰减等因素帮助用户挑选可能感兴趣的信息。

Amazon由在线图书销售商转变为网络电子商务公司,采用A9算法,以“用户体验为中心”,立足于消费者在Amazon进行的所有购买行为数据,根据不同消费者的搜索习惯和爱好推送产品,并通过消费者提供的产品评级(或评论)来揭示产品质量,依据相关性和转化率计算推荐商品排名,从而可以确保消费者能够快速精确地搜索并购买到自己喜欢的产品。

Netflix是最受欢迎的流媒体节目平台,采取用户订购的方式提供原创影视剧和卡通节目等。Netflix采用大数据算法,把“会员首页”作为推荐系统的载体来驱动,通过首页,可以获取大规模用户的评分矩阵和视频的隐含特征,结合用户画像,为用户推荐分数较高以及让用户有足够新鲜感的影视作品。

Google是著名的搜索引擎公司,根据用户和受众的变化,Google迅速实现了向智能推荐系统的转向。它采用PageRank算法,根据链接到某一页面的其他页面的数量来体现该网页的相关性和重要性,从而向用户展示最相关和最有用的页面。“Google新闻算法能够利用用户的详细资料,并将其与来自网络上的他们可能感兴趣的新闻故事进行匹配。”[4]

尽管这些公司算法的具体形式有一些差异,但是从计算传播学的视角出发,当前的智能推荐技术的原理主要分为三类:一是基于内容的智能推荐技术,是根据推荐物品与用户过去喜欢的项目的相似性来推荐。“基于内容的智能推荐系统利用给定描述信息中的项目属性和用户配置来生成推荐。”[5]二是基于协同过滤的智能技术,利用用户大量个人档案中包含的数据来查找用户之间的共同兴趣,将用户与其他用户匹配,分析他们的行为的共性后再提供推荐。三是混合智能推荐系统技术,是集成了两种或多种智能推荐技术的系统。它使用融合策略进行加权,将不同推荐技术的加权分数进行数值组合以产生输出分数,然后进行最终推荐。

总体说来,智能推荐技术的原理主要是基于用户的相似度。如果两个用户选择了很多共同的项目或者对某物品给予接近的评分,他们就会被赋予高相似度。智能推荐技术寻找“用户的邻居”,合并同类项,根据偏好的相似度或评级的相似度获得用户的喜欢特征,并抽取出这些特征作为推荐系统的关键词完成推荐。

(二)智能推荐技术的算法逻辑

Facebook、Amazon、Netflix和Google等公司的算法逻辑主要有以下几个方面:

一是以行为逻辑来呈现。每一个用户访问公司网站的行为都被记录并且存储,用户的体验行为成为公司对用户的体察和观测对象,在此基础上,公司进行用户喜好的排序,进而依据关键词为算法设计标签。

二是以历史逻辑来记忆。“具体来说,倾向于利用用户的历史交互来了解用户的静态偏好,并假设历史序列中的所有用户对项目交互都同样重要。”[6]正是在对这一历史阶段用户的分析上发现用户的偏好,相关公司据此确定推荐的导向。

三是以数据逻辑为基础。这个逻辑主要是建立在用户的大数据之上,通过大数据体察用户。四家公司都是所在行业的领军企业,拥有大量的客户群体,这为他们大规模采集用户数据提供了有利的条件。

四是以流量逻辑做主导。流量——点击率、访问量、销量(转化率)成为重要和主要的衡量指标。相关公司据此可以对用户进行细分和画像,将流量转化为购买商品或服务,这是商业逻辑的体现。

由上可以看出,当前推荐技术的算法逻辑主要表现出三个方面的特点:第一,技术逻辑远远大于价值逻辑,技术实际上取代了社会和法律中的价值观。主要依据众多用户的大数据判断出用户的喜好,而不管所推荐的信息中所反映出的价值观导向。第二,行为逻辑远远大于生活逻辑,感性的点击还是理性的点击无从区分,统统被纳入统计的范畴,进而作为体察用户的指标来呈现。第三,商业逻辑远远大于公共逻辑,也就是高度重视流量,着眼于商业利益的获得而不是公共利益的效果。由此可以看到,政府在算法的设计上处于弱势和失声的位置。这样造成的结果是算法价值和算法把关的形成,算法可以担负影响现代社会许多方面的复杂决策系统的功能。

“我们越来越依赖计算奇观来看待世界。”这种发展已经改变了社会运作的规则,算法成为“社会中新的权力掮客”[7]。算法在社会应用中发挥着越来越大的作用。“如今,算法为我们做出越来越多的重要决定,无论是我们获得的新闻、我们查看的广告,还是我们采取的工作路线。”[8]算法成为了社会的主宰,所谓的智能推荐系统其实就是算法推荐系统,智能推荐系统只拥有算法这个唯一的要素,这必然会引起人们对于算法的疑虑和担忧。

二、智能推荐系统建构的诸要素

基于以上分析,可以从计算传播学的视角,针对智能推荐系统所担负的社会职能,揭示智能推荐系统的本质属性,科学地解读和认识智能推荐系统的维度,准确完整建构智能推荐系统。

(一)智能推荐系统的运行要素

计算是计算传播学的本质。计算传播学遵循的是计算思维。计算思维的基点包含算理和算法,这必然要贯彻到智能推荐系统的运行和操作中。

首先,算理是智能推荐系统的原理。算理指计算的理论依据,它“是由数学概念、性质、定律等内容构成的数学基础理论知识,具体包括数的意义和运算的意义、性质及规律。算理附着在数学符号、图表以及执行算法的过程中”[9]。算理以问题为驱动,是逻辑思维的规范化。算理具有隐蔽性、抽象性与理论性等特征。在智能推荐系统中,算理决定了该系统的计算原理。

其次,算法是智能推荐系统的操作。算法指用系统的方法描述解决问题的策略机制。现代数学和计算机科学上的算法,可以定义为解决问题或执行任务的一组指令。算法是解决问题的操作程序,以有限的命令形式表示,具有外显性、直观性、可操作性等特征。在智能推荐系统中,算法已成为依赖数据和软件的操作过程的简写。

算理和算法的关系是计算传播学的核心要旨。算理与算法是运算的一体两面,两者之间的关系是对立统一、相辅相成的,具有同等地位。算理是客观存在的规律,是计算的依据,是算法的基础,主要回答“为什么这样算”的问题,而算法是人为规定的操作方法,是依据算理提炼出来的计算方法和规则,主要解决“怎样计算”的问题。算理为计算提供了正确的思维方式,保证了计算的合理性和可行性,算法为计算提供了便捷的操作程序和方法,保证了计算的执行性和快速性。

计算思维中算理是计算的“道”,算法是计算的“术”。算理是算法的理论基础,算法是依据算理的一种操作方法,在智能推荐系统中,必须以算理为前提。必须做到算理和算法并重。算理说明算法不是以技术无意识的方式运行,不存在价值中立的基础。

尽管算理和算法同等重要,但是在当前的社会生态下,鉴于算理的内在性和算法的外显性,算理和算法的关系出现了扭曲,算理日益内化入算法之中,被算法遮蔽,成为算法的一部分,计算思维在现实世界已经完全表现为算法思维,就是将解决问题的方法归结为算法设计的过程。从表象上看,智能推荐系统也就和算法形成了一一对应的关系。因此,智能推荐系统存在一定的风险。“特别是在透明度和问责制存在问题以及此类系统外包给私营部门的情况下。因此,能够检测和分类这些风险对于制定应对和校准措施至关重要。需要学习如何识别它的好处和它的潜在风险,以及如何校准和管理这些风险,需要学习如何控制算法。”[10]

算法治理成为智能推荐系统的核心问题和首要问题。我们应秉持包容、谨慎、专业的原则正确审视智能推荐系统算法的应用,提升智能推荐系统算法应用的规范性。一方面,必须让算理和算法回归到其在计算中的本来位置上。另一方面,必须加强对算法的评估和对算法的管理。

(二)智能推荐系统的规制要素

从计算传播学的视角出发,必须在智能推荐系统中引入算力和算规两个规制要素,完善算法的评估体系和管理体系。一方面要能够对智能推荐系统算法的效能和传播效果进行评估,另一方面要在评估的基础上建立对算法实施有效治理的管理体系。规制要素的构建和应用主要在于:

第一,优化算力建立智能推荐系统评估体系。算力是对智能推荐系统的评估,也就是对算法的衡量和评估,能够衡量算法的推荐效果,以确定一个算法所带来的传播效果。算力越强意味着算法的推荐效果越发显著。就智能推荐系统而言,算力可以从计算的软硬件两个方面进行评估:从计算的硬件上,评估算法运行时处理大数据的能力,即对于用户行为数据的反应能力。从计算的软件上,衡量算法软件的优化能力,让算法在多样化选择方案中实现最优化。软硬件指标的结合可以测量推荐系统计算过程的时间和空间。算力为算法高效运行提供有力的支撑,决定了该推荐所能覆盖用户范围的大小和传播效果的优劣。Facebook、Amazon、Netflix和Google等公司的智能推荐系统都取得了良好的传播效果,是它们持续不断地提升各自的算法系统算力的结果。

第二,依靠算规建立智能推荐系统的管理体系。算理表明算法并不是中立的,而是要依据一定的规则的。“算法的社会背景是指行动发生环境的实际意义,以及通过数据提供信息的社会互动。算法不是中性的规则集,而是嵌入精确世界观和本地化社会文化价值观的数学形式。”[11]因此,有必要建立算规体系。所谓算规即是智能推荐系统也就是算法的设计和运营所遵循的规则。算规体系既是对算法治理措施的落实,也是规范算法运行的有效管理体系。

计算和管理相结合,算理、算法和算力、算规是智能推荐系统全要素,可以建构起完备的智能推荐系统。

三、智能推荐系统的算法治理

对于算法的治理应确保其有效性和合法性,从计算传播学的视角来看,对于算法的治理应该建立在智能推荐系统的要素上,要从以算法为核心向以算规为中心转变,具体地说,就是要建立起算规体系,针对智能推荐系统各个要素进行针对性的机制设置。

(一)算法治理面对的问题和挑战

算法越来越普遍地渗透到日常生活的所有领域,影响日常行为的规范和规则,影响着现实生活中个体经营活动的有效建构。算法治理要解决的问题突出表现在信息、交易、社交和娱乐等各个生活领域及深层的社会和政治治理方面。

在信息方面,“算法是当今媒体技术的决定性元素,算法会自动选择和推荐符合用户兴趣和偏好的文章,接管以前由记者和人工编辑完成的新闻选择过程”[12]。2014年,Facebook 推出了“热门话题”,签约记者负责监督热门话题。2016年,Facebook将热门话题完全交给了算法,热门话题在未知其可靠性的情况下提高了知名度。

在交易方面,由于在线商店智能推荐系统的出现,电子商务服务越来越多地通过量身定制的广告来个性化推荐商品,从而影响消费者的决策和行为。以数据为基础的算法经济已经反向改变了传统竞争机制,进而出现了用户算法歧视和价格算法共谋,陷入商业道德困境。

在社交方面,Facebook和Twitter应用的出现改变了人们相互了解的方式。它从根本上塑造了日常交流行为。但是,算法会泄露个人隐私,会精确地根据各类信息识别社会主体的各类身份,将他们困在各自数据产生的无形茧房中,这不仅可能会剥夺人们接受教育、就业、贷款的公平机会,还可能给公共生活造成难以弥合的分裂[13]。

在娱乐方面,Netflix提供的流媒体订阅视频服务和Google旗下YouTube视频服务的推荐变得越来越重要。但算法的追逐有可能出现令人不安的儿童视频和低俗视频,乃至形成算法植入暴力视频的娱乐化倾向。

通过分析大型科技公司的算法可以发现,算法通过推荐和选择来影响日常行为的规范和规则,塑造了世界的感知方式和现实的构建方式,进而可以引导社会和政治导向。“把关可以广义地理解为通过关口或过滤器对信息加以控制。本质上,把关是对应当收集、评估并最终共享哪些信息进行判断或决策。”[14]“文化产品和新闻越来越多地通过被称为平台的信息中介,这些平台依赖算法来过滤、排序、分类和推广信息。算法内容推荐扮演着一个重要的、越来越有争议的把关人的角色。”[15]大型科技公司通过算法将数十亿用户聚集到人为策划的环境中,可以进行个人决策的部分操纵,影响人们的隐私、访问权、财产和言论,其领域涉及社会公共事务、媒体传播、管理和法律,从而也指向政治领域,形成“代码就是法律”,让社会感受到来自算法本身的挑战。

首先是公平性的挑战。由于各公司在线数据的局限性,算法所依据的大数据只能来自于该公司搜集和拥有的数据,这样一来,虽然数据可能包含很多洞察力,但它可能只与特定用户相关联,往往未必能够反映全面的人口统计资料,这必然会导致偏见的出现。

其次是公正性的挑战。算法驱动的新闻信息在数据、代码、生产者等层面都可能产生新闻价值模糊、新闻从业者主体性削弱、报道对象隐私被侵犯等诸多伦理风险。受众对信息体验的追逐和传者对算法技术的推崇是导致伦理风险的重要因素。

再次是偏狭性的挑战。算法在信息流动中追求的是对受众或用户的追逐,必然受到用户偏好的影响而导致信息茧房效应。

最后是透明性的挑战。主要是指算法开发的封闭性导致算法黑箱,使得公众无法弄清楚算法的目的和意图,甚至对开发者的相关信息也一无所知。

以上问题和挑战带来了对算法治理的难度,更谈不上对于算法的评判和监管。“算法选择对于未来的信息检索将变得更加重要,伴随这些考虑的是对个性化回声室或过滤气泡的恐惧,从而导致对社会的碎片化、有偏见的看法。”[16]而政府在算法治理方面的滞后性,会导致算法权力的无限膨胀和失控,这使得算法权力发生了异化。[17]

(二)算法治理体系的建构

算法治理可以理解为对算法运营和应用设置监控规则和权限模式,以指导算法在整个生命周期的正常运行并确保其担负责任。算法治理的概念概括了一系列广泛的社会技术实践,这些实践以特定的方式对算法进行调节和管理,从而有助于应对新兴数字社会和数据生态的关键争议和挑战。

“算法治理关注如何解决算法决策过程中涉及的复杂性,特别是需要使其透明、负责和公平。”[19]为此,可以采取多种治理选项来降低风险并增加算法选择的收益。一方面,治理可以理解为是一种社会秩序,治理形式涉及公共政策的产生和公共法规的实施,包括国家机构与行业之间的监管合作以及行业部门的集体自律,从而超越在组织内部的公司治理。另一方面,治理可以理解为一种制度导向,从根本上说,治理旨在解决集体行动问题和社会互动的协调。“从制度的角度来看,治理选项可以定位在一个连续统一体上,从一端是市场机制,到另一端是国家指挥和监管的平衡。”[18]为此,要建构算法治理的社会秩序体系和制度导向体系。

1.算法治理的社会秩序体系

从计算传播学的视角来看,“算法并不是在真空中运行的。算法的精度只能根据其编程方式和初始输入来确定”[20]。算法治理的核心在于制订和完善算规体系,具体来说,算规体系的建构要遵循以下几项原则。

第一,在算理中注入社会价值观。算法治理要体现计算正义原则,“计算正义是正义原则在算法实践中的体现,是人的社会合作和创造活动被计算化过程中所应遵循的价值准则。”[21]算法设计首先要遵从社会价值观和新闻价值观。要充分认识算理的基础位置,重视算法对算理的依赖关系。当前算法的数据逻辑和行为逻辑反映的是用户的实然,但实然之中包含应然,智能推荐系统必须要立足一定的社会价值观进行推荐,不能只是追逐受众的行为,而应该在了解受众、尊重受众的基础上主动作为,考虑到传播内容的适合性。

新闻智能推荐系统也要和新闻价值相一致,与新闻的选择和把关标准相吻合。2018年12月18日,欧盟委员会公布《可信赖的人工智能道德准则草案》,其列举的十条需求原则中包括“尊重人的自主性”这一原则,并提出在算法治理过程中“有必要通过自主性原则,尊重用户的主体性,让算法技术发挥人本精神,更好地为用户提供信息服务”[22]。此外,欧盟于2020年发布《人工智能白皮书》,明确AI的发展必须以人的价值观和人权(如人的尊严和隐私保护)为基础[23],这对我们也有一定的借鉴意义。

第二,在算力中把握大数据的平衡性。从计算传播学的视角来看,算法是通过将输入数据转换为所需输出以解决问题的编码程序[24]。“数据质量由许多维度组成,包括准确性、及时性、完整性、一致性、客观性、可信度和相关性,这些都决定了数据是否适合使用。”[25]“数据治理不仅应关注数据,还应关注收集、管理和使用数据的系统。”[26]基于算法的大数据应该由政府提供,从而可以保证数据的公正性和完整性,保证智能推荐系统的全面性。政府还要制定有关数据收集、共享、存储和使用的法规。

数据处理是算力的核心,政府要充分认识算力的支撑作用,把握好从“数据集”到“数据设置”的转变,为此,要做好大数据的基础设施建设,建构智能推荐系统的大数据系统,并建立统一的数据监管机构,设置数据审查与问责机制。“从计算法的角度来看,向算法治理的转变代表着我们与数据和法律关系的根本性重新定位。”[27]2018年5月25日,欧盟在数据治理框架下通过赋予数据主体新型算法权利的《通用数据保护条例》(GDPR),其中提到“算法解释权”和“算法审计制度”,明确要对算法的技术和使用进行审查,以保证算法的合规性和可复审性[28]。

第三,在算法设计中建立社会化机制。基于算法在智能推荐系统中的引领地位,必须建立开放性的社会化算法设计体系,由政府、社会、企业和公众共同参与,改变当今算法完全由企业主导的格局。虽然在社会的微观层面,算法以应用企业为承载体,但要在社会的宏观层面接受政府、社会的监督,接受公众的意见和反馈。算法的有效性不仅取决于其技术特征,还取决于人类在各种环境中的感知方式。重要的是要了解用户如何使用并理解算法,用户体验不仅塑造用户对计算系统的期望,还有助于塑造算法本身,从而督促对算法进行逆向工程、实验设置或代码审查。做好算法话语框架的分析,科学选取和设置算法的“关键词”和“标签”,对于新闻传播推荐系统,标签应该由新闻界和专业委员会以及公众来制订。

2.算法治理的制度导向体系

算法治理应该确保它是实现某些目标的有效手段,同时保持程序公平、公开和公正,增强制度导向[29]。在算规体系中,针对各要素建立实施主体,算法治理的方法重在建立协同治理的行动者网络体系,把技术效能和社会协商性联系起来,在技术界与社会界两个层面之间建立联结,使政府、社会、企业、公众作为行为主体或行动者在算法的重构中担负不同的功能。为此,必须充分体现政府监管、社会监督,企业自律、公民参与的多元共治算法治理格局。

政府是算法规制的政策制订者与推动者,要求算法维护主流价值观和促进社会稳定,坚持开放透明、尊重隐私、安全可控、公平公正等原则。

社会方面,主要是专业委员会和传媒机构参与算法的设计与评估,一方面要充分保障个人的知情权和选择权,加强对个人信息收集与使用的监管;另一方面要让算法的设计者与研发者能够更好地理解社会价值观和新闻伦理的诉求,推动主流价值与算法的对接。

企业平台应主动公开算法设计的意图,解释算法的目的,接受政府和社会的评估和监督,保障算法运作的开放、透明和公正,不断调整与改进算法。

公众是算法的落点也是其风险的承担者,一方面需完善相关法律法规,保证其个人信息数据安全;另一方面需要提升其算法修养,作为公共利益的代言者发挥作用,准确、合理、公开地表达自身意见,更好地参与监督算法。

无论是社会秩序体系模式还是制度导向体系模式,都强调的是要共同治理。共同治理是一种以权力共享和相互依存为特征的互动。通过建立多主体协同管理算法治理平台,既要求企业应该承担社会责任,也要切实保障政府和社会公众在治理体系中的主体地位。在算法治理中建立起多元共治体系,促使算法提供者承担社会责任,健全算法服务的责任义务体系。

四、结语

在当前的智能推荐系统设计中,算理被忽视,算法直接作为替代物,从而使得智能推荐系统和算法建立了一一对应的关系。算法被泛化,形成算法社会,让算法成为当今社会的重要影响要素。从计算传播学的视角分析智能推荐系统,充分认识智能推荐系统的本质和要素,必须全面认识算理和算法的关系,适时引入算力和算规要素,进而构建完善的智能推荐系统并实施对智能推荐系统中算法的治理。只有建立政府、社会、企业和公众为一体的算法治理体系,才能保障信息传播的真实性、客观性和全面性。

猜你喜欢

智能算法用户
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
智能前沿
进位加法的两种算法
智能前沿
智能前沿
智能前沿
关注用户
关注用户
一种改进的整周模糊度去相关算法