意义消费视角下社交媒体内容审查算法的治理困境研究
2023-05-15李凌霄秦勇
李凌霄 秦勇
【摘要】社交媒体的内容消费是一种意义消费,但是社交媒体内容审查算法的治理对象却是形式语言。形式语言与意义之间的强关联是社交媒体内容审查算法治理的基础假设,但实际上二者的关联具有任意性,治理目标形式与实质的分离、对内容审查算法的过度赋权造成了社交媒体的内容治理困境。改善当前社交媒体的内容生态应当跳出社交媒体内容审查算法造成的治理循环,寻找新的治理可能。
【关键词】意义消费;社交媒体;内容审查算法;内容失范
2022年12月15日,《互联网跟帖评论服务管理规定》正式施行,其中要求互联网跟帖评论信息内容实行“先审后发”,该要求引起了网民的广泛关注。要对当前超越“摩尔定律”的海量互联网评论内容进行实时审核,这一任务非内容审查算法不可完成,这一规定的出台事实上肯定了内容审查算法的功能和合理性。由于人工审查和算法审查数量之间的巨大差距,内容审查算法在一定意义上已经是社交媒体内容规制体系的绝对核心。
社交媒体内容审查算法的价值在学术研究中也是受到肯定的。目前国内学界针对内容审查算法的研究相对较少,并没有真正站在批判立场上对内容审查算法进行重新审视,仅有的质疑是内容审查算法对言论自由的不利影响[1],但并没有对内容审查算法的功能作出根本性的批判。时至今日,通过人工智能工具实现对社交媒体的内容治理仍然是研究者所倡导的治理方式。[2]
国外的社交媒体平台如YouTube、Mate等也公开承认社交媒体内容审查算法是其删除失范内容的主要工具。国外的研究者目前已经认识到内容审查算法在一定程度上对于内容的合法性缺乏评价能力,因此对社交媒体内容审查算法的必要性提出了质疑[3],但并没有对算法为何不能正确评价内容合法性的问题做出探讨。目前对内容审查算法的批判主要是对算法偏见[4]的批判和对内容审查算法运行中人工审核员非人性劳动的批判。[5]但是这些批判都没有真正否定内容审查算法的合理性,而是通过发现内容审查算法中的不合理之处,试图实现对算法的改良,对于内容审查算法中的逻辑问题并没有进行深入的思考,也并没有撼动内容审查算法在社交媒体内容治理实践中的核心地位。
目前,我国的社交媒体平台中,不同主题的内容治理专项行动仍在开展,从社交媒体平台用户的日常传播实践经验中也可以发现,失范内容在社交媒体平台上仍时有出现,内容审查算法为何没有达到理想的治理效果问题值得进一步思考。
一、意义与快感:社交媒体的内容消费起点
约翰·费斯克在《理解大众文化》一书中指出:“在文化经济中,流通的并非货币的周转,而是意义和快感的传播。”[6]当前社交媒体平台众多,内容形式、核心用户群体各不相同,但是社会成员的社会观念、社会中整体的流行事物仍大致相通,这说明用户在社交媒体平台上消费的不是机械的内容,而是不同内容背后大致相近的意义。
(一)社交媒体:意义与快感的交互平台
1980年,用户可以阅读他人消息并参与讨论的新闻组(Usenet)的出现可以被视为社交媒体的雏形。由于广播和电视在过去50年已经高度成熟,用户获取新闻信息已高度便捷,因此,当前用户对于新闻组或社交媒体的需求并不迫切,以至诞生于信息富裕时代的社交媒体作为信息传播工具不再以传递信息为主要功能。但由于单向的大众传播媒体缺乏意义与快感的生产消费空间,双向互动性迅速成为社交媒体重要的专业化服务方向,意义和快感也就成了社交媒体平台上最重要的商品。
从这一定位出发,社交媒体产品迭代的目标,是不断为用户提供更加优质与便捷的意义、快感交互体验。纵观我国社交媒体的发展历程,不论是以微信、微博为代表的图文内容呈现形态优化,还是短视频、XR内容的兴起,都可以用新的内容形态优化意义、快感的交互体验进行合理的解释。
(二)社交媒体内容推荐算法:意义逻辑的实践
当前社交媒体采用的推荐算法的基本逻辑是内容推荐和协同过滤。内容推荐是根据用户阅读的文本推荐相关主题的文本,协同过滤是为用户推荐好友、同一时间空间或具有其他相同特征的用户感兴趣的内容。不论社交媒体采用什么样的算法推荐逻辑,可以确定的是内容推荐算法并不是机械地推荐特定的、与用户感兴趣内容完全一致的特定内容,而是依据内容的文本、符号、标签等形式语言,为用户推荐可能感兴趣的、具有相同特质的其他内容。内容推荐算法想要实现以用户兴趣为中心的内容推荐,就需要寻找形式语言与意义之间的关联性。但内容推荐算法并不会强制用户阅读,用户仍然是传播行为的最终决策者,将算法对意义的解释权力控制在了相对合理的范围内。在保证用户主体性的前提下,由于用户对自身的意义需求有着较强的主观判断能力,适度存在的算法对意义的误读问题并不会使用户使用、平台运营出现问题,反而可以被视为用户突破“信息茧房”、寻找新的意义兴趣的一种有益尝试。
二、功能—期待悖论:社交媒体内容审查算法的功能困境
內容推荐算法是算法通过形式语言实现对意义的抽象的一种尝试。但是内容审查算法的运行结果是“是/非”二元的,在内容审查算法的主流化技术光环下,平台、用户与管理机构都期待内容审查算法成为一种公正、准确的内容治理工具。
(一)形式语言与意义的稳定关系:内容审查算法的功能假设
早期的内容审查算法主要采用关键词过滤的方式进行内容审查,但这一方式存在较大弊端。随着NLP等技术的发展,内容审查算法也开始依据内容的整体意义进行内容审查。但算法不具有人的认知能力,内容审查算法对内容意义违规与否的判定必须依据一定的形式语言。因此,内容审查算法对内容意义正确判定的假设是形式语言与意义之间有着相对确定的关系,一旦形式语言与意义之间的关系出现断裂、重组,内容审查算法就无法对意义进行正确的判定。社交媒体的短暂发展史就曾出现过火星文、emoji表情等多种通用流行符号,各种群体内部通用的符号、图案、隐语更是层出不穷。在负面的网络舆情事件中,社交媒体用户为了规避可能存在的内容审查,也会迅速形成指代特定事件的新形式语言,赋予形式语言新的意义。
(二)数据质、量问题:内容审查算法意义判断的基础性问题
内容审查算法虽然经常被冠以智能审查之名,但并不能真正和人类一样调动已有知识形成对新事物意义的认识,而是需要通过被动的算法迭代,建立起形式语言与意义之间的新联系进而实现内容监管。目前算法迭代路径主要包括有监督深度学习和无监督深度学习两种,两种路径的共同特征是均高度依赖人类专家提供的海量优质样板数据,[7]而且目前可以用于内容审查算法的样板数据在数量和质量上都存在一定的问题。
从量的角度看,失范内容属于社交媒体平台上的少量内容,内容审查算法不可能像内容推荐算法一样以平台上的全部数据为样板数据,这意味着内容审查算法的数据基础存在“先天不足”。
从质的角度看,有监督深度学习模式下,样板数据质量虽高,但难以满足算法深度学习的量的要求。无监督深度学习模式下,算法可以通过少量的初始样板数据在社交媒体平台的全部内容中寻找相似文本,形成包含较多内容的样板数据库。但由于无监督深度学习的样板数据采集是在算法黑箱中进行的,人工专家无法对无监督深度学习算法的学习对象、学习过程进行完全控制,只能通过算法运行的结果大致了解算法深度学习的水平,算法学习的对象并非真正意义上的样板数据。这就导致了内容审查算法的学习、审查结果并不完全可预期。
相较于内容推荐算法以平台所有内容为样板数据、平台所有用户在使用过程中对算法的意义判断结果做出实时反馈,并建立起了形式语言与意义之间的联系,内容审查算法只会由极少数平台工作人员控制、训练。反馈不足和算法数据基础薄弱使得内容审查算法对形式语言与意义之间关系的认识存在误差是必然的。
(三)功能—期待悖论:内容审查算法的功能问题循环
由于算法训练难以达到理性水平,社交媒体内容审查算法实际上是解读形式符号与失范意义之间关系的一种尝试,其判断结果可能正确也可能存在偏见,判断结果应当被审慎对待。但是,受社交媒体内容审查的行政要求、社交媒体平台发展的成本限制以及对非商业功能相对忽视等多方面因素的影响,内容审查算法最终被赋予了能正确理解形式语言所代表意义的功能期待。而这一功能期待也被应用在社交媒体的传播实践活动中,使内容审查算法拥有了超越其功能效果的审查权力。未通过算法审查的内容将被直接删除或与其他内容去连接化,剥夺了其传播权利。
对内容审查算法审查结果的准确性期待也在进一步影响着内容审查算法的迭代。目前的内容审查算法多数采用无监督深度学习模式,由于内容审查算法的审查结果被默认为是准确的,算法判定的违规内容将作为样板数据的一个部分进入违规内容库,成为内容审查算法的训练素材之一。在技术的放大效应之下,内容审查算法对意义的偏见和误判所造成的影响进一步扩大,导致算法黑箱中存在更多的不可知的内容审查问题。
三、社交媒体内容生态治理的意义治理路径
社交媒体以意义和快感为主要传播对象,内容治理的目标应当是防止失范意义的出现。当前的内容审查算法不能直接对抽象的意义进行直接治理,只能通过形式语言的表征对意义和快感进行间接治理,其治理效果自然有限。鉴于目前的内容治理并未达到理想效果,未来的社交媒体内容审查或许可以跳出当前的算法治理路径,直接对社交媒体内容进行意义治理,以期维护社交媒体良好的内容生态。
(一)对内容审查算法进行合理赋权
算法并不是天然的权力拥有者,算法拥有的审查权力来源于用户为满足平台使用条款要求,放弃并让渡了自身的内容审查权。内容审查算法因汇集了全平台用户的内容审查权而拥有了超高权力,但内容审查算法是当前技术条件下社交媒体内容进行技术治理的一种可能性尝试,算法对意义的判断结果并不绝对正确,赋予算法直接决策的权力明显超出了算法功能可供的范围。公平公正是实现有效治理的基础,当算法不能满足这一要求时,对其权力进行适度的限制使其在合理的范围内容发挥作用是必要的。合理的内容审查算法应用应当类似于内容推荐算法,将算法的判定作为一种可以参考的可能性指标,将更多的决策权力交还用户本身,使用户而非算法成为意义的最终判定者。
(二)以用户为基础实现意义治理
社交媒体的长期实践证明,对社交媒体进行某种程度的管理是必须的。但通过对内容审查算法功能基础、治理逻辑的分析可以发现,当前算法主导的内容治理模式存在严重问题,亟待寻找新的治理可能。社交媒体不仅仅是内容消费平台,更是意义和快感的消费平台,而一切意义、快感都是由用户进行生产和赋予的,因此通过用户实现对社交媒体意义生产与消费的有效治理,比基于形式语言进行内容治理进而实现意义规制更加直接、有效。
目前的内容审查算法主要对内容进行治理,对于用户的治理则相对宽松,少量的失范意義生产行为并不会影响用户的社交媒体使用,用户违规成本较低,也缺乏主动进行意义管理的意识。但是当社交媒体通过友善内容声明等方式要求用户实现文责自负,并提升用户的意义失范成本时,用户就会成为意义管理的第一责任人,将内容治理从平台要求内化为自身责任。
四、结论与讨论
将意义和快感视为社交媒体平台的主要消费品后,内容审查算法广泛应用的合法性基础就不再存在。赋予不具有意义审查功能的算法意义审查的权限,是算法滥用的一种表现。缺乏公平性的算法会导致用户在意义生产过程中不得不做出更多突破内容审查算法的尝试,最终导致更多的意义失范现象。因此突破当前社交媒体的内容治理困境需要尽快修正社交媒体的内容治理标准,保障用户的主体性地位,将用户作为内容治理的第一责任人,使用户、算法、平台在自身的能力范围内各司其职,营造风清气正的社交媒体内容生态圈。
[本文为国家社会科学基金项目“非视听感官美学研究”(17BZW183)]
参考文献:
[1]齐琦.人工智能在线内容审查对言论自由的影响[J].科学咨询(科技·管理),2021(10):101-102.
[2]孙浩,尹晓佳.主观想象与客观事实:社交媒体时代用户内容生产的内在逻辑及其治理研究[J].中国编辑,2022(3):49-54.
[3]Gillespie T.Content moderation,AI,and the question of scale[J].Big Data & Society,2020,7(2):205.
[4]Haimson O L,Delmonaco D,Nie P,et al.Disproportionate removals and differing content moderation experiences for conservative,transgender,and black social media users:Marginalization and moderation gray areas[J].Proceedings of the ACM on Human-Computer Interaction,2021,5(CSCW2):1-35.
[5]Roberts S T.Commercial content moderation:Digital laborers'dirty work[J].2016.
[6]约翰·费斯克.理解大众文化[M].王晓珏,宋伟杰,译.北京:中央编译出版社,2001:33.
[7]徐英瑾.人工智能哲学十五讲[M].北京:北京大学出版社,2021:52.
(李凌霄为首都师范大学文学院2021级博士生;秦勇为首都师范大学文学院教授,博士生导师)
编校:王志昭