从Facebook隐私泄露事件看新闻算法影响公众意见的机制
2018-10-21王玉山
王玉山
摘要:Facebook泄露隐私事件让人们将目光重新回到了2016年美国大选。由于人们对于算法的影响仍然察觉不足,算法机制下的新闻对人们似乎有着“皮下注射”般的效果。为了规制这样日趋成熟且影响巨大的算法,人们可以考虑从市场、法律、架构和准则四个维度入手。
关键词:互联网;新闻;意见;美国大选;Facebook;议程设置
2016年特朗普当选美国总统的结果出乎了许多人的意料,从传统的理论出发来看,媒介议程能够影响公众议程。而在2016年的美国大选中,却出现了媒介议程与公众议程的极大差异。大选中,主流媒体的声音似乎一直在调侃特朗普,支持希拉里,而由它们塑造的公众意见气候以及广大调查公司侦测到的意见气候,也是以支持希拉里为多数的。而从最后的结果来看,公众的真实的意见却支持特朗普。这一被称为“特朗普现象”的事实显示,不仅媒介议程被改变了,连传统的感知意见气候的方式都已经过时。传统媒体与互联网媒体之间、精英的意见与大众的意见之间,形成了一种割裂。
矛盾背后的原因,可能是公众意见气候与公众意见本身就存在着差异,可能是议程设置的理论在这个新的时代已经不再适用,而直到2018年初Facebook泄露用户信息的丑闻曝出,人们才开始将目光移到技术的角度。本文试图从技术角度出发,探究新技术背景下,媒体是如何影响公众意见的。
一、互联网技术背景下的媒体
对比从前和现在的媒体,不难发现,之前的理论框架下的媒体和现在的媒体已经有了巨大的差异,抛开电视、报纸、广播等传统媒体本身的变化,互联网作为媒体出现,其本质与传统媒体有着巨大的区别。人们似乎直到现在才开始意识到,互联网在影响人们的想法上的巨大的威力。尤其是当人们试图通过改变媒体议程来影响公众议程的时候。
互联网作为媒体,其体量已经超过了所有的传统媒体。人们无法用一个单独的、割裂的眼光来看待互联网,因为其内容的丰富使其又不仅仅是一个媒体。互联网既是新闻的载体,又是人们接触新闻的场景。人们习惯于在浏览信息、上社交网络甚至娱乐互动时接触到一条一条传统定义中的新闻。在互联网上,人们通常会忽略新闻本身的新闻特点,而直接将其归于信息流之中。
互联网是技术主导的、没有完整行业规范的媒体。区别于人们早已认识到其威力并制定了完整的行业规范和伦理的传统新闻行业,互联网作为媒体仍处在野蛮生长的阶段。互联网的规则是“流量为王”,传统的新闻伦理没有办法限制到本来与新闻行业相差甚远的非新闻专业出身的互联网媒体人。在法律和硬性规定以内的所有手段都可以被使用才是互联网的逻辑。
互联网是其他媒体的内容表现平台,与大部分其他媒体共享同一内容库。不同于传统媒体之间区别的主要方式是内容形式,互联网的极大包容性允许任何新闻以任何形式呈现,并且成为传统媒体必须争抢的主要用户渠道。尽管仍有不少媒体拒绝互联网的渠道和分享,但用户的流失让拥抱互联网、共享内容成为大多数媒体继续生存的仅有途径。
对比作为媒体的互联网与传统媒体,不难发现,互联网与传统媒体共享记者、内容库,但却比传统媒体有着更广大的受众。当然,决定用户究竟从互联网和传统媒体上获得什么信息的关键,则是编辑。区别于传统媒体的以人为主的编辑室机制,以技术为主导的互联网则发展出来了新的编辑机制。
二、以算法为主导的新互联网编辑机制
算法最开始是一个纯技术术语,其本意指通过代码编程,使计算机实现人们所需要的内容。其内核在于,用系统的方法描述解决问题的一个机制。在计算机学科内,通过简单的“输入-计算-输出”结构解决大多数问题,而算法就是其中计算过程的一个具体过程。而在现实的使用中,一般指代以用户个体特征为基础的新闻推荐算法机制。互联网算法的内核是收集用户信息、比对用户行为,在此基础上直接推荐内容。用户在上网时的每一次点击、每一条评论、每个页面停留的时间、使用的网络(Wi-Fi 还是移动数据)、手机机型都将被系统收集起来,随后算法会利用这些收集到的数据构成一个多维的数据矩阵,并以此刻画出属于这一用户的“用户画像”。在确定了用户的特征之后,算法就可以基于此向用户推荐他可能感兴趣的内容。也就是说,算法和“用户画像”在互联网新闻中取代了传统媒体的编辑工作,由来源于用户本身的信息所显示的用户兴趣来决定用户自己读什么。
通过算法推荐的新闻产品与传统媒体所呈现的新闻产品有着相同的内容源、记者、新闻稿库,区别就在于编辑的不一样。这样的区别决定了最终出现在受众眼前的内容的不一样。毕竟,受众的精力是有限的,有限的精力和阅读意愿被编辑所引导,最终出现在受众眼前的文章与编辑的关系甚大。传播学者已经反复证明了人们的观点与所读文章的相关性,所以我们可以推测,并非议程设置的理论在新环境下已经不适用了,而是在新技术条件下,人们所接触到的媒介议程已经个体化、区别化了。在“千人千面”的媒体议程下,人们需要与新技术结合来重新看待媒介议程和意见气候的关系。
而Facebook隐私泄露的丑闻则告诉了我们,现在的互联网公司是如何使用用户数据和算法,来为用户进行新闻推荐的。3月18日,《卫报》的报道证明,在美国,Facebook干预了大选结果。一家名为剑桥分析(Cambridge Analytica)的数据公司窃取了5000万Facebook用户资料,根据每个用户的日常喜好、性格特点、教育水平,预测他们的政治倾向,进行新闻的精准推送,达到洗脑的目的,间接促成了特朗普的当选。该公司的主要业务是运用大数据挖掘和心理侧写(Psychological profiling)等技术手段,提供信息精准投放服务。CA 公司将美国人口分为 32 种人格类型并且仅关注 17 个州。通过这种方法 CA 公司发现了诸如喜欢美国汽车的人民更有可能支持特朗普这样的性格倾向。同时这类信息又很好地提示了何种信息在何处能够发挥最大的效果。
尽管报道中欠缺对于技术直接影响意见的证明,但通过隐私信息和算法,为民众推荐既符合其行为爱好又具备政策、意见、选举倾向的新闻的做法,是完全可行的。也就是说,如果传统的议程设置理论的机制在今天没有出现太大偏差,那么这样一个通过技术设置个人专属的议程来影响公众意见的逻辑也是完全说得通的。这样的推测似乎让传播学重新回到了强效果理论的时期,人们对于新技术的抵抗力近乎为零,影响公众的意见如发射子弹和皮下注射般轻松写意。
三、对于算法的规制
毋庸置疑,算法对于互联网出现后的传媒的影响是巨大的,其出现在公众的视域中的方式却是十分负面的。正如新闻业在不断的规制中成熟一样,如果不开始对算法进行限制,类似于Facebook泄露隐私的事件必然会不断重演。关于如何规制算法,在网络世界刚出现时,莱斯格在著作《代码2.0:网络空间中的法律》一书中就探讨过规制网络世界的四个基本元素:市场、法律、架构和准则。
目前,市场是影响算法相关产品的最成熟的一环。事实上,正是市场这一元素,让互联网公司和算法的野蛮生长和所谓“技术中立”的说辞有了意义。“技术中立”正是价值不中立的绝佳掩饰,这并不是对于互联网公司的贬斥,而是正常的自由主义市场下必然出现的结果。因为网络空间一直以来的技术导向,让人们忽略了它背后的价值觀。一直到2016年12月21日,扎克伯格才终于改口,认为“Facebook”不是一家传统媒体公司。“我们构建技术,我们对它的使用负责。”显然,互联网世界并非只有市场说了算。
在代码层面,莱斯格认为代码的透明度是很重要的部分,中国社科院新闻与传播研究所副研究员季芳芳的研究中同样有所提及。新闻媒体中的算法透明度,是公开算法机制相关信息的尝试。算法信息的披露,有利于公众知晓算法可能存在的价值观导向。算法的透明度虽然会对用户体验产生不良影响,但当受众对特定推荐进行选择时,也增加了对算法质量的认可。公开透明的算法是代码层面解决问题的路径之一,但并非唯一路径。在技术层面上,开发外向性的研究推荐算法来减少信息茧房的形成,在算法推荐的基础上加入人工推荐的元素等方式也都是可行的。
准则强调的是个人参与、素质以及社会认知。在准则层面对算法进行规制,个人的媒介素养是重要的一环。人们目前对于网络媒介的使用习惯、信任程度无疑是让算法由工具成为操纵者的主要原因之一。提高使用者的自主程度,改变使用习惯,是我们每个人可以完成的对抗算法的影响的行为。