算法时代的“信息匮乏”
——基于Facebook“边际排名算法”公式的反思
2018-02-22戚金城
戚金城
2018年初,以“未成年妈妈成网红”“未婚先孕”“侮辱英烈”等为代表的严重侵蚀价值观的社会话题,借助算法推荐在网络世界大肆传播。同年4月,国家广播电视总局针对社会舆论强烈关注的今日头条、快手,约谈了两家网站的主要负责人。虽然相关平台已第一时间清理并道歉,但围绕以今日头条为首的内容管理、算法推荐等方面的争议并未停止。
自20世纪90年代以来,互联网的逐步发展,缔造了一个强大的信息帝国。海量的信息在极大地满足网民搜索需要的同时,也加剧了传播者之间的竞争,即自己的信息能否在庞大的信息库中脱颖而出,成功进入受众的眼睛。于是,互联网从比特形式走向了更为高级的人工智能阶段,而这种技术的本质就是算法。人工智能让新闻生产更加便捷、高效的同时,却因其个性化推荐在海量的信息库中导致了新的信息匮乏。
算法新闻的理念发端于美国,率先在发达国家得到应用。算法,可以解释为用于解决某一特定问题或达成特定目标所采取的一系列步骤,通过算法进行决策依赖于排序、分类、关联、过滤四个步骤。[1]因此,本文根据2010年Facebook f8大会提到的和2018年今日头条前资深产品经理闫泽华在《内容算法:把内容变成价值的效率系统》一书中提到的Facebook“边际排名算法”(Edge Rank Algorithm)核心计算公式,阐释算法如何将受众重新带回信息匮乏的时代。
一、算法新闻的理论缘起
20世纪30-60年代,是算法新闻的理论孕育期:科学家在机器学习、脑科学等领域的探究,为算法新闻准备了理论基础。此阶段的代表性理论研究有英国数学家阿兰·麦席森·图灵(Alan Mathison Turing)提出的辅助数学研究的机器(1937)和判定机器是否具有智能的“图灵测试”(1950)、美国学者麦卡洛克(W.S.McCulloch)和皮茨(W.Pitts)提出的神经元交互理论(1943)、美国心理学家罗森布拉特(Rosenblatt)提出第一个具有完整算法描述的神经网络学习算法(1958)。[2]但是,此阶段的研究并没有投入技术研发,只停留在理论层面。
20世纪70至90年代,是算法新闻的技术探索期。1976年在耶鲁大学诞生的全球首套故事写作机器算法是具有代表性的算法,开启了机器模拟人类写作的先河。21世纪以来,算法新闻的应用越来越成熟,路透社于2006年使用算法为其网站编辑财经新闻,Facebook也在同年推出动态消息。2006年被认为是算法新闻应用推广元年;[3]2009年Facebook推出新的首页、动态消息不再依时间排序,而是通过相关程序筛选好友与专页的大量贴文、照片、故事等动态,目的在于向使用者展示有趣且愿意互动的内容。
二、 Facebook“ 边 际排名算法”
Facebook最初的排序公式,被称为“边际排名算法”。该算法的核心公式为:E=u×w×d。[4]u:指用户与内容发布者之间的亲密分数,互动越高的亲密度分数越高;w:不同反馈动作有不同的权重,反馈动作包括展示、评论、点赞等,比如,评论动作的权重就会显著高于点赞动作;d:基于时间的衰减,越新的内容权重越高。如今,社交软件如新浪微博、推荐引擎产品如今日头条,都能看到Facebook算法公式的影子。
(一)内容呈现掌握在活跃的网民手中
Facebook算法公式的第一个变量为“u”,即与用户互动程度越高的内容越能呈现在该平台上。亲密度和用户动作的引入极大地抑制了大号和营销号刷屏的情况,没有互动的粉丝就只是停留在页面上的一个数字而已,这使得企业账号在获取粉丝之后,必须同时下力气维护自己的粉丝群体。Facebook从个人专页逐渐扩散至Facebook粉丝专页,集结了虚拟社区,达到了社群营销的效果。但是,社群集合是为了共同的目标,而这个共同的目标则可能是对社会不利的。
以2016年的英国脱欧和美国大选为例,有人称之为“谎言的胜利”[5]。“后真相”(posttruth)经过这两个政治事件后被《牛津词典》评选为年度新词。主张脱欧的英国政客约翰逊(Boris Johnson)和特朗普被指责利用民众的偏激情绪,不断发表煽动性言论,曲解事实,制造谣言而赢得大量支持者。受众盲目拥护某个政见或政客,民众对政治事务的认识仅凭自我感受。按照粉丝互动的算法公式,煽动性言论只会甚嚣尘上。
1949年,美国信息学者C.香农和W.韦弗在《传播的数学理论》一文中提出过一个传播过程模式,被称为传播过程的数学模式或香农-韦弗模式。如图所示,由信源发出讯息,再由发射器将讯息转化为可以传送的信号,经过传输,由接收器把接收到的信号还原为讯息,将之传递给信宿。虽然该模式存在缺陷,但他们提出了一个重要的概念——噪音。
噪音并不是狭义的概念,而是指对讯息传送过程的干扰,使得信息产生某种衰减或失真。人工智能时代的算法,正是有一种“噪音算法”的干扰,造成信息传播的失真。这种失真阻碍了普通网民的表达权,新闻、言论就无法真正实现自由,呈现出的内容也会不全面。
(二)内容的“能见度”取决于社交媒体使用行为
Facebook算法公式的第二个影响因素“w”,即反馈动作影响内容的排名:评论动作的权重高于点赞动作。我国周懿瑾等学者针对微信朋友圈使用行为的研究也表明:评论作为组合式的信息,能够承载个性化的内容,发送者能得到接受者进一步的互动及互惠行为,相较于点赞,更能为用户带来社会资本。[6]评论动作对于Facebook核心算法的重要作用便是增加内容的“能见度”(即新闻内容的呈现或遮蔽),让新闻业面临凝聚读者注意力的挑战——媒体不得不让渡过去在“能见度”上的影响力,向算法权力靠拢。[7]
Facebook 2009年推出的新的首页,透过预设筛选好友与专页的大量贴文、照片、故事等动态,目的在于向使用者展示有趣且愿意互动的内容。每当使用者登录时,算法便扫描并搜集使用者过去一周的每位朋友、追踪过的每个人、所属社团中发布的贴文,还有点赞过的每个专页。之后,动态消息便依照贴文的价值程度进行排序。因此,基于Facebook的算法,各大媒体的Facebook账号为了吸引受众评论和点赞,从而增加被受众注意的概率,就必然会投其所好,发布的内容向受众靠拢。这样的“窄播”无可厚非,但长此以往,难免会使受众局限于狭窄的“视界”中,造成互联网时代的信息匮乏。
(三)优质内容湮没在海量信息之中
Facebook核心算法公式的第三个因素是“d”——越新的内容呈现频率越高。从传统的报刊时代到如今的互联网时代,内容的生产和传播速度有了巨大的提高,人人拥有“麦克风”也让互联网上的信息越来越泛滥。但Facebook算法公式中的“d”(时间因素)让不断新产生的内容覆盖在老旧的内容之上,就可能会导致旧有的优质内容被湮没,以至于减少了被受众注意的概率。以特朗普的Facebook账号为例,其频繁更新的贴文覆盖了之前发布的动态,引导Facebook使用者追寻一个又一个新的热点,利用网民的“易忘性”来“冷却”曾经的对自身具有负面影响的热点。
此外,从新闻学原理来看,衡量新闻价值的一个重要标准便是新鲜性,但一味追求速度而忽视新闻的真实性,就会导致越来越多未经求证或蓄意制造的假新闻、反转新闻出现。新闻的生产需要专业记者在采访后编写而成,但假新闻、谣言的产生速度却快得多,并且是普通网民便能制造的。在月活跃用户达10亿的Facebook,造谣者利用谣言的煽动作用,裹挟着网民的强大互动,便能“滚雪球式”地吸引更多网民的关注。
三、对算法新闻的反思及治理建议
Facebook在陷入“半人工”政治偏见风波后也更新了最新的算法,即在最初的三个Edge Rank之外增加新的特征和排序方法,如Story Bumping(对信息进行二次判断,如果判断为重要,则会跳过时间顺序进行展示)。但这种算法公式终究还是在机器的“机械”操作之下进行的。关于对算法(人工智能)的治理,已有诸多研究者从新闻传播伦理、加强人为把关等方面进行过论述,笔者拟从新闻公评人制度对算法新闻的治理提出些许建议。
公评人(Ombudsman)一词最初源于古斯堪的纳维亚语,本来专指调查公务人员舞弊情况的政府官员。公评人制度早先主要运用在欧美国家,新闻公评人则在日本较早尝试:1922年《朝日新闻》任命一个委员会,接受和调查读者对于报纸错误的投诉。[8]新闻公评人的角色定位相当于受众在媒体中的代表,旨在接受和调查公众关于新闻报道准确、公平、平衡以及品位方面的投诉,并向有关部门或人员提供改进建议。这种制度有利于媒体自我监督,加强与受众的联系及与之增进信任,减少政府干预。
学者喻国明等人认为,算法的本质是一种社会权力:信息的传播与控制方式在新媒体时代受到来自技术赋权的挑战。[9]即算法背后的掌控者在操控内容的分发,一旦技术被这种权力操控,就必然为技术背后权力主体的利益服务,信息的封锁、过滤与审查就将通过技术手段来实现。
所以,以Facebook为首的内容分发平台要想不被受众质疑对内容的操控,就有必要在人为把关措施之外实行新闻公评人制度:以受众为主体增加对平台的监督,减少权力的干预,让新闻、言论在社交媒体时代变得更加自由,这也有利于受众破除“信息茧房”。
注释:
[1]方师师.算法机制背后的新闻价值观:围绕“Facebook偏见门”事件的研究[J].新闻记者,2016(9).
[2]吴锋.发达国家“算法新闻”的理论缘起、最新进展及行业影响[J].编辑之友,2018(5).
[3]Tomasula, S. Introduction to focus: machine writing[J]. American Book Review, 2014, 35(2): 3-7.
[4]闫泽华.内容算法:把内容变成价值的效率系统[M].北京:中信出版集团,2018.
[5]刘建明.“后真相”论的执迷与幻觉[J].新闻爱好者,2017(12).
[6]周懿瑾,魏佳纯.“点赞”还是“评论”?社交媒体使用行为对个人社会资本的影响[J].新闻大学,2016(1).
[7]萧维杰.能见度的支配与拼搏:Facebook动态消息演算法权力下的台湾新闻媒体[D].台北:台湾师范大学,2017.
[8]刘学义.大众媒体的自我检视:美、加等国新闻公平人制度探微[J].西南民族大学学报(人文社科版),2010(3).
[9]喻国明,杨莹莹,闫巧妹.算法即权力:算法范式在新闻传播中的权力革命[J].编辑之友,2018(5).