APP下载

智媒研究的“算法”是个伪概念

2021-04-16刘建明

新闻爱好者 2021年3期
关键词:算法

【摘要】近些年,我国新闻传播学界某些误译、误用西方传播学概念的现象,直接干扰了学界的正常学术思维。频繁使用“算法”,曲解智媒数据运算程序的规则,遮掩了智媒制作和输出信息的机制。不了解西方新概念产生的背景,广泛使用“新闻生产”“内容生产”,又落入西方话语骗局的圈套,显露出种种“文盲”话语的憨态。

【关键词】算法的误用;智媒的计算程序;智媒的新闻生成

近几年智媒研究成为热点,频频出现“媒体算法”“新闻算法”“推荐算法”等概念。当学界着魔于“算法”这一术语,迷迷叨叨说些连自己都不懂的高科技,本文提出“算法”是个伪概念,无异于引爆一颗诱人的新概念炸弹,可能遭致四面八方的嘲讽。须知,外文词语含义的直译,往往不能表达原词的意旨,“算法”无法切中algorithms的原意。信息传播与“算法”搭配,把含义深藏起来,多数人不知道媒体在背后算什么、怎么算,神秘的论说好像晃晃悠悠地在迷雾中蹒跚。弄清智媒深处的“算法”究竟是什么意思,以及如何表达“算法”,达到中英传播学概念的准确互译,需要学界同仁携手共思,相互切磋。

一、媒体“算法”一词的误译与误用

为说明“算法”一词的误译和误用,本文以美国学者史迪·戴维斯(Ste Davies)的论文“Decoding the social media algorithms in 2020”的中译文本为例,说明信息传播同“算法”直接搭配的龃龉。这篇中译文本选自微信公众号“ID:TencentMRI”①,译文的题目是《全球主流社交媒体算法大解析》。

译文开头说,“当下,算法已经成为我们日常生活的核心。当你使用网络搜索引擎,滚动浏览社交媒体,或者从Spotify上接收歌曲推荐时,实际上你正被算法指导,算法甚至可能比你本人更了解你的消费习惯”。这里的意思是,我们在社交媒体上搜索或选择我们需要的信息时,算法指导我们的搜索或选择。顾名思义,“算法”就是计算方法的简说,可是,究竟是受众还是社交媒体用算法指导人们寻找或浏览信息?如果是社交媒体,它的算法是什么呢?是如何计算受众需要多少信息,还是计算有多少源头给受众提供信息?上文显然没有说清楚。“算法”总是和一定数量相联系在一起,受众要阅读或收听某条信息或某首歌曲,直接需要的是点击或搜索,而不是“算法”。媒体给受众提供信息,首先要通过信息输入输出程序,也不是“算法”。大量生活内容不是在算什么,“算法”怎么能是“人们日常生活的核心”呢?!根本说不通。

译文继续说:“无论是在Google上搜索,还是在Facebook和Twitter上滚动浏览,呈现新闻和信息的方式均来自一个数学方程式,基于以下两个因素:(1)算法质量——内容的质量标准;(2)历史记录——过去你对特定内容所做的动作和反应。这意味着无论是被设计的还是个人选择,社交媒体算法都使我们能够创建过滤器,查看所需内容,并删除所有我们不需要的内容。”这几句话让人确信,媒体运用算法过滤和向受众推荐信息,来自一个数学方程式。但实际上,受众需要的信息是由社会各领域的人发到网上去的,或由智能媒体自动链接或由媒体人员编写的,不是由某个数学方程式提供的。任何数学方程式都不能凭空制作和编辑信息。智能媒体过滤或删除信息,直接借助的是服务器的计算程序,数学方程式只是构成这种程序的手段。数学方程式作为编程语言,编程完成后,计算程序经过信息排序、过滤、递归、协同或对号,自动向用户传送信息。

在译文几个关键段落,作者否定了“算法”的重要性,因为“算法”不是智媒传播信息的直接路径,而仅仅是一种方法。这几段译文如下:“本文并不打算列出算法内部的确切的计算原理,而是将重点放在囊括当前主流社交媒体算法的主要特点……它们更多地是展示某些决定性问题,而不是算法方程式。”这几句话说到了关键,抓住了问题的根本,即智媒传播信息的“决定性问题不是算法方程式”。译文接著写道:“社交媒体尤其是Facebook,开始把自己定位为新闻发布的渠道。随着越来越多的人开始通过他们接收新闻,Facebook改变了自己的算法以适应这种变化,新闻出版机构致力于在这些平台上扩大受众,并越来越多地制作简短有趣又可共享的内容。”“所有的平台都将优先展示自己平台上的原创内容,而不是第三方链接。在2018年,‘搜索超过了‘社交,自2015年以来首次成为社交网站上新闻网站的更大引荐来源。”“与用户相关的生活内容才是王道,生活内容改变了社交媒体的格局,而新闻信息流遭受重击。消费者最想看到的内容是他们的朋友、家人和KOL网红们在Instagram、Snapchat和Facebook上发布的短内容。”这说明,算法已不那么重要,重要的是“‘搜索超过了‘社交”“原创内容超过链接”“内容才是王道,重要的不是算法”。

以上引用的文字足以说明,“算法”在西方社交媒体上正在发生变化,不再是智媒“决定性的问题”。社交媒体的决定性问题是把自己定位为新闻发布渠道,给用户提供简短、有趣和原创性内容,向用户推荐他们喜欢的个性化定制信息。用户需求信息也不再等待媒体的分发和推荐,而是自行搜索和选择与他们的生活相关的内容。这样一来,直接发挥作用的不再是“算法”,而是智媒运行的一整套计算规则。没有搞清智媒信息程序的机理,热衷于研讨“算法”在智媒信息传播中的突出作用,实际是打偏了“靶子”。

二、Algorithm的内涵与用于智媒的含义

作为社会科学的新闻传播学,探讨智能媒体的深奥技术问题,已经超出本身的研究对象。没有深厚的计算机专业知识,想要精确阐述“算法”在信息传播中的应用和作用,不能不偏离智媒的技术原理。新闻传播学研究的是信息传播的社会知识和定律,不是探讨电子技术和电脑程序问题,渲染“算法”神秘作用的文章不可避免地会出现指向错误,把社会属性硬塞给微电子的技术细节。Algorithm的英文原意是指,计算机程序中的数据统计与契合法则,简称数据计算法则。算法不等于计算,更不等于数据的统合程序。然而,大量研究智能媒体的论文却把二者混为一谈,许多陈述屡屡出现佶屈聱牙之处。下面从《什么是推荐算法?新闻推荐算法对新闻媒体意味着什么?》②一文中摘录五段话,反思“算法”这一概念的使用究竟错在哪里。

(1)作为新闻业在数字环境下“后台前置”的下一个阶段——“把关后移”的主体,平台媒体(platisher)的新闻推送业务大多基于用户的使用习惯,通过算法预测用户感兴趣的信息和话题,再将其推送给用户。

(2)在国内资讯信息分发市场上,算法推送的内容已经超过了50%;路透新闻研究院的调查显示,虽然对于算法推送新闻确实存在算法审查(Algorithmic Censorship)、平台偏向(platform bias)、信息茧房(information cocoons)以及回音壁(echo chamber)的担心,但人们尤其是年轻人,更加愿意使用和相信根据算法生成和推送的内容。

(3)无论是4月刚获得10亿美元D轮融资的今日头条,还是上线不到两年就跻身资讯应用前三名的天天快报,抑或一点资讯、网易号、百家号等各自圈地的新产品,都无一不强调自己的技术属性和渠道分发优势,算法面前,内容为王的声音似乎小了许多。

(4)推荐算法主要分为6种:基于内容推荐、协同过滤推荐、基于规则推荐、基于效用推荐、基于知识推荐和组合推荐,本文选取两种常用的介绍。

(5)把权力讓给算法,让算法来识别人们的喜好,推荐人们可能感兴趣的内容。

读完这五段话,刷成黑体的词语让人如坠迷雾,懵懵懂懂不知何意。再读一遍,一个字一个字推敲,发现这些黑体词语不仅晦涩破裂,而且拙言害意之处有明显的伤痕。比如,第一段话中的“后台前置”“把关后移”究竟何意?通篇没有解释,断言突语让人摸不着头脑。由此引申出来的下句话——“通过算法预测用户感兴趣的信息和话题,再将其推送给用户”——仍是前言不搭后语。“算法”即“计算方法”能“预测”吗?“算法”只能用于计算,不能预测或说明什么。合乎逻辑的说法是“通过计算预测用户感兴趣的信息和话题”,语义才表达得清晰和顺畅。同样,“算法与推送”词义也不搭配,应改为“计算推送”或“通过计算程序推送”。还有,“算法面前”应改为“在计算程序面前”,“把权力让给算法”也应改为“把权力让给计算程序”。第(4)段话,“推荐算法主要分为6种”,先后列出的“内容推荐、协同过滤推荐、基于规则推荐、基于效用推荐、基于知识推荐和组合推荐”,恰恰不是“算法”推荐。内容推荐是算法推荐吗?基于规则推荐能说是算法推荐吗?这六种都是依据何种方法的推荐,或者说是什么类型的推荐,参与其中的是数据统计,而不是“算法”。

为什么大量研究智媒的文章都把“算法”用于其中,高频率地使用“算法”论证智媒服务器是“解决数学问题的一种程序”[1]呢?原因是,研究者根本没有搞清楚Algorithm一词的含义。查阅《韦氏大词典》(Merriam-Webster),该词的本义及转义一目了然。该词典的解释是:Algorithm“常用于机器(尤其是计算机)为达到特定目标所遵循的多种规则,它并不总是适用于以计算机为媒介的活动。这个术语像制作披萨饼或解决魔方一样,用于计算数据的步骤。”该词典最后做出的归纳是:Algorithm是“为解决数学问题或完成计算机程序而遵循的一组步骤”[2]。由此判断,Algorithm在汉语中译成“计算步骤”“计算程序”或“自动推理”才能说得通,将其简译为“计算”要比“算法”更贴近“数据运算程序”的含义,也更能和说话者表达的语境吻合。《大不列颠百科全书》(The Encyclopaedia Britannica)给Algorithm下的定义更为通俗,即“在限定的步骤中对一个问题给出的答案或解决一个问题方案的系统过程”,将其译为“算法”似乎隔着一层皮,没有抓住它的要义。

智媒借助服务器的数据库推荐新闻,通过数据计算步骤给用户提供信息,不是由算法直接完成的。有篇文章说:“简单来说,算法就是用来决定‘把量分给谁。两个人都来买我的广告,那我卖给谁?‘谁给的钱多卖给谁就是一种算法。”[3]“谁给的钱多”明明是“计算”出来的,而不是“算法”出来的,这个十分明显的逻辑破绽无须多动脑筋就看得一清二楚。正如百度上《算法(Algorithm)》这篇博文所说:“算法中的指令描述的是一个计算,当其运行时能从一个初始状态和(可能为空的)初始输入开始,经过一系列有限而清晰定义的状态,最终产生输出并停止于一个终态。”③网络信息从一个状态到另一个状态的转移和传播,送到一个需要它的用户,都是通过数据的计算程序完成的,计算是智能媒体运作的核心,而不是“算法”。

做任何事情都需要一步步来完成,智媒体的信息推荐也是由数据一步步计算和统合(统计、归纳、整合)实现的,把Algorithm简译为“步骤”也许是更为通俗的说法。为了证明这个译词有足够的理由,本文把美国可汗学院(Khan Academy)和教育网站从2016年至2020年不定期连载的科普文章《什么是Algorithm,你为什么要关心它》的三段文字摘译如下:“你可能有一个从家到学校的Algorithm,一个制作烤奶酪三明治的Algorithm,或者一个在杂货店寻找你想要的东西的Algorithm。在计算机科学中,Algorithm是计算机程序完成一项任务的一系列步骤。”[4]

把引文中的所有“Algorithm”替换为“程序”或“步骤”,读起来文从字顺,假如换成“算法”,听者或读者的思路就要添堵。当你说“你可能有一个从家到学校的算法”“有一个制作烤奶酪三明治的算法”,你的脑子一定出了毛病。Algorithm在什么情况下译成“计算”“程序”或“步骤”,要看具体的语境。即使非要译成“算法”,也要同具体语境相吻合。然而,我们看到的有关智媒体研究的大量文章,把Algorithm一律译为“算法”,这种似是而非、不求甚解的翻译使学术的精准性遭到啮蚀。

三、学术引进的病态:“新闻生产”话语的误用

把外语论文中的概念译成中文是学术引进的基础性环节,概念翻译得准确与否,决定其观点及论证让人理解得是否正确。正如前述,把Algorithm译成算法还是计算或程序,关系到对智媒运算机理的科学认识。这是借鉴外来学术的要害问题。当前,我国的媒体与传播学研究大量引进西方的知识与观念,不能小觑概念的翻译问题。事实上,我国新闻与传播学界使用的西方概念已经出现一些语误,产生的逻辑混乱严重影响了人们的正常思维,“新闻生产”就是另一个被广泛误用的“伪概念”。假如我们提出“汽车腿”“相声生产”或“戏曲车间”的概念,所有正常的人都会认为十分荒唐,而且愚不可及。因为汽车没有腿,相声不是生产出来的也不可能生产,至于戏曲无论是创作还是表演,都不会有专门的车间。在新闻传播学中使用类似的伪概念则习以为常,大量照葫芦画瓢、直译西方的概念,给我们的母语造成了严重的伤害。

新闻传播学论文除了频繁出现“新闻生产”外,“内容生产”“新闻意义的生产”“新闻价值生產”也被学术刊物经常使用。[5]但在别的学科,这种亦步亦趋、踩着西方脚印走的现象很少见到,即使有,也没有达到如此食而不化的程度。我们见到过“歌曲生产”“理论生产”“电视生产”“网络生产”的说法吗?没有。稍有文化的人绝不会使用这类“文辞错乱”的概念。“新闻生产”或“内容生产”完全是“文盲”话语,显露出一副目不识丁的憨态。可能有人质疑,西方学术论著使用的就是“生产”(production/product)这个词,这是照原词翻译过来的,岂有可挑剔之处?!如果我们注意翻译过来的英语国家的电影,片尾的电影制片厂production,从来没有译成电影制片厂“生产”,而是译为电影制片厂“出品”,中国电影制片厂“译制”,这才是符合汉语习惯的准确译法。

只知道production/product的“生产”含义,不知道它的全部内涵和确切意思,简单地将其译为“新闻生产”“内容生产”,是缺乏翻译知识与技巧的结果。《剑桥英语词典》把product、production(动词为produce)解释为:“通过工业过程或农业种植获得的东西。”“可引申为产品、产物、结果、制造、提供、产生、生成,影视作品的录制”。《牛津高级美国英语词典》对product、production的解释是:“种植或制作食物、货物或材料的过程,尤指大量种植小麦或生产石油、汽车等货物或材料。”“也可指电影、戏剧和音乐作品的制作”。面对production的多种含义,英美人说news production并不是指像制造物质产品那样的“新闻生产”,而是指新闻制作或智能新闻的生成。2008年比利时根特大学教授汤姆·范·霍特和吉尔特·雅各布斯(Tom Van Hout and Geert Jacobs)发表在《语用学》杂志上的“News production theory and practice”[6]一文,对“News production”的本意作出的确切说明是:“微电子自动化技术(AMT)生成新闻的过程。”这一解释基本符合《剑桥英语词典》和《牛津高级美国英语词典》对prodution一词的释义,即新闻是由机器生成和制作的,不是由记者、编辑写出来的。

在马克思主义看来,生产“不仅使自然物发生形式变化,还在自然物中实现自己的目的”[7];“生产本身又有两种。一方面是生活资料即食物、衣服、住房以及为此所必需的工具的生产;另一方面是人类自身的生产,即种的蕃衍”[8]。自然物(原料)经过工具(机器)加工改变了形态,产出有使用价值的物品,才叫做“生产”。无论文学作品还是新闻,通过反映事物的过程和结果完成的是无形的精神生产,不是对物质材料的加工和制造,没有物质产品的构型,因而不能使用“新闻生产”或“内容生产”之类的概念。《现代汉语词典》把“生产”界定为“人们使用工具创造各种生产资料和生活资料”,《辞海》对“生产”的注释同样是:“以一定的生产关系联系起来的人们,利用生产工具改变劳动对象以适合自己需要的过程。”[9]在中外语言中,“生产”(production)都是指制造或制作实物,[10]其产品有形状、有质地,是能够拿起来放得下的物品。

在英美,“News production”这一概念的出现,恰恰是在计算机发明制作新闻的时期。美国学者姆·考克斯(M.Cox)证明,20世纪60年代电脑在某些报社使用时,有些记者开始使用电脑辅助报道(computer

assisted reporting,CAR)来完成新闻工作。[11]1979年,拉图尔(Latour)、布鲁诺(Bruno)、拉蒂夫·伍尔加(Steve Woolgar)和帕拉西(Parasie)等调查记者、计算机辅助记者和编程记者在实验室经过19个月的反复研究,展示了电脑能够把人的信念写进一篇新闻稿中,尽管经过多次失败,最终让计算机能把人的认识和对事件的描述通过数据记录在物质的东西上(硬盘、U盘)。[12]1989年,美国新闻学者迈克尔·舒德森(Michael Schudson)发表了论文《新闻生产的社会学》(The sociology of news prodution),刊登在当年《文化与科学》杂志第3卷上。1998年,计算机程序员Lee和Kim创建了机器人“新闻点播”(News On Demand,NOD),使用机器人收集每日新闻,并向用户提供综合新闻提要。[13]2010年,美国西北大学计算机研究员克里斯·哈门德(Kristian Hammond)和拉里·伯恩鲍姆(Larry Birnbaum)在实验室基于人工智能开创了“羽毛笔叙事科学”,服务器根据数据能够快速描述事件和陈述观点,以二进制数码形式附着在服务器和电脑的硬盘上。[14]新闻开始被机器制作出来,这就是西方使用“News production”的真正含义。

“新闻”被计算机(智能媒体)生成,在英美有多种称谓,自动化新闻(Automated journalism)、机器人新闻(robot journalism,)、人工智能新闻(A.I.journalism)或数据驱动新闻(data-driven journalism),这些都强调是智能机器制作出来的,具有物质生产的一般特征,“News production”在英语中才被广泛使用。2006年,汤姆森路透社用计算机在0.3秒钟内就写出了一篇公司财务新闻[15],2014年5月英国《卫报》的每一期,都用“机器人”率先报道热点新闻。美联社的WordSmith(文字匠)在2013年产生了3亿篇各类新闻,平均每秒钟写出9.5篇。[16]把“News production”准确译成汉语,只能是“新闻制作”或“新闻的智能生成”。不考虑概念的深层内涵和语境,滥用“新闻生产”“内容生产”,轻点说是语用出了毛病,严格说是缺少语言背景知识,客观上是在鼓吹编造新闻、愚弄受众。

2008年,智能媒体普遍生成新闻之前,美国少数学者把“News production”(新闻生产)主要用于媒介经济学和媒介社会学,视其为“制造新闻”的同义词。正如迈克尔·舒德森所说:新闻生产“是一个宣传模型,是独裁者和玩弄权术的出版商、利己的记者精英设计的想法或计划,从媒体的字里行间映射出来,周而复始而令人生厌地不停喧嚣,直到最后它深入人心并使公众遵循其道”[17]。约翰·麦克马纳斯写道:“获取最大化利润的商业目标主导着新闻生产,以至于理性运作的新闻部门必须照此行事,市场逻辑指导着新闻生产的例行程序。”“掌握权力的利益各方希望隐瞒一些事件,突出对他们有利的事件,进而制造新闻,以影响公共议程。”④我国的新闻学术刊物忽视西方使用“新闻生产”的真正含义,没有意识到它包含“制造新闻”的贬义,不知不觉地落入西方语义骗局的圈套。

注 释:

①Ste Davies:《全球主流社交媒体算法大解析》,虎嗅App,2020-11-01。

②引自《什么是推荐算法?新闻推荐算法对新闻媒体意味着什么?》,电子发烧友网,2018-03-02。

③《算法(Algorithm)》,CSDN技术社区,2016-11-10。

④McManus,J.Market Driven Journalism:Let the Citizen Beware?London: Sage,108,1994.参见(美)约翰·麦克马纳斯:《市场新闻业:公民自行小心》,新华出版社,2004年版。

参考文献:

[1]Definition of algorithm[EB/OL].https://www.merriam-webster.com/dictionary/algorithm.

[2]Other Words from algorithm[EB/OL].https://www.merriam-webster.com/dictionary/algorithm.

[3]宁阿姨.从媒体角度聊聊广告流量分配[EB/OL].https://mp.weixin.qq.com/s/BwCjrBs3tEMp4YzzoyAJvQ.

[4]What is an algorithm and why should you care? Khan Academy,Oct 09, 2016—May 07,2020.

[5]劉建明.新闻的意义是生产出来的吗?[J].新闻爱好者,2017(6):8-12.

[6]Tom Van Hout and Geert Jacobs,News production theory and practice, Pragmatics 18:1.59-85,2008.

[7]马克思.资本论:第1卷[M].北京:人民出版社,1975:202.

[8]恩格斯.家庭、私有制和国家的起源:序言[M]//马克思恩格斯选集:第4卷,北京:人民出版社,2012.

[9]现代汉语词典[M].北京:商务印书馆,2006:1217;辞海[M].上海:上海辞书出版社,2002:1494.

[10]牛津高级英汉双解词典[M].北京:商务印书馆,2005:1369,1370.

[11]Cox M,The development of computer-assisted reporting.In:Proceedings of the Newspaper Division of the Association for Education in Journalism and Mass Communications Southeast Colloquium,Chapel Hill,NC,17–18 March,2000.

[12]Latour,Bruno,and Steve Woolgar,Laboratory Life.the Construction of Scientific Facts. Princeton,NJ: Princeton University Press,81,1979.

[13]Lee,S.M.and Kim,T.Y.(1998)A news on demand service system based on robot agent.Proceedings of the 1998 International Conference on Parallel and Distributed Systems (pp.528–532).

[14]N.L,Latar,Robot Journalism:Can Human Journalism Survive?World Scientific Publishing Co Pte Ltd,87,2018.

[15]Momus,Robots Wrote This[EB/OL].http://archive.wired.com/culture/lifestyle/commentary/imomus,08/07/2006.

[16]刘建明.对智能新闻若干问题的释疑[J].新闻爱好者,2017(11):4-8.

[17]Schudson,M.The Sociology of News,New York:Norton & Company Incorporated,23,2003.

(作者为清华大学新闻与传播学院教授)

编校:董方晓

猜你喜欢

算法
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
进位加法的两种算法
基于CC2530的改进TPSN算法
基于BCH和HOG的Mean Shift跟踪算法
基于增强随机搜索的OECI-ELM算法
一种改进的整周模糊度去相关算法
一种抗CPS控制层欺骗攻击的算法
Wiener核的快速提取算法
带跳的非线性随机延迟微分方程的Split-step算法