APP下载

网络时代的“人工”与“智能”
——从“黑天鹅事件”看编辑工作的人机角力

2021-11-28□刘

记者摇篮 2021年3期
关键词:黑天鹅人工算法

□刘 敏

当前,公众获取信息不再仅依赖于主流大众媒体,智能端的新闻聚合平台也成为信息传播的重要渠道。以往“技术乐观主义”氛围把持着绝对话语权,学界热议技术如何给编辑工作带来高效助力乃至深刻变革,即使对其有所反思,也往往聚焦于隐私风险问题。然而,隐私风险问题却是能够在法律和技术框架内得到适当解决的。其实,“技术乐观主义”的“七寸”并不在于常态化的新闻报道,而在于代表机器智能的算法推送无法应对“黑天鹅事件”的报道。

一、“黑天鹅事件”的内涵及特点

“黑天鹅”曾是欧洲人言谈与写作中的惯用语,用来指代不可能存在的事物。他们认为天鹅都是白色的(后来这个不可动摇的信念随着在澳大利亚发现第一只黑天鹅而崩溃),黑天鹅的存在寓意着不可预测的重大稀有事件,它在意料之外,却又改变一切。希腊学者亚里士多德用“黑天鹅”来表达“不可能”,随着“不可能”事件越来越多,人们对“黑天鹅”的关注也愈发强烈。虽然各方学者在文字表述上有所差异,但对“黑天鹅事件”的本质特征他们几乎达成了共识——通常是指不可提前预测、出乎事前对事件有关知识的掌握范围,并带来极端后果的低概率事件。具体而言,其有如下特征:

第一,偶发性。“黑天鹅事件”以稀少作为它的第一特征,因为稀少所以不容易被重视。正如极端天气少见,人们自然不会在风和日丽的晴天担忧暴雪降临。

第二,难预测。“黑天鹅事件”可能发生在各个领域、以不同的方式呈现,而在它发生之前人们往往对其一无所知。也许它已释放了短暂而微弱的信号,但人们受认知的限制而难以将其捕捉。

第三,严重性。由于“黑天鹅事件”的发生打破了人们现有的认知,人们对于如何应对和处理此类事件面临诸多挑战,很多时候无法阻挡它带来严重后果。

二、缺陷与失灵——“黑天鹅事件”报道中的算法推荐

“黑天鹅事件”本身就属于偶然性事件,它的报道也有特殊性。正因如此,算法面对“黑天鹅事件”的反应明显不如其日常推送那样令人满意。

1.缺乏“黑天鹅事件”的样本和数据

数据是算法的灵魂,但“黑天鹅事件”并不具备这个灵魂,这就使得算法无法通过对“黑天鹅事件”数据的处理来实现很好的推送效果。自2016年成为算法编辑内容超越人工编辑内容的拐点之年以来,各媒体对算法愈发重视。新闻业目前较为盛行的几种算法尽管在取向偏好和数据处理方式上有所差异,但它们对数据的绝对依赖是相同的。以算法新闻的核心——自然语言生成系统(NLG)为例,它有输入、处理和输出三个内部处理机制,其中处理是整个过程的核心,而输入则是整个过程的立足点,输入的过程也就是数据挖掘和数据收集的过程。当所需的数据无法得到满足时,算法系统的处理结果往往会事与愿违,例如当用户活跃度不同导致用户历史记录的数据不足时,那些不太活跃的用户可能很难得到精准的相似度匹配。“黑天鹅事件”本身就超出了人类的认知范围,因此人类对于此类事件的数据掌握也是十分匮乏的,算法就更不可能提前获得任何数据进行算法模型的训练。

2.无法对作为“极值”的偶然性事件作出有效应答

新闻业现行的几种算法虽对于数据取向的侧重点有所不同,但本质上都是采用针对某对象分类聚合的方式实现的,即聚类分析。聚类分析最为核心的步骤为“聚类和分组”,实质上与我们常说的“个性化分类”是一致的。在聚类的过程中要对大量数据进行符合算法逻辑的归类和再分发,其结果是筛掉了作为“极值”的极端个例,保留了样本充足、具有诸多共同特征的“均值”个体。“黑天鹅事件”无法作为“均值”纳入个性化推送系统,因为“黑天鹅事件”本身就是极端个例,采纳作为偶然性事件的“极值”进入算法系统会干扰“聚类”步骤的推进,算法尚未聪明到能够对“黑天鹅事件”产生正确有效的认知。一方面,“黑天鹅事件”缺乏历史数据,包括用来界定“黑天鹅事件”的数据和用户偏好数据;另一方面,“黑天鹅事件”即便以某种数据形式进入了算法系统的处理层,也会因为无法实现匹配和对接而被搁置。

3.算法“常识”缺失营造技术黑箱

算法在提升效率、解放人力方面的优势不可抹杀,但算法营造的“技术黑箱”亦备受诟病。一般而言,算法推送的传播过程由信息的正向传播和误差反向传播过程组成,其间的误差反向传播过程可以理解为机器内部的自我反馈与修正。

事实上,这种自我反馈与修正的能力是十分有限的,它仅仅是在人类赋予其数据用作机器“知识”的前提下进行的。也就是说,所谓的自我反馈与修正只是听命于预设数据作出的条件反射而已。这使得算法在这一过程中完全服从于被设定的数值——符合预设值域则训练停止,反之则训练重新开始直到符合预设值域为止。机器的这种自我判断的正误与否都是未知的,因为深度学习算法在运用的过程中缺少了“常识”,我们没有办法运用人类的思维去揣度机器的决策过程,算法在这种缺乏“常识”的情况下形成了技术黑箱。作为没有任何背景知识的算法,企图对尚处于人类知识盲区的“黑天鹅事件”作出有效的回应是有些困难的。

三、把关与服务——“黑天鹅事件”报道中的人工编辑

算法在“黑天鹅事件”报道中暴露了缺陷与失灵,而人工编辑则体现出其独特的优势。他们能够凭借自身认知将优质内容呈现出来,在新闻价值和事实真伪的判断方面有着压倒性优势,而且人工编辑在履行社会公共职能方面的责任也是算法无力实现的。

1.优质内容的生产与推送

算法的逻辑是用户喜欢看什么就推送什么,而不能依据内容质量作出判断。如果过分重视用户的需求而忽略了对新闻初衷的把握,就可能会带来“标题党”泛滥。更为重要的是,将新闻内容的生产与推送工作完全交给算法可能导致用户产生信息茧房和信息过载两种极端体验的复杂交织。算法推荐在前期可以根据数据进行匹配从而达到对信息有效推送的目的,而到了后期用户经过大量同一主题推荐内容的阅读后,一方面在浩如烟海的信息流中无从选择,另一方面被推送的又是大量已读过的无用内容。因此,人工编辑在优质新闻内容的生产和推送工作中的地位是不可撼动的。在“黑天鹅事件”报道中人工编辑可以弥补算法的不足,在算法对突发事件不敏感、滞后的情况下作出快速反应。

2.新闻价值和事实真伪的判断

对于新闻价值和事实真伪的把握,人工编辑是优于算法机器的。“与人类相比,机器最大的软肋在于缺乏人的思辨能力、情感表达能力和创造能力”。即便当前的深度学习算法已经很智能了,但是在新闻专业性面前与人工编辑相比还是稍逊一筹。人工编辑对于新闻价值和事实真伪的判断基于“经验”“常识”“价值观念”,而这些恰恰是算法无法获得的属性,尤其是在“黑天鹅事件”面前。尽管机器人选手曾在棋局击败过人类,但这并不意味着机器已经“进化”到了比人类更聪明的程度。当算法和人工编辑面对同样未知来源的信息,人工编辑可以从信息源头追溯其真实性,而这一点是算法无法做到的;当算法对于作为突发事件的“黑天鹅事件”的滞后反应结束时,即使它能够作出反应了,也很难鉴别有关信息的真伪。

3.履行社会公共职能

媒体技术环境的迁移引起了记者和编辑行业的流动,加上“新闻业内在的‘品质’与‘效率’的天然冲突”使得记者职业逐渐被边缘化,而编辑的职能却在聚合时代进一步扩大。人工编辑在执行传统意义上的审核把关任务的同时,还兼顾了一部分记者职能,并且承担了媒体运营角色。面对这样的角色定位,人工编辑不得不进一步考量自身所承担的公共责任,在新闻内容的选择和推送上更加谨慎而富有使命感。不仅如此,人工编辑履行好社会公共职能还有利于政府和公众有效规避风险。

四、人机协同——算法与人工编辑的合作机制

不管是“黑天鹅事件”的报道还是整个新闻业,“从长远看,人和算法之间的关系将更加紧密,可能达到‘人机联姻’的状态”。所谓“人机联姻”即“人机协同”,它是基于不片面强调人工编辑和算法的前提下尽可能让两者达到平衡状态。

1.人工编辑:主体角色,拥抱算法

媒介始终是人的延伸,而不能够越过人的权利,否则就是喧宾夺主。聚合时代的算法在新闻业固然占据了重要地位,但人工编辑在把关和决策方面依然需要扮演好主体角色。首先,算法并不具备完善的把关机制,仅凭算法过滤信息的设想是不可行的,这就要求整个新闻生产和分发流程中算法居于人工编辑之下,把关由人工编辑完成。具体而言,在选题阶段,算法发现和挖掘选题,人工编辑进行筛选;在采集阶段,算法整合素材,人工编辑采集核心素材;在新闻生成阶段,算法做初稿,人工编辑审核再修改;在新闻分发阶段,算法进行个性化推送,人工编辑进行补充性推送。其次,算法并未拥有完整的价值体系,不能做到新闻的生产与推送完全符合主流价值观,此时人工编辑的作用凸显,他们在决策中既能坚守新闻业的公共属性,又可以协调新闻业公共性与商业性之间的关系;既要利于提升用户体验、实现新闻商业盈利,还要在决策中体现价值取向、引领主流价值观。但不可否认的是,人工编辑在对把关和决策拥有主导权的同时,也应该积极拥抱算法,在算法的帮助下实现更有效率、更高质量的新闻生产与推送。只有人工编辑了解算法并懂得如何运用算法,才能将其优势最大程度地发挥出来,使之更好地协助人工编辑做好新闻工作。

2.算法推荐:辅助角色,技术革新

尽管算法推荐因信息茧房、算法黑箱等原因受到批评,但这并不意味着我们要全盘否定算法推荐。算法推荐最好的存在方式是以辅助工具的角色帮助人工编辑处理新闻工作,但在使其作为辅助工具的过程中,更为重要的是改进算法技术以更好地适应需要。算法推荐的辅助功能可以概括为对信息的初步筛选、新闻内容的简单写作和新闻内容的辅助推送,前两项工作中算法的优势不言而喻,但在新闻内容的推送中,尽管算法可以进行大面积的个性化推送,当面对“黑天鹅事件”或者重要社会公共事务的推送时依然需要人工编辑来解决。当前提倡的PGC(专业生产内容)和MGC(机器生产内容)相结合的方式,实际上就是强调人工编辑作为主体、机器作为补充的一种方式。

无论如何,至少算法推荐作为一种先进的技术手段辅助人工编辑进行新闻工作,能够很大程度上提升新闻工作的效率,在此基础上我们要做的是击破算法“常识”壁垒使其更智能,因此可以从算法模型的完善和数据共享入手。媒体数据库互通、共享则是解决该问题的基本途径。

五、结语

近些年人们对于“人工”与“智能”的理解太过片面,过度依赖技术便利而导致控制权逐渐丧失。面对无法预测的突发事件,这种缺陷便充分凸显。“黑天鹅事件”报道中算法暴露出了其不够智能的劣势,而人工编辑则显现出了作为人相对于机器而言独有的优势。但这并不意味着新闻工作者要完全抛弃算法回归人力,我们要做的是认识技术局限性的同时把握技术带来的优势并加以利用。在今后的新闻报道中,我们也应树立人为主体、机为辅助的观念,只有人机协同才是新闻业走向质与量并行的最佳通道。

猜你喜欢

黑天鹅人工算法
人工3D脊髓能帮助瘫痪者重新行走?
人工,天然,合成
人工“美颜”
黑天鹅格里布
除了“黑天鹅”“灰犀牛”别忽视了“大白象”
基于MapReduce的改进Eclat算法
Travellng thg World Full—time for Rree
“灰犀牛”“黑天鹅”
进位加法的两种算法
直视“黑天鹅”