算法推荐时代的假新闻：界定、产制与媒介素养教育启示

2019-12-04陈虹虹

传播与版权 2019年10期

陈虹虹

（海南师范大学新闻与影视传播学院，海南海口 571158）

近年来虚假新闻在世界范围内的泛滥激发了国内外对“假新闻”研究的新热情。当前新闻生产和传播开始进入算法推荐时代，即信息内容提供主体多样化，除传统媒体组织外，还包括个人账号甚至机器账号；受众接受的信息在算法推荐模式下呈现千人千面的特点；信息分发的渠道由社交平台、聚合平台等科技公司掌控，分发的方式由各个平台媒介公司设计的机器算法掌控；信息的把关由平台公司设计的程序进行自动审查。鉴于此，本文尝试以平台媒体公司为切入点，回答以下问题：算法推荐时代，平台公司如何通过技术界定假新闻？假新闻的生产与平台公司之间有何关系？新闻传播教育应该提供什么的媒介素养教育，帮助公众认识平台媒体公司并应对假新闻？

一、界定：算法推荐时代假新闻的平台核查依据

2018年路透社的数字新闻报告指出，公众获取新闻的方式主要通过各类平台媒体，包括社交平台、搜索平台、新闻聚合平台、甚至智能音箱平台。各类平台既是科技公司，也是媒体公司。它们依靠互联网数据流，根据不同算法技术向用户搜集、选择、推荐新闻，同时也过滤“假新闻”。

假新闻的机器核查过程首先是工程师对假新闻进行界定和类型选择，建构计算模型，最后由计算机自动执行。

在对假新闻的界定上，目前工程师们在编制假新闻核查程序时大多数使用Allcott和Gen-tzkow的定义，他们将假新闻定义为“故意和可核实的虚假新闻文章，可能会误导读者”，强调“假新闻产生的两个主要动机，一方面为内容生产者提供了可转化为广告收入的点击；另一方面诋毁他人”。[1]换言之，假新闻在内容层面上有两个重要的核查标准：事实的依赖程度和生产动机。而学者Tandoc、Lim和Ling综合近年学术论文中假新闻的概念操作并结合社交平台出现的假新闻案例，提出了假新闻的“类型学”，把假新闻分为讽刺、模仿、虚构、操纵、宣传和广告六大类型。[2]由此，假新闻成为各种维度下组合的连续统一体，不同的权重标准设置将产生不同的假新闻过滤结果。

表1 假新闻界定维度

在假新闻的“特征数据”搜集和计算模型建构上，目前平台公司的算法技术主要围绕新闻内容和社交数据挖掘两个维度来建构。[3]

从数据挖掘和筛选来说，新闻内容维度的筛选数据主要来源于新闻的标题、正文、配图、消息源等新闻要素。数据类型包括语言和视觉两种，前者基于自然语言的词汇特征、句法结构和修辞特性，从写作风格上排除具有欺骗导向的数据；后者统计的数据包括视觉文本的清晰度评分、一致性评分、相似性分布、多样性评分和聚类评分等。社交维度的数据主要来自户个人数据、帖子和社交网络三方面。通过提取用户的年龄、粉丝数、发文数量等数据，计算机便可判断用户个人的可信度与可靠性，进而判断其制作的新闻可信度。从与新闻相关的帖子中提取立场特征、观点、态度等有用信息，并将所有相关帖子的功能值进行聚合，计算机便可用平均可信度评估新闻的可信度。计算机围绕用户兴趣、新闻主题、用户社会关系等不同方面形成的社交网络来监测新闻的传播轨迹，进而发现假新闻的“回音室”。

从模型建构来说，基于新闻内容的核查模型主要有“基于知识的模型”和“基于样式的模型”。前者是利用专家核查、大众举报并标注等外部资源来检查新闻内容中提出的事实和主张，然后由机器程序进行聚合汇总；后者是分析深层句法和修辞结构来捕获各种符合假新闻特征的陈述，包括抓取各种耸人听闻的夸张描述。而基于社交内容核查模型则主要有“基于传播的模型”和“基于立场的模型”：前者是根据相关社交媒体帖子的传播轨迹、热度来判断新闻真假的概率，其基本假设是假新闻与其相关帖子具有社交结构的同质性；后者是利用用户对相关帖子的观点评价来判断新闻的真实性，用户帖子的情绪、态度、观点甚至位置等信息都是机器检测的目标。

同样，各平台公司的算法对数据来源的依赖权重不同，模型建构的方式不同，同样导致假新闻核查的结果呈现多样特点。

表2 假新闻的机器核查维度

二、产制：算法推荐时代假新闻生产与平台的关系

在传统的大众传播业时期，假新闻的成因包括职业编辑记者的疏忽，商业利益冲击媒体部门正常的采编活动，作为新闻主要来源的政府部门有意夸大事实。[4]而在算法推荐时代，假新闻的生产和传播很大程度上是由各类数字平台的技术逻辑和运营逻辑决定的。

第一，各类平台媒体公司向用户呈现信息的宗旨是为了鼓励人们的参与，而不是从谎言中过滤真相。数字平台的价值取决于其拥有的用户数量。各平台公司通过各种办法吸引个人、机构和组织使用平台，鼓励他们发布各种信息。随着参与者人数的增加，产生的数据量也在增加，平台算法的可靠性和推荐匹配效用不断提高，结果是，平台只向用户推荐其“喜欢的”“已经相信的”，而非“真实的”信息，这就造成了观点的“回音室”现象。早在传统大众媒体时期，心理学研究已表明人们为克服态度、行为与自我认知的冲突，倾向于接受与其观点一致的信息。平台的算法推荐技术特征强化了这种行为模式，人们只相信自己“愿意相信的”，修改或删除相关内容反而会引起用户的反感。[5]

第二，数字平台公司创造的参与文化成为某些个人通过传播虚假信息增加价值、改变社会地位的方式。平台公司本身不生产信息，它依赖并鼓励用户生产、共享、推荐和评论各种信息。信息生产和传播不仅成为用户展示自我的重要手段，而且可以累积个人的可信度和价值。通过生产分享信息，收获他人的点赞和评论，虚假信息的生产传播者与社会其他个人建立起联系，甚至因为“敢说”“掌握秘密”而在社群中收获一定的社会地位；而虚假信息的阅读者也在平台算法的帮助下找到自己认同的特定团体。分析各种“阴谋”、分享各种“秘密”成为他们“身份工作”的一部分。当虚假信息的传播实质上对传者和受者都存在一定的价值，那么大众防止假新闻的制造和传播动机就会减弱。

第三，平台公司的信息构建方式弱化了传统媒体作为“信息守门人”的地位。平台媒体的实质是一个中介，通过规定关系条款来管理平台用户的交互关系和数量，选择和框定不同用户的地位与权重。2016年，由于Facebook将其新闻推荐算法改为好友和家人偏好优先，不再强调主流媒体的偏好，导致主流媒体受众接触率下降。平台公司的运营目标是尽可能将用户留在平台上，任何链接到平台外部网络的链接都会被降级。传统媒体难以通过推荐平台将用户引流至自己的网站，这些直接导致传统媒体受众数量锐减，广告吸引力和社会影响力下降，无力支付高昂的新闻核查成本以及高质量新闻的制作成本。

第四，平台媒体公司的新闻推荐算法容易被“技术性”地反向利用于新闻操纵。平台媒体公司的运营策略是鼓励尽可能多的用户使用，并将其使用记录纳入算法统计。一些心怀不轨的个人或机构通过注册或购买虚假账户，发布虚假言论，操控舆论；或者通过运行计算机程序操控社交媒体账户。社交机器人账户能自动生成内容并与人类账户进行互动，有研究表明社交平台传播的假新闻有许多是机器程序自动生成和传播的。[6]假新闻制造者，有的会在信息中策略性地使用“搜索引擎优化策略”，使用各种容易被引擎爬虫程序注意到的内容标签；有的甚至开发出旨欺骗搜索算法的“黑帽搜索引擎优化”技术，将用户引流到各类虚假网站或购物网站；还有的通过操控大规模真假用户的搜索行为“制造”“假热点”。

第五，平台媒体公司的运营推广模式将大众卷入造假传假的漩涡。平台公司的营业收入主要来自广告，运营模式是提取并分析用户信息，然后将信息匹配给相应的商品制造商，此种运营模式需要足够多的用户和数据。为此，平台往往采用按新闻点击量支付广告费用的方式鼓励新闻生产者参与流量制造。2016年马其顿韦莱斯小城的青年人通过在FACEBOOK上制造和传播特朗普的假新闻，骗取巨大流量进而赚取了巨额广告费。中国也有众多所谓“自媒体村”的“小镇青年”通过拼接、洗稿，甚至造假的方式为百度、腾讯平台引流。某些新闻聚合平台，为扩大流量、获取用户信息，通过发放红包提现的方式，诱导用户点击、转发信息。许多个人用户由于媒介素养不高，对虚假新闻的危害缺乏认识，在利益的引诱下无意识地参与到了假新闻的制造和传播中。

三、应对：算法推荐时代媒介素养教育的平台启示

平台公司的算法推荐潜移默化中改变了大众接触和阅读新闻的方式。研究者在论及假新闻的应对时，很多只注意到宏观层面对平台公司的监管，或者微观层面对具体算法模型的改进，虽然也有学者提倡对公众的媒介素养教育，但大多数泛泛而谈。既然当下假新闻的生产与平台关系密切，那么媒介素养教育应该将数字平台的技术架构与运营模式作为重要内容，具体来说有以下几方面。

首先，媒介素养教育要将帮助年轻人培养新的新闻阅读实践作为重点。算法推荐时代，新闻阅读的方式发生了重大变化：一是新闻阅读成为社交活动的附属品，发现新闻不再是个人追求，而是社会关系运作的结果；二是人们不是在新闻领域里完整地接触新闻文章，而是在社会关系中接受零碎的信息，因而没有机会比较不同新闻之间的风格、结构、来源、目的等核查虚假新闻的要素。媒介教育者不仅要认识到这些变化，还要根据变化找到支持年轻人培养正确阅读新闻的方法，作为年轻人日常生活中重要的社交媒体使用体验。

其次，媒介素养教育要帮助年轻人了解平台媒体的架构知识，识别算法技术中隐藏的意识形态。大众对平台公司传播假新闻的作用认识不足，将平台公司视为新闻和信息传播的中性渠道。媒介素养教育应该帮助年轻人了解平台架构的知识和算法推荐技术作为认知框架的功能，帮助年轻人了解平台选择和呈现内容的优先顺序及其结果影响；要让大众认识到：技术本身不是中性的，技术使用者更不是中性的，技术使用的背后隐藏着各种各样的动机。大众在信息接受和传播过程中不仅需要学会对文本内容的仔细审查，还要学会思考信息生产和传播背后是否带有炒作、攻讦、广告等目的。了解平台架构的知识有助于大众理解虚假新闻的呈现和传播方式，参与抵制虚假新闻的活动。

再次，媒介素养教育要帮助受众认识自身在平台传播中的正向能力。虽然平台公司掌控用户的管理，但用户依然可以根据平台允许的设置来建构自己的服务。平台能加快虚假新闻的传播速度和扩大范围，同样也能正向作用于真实信息的传播，对抗虚假新闻。用户通过提高关注高质量新闻媒体账号，传播高质量新闻，分享“打假”信息以提供外部知识等方式就能在一定范围和程度上清洁数据流。2018年路透社数字新闻使用报告指出，如果知晓高质量新闻生产难度、过程和费用，受众更愿意付费消费高质量新闻。这说明，很多用户对高质量新闻的功能、生产流程以及自身在传播中所扮演的角色认识不足，未能从参与高质量新闻消费活动中获得相应价值。因此，媒介素养教育既要提升受众的新闻鉴赏水平，更要增强大众参与高质量新闻传播活动的动力。

最后，媒介素养教育应该帮助大众认识媒介市场的特征。媒介市场传播的信息产品不是普通商品，而是能够影响和形塑人们世界观和价值观的精神产品。各数字平台公司不只是科技公司，同时也是媒体公司，需要肩负“社会良心”的责任。媒介组织的盈利模式具有“二元结构”特征，即将受众的注意力或个人数据精准售卖给相应的广告商。对大众普及媒介市场特征的相关知识，有利于大众认识对当下各个数字平台媒体的运营模式，使大众对平台媒体的货币化保持警惕。

四、结语

假新闻在世界范围内越演越烈，破坏性影响日益严重，这与平台公司推行算法推荐技术带来的传播环境改变、新闻生产流程重构、新闻理论知识更新不无关系。本文以平台公司为切入点，梳理了算法推荐时代假新闻的核查技术，分析了平台公司运营模式对假新闻生产传播的影响，讨论的最终目的是引起人们对生产和传播假新闻的基础设施的注意，澄清算法推荐时代个人应对假新闻所需要的媒介素养。未来，如何正确认识算法推荐技术，认识平台媒体公司对传统新闻业的影响；如何培育和实施大众所需的媒介素养等问题都需后续持续研究。