欧美新闻算法应用研究的启示与经验
2018-02-26张旦
张 旦
(四川外国语大学 新闻传播学院,重庆 400031)
近年来,随着大数据和人工智能技术的发展,新闻业也积极探索应用大数据挖掘和人工智能技术改进新闻生产方式,新闻算法应运而生。新闻算法的出现改变了传统的新闻生产方式,重塑了新闻生产与分发这两个维度,使得数字新闻业经历“算法转向”,即从人工编辑形式走向更为高级的智能算法阶段,在业界、学界和社会各界都引起了很大震动。本文通过梳理欧美新闻算法应用的最新进展和主要案例,以期为我国新闻算法的发展提出可能的研究方向和思路。
一、欧美新闻算法的应用概况
首先,欧美新闻算法应用时间较早。早在2001年,谷歌就开始采用个性化新闻推荐,这是媒体首次将算法应用到新闻生产之中。其次,应用领域比较广泛,在欧美地区,新闻算法较多被互联网巨头、初创型科技公司以及传统媒体等机构采用。谷歌、脸谱网早已在新闻搜索、推荐、分发等系统服务中应用算法技术。初创型技术企业,如叙事科学和自动化洞察等公司主要研发一些自动化的写作软件,并通过这些软件生成财经资讯、体育资讯等类型报道。主流媒体和通讯社也尝试通过采纳算法来改造传统的新闻生产和新闻分发过程。[1]
再次,算法技术比较成熟。新闻算法在前期的应用中只推送用户喜欢的信息,逐渐形成了“信息茧房”的窘境。人工智能针对算法的革命就在于对现有推荐系统的不断优化。一方面,考虑普遍相关性;另一方面,照顾个体差异,使用户有机会接触更多可能感兴趣的内容。比如,英国《泰晤士报》和《星期日泰晤士报》正在开发一个名为“詹姆斯”(James)的全新推荐系统,它将针对用户的个人偏好进行学习,不仅根据用户经常点击的内容进行推荐,更重要的是坚持新闻标准。对算法的改进是当前人工智能应用于新闻业的主要技术路径。
二、欧美新闻算法应用实践的相关梳理
(一)新闻算法的理念及基本工作原理
算法是指一系列非常复杂的数学规则,通过预先设定的步骤解决特定问题的计算机程序。[2]其最大的特征就是新闻生产的自动化。以叙事科学公司的新闻算法为例,这个流程主要包括五个步骤:一是读入大量结构化和标准化的数据;二是测量数据中的“新闻性”;三是找出合适的报道角度,如果有多个角度,则按照重要性排序;四是将报道角度与数据中的具体事实相匹配;五是生成报道文本。[3]通过以上的工作原理可以看出,当前新闻算法在新闻报道中依然处于辅助地位,用于处理一些有清晰数据支撑、报道程式简单明确的新闻题材。
(二)欧美新闻算法应用实践
在欧美地区,新闻算法较多地被应用到新闻的写作、选编、审核和分发等领域,本文结合欧美的具体应用案例进行讨论。
1.算法选编:机器自动对新闻排序。算法通过对用户行为进行分析后确定其内容偏向,筛选出最具商业价值的新闻,然后根据这些标准推送读者感兴趣的内容。《卫报》于2014年推出了一份名为“#Open001”的纸质报纸,算法机器会自动将社交网络上的分享热点进行内容筛选、编辑排版和印刷,最后生成一份报纸。《纽约时报》研发的机器人Blossom采用算法帮助编辑挑选出最适合推送的文章和内容。路透社名为“Open Calais”的算法机器人和《纽约时报》推出的“R&D Editor”利用算法完成了算法排序、识别关键词、找出热门内容、文章标签自动化等工作。[4]总之,算法机器给新闻界带来了更多的想象空间。
2.算法写作:人机互动的前瞻。2013年,美联社采用人工智能算法,让程序自动撰写体育报道类新闻稿件。基于美联社预先编辑好的写作结构,在几秒钟之内生成1篇150~300字的新闻快讯。之后,越来越多的媒体开始采用算法机器写稿。《洛杉矶时报》推出了支持灾难报道和犯罪新闻报道的机器人;法国《世界报》通过和Syllabs公司合作,用机器人记者报道选举活动;[4]《华盛顿邮报》在里约奥运上派出了机器人Heliograf进行赛事报道。利用算法机器写稿,极大地节省了记者的时间,可以让记者专注于深度采访和高质量的报道。
3.算法审查:自动核实新闻内容。早在2012年年末,《华盛顿邮报》就启动了名为“truth teller”(吐真者)的实时新闻核查项目。它能全程记录新闻报道中的文字、语音等信息,随后与“打假”数据库进行对比,一旦发现异常便会发出警报。《纽约时报》则应用了一套能够自动审查过滤用户评论的人工智能软件,大大降低了人工审查的成本。Google也推出了人工智能新工具Perspective,它能够通过机器学习来检测网络上的恶意或有害的评论,既可以有效地帮助各大媒体机构进行骚扰和负能量内容的处理,也可以帮助网民识别有害信息,净化网络空间。[4]
4.算法推送:信息私人定制的个性化推送。2001年,谷歌开始采用算法进行个性化新闻推荐,即由算法决定给哪些用户推送什么内容。之后,Facebook采用了News Feeds算法的协同过滤机制,其目的是把用户真正关心的内容找出来。Twitter采用算法推荐机制,将推文推送给对内容存在潜在兴趣的用户。这种机制的本质是为用户打造私人定制信息,即所谓的“个性化报纸”。[5]国外知名的个性化新闻推送应用News Republic和Flipboard也是通过智能编辑、数据分析等手段向全球用户提供最广泛的个性化新闻内容推荐。算法推送实现内容的个性化推荐,有效强化了传播效果。
三、国内新闻算法的应用概况及不足
(一)国内新闻算法的应用概况
国内算法领域的主要尝试者是技术型公司和传统媒体,算法主要被这些公司用于新闻的生产与分发。在算法写作领域,腾讯推出的Dream writter机器人利用算法能自动生成稿件,并能在第一时间将重要资讯推荐给用户。2015年9月,腾讯用它创作了一条财经新闻《8月CPI同比上涨2% 创12个月新高》。还有新华社的“快笔小新”,阿里巴巴与第一财经联合推出的DT稿王,今日头条的新闻写作机器人“张小明”。
算法在个性化新闻推荐上的应用早已为人熟知,《移动互联网2017春季报告》指出,网络新闻活跃用户数量排名前三的是腾讯新闻、今日头条和一点资讯。纵观当下国内资讯类APP市场,算法似乎已经成为资讯类APP的核心标配。今日头条、一点资讯、天天快报都将其作为平台的核心配置。[6]目前,个性化新闻推送在我国新闻市场拥有极高的市场占有率,有用户黏结性强、渗透率高等特点。
(二)国内新闻算法应用的不足
1.应用领域有限。不同于国外,算法在国内的起步时间较晚,技术发展也不太成熟,因此在新闻业的应用领域也相对有限。国内新闻算法领域的主要尝试者是技术性公司,传统媒体略有采纳算法技术,但应用程度不高。[1]目前,算法在我国新闻业的应用主要集中于机器写作和智能分发两个领域。相比国外媒体将算法应用于分析、写作、选编、审核、推送等整个新闻生产流程,我国新闻算法的应用发展还有很长的路要走。
2.算法写作存在的局限性。算法写作是基于既定的模板将收集好的数据信息嵌入生成的新闻稿件,在当前国内算法写作的新闻实践中,主要被用来撰写财经、体育、灾难事故等领域的新闻,应用领域较少,还未进行解释性报道和深度报道。同时,算法新闻的生产主要是通过自动化模板和数据分析与挖掘技术实现的,因此虽然语句流畅,但缺乏思想深度和缜密的逻辑思维,单纯依靠模板生成的内容容易千篇一律,缺乏人文关怀、理性思考。
3.算法分发存在的伦理问题。国内的新闻客户端会利用算法技术对用户的个人数据进行统计和处理,算法技术能够精准分析并解读用户的阅读习惯和兴趣,并以此刻画出每一个用户的“画像”,从而为用户提供量身定制的新闻产品,满足了人们的个性化需求。但技术是一把双刃剑,在带来好处的同时,也引发了“算法黑箱”“信息茧房”以及用户隐私泄露、价值观缺失等技术伦理等问题。
四、未来展望:欧美新闻算法应用带来的思考
随着算法技术对新闻业和社会的影响越来越大,我国很有必要进一步重视新闻算法的研究与应用。展望未来,我国的新闻算法应用需要重点在以下几方面拓展与深入。
(一)对新闻算法的研究进行长期投资
在欧美国家,政府一直积极推动人工智能新技术的发展,因而欧美的新闻算法起步时间较早,应用领域也更为广泛。目前,我国的算法技术还处于起步阶段,新闻算法在应用的过程中有很多不足,因此政府必须主动承担责任,而其承担责任的主要形式就是提供长期持续的资金支持和应用鼓励。首先,加大对新闻算法研究的资金投入和支持,当前算法产生的一些伦理风险究其根本是技术的发展水平不够高,因而要不断优化算法技术,规避现阶段造成的“信息茧房”等风险;其次,率先进行应用推广,目前算法只是在平台型媒体中应用,传统媒体的应用程度不高,未来可以鼓励更多的传统媒体机构采纳新闻算法,将其应用到搜集信息、审核信息等领域。
(二)加快人工智能新人才的培养
新闻算法作为人工智能技术与新闻业融合的产物,在未来的发展过程中需要大量的人才资源。欧美国家为应对人工智能的发展建立了相当庞大的人才资源库,这一点对于我国具有极大的借鉴意义。人工智能的人才需要三个层面的体系化队伍,一是在技术层面有精深的技术专家和相应的人才队伍;二是在社会层面,有对人工智能透彻理解的社会治理领域的应用专家;三是有能够把握技术趋势和未来社会发展的未来学专家,从而构建从技术到社会治理领域的有效沟通,不断研判通向未来的道路。[7]而新闻算法研究涉及的领域包括基础数学、信息科学、自动化控制和新闻传播学等。只有建立全方位的人才库,才能更好地应对人工智能时代算法的发展需求。
(三)构建算法时代的法规与伦理
在我国,算法推送是后Web2.0时代的一个新事物,关于这一领域的规制研究基本上还是一片空白,尤其是针对用户数据泄露、不良信息传播等问题,缺乏相应的法律法规。[8]欧美地区的法律体系和监管体系相对完备,如欧盟于2016年推出了《一般数据保护条例》,对数据主体享有的权利进行了细致划分,规定数据主体享有对个人数据的“删除权”或“被遗忘权”。因此,在算法时代制定新的伦理和法规很有必要。从宏观层面而言,国家应制定和完善严格的法律法规,尽快将数据立法提上日程,明确互联网条件下个人隐私的边界;从中观层面而言,企业自律非常重要,应当建立更加完善的分发机制,协调好工具理性和价值理性,主动承担社会责任,关注人的发展。
[1]章震,周嘉琳.新闻算法研究:议题综述与本土化展望[J].新闻与写作,2017(11):18-23.
[2]邓建国.机器人新闻:原理、风险和影响[J].新闻记者,2016(9):10-17.
[3]Kumar P B, Chhotray A, Parhi D R. Anatomical Characterization of a Humanoid Robot[A]. International Conference on Progressive Engineering, Technology & Science[C]. 2016:119-130.
[4]孙国新,汪小东.人工智能在报业的应用前景分析[J].新闻战线,2017(12):19-21.
[5]方师师.算法机制背后的新闻价值观——围绕“Facebook偏见门”事件的研究[J].新闻记者,2016(9):39-50.
[6]姜红,鲁曼. 重塑“媒介”:行动者网络中的新闻“算法”[J].新闻记者,2017(4):26-32.
[7]何哲.通向人工智能时代——兼论美国人工智能战略方向及对中国人工智能战略的借鉴[J].电子政务,2016(12):2-10.
[8]郝雨,李林霞.算法推送:信息私人定制的“个性化”圈套[J].新闻记者,2017(2):35-39.