人工智能技术对新闻生产的影响与再造
2016-12-17梁智勇郑俊婷
梁智勇 郑俊婷
内容提要本文阐释了人工智能技术对新闻生产的三方面影响:一、新闻生产方式由专业生产过渡为“专业生产+社会生产+机器人生成”;二、议题设置方式由流水线生产的线性传播模式过渡为个性化、精准化生产;三、媒体运作模式由“内容为王”过渡为全产业链运作模式。文章同日寸指出,人工智能技术不可能彻底取代人工,它所推动下的议题设置权力让渡给社交关系和算法生成也可能带来隐患:受众陷入过往经验的狭隘境地等。
关键词人工智能机器人大数据新闻生产
谷歌公司的AlphaGo战胜世界顶尖围棋选手李世石的新闻,再次引发了人们关于人工智能技术的热议:记者未来会不会被机器人替代?
在大数据、云计算和人工智能技术的支撑下,苹果的SIRI、百度的度秘、微软的小冰等都已经在媒体行业大显身手。人工智能技术将使新闻生产更加高效便捷,受众行为分析更加精准,媒体传播效果更加优化,它对新闻的内容生产、议题设置、运作方式等带来革命性的影响。
一、全新的新闻生产:从专业生产,走向“专业生产+用户生产+机器人生产”
2015年9月,腾讯财经推出了自动化新闻写作机器人“Dreamwriter”,用时一分钟写出了第一篇报道;11月,新华社写稿机器人“快笔小新”正式上岗,可以写体育赛事中英文稿件和财经信息稿;2016年3月,韩国写稿机器人上岗,仅0,3秒就写出一篇股市行情的新闻稿。一时之间,引发各界猜想:机器人上岗,是否意味着记者的终结日来临?
计算机自动生成的机器人新闻,尽管在国内尚属新鲜事,但是国外几年前就已成为现实,机器人早已开始协助写稿、编辑、校对等。路透社、美联社、《纽约时报》《洛杉矶时报》、雅虎、赫芬顿邮报等传统媒体和互联网公司都已纷纷采用机器人生产新闻。
成立于2007年的AutomatedInsights公司,是一家由美联社及其它投资者合资的科技公司。它既为美联社自动编写新闻,也为雅虎、康卡斯特等客户服务。它可接受任何数据格式,通过算法找出事件的来龙去脉,生成叙述性长短文章、财务报表、可视化图形等,并实时推送至各个终端。A1有超过3亿模板可以供不同的新闻使用,它们在2013年就产生了3亿篇新闻,2014年产量达到10亿篇。2014年7月,美联社开始使用该公司的WORDSMITH软件批量生产财经新闻。过去,每季度美联社仅出产约300篇财报新闻,现在不知疲倦的机器人每季度可出产4400篇,产量大幅增加。2015年3月,机器人记者功能再次升级:使用自动化编辑器扩大算法范围、传感器搜集实时数据等。
机器人还可以协助美联社将NBA比赛、橄榄球赛的流水账式记录,统计整合成一篇报道。过去,专业体育记者一边看电视一边查官网数据一边写稿子;如今,机器人新闻可以全部自动识别所有球员的得分、助攻、篮板、抢断、盖帽等,之后机器人根据这些数据,结合关键球员的表现,球队排名等赛况写出报道。
2011年在美国创立的NarrativeScience公司,2014年得到了1000万美元的新一轮融资。公司CEO斯图亚特·弗兰克尔(SfuartFrankel)称,该公司的Quill平台可以分析结构化数据,从而理解这些数据的重要性,最终可以无限生成接近完美的书面内容。NarrativeScience的核心是将人工智能与大数据进行技术融合,从而产生简短的文字表述或结构化的报告内容并不断提升算法,使语法更具人情味。它可以生产快讯,亦可生产深度报道,文风可严肃、可诙谐亦可辛辣。福布斯网站等多家知名媒体已成为其客户。
随着人工智能技术的逐渐成熟,机器人的计算能力和学习能力不断提升,传统新闻生产的方式将逐渐被颠覆。过去依靠专业记者生产内容(PGC)的手工模式,继走向“专业生产+用户生产”(PGC+UGC)的Web20模式后,又将走向Web30新阶段:算法生成内容(AAC),与PGC~UGC三者鼎立。
新华社副社长刘思扬6月在圣彼得堡国际经济论坛讨论人工智能对新闻业影响时认为,未来人工智能至少会从内容生产和消费两端对媒体发展带来变革。人工智能与物联网、大数据深度结合,将催生真正意义上的“精准媒体”,在图像识别、视频处理、跨文本翻译、数据库激活等领域,推动媒体融合快速发展。
短期而言,体育报道、财经报道、房地产分析报告、民意调查、市场调研报告等比较容易实现标准化生产的领域,人工智能的应用迅速普及推广。如路透社使用OPENCALAIS的智能解决方案,《纽约时报》使用BLOSSOM分析大数据推荐好文章,《华盛顿邮报》应用TRUTHTELLEE专职核查新闻,《洛杉矶时报》使用智能系统应对地震等突发事件,《卫报》使用OPEN001软件进行内容筛选、编辑排版并最终生成报纸等,把记者从琐碎的日常工作中解放了出来。
二、全新的议题设置:从流水线生产,走向个性化定制
传统媒体的议题设置,主要取决于当时的新闻热点、宣传管理部门的指令、媒体同行的选择和编辑记者的经验。但是,人工智能技术出现后,媒体议题设置和编排分发的旧有规则被打破了。算法推荐新闻,以及受众之间的相互推荐,逐渐开始争夺内容分发的主导权。
依靠受众阅读习惯编排内容,使传统意义上的头条被重新定义。在媒体融合的大背景下,《纽约时报》惊呼:“头条已不重要”,遂被人解读为“传统意义上的头条已死”。2014年5月,《纽约时报》披露了一份96页的内部报告,在媒体界内引起轰动:“在《纽约时报》,报道一旦被刊登,记者和编辑的工作便完成了。而在赫芬顿邮报,报道刊发后,它的生命才刚刚开始。”需要说明的是,赫芬顿邮报是一家互联网报纸,它提供原创报道和新闻聚合服务,只通过网络传播。一篇文章只有被转发、阅读、点评,它的影响力才能真正得到体现。
人工智能技术的核心是数据挖掘。媒体的受众分析将比以往更精准,内容的聚合与分发,将更加精准化、智能化、对象化、个性化。通过大数据挖掘技术、个人信息行为追踪,新闻机构可以做到为用户智能推荐,实现个性化的新闻定制。全球新闻生产从人工整合向技术整合的趋势愈加明显,人工智能向传媒领域进军已成潮流。人工智能技术宣告了个性化新闻时代的全面到来。针对每个订阅用户的专属评论和定制化报道,已经成为现实。
首先,人工智能技术使得“用户画像”更清晰,可以为用户量身定做内容。过去,“一点对多点”的、千篇一律的生产模式将转变为个性化、对象化、差异化的内容生产模式。大数据技术可以对受众进行详尽的统计分析。“你在看手机时,手机也在看着你”,互联网巨头悄然地收集着用户所有行为数据——除一般性的用户数据(如性别、年龄、地域分布、情感倾向、注意力偏好、行为喜好、渠道偏好、消费能力、生活轨迹、关系圈、终端匹配等),还有产品数据(如产品形态、产品资费、渠道、品牌、类型和终端要求等),以及网络能力数据(如网络功能、利用率、效率等)。新闻客户端“一点资讯”的创始人郑朝晖曾坦言:“比阅读重要的是阅读者的行为”。
其次,人工智能技术可以为受众进行场景化适配,这是传统议题设置望尘莫及的。在不同时段、不同地理位置,用户对新闻的需求都不同,机器人可以在后台实时调整。如此,就不会出现将传统媒体内容照搬到PC端,PC端内容复制到手机端,将白天信息需求视为和夜晚等同的窘境。
罗伯特·斯考伯、谢尔·伊斯雷尔在《即将到来的场景时代》写道:“移动互联网时代,场景(情境)的意义被极大地强化,移动传播是基于场景(情境)的服务,即对环境的感知及信息(服务)适配。”与场景时代相关的有五大因素:大数据、移动设备、社交媒体、传感器和定位系统,它们都和内容生产关联起来。“从哪来一现在哪一去哪里”三个阶段,用户接收的内容都不一样。如受众走路或运动时,可以通过谷歌眼镜、智能手环等可穿戴设备,接收短小精悍的突发新闻;受众在等车候机时,可以通过手机接收碎片化、趣味化的内容,受众在临睡前,可以接收娱乐类、情感类的内容。
最后,人工智能技术使媒体更加社交化,更加注重对社交媒体数据的收集和挖掘。对媒体来说,没有大数据,一切都将成为无源之水、无本之木。未来媒体的竞争力,取决于其数据挖掘的能力,而非简单的叙事能力。
过去的议题设置,片面追求新闻热点,忽略多元化用户的需求。而人工智能时代的内容选择,取决于兴趣引擎以及长尾理论。今日头条的竞争对手“一点资讯”也深谙此道。它通过微博绑定,推测出用户的兴趣爱好。用户使用时间越久,基于兴趣引擎的媒介工具会越来越懂用户,在频道内容和排序上会更符合其胃口。此外,腾讯的天天快报,知乎的读读日报,印度的Dailyhunt(用户数约1000万),日本的SmartNews(用户数约300万),印尼的Babe(用户数约120万)等,都是沿循了“算法生成内容”的模式,解决用户“该看什么内容”的问题。
以往的议题设置往往从专业媒体的视角出发,忽视受众的自主性选择和个性化需求,呈现出单一的线性模式的传播特点。在信息化社会,随着海量信息的爆发,在人工智能构建下的互联网所形成的新的媒介生态中,国内有学者认为,随着“机器新闻写作”的成熟和应用,媒体的角色应从传播领域的生产者、控制者转型到社会生态的共建者。将自身作为融入大生态中的一份子,媒体要思考的不再是“我该怎么控制和占有这个系统”而是“我作为其中一个行动主体,应该怎么维持这个系统的有序性和良性运行”。这也就意味着,媒体机构将不再高高在上,而是成为协调者、组织者和服务者,平台型媒体将成为主流形态。
三、全新的运作方式:从内容为王,走向全产业链运作
人工智能技术,将使传统媒体内容开始向移动化平台聚合,推动传统新闻媒体的改造。
机器人写作相比人工新闻的优点不言而喻。其写稿速度最陕可达到毫秒级,无人匹敌;其应用大数据技术处理海量数据的能力让人类望尘莫及;它不知疲惫、产量惊人、准确性高,大大提高了传统新闻工作者的效率。生物传感机器人,可以把观众的真实体验实时地呈现出来,供创作方分析、供观众了解自己,也可以让记者从中发现有新闻价值的东西。某种程度上,机器人的算法,比编辑记者更懂受众。一个典型的例子是,《纽约时报》使用BLOSSOM推荐新闻,平均阅读量是原来人工推荐文章的38倍。
在这种情况下,传统媒体就不能抱残守缺、无动于衷。
首先,传统媒体不能一味沉溺于“内容为王”的路径依赖,而要考虑“内容+技术+渠道+市场+人才”的全产业链运作。片面强调“内容为王”,对科技发展视而不见,最终会导致传统媒体的彻底边缘化,丧失主流舆论阵地。
其次,传统媒体除了培养“全能型记者”,还要引进软件算法工程师。一方面,媒体需要复合型的人才队伍,需要记者掌握多元化的知识结构,使其除了必备传统“报台网”的采访、编辑和写作技巧,懂得文字、图片、音频、视频的制作技能,还要懂得微博、微信、客户端等新媒体平台的发稿流程。另一方面,媒体队伍需要专门的算法工程师。媒体队伍的知识结构,不能局限于中文、新闻、传播等文科领域,还需要大量的IT人才,满足TMT、ICT的融合趋势。不久前,今日头条以百万年薪招聘算法工程师的新闻在媒体圈引发轰动,这家具有广泛影响力的科技型公司,核心团队仅为百人。
再则,面对人工智能技术的步步紧逼,传统媒体不能画地为牢,需要打破藩篱,既要开展传统媒体与新媒体的一体化运营,也要做好内容集成服务商,在媒体聚合平台安营扎寨(如媒体公众运营号),还可以主动聚合自媒体(如发起自媒体联盟),实现平台共享。
目前,国外媒体机构利用网络巨头以人工智能技术为支撑的内容分发平台,实现了内容快速抵达用户的效果,初步尝到了甜头。内容生产与内容分发(类似于“制播分离”),实现了完美结合。
Slack最早是一款即时通讯的企业聊天工具,现在朝着企业协作的操作系统方向发展。在Slack第三方应用商店AppDictionary中目前已拥有数百个应用程序,包括许多媒体机构。Slack可以将不同的兴趣话题创建成频道,而且这个频道对所有用户可见并能参与。然而它并不会像群消息一样干扰你,因为只有你设定的关键词出现时系统才会推送提醒,俨然是升级版新闻推送神器。BreakingNews是隶属于NBC公司的新闻网站,加入Slack后,用户通过与Slack的聊天机器人对话,BreakingNews App就可以实现个性化定制推送,极大改善了用户体验。
2015年5月,日活跃用户超过10亿的Facebook推出了新功能InstantArticles。《华盛顿邮报》《纽约时报》、BBC、《国家地理》《赫芬顿邮报》、Buzzfeed等媒体纷纷接入。它可以给媒体机构提供生产工具、制作规范,以及极速加载技术。媒体机构在Facebook发布内容的时间从原来的8秒锐减到不足1秒,极大提升了用户体验。11月,Facebook推出的另一个独立产品Nofify,把入驻的媒体机构更新的内容自动推送给用户,用户可以不用打开Facebook,就可以直接从锁定的手机屏幕跳转到自己感兴趣的内容。
Buzzfeed通过Instantarticle,使其在Facebook上发布内容的直接浏览量跃升为11,3亿次。而此前通过发布链接导流到自家网站的方式,浏览量仅3.49亿次。作为老牌媒体成功转型的代表,《华盛顿邮报》在2013年被亚马逊的CEO贝索斯收购后,就转型为一家数字化公司。2015年10月,报纸的用户访问量在历史上首次超过了老对手《纽约时报》。一个月后,访问量达到了历史高峰7160万人次,几乎是被收购时的3倍。《华盛顿邮报》CEOFredRyan说:“我们想要在所有平台上触达未来的读者,对此毫无保留。”
通过大数据挖掘,机器人可以更精准地预测未来。人工智能的核心是数据处理,它可以极大提高出稿效率,对突发事件实现快速反应。与此同时,媒体人借助人工智能技术把内容输送到算法推荐平台,实现精准传播。
那么,专业记者会被机器人替代吗?答案是不会。“科技性失业”的恐慌在20世纪60年代(公司开始安装计算机和使用机器人)和80年代(个人电脑开始上市)都曾弥漫开来,但事实上每一次恐慌之后,科技进步为社会创造的就业岗位远多于它消灭的岗位,我们需要更多的人从事全新工作。这意味着要调整教育和训练模式,使其足够灵活,从而快速、高效地教授全新的技能。对新闻工作而言,人工智能一方面将记者从繁琐的日常工作中解放出来,另—方面又催生了新闻报道领域对算法工程师的旺盛需求。
此外,新闻产品需要的是有温度、有情感、有人性的写作。即使计算机的算法和模型再精准,它也无法减少人工干预。在调查研究、深度报道、评论分析等优质内容生产的关键环节,人工依然有着不可替代的压倒性优势。懂内容和懂算法几乎同等重要,一个有发展潜力的媒体需要算法与人工并行,并寻求两者之间的最佳结合点。
掌握人工智能技术的机器人,给编辑部里的记者们带来了巨大的竞争压力,同时也带来了一系列问题。比如,受众可能无法感知兴趣之外的新事物和新议题,陷入狭隘的境地:受众只关心自己关心的事,无法培养新的兴趣。个性化新闻深入发展,很难平衡传统媒体信息筛选、议程设置和普通受众的个人喜恶之间的关系。用户最终被算法主导,可能会沦为井底之蛙。