媒体大脑:媒体与人工智能的融合重生之路
2018-03-07徐常亮
文/徐常亮
相比于拥有数百年历史的媒体行业,人工智能是一个崭新的概念。这项复杂的技术基于一个简单的理念:让机器来认知世界,通过人类难以企及的计算能力来解决问题和完成复杂的工作。2011年,谷歌首先提出了“谷歌大脑”的概念,2012年,谷歌又做出了一个标志性的成果:让计算机可以识别猫脸。这意味着人工智能第一个阶段的开端:让机器来认知世界。
2016年,发源于互联网行业的人工智能,却开始向互联网以外的行业延伸,开始触达传统行业,甚至在一些特定领域引起了颠覆性的革新。谷歌旗下的人工智能公司Deep Mind研发的阿尔法狗(AlphaGo)在围棋人机对战中击败了世界上最顶尖的棋手,让普罗大众开始认识和了解人工智能这一概念。几乎同一时间段,阿里云推出了“城市大脑”,让人工智能开始应对交通和城市管理的问题。人工智能第二个阶段的探索开始:让人工智能来解决问题和完成工作。
而媒体大脑是媒体与人工智能融合的产物。从报纸到广播、电视,再到互联网和智能手机,技术一直是驱动媒体变革和发展的力量之源,而如今无疑又到了一个媒体需要变革的时代,有一系列的问题亟待解决:新闻核心生产力靠什么技术?媒体影响力靠什么提升?未来的新闻资源在哪里?下一代媒体长什么样?
2017年12月26日,在成都举行的第五届中国新兴媒体产业融合发展大会上,新华社发布了中国第一个媒体人工智能平台——“媒体大脑”(mp.shuwen.com)和第一条MGC(Machine Generated Content,机器生产内容)新闻,向海内外媒体提供2410(智能媒体生产平台)、采蜜、新闻分发、版权监测、人脸核查、用户画像、智能会话、语音合成等8个模块的服务,探索人工智能时代媒介形态和传播方式。
2018年1月,新华社社长蔡名照指出:“今年,新华社将整合全社人工智能资源,升级‘现场云’资源聚合平台,利用‘媒体大脑’平台的智能采集、用户分析、图像识别、语音合成等功能,推进在策划、采集、编辑、加工、分发、反馈等全流程应用,探索智能化编辑部的标准和范式,抢占融合发展制高点。”
媒体大脑是媒体与人工智能融合的产物。从报纸到广播、电视,再到互联网和智能手机,技术一直是驱动媒体变革和发展的力量之源,而如今无疑又到了一个媒体需要变革的时代,有一系列的问题亟待解决:新闻核心生产力靠什么技术?媒体影响力靠什么提升?未来的新闻资源在哪里?下一代媒体长什么样?
负责媒体大脑研发的公司就是新华智云,新华智云的宗旨是:“凭计算之力,求数据洞察,赋万物为媒,迎智能时代。”媒体大脑实际上是新华智云对这条宗旨的实践,它的核心要素主要包含这四个词语:计算、数据、万物、智能。计算联结数据,智能赋予万物。
计算联结数据
孤立的数据无法产生价值,大数据对“量”这一指标的需求是空前的,数据的联结靠的是计算。媒体行业数百年累积下了巨量的数据资源,是有待挖掘的宝藏。
互联网公司内有这样一种思维:“一切业务数据化,一切数据业务化。”这很像毛泽东提出的“从群众中来,到群众中去”的工作方法,只不过需要提炼和系统化的对象变成了一项项具体的业务。媒体同样是业务的一种,而人工智能的快速发展,则让媒体看到了这一工作方法的可行途径。
业务数据化,首先要做到的是让线下数据走向线上,让过去的数据产生价值。在机器识别猫这一过程中,人工智能首先得到了几百万帧的静态视频资料;AlphaGo在刚刚起步时,同样搜罗了巨量的人类棋谱来学习。这都是让既有的信息记录,真正变成人工智能管理下的数据资源。通过强大的计算力,人工智能就可以在图片间、棋谱间找到关联,进而得到“识别猫”“下围棋”等能力。
数据业务化是为人工智能的工作找到了一个出口,并进一步接收反馈。AlphaGo通过自我对弈和与人类高手的较量,不断调整自己的棋路以及对胜负的预期,最终获得了人类难以企及的棋力;而“城市大脑”则是根据城市摄像头数据对红绿灯的放行策略进行优化调整,具体的调整结果又会反馈到“城市大脑”中,成为进一步完善调整策略的重要参考。以往成功的人工智能案例在这一步上所做的,是让数据的使用和反馈成为一个闭环,而这也是媒体和人工智能融合过程中的一条必经之路。
新闻记录的是历史,沉淀的是数据。媒体大脑的第一项工作,就是建立了一个全球最大的新闻资讯库,这包括文字、图片、音频和视频等各种媒介形式,也包括主流媒体和自媒体乃至UGC(User Generated Content,用户生产内容)等各类信息来源。搜罗信息仅仅是一个开端,如何让信息结构化、标签化才是“一切业务数据化”的关键,而这个过程中必不可少的就是算力。随着云计算业务的发展,媒体大脑可以调用的计算资源在近几年得到了巨大提升,这对媒体而言是前所未有的一次机遇,也是媒体大脑发展的重要基础。
而在收集反馈、形成闭环方面上,人工智能的发展早已走在了前面。随着互联网和智能手机的快速普及,新闻受众对于信息的反馈早已不再是慢悠悠的“读编往来”,人工智能的一个小分支——推荐算法,近几年已经形成了一种行之有效的商业模式。对于媒体来说,收集受众的反馈本该比过去任何一个时代更简单。但在实际工作中,许多媒体却受限于工作思路或媒介形式,缺乏相应的信息沟通渠道。而汇总了全媒体信息和数据的媒体大脑,提供的正是这样一种一站式的解决方案。它收集的反馈一方面使媒体受惠,另一方面,还能为人工智能的自我进化提供数据支持,让媒体和人工智能之间达到互利共赢的效果,这也是媒体和人工智能融合的价值和意义所在。
智能赋予万物
人工智能并不是独立存在的,它需要依托于作为“物”的计算机和智能设备才可以工作。而反过来说,人工智能也可以赋能给各种各样的设备,让它们具有感知世界、向世界发声的能力——这是人类能力的延伸。随着人工智能的发展,我们也将目睹一个万物为媒的进化过程。
媒体大脑8项产品和应用
媒体大脑2410(智能媒体生产平台)目前运用人工智能、大数据、物联网、云计算等新技术,由MGC新闻覆盖突发事件、程序性报道、舆情报道。其生产过程是:首先通过摄像头、传感器、无人机等方式获取视频和数据,然后经由图像识别、视频识别等技术让机器进行内容理解和新闻价值判断,选取报道角度,将新理解的内容与已有知识图谱进行关联,对语义进行检索,并配合接入天气、交通、地理等数据,经过视频编辑、语音合成、数据可视化等一系列过程,最终生成一条富媒体新闻(包含文字、视频、图谱、音频、可视化等),可以在不同的平台上展示。
新华社提出的MGC新闻这一概念,与广为人知的UGC形成了对应。在新闻领域,MGC和UGC的共性是在第一时间、第一现场搜集第一手的新闻素材,但MGC的潜力显然更胜一筹:它的感知设备是可复制的,将来覆盖的时间、空间和信息收集的类别都将远超于人类。机器收集的素材也不存在主观判断问题,它是一个更加真实、全面,也更加结构化、数据化的新闻资源。
在可预见的未来,MGC新闻的发展将与智能设备的发展紧密联系在一起,信息渠道的多寡决定了MGC新闻的覆盖面和进步速度。这包括行车记录仪、无人机、智能家居等各类摄像和传感设备,以智能音箱、智能电视为代表的各类信息输出设备,还包括潜在的VR/AR设备,甚至是未来可能无所不包的机器人。人工智能将全面赋能给这些设备,并从中获取自己成长所需的“养分”。
全量数据,万物为媒,人机协同
在人工智能领域,有一个长久以来被争论的问题:人工智能是否会取代人类?具体到媒体领域,人工智能有没有可能取代记者、编辑?MGC新闻是否会替代人类的报道?2013年,牛津大学研究员的Carl Benedikt Frey和Michael A. Osborne共同发表了一篇论文《The Future of Employment》,对702种职业被人工智能取代的可能性做出了分析。具体到记者这个职业上,论文中提到,人工智能可以取而代之的概率只有11%。两位学者提到了难以被人工智能取代职业的三个特征:帮助和关切他人、思考和创意内容、社交和谈判能力。截至2017年年底,这篇论文已经被引用超过1500次。
笔者认为,媒体人在日常工作中,恰恰对这三个特征都有一定程度的需求,而这就对应着我们评价新闻报道时常说的有温度、有态度、有深度。如果新闻欠缺了这些要素,那它确实可能被机器所取代,但这显然不应成为媒体人对自己的要求。人工智能的发展和MGC新闻的出现,其实为媒体人展示的是另一条路径:让机器做机器擅长的事情,让机器成为人类的千里眼、顺风耳,让机器承担低价值的重复、枯燥的劳动,而媒体人将由此得到生产力上的解放。
现在的记者都需要花费大量的时间在搜集、整理新闻相关的资料上,这件事未来就可以让机器来做,而且很可能比人类做的更加有条理、有效率;以往记者收集自己作品的反馈费时费力,在未来这同样可以由机器代劳。媒体与人工智能的融合会在整个新闻生产流程中提高效率,而节约出来的时间就可以让记者去做更有价值、更有观点、更有温度的深度报道。媒体大脑所推动的正是这样一次新闻生产流程的重塑,进而改变媒体由内到外的整体生态环境。
未来优秀的媒体人不必是人工智能专家,但他一定知道怎样利用人工智能来更好地为自己的工作服务。媒体大脑的出现,不是要取代记者和编辑,而是在更高层面上,把人与物的延伸连接起来,更快、更准、更智能地获取新闻线索和新闻素材,赋能记者和编辑,帮助媒体提高生产力。在媒体和人工智能的融合之路上,媒体大脑将与媒体携手前行。