APP下载

“大数据+人工智能”的新闻生产和分发平台
——新华社“媒体大脑”的主要功能和AI时代的新闻愿景

2018-04-10傅丕毅徐常亮陈毅华

中国记者 2018年3期
关键词:大脑人工智能智能

文/傅丕毅 徐常亮 陈毅华

傅丕毅新华智云科技有限公司董事、联席CEO

技术进步一直是媒体变革的驱动力,伴随着人工智能技术的兴起,媒体智能化时代就此拉开帷幕。2017年12月26日,在成都举行的中国新兴媒体产业融合发展大会上,新华社发布了基于大数据和人工智能技术的“媒体大脑”,并通过“媒体大脑”生成了中国第一条MGC(机器生产内容)视频新闻。短短2分08秒的视频,意味着人工智能技术在媒体领域取得重大突破。

一、未来媒体的竞争优势在于怎样用好人工智能

从造纸术到广播、电视再到互联网,媒体往往是信息技术革命的第一批见证人,AI技术将在策划、采访、生产、分发、反馈等全新闻链路上赋能媒体,将为这一有着数百年发展历史的行业注入新的动能,互联网技术之光正在照亮内容生产者前行之路。

现阶段正处于人工智能技术的新兴阶段,技术将走向何方,将产生怎样的媒体形态还难以预测,但技术发展的趋势不会逆转,未来媒体的竞争优势不在于使用人工智能,因为所有人都会用人工智能,竞争优势在于怎样用好人工智能。

媒体融合也同样需要用技术来破解发展瓶颈,新华智云也是在这样的背景下成立的,期望通过大数据及人工智能技术,为包括新华社在内的媒体提供涉及内容发现、采集、编辑、存储、分发、反馈等全生产链的专有智能技术,探索适应大数据智能时代的媒介形态和传播方式。

新华智云2017年6月成立以来,针对内容生产者、信息消费者的实际场景,研发出“媒体大脑”,通过“媒体大脑”扮演新闻生产基础设施的角色,融合大数据、AI、云计算、物联网等多项技术,让新闻信息生产更为智能化,综合运用各项技术,赋能媒体,促进媒体的深度融合、跨界融合,改变媒体行业的生产模式。“媒体大脑”将与媒体互相促进、互相学习、互相辅助,共同迎来媒体的智能时代。

2017年12月26日,新华社在成都发布中国第一个媒体人工智能平台——“媒体大脑”。

二、“媒体大脑”的主要产品和功能

“媒体大脑”目前已经发布了覆盖新闻生产、分发、监测、反馈各环节的8项产品和功能,让媒体与人工智能技术进行全方位接触,人机协作。现阶段,产品和服务包括:自动采集生产新闻的2410智能媒体生产平台;实时语音识别及自动转写的工具“采蜜”,帮助记者提高采访及新闻生产效能;从图片、视频中识别特定人物身份,特殊标识的图片识别工具;监测新闻信息内容在接近全网300万个网站及头部自媒体的传播、版权行为状况;面向未来的新闻信息传播场景的新闻分发,以及基于用户阅读偏好的新闻分发系统;为媒体机构描绘自身用户群体特征、偏好的用户画像服务等。

(一)2410(智能媒体生产平台)

摄像头等智能采集设备将变成记者的眼睛。通过视频摄像头、传感器、无人机、行车记录仪等智能采集设备,以及数据源自动采集的数据获取信息、实时监测新闻事件、自动发现新闻线索,然后通过“媒体大脑”,调用该新闻事件相关的地理位置信息、历史数据资料、同类事件信息,智能进行内容分类、数据分析、数据可视化、稿件撰写、视频剪辑、全程配音等一系列工作,进行智能生产、智能审核、智能发稿、智能分发。2410不仅给媒体和记者提供富媒体内容的新闻线索和新闻素材,也通过人工智能完成从繁杂的数据流和信息流到转化为可用的新闻。

(二)采蜜

“媒体大脑”也为记者的“耳朵”进行赋能,结合业界领先的语音识别能力,推出为记者量身打造的应用“采蜜”,可将采访、会议等录音内容自动转写为文字,自动同步至PC上,省去大量简单重复劳动,大幅提高记者的工作效率,让记者、编辑投入更多精力专注于内容创作本身,并使后续的编辑、审核环节更为顺畅。

(三)新闻分发

未来受众会在哪里看新闻?依托面向未来的智能硬件和国内一流的分发渠道,和个性化推荐、语音交互等智能技术将新闻内容触达到用户。通过大数据,为读者精准推送新闻资讯,也让内容生产者真正了解用户,拉近媒体与用户间的距离,这两者相辅相成,从而达到媒体影响力扩大、用户体验提升的双赢效果。

(四)版权监测

捍卫原创的权利永远是内容创新的动力,“媒体大脑”为原创者开辟一道护城河。一方面原创内容将被进行快速的版权登记,另一方面,基于覆盖全网的数据能力和针对文字、图片等相似度的算法判别技术,“媒体大脑”可以在第一时间针对权利人登记的原创内容,进行全网版权监测,帮助媒体机构和内容生产者快速了解自身内容在全网的使用、传播情况,被侵权行为分析。提供可视化数据报表、监测分析报告,建立版权监控体系,使抄袭、“洗稿”等乱象受到有效遏制。

(五)人脸核查

人脸核查是“媒体大脑”服务媒体的重要板块,通过领先的人脸识别技术,360度全姿态检测,可以帮助媒体在海量的新闻图片、视频中,精确定位特定人员,并可以对图像中包含的人物进行自动分类,提升图像的使用效率;可以帮助媒体在海量的网络媒体和社交媒体新闻图片中,精确识别图片中的人物,构建图像中人物的关系图谱,提升新闻线索发现的效率。图像识别技术可以从人脸识别延展至特定标识、文字识别。

(六)用户画像

基于新华智云的大数据能力,结合媒体机构自身用户行为数据,勾勒用户画像。提供多维度指标交叉分析,精准定位不同用户群,洞察用户特征,帮助媒体机构深度了解自己的用户,使媒体的运营更加个性化、精细化。

(七)智能会话

“媒体大脑”赋予传统新闻新的呈现方式。智能新闻会话机器人通过对新闻大数据的学习,应用最新深度学习语义理解技术及新闻知识图谱,与受众实时进行新闻对话和互动。

(八)语音合成

智能语音合成系统可以将文字生成音频,使文字新闻通过智能家居、汽车音响等各类渠道到达用户,进一步延伸新闻内容的传播路径。

三、MGC视频新闻:“媒体大脑”的初步应用

在2017年12月26日中国新兴媒体产业融合发展大会上,新华社依托“媒体大脑”发布了首条MGC(机器生产内容)新闻。与以往会议报道不同的是,会场内多了一些新面孔:21路摄像头、4类传感器,还有会场附近多类传感器随时待命,它们构成了“媒体大脑”的眼睛和耳朵,301万个网站的公开数据则是“媒体大脑”的知识储备库,背后通过强大的计算能力,实时将数据、AI功能提炼串联。

在会议过程中,登台嘉宾首先要通过人脸核查,数据挖掘技术将嘉宾丰富生动的简介同步呈现到大屏幕上;嘉宾们的发言经过实时语音识别后提取关键词,并将实时检索结果以数据可视化方式呈现;“媒体大脑”还调用了地理位置、天气、交通等多维度数据,经过图像识别、视频识别、自然语言处理、语音识别、语音合成等技术处理后,智能生产出一篇富媒体视频内容。

根据首条MGC(机器生产内容)视频新闻显示,该新闻由“媒体大脑2410会议报道模型”生成,实时调用服务器数量:1000台,分析网页108786961个,检索视频15793分钟、音频4465分钟,调用知识节点437个,计算耗时:10.3秒。

MGC视频新闻只是“媒体大脑”初步的应用尝试。未来,在数据新闻、知识图谱等人工智能的强项上,“媒体大脑”将完成全面覆盖,成为媒体最优质可靠的信息渠道。今后可能只需要记者口述“我想要知道杭州近三年的房价对比”,或是“我想要知道新华社与新华智云公司的关系”,就能得到相应的可视化报表或是知识图谱,而省去了以往繁琐的信息搜集和确认步骤。

现阶段,“媒体大脑”所提供的8个产品和服务只是赋能与媒体内容生产的部分基础要件,随着技术的进步,与业务场景的深入结合,将进一步完善现有的产品和功能,推出新的智能技术应用。从智能辅助到人机协作,到智能化生产内容的路径同时并行,技术发展与媒体业务场景是彼此促进的关系,而非简单的辅助工具,两者结合将产生奇妙的化学反应。

四、“媒体大脑”与智能时代的新闻愿景

新华智云的发展愿景是:凭计算之力,求数据洞察,赋万物为媒,迎智能时代,集中体现在计算、数据、万物、智能这四个关键词上。“媒体大脑”及8个产品和功能也是基于此产生的。

以往,媒体记者从田间巷口采访新闻,经过编辑加工,再发布出去,有了人工智能手段,依托强大的计算能力,人机协作可以极大提升生产力。现场的语音、图像实时转换成文字,选出图片,自动提炼出新闻,同步发布给适合的用户。有了人工智能辅助,也将盘活媒体机构的文字、图片数据,数据将联通媒体机构和外部世界,发现其中的联系,大数据洞察下,将极大丰富我们认知的“视界”。

以摄像头、行车记录仪为代表的智能设备,将成为媒体机构实时在线的通讯员,发现新闻线索,自动采写成新闻,新闻信息获取和生产将脱离口头、纸面和屏幕,人工干预的程度会越来越低,自动化的程度会越来越高。以智能音箱、智能家电为代表的智能硬件将全面融入受众的生活,受众获取新闻信息的渠道也将从手机、报纸变得多样化,智能家电、电脑、手机、智能音箱、互联网汽车等,都会成为新闻信息交互的媒介,万物为媒这个过程并不会遥远。

从数据的角度看,摄像头等智能传感器不断积累数据,智能音箱、互联网汽车等智能媒介将成为数据的出口,将新闻信息透出给受众,同时,受众通过“媒体大脑”智能会话等产品,将不再是被动的接收新闻,而是与“媒体大脑”交互,提出需求,发现更多的新闻,这个过程,将用户偏好信息传递给“媒体大脑”,也将产生更多更生动的延展新闻信息资讯,这类数据将不断改进内容生产的针对性,贴近受众实际阅读需求,这个数据积累沉淀的过程都将通过智能化的手段实时完成。

互联网时代诞生了很多类似人工智能、虚拟现实、增强现实、人脸识别、图像处理等技术,未来的媒体将会更多融入这些技术,新华智云将持续以“媒体大脑”作为内容生产者的基础设施,提供贯穿整个生产链条的智能化产品和服务,用新兴技术改变传统新闻采编发的生产流程,甚至创造新的内容生产模式,帮助媒体机构产生更有价值、更真实、时效性更强的新闻内容。媒体机构可以依托“媒体大脑”这一基础设施资源,将有限的人力投入到深度调研等内容生产的核心领域中。新华智云公司内部

常提起一句话:Before it's news, it's data;After it's news,it's data。智云的使命就是要重新定义大数据时代内容生产者的核心竞争力,让人工智能为媒体服务且赋能,新华智云将始终不渝地追求内容人与新技术的完美融合。

正如新华社副社长刘思扬在发布仪式上强调,“媒体大脑”和MGC新闻的出现,不是要取代记者和编辑,而是在更高层面上,把人与物的延伸连接起来,更快、更准、更智能地获得新闻线索和新闻素材,赋能记者和编辑,帮助媒体提高生产力。媒体大脑可能不是未来媒体发展的唯一方向,但一定是其中一个方向。刘思扬还表示,人工智能平台正在成为媒体创新发展的基础设施,我们愿意为未来互联网发展做出媒体人的贡献。 (作者傅丕毅是新华智云科技有限公司董事、联席CEO;徐常亮是新华智云科技有限公司董事、联席CEO;陈毅华是新华智云科技有限公司董办主任)

猜你喜欢

大脑人工智能智能
2019:人工智能
智能前沿
智能前沿
智能前沿
智能前沿
人工智能与就业
数读人工智能
下一幕,人工智能!