智能媒资在媒体融合中的应用与思考
2022-07-09罗琼覃俊邓蕾
罗 琼 覃 俊 邓 蕾
(广西日报社,广西 南宁 530015)
导语
媒体融合在逐渐向纵深发展,传统媒体过往的媒体资源管理状态已然无法维持,在全媒体发展的进程中,海量的媒体资源散落各处,加上无序、不集中存储与粗放的管理模式,使得需要查询资料时,只能通过传统的人工方式四处查找。如此,想要快速查询或者获取历史资料就会变得既麻烦又耗时,如何避免宝贵的历史文献信息的流失,改变内部智能分享环节的缺失和无序的管理环境,从而共享到信息技术创新所带来的数智化管理体系红利,亦或是建设一套符合融媒发展需求的智能媒资系统,是当下国内众多传统媒体所面临的难题。例如偏重传统纸媒方向的广西日报传媒集团,之前因条件限制,大多数的新闻信息资源管理处于粗放的状态,更不用说是对音视频、图片类资源进行高效的管理和施与科学的处理手段了。
广西日报传媒集团广西云智能媒资库的建设重点在于摒弃上述短板,在整合报社内部资源的同时与广西云平台对接,搭建一套可对媒资内容进行检索、获取、共享等功能的系统,通过在媒资管理业务流程中引入云计算及人工智能技术,构建起一个具备人脸识别、字幕识别、语言识别等功能的“智能化媒资管理平台”。如此,才能有效解决集团传统媒资管理中的长期缺陷,使智能媒资管理系统得以从传统档案管理型媒资向生产服务型媒资转变。与此同时,在既能对集团旗下所有媒体平台提供智能媒资管理服务的同时,作为自治区级平台广西云建设中不可分割的部分,还要面向广西壮族自治区内14个设区市、111个县(市、区)开放并提供服务,为全区媒体融合发展提质增效,以技术赋能县级融媒体发展,夯实广西云融媒平台发展基石。总体架构如图1。
图1 总体架构
1.传统媒体转型,媒资管理短板凸显
随着信息技术的日新月异的快速更迭,传统媒体的媒资管理短板日益凸显,极大地影响了媒体融合发展的效能。常年积淀的媒资散落各处,海量的宝贵信息资源根本无法体现其价值,造成媒资资源没有得到有效利用,甚至造成无法实时地与外部进行交互,新媒体在进行内容生产时也无法得以快速响应,阻碍了“移动优先”的全媒体时代大量资讯快速生产的需要,这样心有余而力不足的状态在媒体融合向纵深发展的进程中更为凸显。当前传统媒体资源管理现状主要表现如下。
海量音像及文本资料的存储、再利用和管理困难。长年累月地积累,各媒体的音像素材数量庞大内容丰富,音视频资源格式、种类繁多,文件大小不一不易识别与交换、变现,难以有效管理,具体表现如下。
管理混乱,图片资料遗失严重。在传统媒体单位,数据库不完善或缺乏素材管理,办公电脑、相机、存储设备等载体的更新换代,大部图片资源散落在各部门、各平台或者个人处以及档案柜的光盘里,原素材难以汇总搜集整理乃至消失,管理处于粗放型的无序状态。
资料安全缺乏保障。由于大量资料处于放羊型管理状态,音视频磁带及录制介质容易受环境及存储的影响导致资料损失或损坏、丢失等情况常常发生,使媒资资源的安全性无法得到保障。
查找缓慢繁琐,效率低下。因为数据库的缺失或者不完善,传统媒体中各管理部门不同存储介质不一,加上素材管理无序,无法汇聚统一,查找起来非常缓慢且繁琐,给日常工作中对历史图片资料等的查询造成了极大困难,这直接导致了获取信息资料工作效率低下。
无法有效快速共享、获取和交互。在传统媒体体系中,大量的音像资料属于员工个人资源由个人存储,或散落在各个部门光盘里和各平台上,已经进行规范化管理的,却还是传统的管理模式,无法有效快速共享和获取、交互。
价值变现效果极低,难以精细化管理。传统的资料管理不集中或粗放的管理方式,导致媒资流失严重。如果媒资缺乏智能的科学的管理手段,哪怕知道那些留存下来的海量音像资料价值极高,但要想变现或满足于媒体融合的业务需要,也是困难重重。哪怕是做个乡村振兴专题展览,都需要花费大量的人力和精力去找寻材料。无法使得媒体资产通过社会化媒体传播发挥其潜能并且创造出社会价值。
因此,需要把这些痛点祛除,利用智能技术去驱动与赋能,在传统媒体与新媒体的融合建设带动下,让变革与创新充分体现出传统媒资应有的价值。让以往通过传统技术和工具无法分析并获取价值的非结构性数据,在大数据时代变成可以深入挖掘的宝藏。价值体现如下图2。
图2 价值体现
2.剔除痛点补足短板,技术赋能融媒发展
“不积跬步无以至千里,不积小流无以成江海”,在媒体逐渐向纵深融合发展的大潮中,要想解决上述面临的问题,需要与时俱进跟上融媒发展的步伐,建立一套专业智能化的媒资管理系统。将海量媒资资源,包括音视频、图像资料、文档及动漫画等尽可能地根据其不同的特点进行安全地集中统一规范管理,并纳入精细化的资产管理范畴,才能有效防止资产流失。目前,集团已经在这方面做出了改革,在平台中纳入第三方能力为己用,边建设边实践边迭代。
当前,人工智能技术已广泛应用于各行各业,我国媒体融合步伐正在逐渐向纵深发展,“媒体+AI”的应用场景已然到来,并迅速融入人们的工作与生活中,各类传统媒体、新兴媒体已将人工智能技术大规模应用于内容采集、生产、管理、审核和分发,检索应用乃至变现等环节。[1]
因于上述媒资管理系统的发展现状和政策、技术背景,“媒资+AI”“非编+AI”的深度融合产品应运而生,通过人脸识别、语音识别(ASR)、语音合成(TTS)、自然语言理解(NLP)、字幕识别(OCR)、智能场景识别等人工智能技术赋能媒资内容的汇聚、生产、审核、编目、检索、统计、存储及运营管理等环节,使业务效率得以全面提升。[2]广西日报传媒集团在智能媒资建设项目的建设中,亦在对上述能力进行不断尝试,并基于自主研发的AI算法中去实现对视频、音频、图片、文档等资料进行统一管理。该系统通过“大数据+人工智能”实现媒资的结构化存储和智能媒资检索。主要通过以下手段提升智能媒资系统的功能和效用。
“存”。首先,建设项目中涵盖的部分即是媒资存储,其存储功能支持高和低双码率,素材码流高的用于归档存储,低者则用于编目检索等功能。同时利用成熟的分布式集群技术解决日益膨胀的内容数据问题,这不仅可以降低数据通信成本和产品维护成本,同时还能够为业务系统提供更稳定、更安全的内容、存储以及数据分析与挖掘的一体化服务。
与此同时,可配合对已存入系统的媒资进行多维度的自动化编目,并把入库的媒资流程尽可能地简化。在媒资管理中包括存储在内的许多个环节赋予AI能力,方便应用人员通过系统进行语音、标签、图片、人脸等识别,以及将图像、音视频等内容进行文本化和结构化。不论是一句话、一行字或是一个场景的媒资均有AI标注,给检索与再利用带来了便利。
“用”。可实时在线对系统内各种信息资源进行编目,或者栏目的灵活添加、字段的删改等多种模式定义功能,支持遵循国家音像资料的编目结构、原则;可针对节目、片段、场景、镜头等多层次的编目。支持对视频片段进行剪辑,播放并下载至本地。支持用户对媒资进行管理,包括添加媒资、查看媒资、搜索媒资,并对媒资进行编辑和导出,为上层业务输入媒资数据,支持批量导出。
同时满足用媒资时能够提高主动检索效率,以便于进行数据服务时,让媒资资产的价值得以加持,从而给报社在进行数据评估变现时做出参考。
“审”。对媒资内容的严格审核,无论在何时,都是主流媒体的一项硬性要求。在智能化的媒资管理系统中,对政治人物、敏感人物、涉黄涉暴等事实的准确核查和审核,是对媒资内容安全的极大保障。
“管”。实现并完善集团媒资对象管理体系。这是基于面向对象的思路,将集团业务数据和业务逻辑紧密结合在一起,实现系统数据管理到内容管理的转化的目标。纳入系统内进行标准化的资源管理,内容包括音视频、图像、文档、flash动画各种常用的格式;并且支持主流单反相机创建的原始格式图片;文档类支持DOC、RTF、XLS、PPT、PDF等格式。并且以上文件都能支持自动识别,浏览格式自动转换,其他数字文件都可以普通文件形式存储。此外,还可对所有租户、应用、角色权限等进行统一管理。
“搜”。智能媒资已经能够满足用户的简单检索需求,因此释放的人力,恰好能进一步集中到专业需求度更强、资料服务量更大、社会效益更高的项目中。[3]在系统建设时,考虑到标签管理是非常重要的一环,因此有一项功能是可以对媒资手工录入自定义标签,同时收入录入标签支持媒资检索。支持媒资检索,在用户登录媒资平台时,可以自动展示最新上传的素材,能够通过筛选项,选择查看图片或者视频等媒资类型。支持通过搜索关键词、通用筛选项(时间、素材类型)、媒资专用筛选项(格式、时长、构图等)对媒资进行查找和筛选。并且可以查看媒资的搜索结果,对命中的关键词进行高亮展示。
选择按发布时间筛选媒资内容,会弹出时间框选项,选择具体检索内容发布时间区间,会自动筛选出该时间段媒资内容进行展示。可以查看包括媒资本身基础信息和通过内容理解、内容萃取提取出的内容详情,并对视频进行编辑或者上下架。可针对视频中解析出来的各类标签,点击查看对应的视频片段。在识别功能上,需要满足语音识别(比如针对足球领域、时政会议领域等)、OCR识别(比如视频字幕、赛事的比赛时间等)、镜头识别(这是针对判断镜头是否转换,可以用于对长视频进行切片,将视频转化为最小颗粒度的媒资,便于更好地利用)、人脸查找(如明星、政要、足球球员、敏感人物等,这个功能的支持是建立在专门的人脸库,来进行特定人物的识别)、ASR(是语音引擎负责将语音请求转换为识别的文字)。[4]
以支持识别视频中出现的名人人脸为例,通过点击查看对应的视频片段,通过与智能数据中心中的数据进行匹配,展示识别出人脸或标签的详细内容。同时还支持识别视频中的语音,并选择指定段落进行播放,支持识别视频中的文字支持对视频片段进行智能剪辑,将在播放条上高亮显示标签/文字/语音/人脸对应的段落,辅助编辑进行剪辑,快速定位到想要的段落,进行剪辑并下载至本地。
通过以上环节的AI赋能,真正地实现了“AI+内容”的有机结合。功能全景图如下图3。
图3 功能全景图
3.提质增效,为融媒产品加分
技术赋能融媒发展已毋庸置疑,并且逐渐地由幕后走到了台前。广西日报传媒集团建设的智能媒资管理系统主要包括两部分:本地媒资管理系统与公有云智能化服务。本地媒资管理系统部署于本地的服务器中,本地上传高码率媒资文件后统一转码为低码率文件,同步上传到公有云(Magic短视频智能生产平台),调用云端智能能力对视频/图片进行智能打标签服务,并将打标签结果同步至本地媒资管理系统中。通过本地化媒资系统实现智能检索、下载等功能。在云端的媒资文件还可以调用智能生产云服务工具,如直播拆条、视频包装、同期字幕、智能模板视频、视频去抖、视频转GIF、新闻拆条、视频压缩、文章自动转视频、海报视频等云工具。在公有云的应用平台上还部署了语音识别、OCR识别、镜头识别、人脸识别、ASR等智能化功能,为融媒平台提质增效,为融媒产品加分。[5]
大数据技术的价值不止于海量数据本身,更在于如何对数据进行有效的数据共享、组织及利用,提升数据处理能力,实现数据价值。[6]广西日报社智能媒资管理系统将AI智能服务与媒资管理功能相结合,建设一套面向视频、音频、图片类型本地化媒体资源管理系统,并与广西云融媒体平台对接,实现媒资内容的检索、获取、共享等功能。同时考虑到AI云服务具有高效率、快迭代、功能丰富等优点,重塑了AI云服务+本地媒资管理系统+广西云平台的数据交互和服务共享能力,既能满足集团内媒体资源管理需求,又能结合人工智能生产需求的智能媒资管理系统,加强媒体资源的利用效率,提高媒体人内容创作效率,统一服务能力,减少运营成本,效益明显提升。
媒资系统的建设不应停留在技术层面 ,更应站在市场战略性层面 ,对其核心竞争力和自身优势进行分析规划 ,使其更好地发展。[7]引入媒体资产管理概念和建立实用的媒体资产管理系统,是关系到各行各业媒体技术提升和多种业务开展的战略性行为。[8]提升传播能力,增长用户连接,亦是建设本系统的主要目的之一。2020年广西云各媒体平台总用户超5178万,发稿120余万条次,新媒体总浏览量达114亿次,点击上亿次的融媒体作品有23款,点击千万次以上的达180款。2021年至2022年1月3日,广西云中心圈粉丝数合计5209万。广西日报传媒集团各新媒体平台总阅读数达197亿次。点击量超亿次的融媒体精品达18款,超千万次的有304款,创历史新高。互联网上60%的广西原创新闻资讯出自广西云;加强舆论引导,传递主流价值观。广西云新闻客户端常态化组织各市级县级客户端联动直播,先后推出大型直播节目《壮美广西·我们的年夜饭》《壮美广西·我们的春晚》《2019记者节大直播“谁不说我家乡好”》等,总阅读量突破2000万次。2019年,广西云客户端111个县级分端共发稿约2.5万条,直播386场;提升资源利用率,避免重复建设。2022年以来,广西云新闻客户端与全区县级融媒体中心联动相继推出“八桂话防控 乡音入民心”“空中课堂”“贫困县风采连线”“县长带货”“云上对歌台”以及“2020,我们行!14城接力赞广西”5G+VR大型全景直播活动等,多个活动的点击量超过1000万,尤其是“空中课堂”的点击量超过1亿次,进一步拓展了广西云在地方的联动性和影响力。目前,广西云分端县级客户端的日均发稿量超过200条。
结语
智能媒资管理系统的关键点是如何将AI智能服务与媒资管理功能相结合。传统媒资脱胎于广电行业的媒资系统,具有非常重要的功能业务及繁冗的系统逻辑,且完全依赖于大量人力的投入。广西日报传媒集团智能媒资管理系统主要分为本地化的媒资管理系统、本地化的OSS存储和基于专属云服务的智能生产系统。由于各系统涉及到本地化设备与云端服务、新建系统与已有系统等的交互衔接,因此该项目的重点工作不只是提供符合要求的产品,而且要做好系统间的接口对接,通过多种接口方式实现内容、元数据、指令等信息的实时交互及AI能力服务调度。技术上的对接与系统的重塑,直接影响到用户的使用体验感,比如音频的上传与文字的转换尚处于探索中,对各种场景的应用,广西日报传媒集团尚在边建设边使用边迭代。