APP下载

媒资系统云端赋能升级的探索与实践

2022-12-16马晓春

西部广播电视 2022年22期
关键词:媒资通州区编目

马晓春

(作者单位:江苏省南通市通州区融媒体中心)

所谓赋能升级就是采用“本地+云端”的协同生产模式,在有效降低本地系统升级投入的同时,通过业务协同赋能方式,实现云端平台业务功能在本地系统中的实际应用,从而达到本地系统功能升级的目的。

近年来,随着广播电视事业的发展,媒资系统成为广播电视行业的标准配置。但是县级传统媒资系统大部分都是归档型系统,主要用于解决节目素材的存储和保护问题,普遍存在融合生产功能不完善的缺点。同时,受各种条件的限制,系统建设和后续的升级改造都难以实现类似人工智能(Artificial Intelligence,AI)等高级功能,影响了融媒体时代内容的管理和节目的生产。为有效解决上述问题,通州区融媒体中心与江苏省广播电视总台联手,通过平台的互联对接和赋能应用系统的开发,成功实现了荔枝云省运营平台融合生产业务功能在通州媒资系统的本地化应用[1]。

1 传统媒资系统的弊端

1.1 编目质量难以控制

所谓编目就是对音视频资源中的代表性特征信息进行提取和整理,抽取关键帧,划分层次,确定相关著录项。编目质量的好与坏,直接影响到节目的后期再利用。传统媒资系统主要依赖人工方式通过主观判断来完成内容主题的分离和描述,因此,系统受人为因素影响较大,得到的编目信息无法全面客观地展现素材的内容和特征,以致编目质量不高,难以得到有效控制。这是传统媒资在智能化环节上的一个主要难点。

1.2 审核容易出现差错

作为海量内容存储中心的媒资系统,节目与素材的审核是极为重要的任务环节,主要包括敏感人物、敏感词语以及插播广告、挂角内容的审核等。传统媒资的审核工作主要由人工完成,面对庞大、密集、冗杂的内容信息,审核人员的主观判断难免会出现偏差,极易导致漏审和差错。

1.3 检索效率偏低

受人工编目方式的制约,著录级别较高,检索深度和维度偏低,可用的检索手段不多,导致无法高效地提取节目内容的特征信息。

1.4 功能不完善

由于传统媒资系统主要用于解决节目、素材的保存问题,因此,对系统的功能要求相对简单,尤其是县级媒资系统,基本上不具备后期的融合生产能力,更没有类似人工智能的先进功能,只能提供最基本的存储、查找和再利用功能,媒资系统的综合服务效能不高。

2 赋能升级思路和系统设计

2.1 总体方案

通过赋能系统的开发和应用,建立“本地+云端”的协同生产模式。应用微服务、分布式等技术,为通州区融媒体中心打造一个持续发展的媒体资产管理系统;逐步引入基于媒资的生产工具,实现所见即所得的资料调用,助力通州媒资系统由单纯的存储型媒资向生产型媒资转型;提升融合媒体生产能力,赋予通州区融媒体中心融合媒体生产工具集、短视频快编工具、视频编辑工具等;实现人工智能本地化赋能,促进通州媒资的融合发展。通过此模式,在降低本地端平台建设改造成本的同时,以先进的框架、开放的模式、统一的思想、多重的能力、多样的服务,赋予通州区融媒体中心丰富的融合业务能力,推动通州传统媒资系统的转型升级。

2.2 具体对接设计

通州区融媒体中心本地媒资平台与荔枝云省运营平台互联,依靠省平台提供的技术支持,促进内容、生产、媒体处理等业务的协同。为实现业务和管理的便捷化,系统具有多用户功能,包括内容管理、应用管理、用户管理等功能,便于实现门户统一集中管理。联网对接模式如图1所示。

图1 通州区融媒体中心与荔枝云省运营平台互联示意图

2.3 云端协同交互流程

具体云端赋能流程如下:一是通州区融媒体中心本地媒资系统素材入库,入库素材为原码素材;二是通州区融媒体中心本地媒资系统对原码素材进行转码,将内容转为低码素材;三是通州区融媒体中心通过本地安全网络互联专有链路,将本地媒资系统中的低码素材自动上传至省运营平台的内容管理系统中;四是荔枝云省运营平台启动智能服务,调用人工智能功能,包括关键词分析、人脸识别、镜头语言识别等;五是通过人工智能功能的调用,对上传至荔枝云省运营平台的低码素材进行分析,并形成数据标签;六是智能数据标签通过安全网络互联专有链路,传输至通州区融媒体中心本地媒资系统中,并绑定原码素材,形成最终的媒资内容业务数据。云端赋能流程如图2所示。

图2 云端赋能流程图

3 业务协同本地化应用场景分析

根据系统设计思路,荔枝云省运营平台可为通州区融媒体中心提供媒体能力协同、媒体内容协同和应用产品协同等方面的服务。通州区融媒体中心可以根据实际业务需要,进行开通和使用。

3.1 媒体能力协同

媒体能力协同为通州区融媒体中心提供云端媒体处理应用程序编程接口(Application Programming Interface,API)服务,包括AI智能分析(语音识别、人像识别、文字识别等)、云端转码、大数据分析等应用,通州区融媒体中心无须购买昂贵的本地引擎,根据实际的使用需要,调用荔枝云省运营平台提供的各种API接口,实现对本地端媒体文件的多元化处理,基于云端媒体能力协同系统返回数据进行本地化应用,从而以低成本实现多种媒体能力的集成。

第一,镜头语言识别(见图3)。在视频拍摄过程中,拍摄者会根据自己的意图去寻找、组织画面,利用镜头为观众呈现所要讲述故事,观众可以透过镜头画面了解体会拍摄者所要表达的意思,这就是镜头语言。镜头语言识别基于视频深度学习技术,对新闻视频内容进行智能分析,得到镜头运动、拍摄角度、景别、画面属性等镜头语言结果。

图3 镜头语言识别

第二,命名实体识别。命名实体识别又称作“专名识别”,是信息提取、问答系统、句法分析、机器翻译、面向元数据标注等应用领域的重要基础工具,是自然语言处理(Natural Language Processing,NLP)任务中最为基础和常用的任务之一,也是支持内容标签库的主要技术手段,是众多NLP任务的分析基础。命名实体识别(Named Entity Recognition,NER)目前可识别出实体类型包含人名、地名、时间、职务、组织机构名称等。

第三,关键词提取。关键词提取是从较长的文本中,选出可以表达最重要信息的词语或短语,提高信息获取效率,减少阅读耗时,是辅助阅读和编辑的重要内容。关键词提取算法基于深度文本理解技术,对文本中各个词语的重要性进行计算,提取能代表人脑记忆快照的关键词,支持用户对文本的快速理解和语义检索。

第四,词向量。基于深度学习技术,通过文本向量化处理,建立词向量表示模型,便于用户快速准确挖掘理解语义。在当前“万物皆可embedding”(embedding即“嵌入”)的思想领导下,词向量既是NLP 领域中一个非常基础的工具,也是推荐、广告等业务场景中用于召回和排序等阶段的简单且实用的有力手段,主要用于语义相似度度量等。

第五,新闻文本分类。新闻文本分类采用编目规范的分类体系,输出文章的一级主题、二级主题和三级主题,如政治、军事、体育、科学技术、法律、休闲娱乐、公安工作、政府工作、外国军事、球类运动等。该分类体系更适合专业领域的理解与使用,有助于相关资料的收录与存档。

第六,新闻摘要提取。新闻摘要功能基于深度学习技术,从较长的新闻文本中,自动抽取关键信息,形成简明的摘要结果,帮助用户快速理解文本主要内容并应用于内容分发、智能写作等多种应用场景,是智能媒体等行业必备的AI能力之一。

第七,视频内容综合分析。智能视频内容综合分析是基于计算机视觉、自然语言处理、知识图谱等AI技术多维度处理的一款专业提取视频标签的产品,能够为用户提供音视频综合分析服务。通过多种AI人工智能基础识别能力,把得到的基础数据通过自然语言处理、专业领域知识图谱等融合推理,输出对应视频的人物、场景、实体和关键词等具有结构化的标签,供用户搜索或者后期制作使用。视频内容综合分析包括以下四个方面:一是视频人物识别。由于传统媒资系统不具备智能化视频人物识别能力,只能依靠人工方式来完成视频人物监管,存在工作任务重、效率低下的弊端。同时,受审核人员能力水平和精力状态等因素的影响,有可能出现审核遗漏和主观判断偏差导致的错误,造成安全播出事故。使用人脸识别技术,可以最大限度避免人工标注任务时,因人为因素造成的错误情况的发生。在展现的界面上,可以根据时间轴上展现的信息,对视频中的指定人物进行更加快速准确的定位监管。荔枝云省运营平台赋予的视频人物识别能力,可以帮助我们快速地获取图像的关键帧,经过预处理计算,生成图像模式向量和特征值,从而获得图像的底层视角语义信息。通过人脸识别技术和丰富全面的人物库,识别视频中的重要人物或敏感人物等,并与筛选的结果进行比较判断,采取相应的处理方式。人脸识别人物库可由用户自定义来保证系统的广泛适用性[2]。二是视频语音识别。视频语音识别技术是基于统计模式识别的基本理论,通过机器对视频语音内容的学习和理解,获得语音信号对应文本的功能。一个完整的语音识别系统大致包括语音特征提取、识别算法、语义理解、语言模型等几个方面。荔枝云省运营平台视频语音识别系统就是基于语音转写技术,把视频中语音内容转化为文本信息供融合推理使用[3]。三是实体识别。在NLP中通常所说的实体指的是人名、地名、机构名,在新闻领域,人们希望了解突发事件的主体,比如人物、地点、机构等。从识别步骤来看可分为两步:第一步识别出实体词边界,也就是实体的开始和结束位置;第二步识别出实体的类型,也就是事件所描述和涉及的人名、地名、机构名等具体的实体类型。通过实体识别算法从自动语音识别(Automatic Speech Recognition,ASR)或光学字符识别(Optical Character Recognition,OCR)文本中获取人名、地名、机构名。四是标签提取。内容标签是对文本、图文、视频等内容以关键词或者短语形式进行的特征描述。例如,在文本内容中标签常常使用关键词抽取技术,提取出该文本置信度最高的关键词,用以表征该文本内容。项目中标签提取功能,就是通过自然语言处理和知识图谱融合推理后,提取出视频中有效的结构化标签。

第八,文字识别。图像处理技术是目前人工智能发展最为普遍的领域。在视频领域积累和沉淀了大量的图像数据,依托着丰富的“场景+数据+算法”,克服背景复杂、艺术字体、分辨率低、非均匀光照、图像退化、字符形变、多语言混合、文本行复杂版式、检测框字符残缺等困难。荔枝云省运营平台为通州区融媒体中心提供一套准确率高,识别速度快,鲁棒性强的OCR识别算法,并提供相应的云服务。

第九,智能化编目。应用云端人工智能识别和自然语言处理技术,可以对音视频素材进行更为详尽而系统的著录编目,这是媒资系统智能化的重要标志之一。应用荔枝云省运营平台赋予的能力,对音视频文件进行AI人工智能分析,通过内容结构化处理,得出人像信息、语音转文本及智能镜头拆条等结果,从微观角度对视音频内容进行编目描述,将所有标签结果与内容的关键码相关联,相较传统编目方式更加细致精准。主要工具有人像信息编目、语音信息编目、基本信息编目等。除此之外,我们还可基于AI人工智能服务,根据业务需要灵活定制其他信息编目方式[4]。

3.2 媒体内容协同

荔枝云省运营平台媒体内容协调单元为通州区融媒体中心媒资系统提供海量媒体内容服务,包括互联网聚合内容、省平台共享内容、云端收录内容、云端备份内容等。通州区融媒体中心可对云端内容进行选择使用。支持在本地上载、非编等工具中对云端素材直接拖拽上时间线进行天地混编;支持云端与本地内容库的统一浏览;支持云端跟本地内容交互和共享,互为备份[5]。

3.3 应用产品协同

实现了开放式的应用集成框架,支持开发/运维一体化管理,各类软件即服务(Software-as-a-Service,SaaS)工具/服务基于应用协同单元规范均可以挂接到应用协同单元上统一运营,从而为通州区融媒体中心提供丰富的云端媒体SaaS应用服务(线索服务、舆情服务、视频编辑、稿件编辑、内容分发等)。通州区融媒体中心可按需开通,通过浏览器/服务器(Brower/Server,B/S)方式使用云端数据、工具及其他服务,从而弥补本地端业务能力的不足,实现融合生产、协同管理。

一是线索服务。通过大数据技术,对网站、微信、微博、手机应用程序(Application,App)等共计2000多个数据源进行订阅,每日采集50 000余条互联网信息,为通州区融媒体中心采编人员提供海量的互联网线索。

二是舆情服务。通过人工智能技术,设置敏感词汇或监控内容主题,对通州相关微信、微博和客户端的信息数据进行监控。例如,监控发现敏感内容,及时告警,并全面分析研判,予以有效处置。

4 结语

通州媒资系统赋能升级的实践,是媒体融合时代多平台业务协同的一次有益探索与尝试,在无须增加通州本地系统升级投入的前提下,荔枝云省运营平台通过赋能模式,在智能化编目、人工智能技术应用、资源共享等多个方面,赋予了通州区融媒体中心媒资系统更多的融合生产功能,推动了通州媒资由归档型系统向融合生产型系统的转型升级。系统自2020年投入使用以来,各项前期目标均得到了实现,达到了满意的预期效果。随着媒体平台协同能力的提高,赋能升级技术必将得到更大范围的推广应用,通州项目的探索与实践也为赋能升级技术的应用推广提供了可以借鉴的成功案例。

猜你喜欢

媒资通州区编目
产改进行时——通州区总工会打造全覆盖分层次的三级培训体系
全媒体时代的版权媒资管理探析
大数据技术的媒资档案管理方法
灾情就是命令 抢险就是责任——南通通州区“8·29”特大暴雨应对处置纪实
国家图书馆藏四种古籍编目志疑
2018年北京市通州区居民吸烟现况调查
一种智能化媒资检索系统的研究
粤剧编目整理之回顾与展望
MRG9000媒资卫士在市级电视台全台网的应用
CALIS联机合作编目中的授权影印书规范著录