面向广电场景的AI平台研究与探索
2022-12-22龚坤,赵时
龚 坤,赵 时
(1.成都索贝数码科技股份有限公司,四川 成都 610000;2.湖北省新闻出版广电监管中心,湖北 武汉 430000)
0 引 言
2020年,中共中央宣传部等九部委联合印发《全国有线电视网络整合发展实施方案》,明确指出要加快推动全国有线电视网络整合,实现全国一网。广电网络生态在不断升级的同时,其管理、工作方法也在受到互联网的冲击。例如,海量制作素材难以筛选,播出内容大量增加,这都给制作人员和审核人员带来了巨大的压力[1]。人工智能(Artificial Intelligence,AI)作为新一代信息技术,已被广泛应用到交通、能源、医疗及工业生产等多个领域,并取得了不错的效果,能有效提升生产效率、减少人力成本。AI技术在广电行业的发展趋势,必将是以AI来代替大量繁杂的重复性人力劳动,研制出更为丰富的、针对广电场景的专用AI模型,推动AI在广电行业的专业化应用。因此,研究AI适用于广电领域的哪些具体应用场景,如何与广电业务系统对接实现应用落地,具有重要的价值。
1 场景需求分析
1.1 选题策划
选题策划的痛点在于如何搜集各渠道信息并确定热点,快速策划出满足各类群体并能引导正能量内容的节目、掌握舆论制高点。对此,利用AI和数字挖掘技术,能够对微博、抖音、快手等各渠道进行信息搜集,并就舆情热点、用户喜好等关键因素进行分析,通过人脸识别、OCR字符识别、语音识别、镜头聚类、模糊对齐等技术手段解读新闻;根据分析结果推荐节目制作的话题和方向,自动撰写策划文稿,帮助节目制作人员快速策划出满足用户需求的节目。
1.2 媒资管理
媒资管理的痛点在于大规模、多模态的数字媒体如何快速检索、编目。利用语音识别、图像识别、视频识别等智能识别技术,可对视音频内的内容进行提取;通过自然语言理解、图像语义分析、视频语义分析等智能理解技术,能将视音频内的人物、机构等重要因素进行智能标签,可实现智能化编目和智能化检索,充分挖掘媒体资源的价值。
1.3 生产制作
生产制作的痛点在于传统媒体素材如何提升画面质量以及如何快速制作稿件。利用图像、视频超分辨率重建、去交错等AI技术,可将视频清晰度增强、变换视频采样格式,并通过对抗学习对画面进行修复。此外,利用图像识别、OCR识别、视频语义分析、自然语言理解等技术,能根据输入标签精准提炼画面、文字,形成专业多媒体稿,可有效提升生产效率,并且增强生产内容的表现力与感染力。
1.4 分发传输
分发传输的痛点在于传播渠道的格式多影响传播速度以及如何将合适的内容传播给需要的观众。一方面,利用自然语言理解、语义分析、图像识别、OCR识别等技术,可实现智能格式修改,提升内容传播速度,掌握宣传主动权;另一方面,通过分析用户行为特征和业务偏好,基于海量内容和用户数据,建立流行度管理和预测方法,利用用户画像等技术,可进行内容推荐,提升内容的传播力和影响力。
1.5 内容审核
广播电视内容安全关乎国家政治安全、文化信息安全以及意识形态安全。目前,内容审核多采用人工方式进行,但是新闻类和访谈类节目中往往包含大量各级领导干部的影像、声音、姓名等信息,审核人员难以辨识所有人物的身份和背景,同时,面对互联网产出的大量内容,人工的低审核效率、长时间工作导致的状态下降等问题愈发突出,播出事故频频发生[2]。利用智能识别技术,可对敏感内容和人物进行标记,从而有效辅助人工对视频中的内容进行高效、全面的判断,避免冗长的无效信息带来的人力成本浪费。
从上述分析可知,选题策划、媒资管理、生产制作、分发运输以及内容审核等广电场景,都对AI有需求,且AI能够有效地提升这些场景下的工作效率和效果。然而,这些场景通常要求多种AI原子能力组合应用以解决问题,而AI原子能力由计算资源、训练数据、算法技术组合得到,因此,需要一个平台来综合提供这些底层资源和技术,从而形成多个AI原子能力,进而面向广电场景实现应用。
2 平台设计
面向广电场景的AI平台,应该具有知识库、大数据治理、AI管理等核心组件,同时需要规划平台的资源层、技术层、服务层等各层级模块以及相互之间的关系,为未来进行平台落地建设提供新的思路和指导方案。
2.1 平台架构
以湖北省新闻出版广电监管中心的AI平台实际建设方案为例,平台的资源层、技术层、服务层等各层级模块以及相互之间的关系如图1所示。
图1 湖北省新闻出版广电监管中心面向广电场景的AI平台
2.2 资源层
资源层由计算服务器、网络设备、存储设备以及广电场景目前逐渐应用较多的移动终端等设备组成。考虑到在全国一网的背景下,广电领域有着海量的素材和复杂的应用场景,对计算能力、精度及可扩展性等性能要求很高,因此,资源由云服务提供商提供,以应对突发情况下资源不足的问题。同时,由于云服务具备弹性资源供给的特性,可以避免采购过多设备带来的浪费问题。
2.3 核心组件
平台核心组件包括知识库组件、大数据治理组件以及AI管理组件。知识库组件根据多年从业人员的输入存储了大量业务经验和知识,能支撑场景化AI原子能力的训练。比如,在智能导播算法的设计中,需要导播提供镜头语言、镜头切换时机、运镜方法等知识;在敏感内容识别中,需要有监管人员界定涉黄、涉暴等内容的相关边界。除了专家的业务经验之外,知识库还可利用知识图谱和数据治理相关技术对历史生产数据进行抽取,有助于收集易被忽视的信息,同时可以分析知识间的关系,明确不同知识在业务场景中的重要性[3]。
大数据治理组件具有可对用户使用数据和内部生产数据进行采集的渠道,利用分布式数据库、分布式计算引擎来构成数据集成系统、数据资源池、数据服务系统以及数据共享系统,并结合数据挖掘技术进行数据管理和数据治理[4]。利用大数据治理组件,可以对用户数据和历史生产数据进行有效管理和价值挖掘,并有助于知识库进行知识抽取,还能提供大量数据训练具有高泛化性的AI原子能力。
AI管理组件由大数据治理组件提供存储资源,计算服务器提供CPU、GPU等计算资源进行模型训练。通过分布式资源调度框架来调度各计算服务器的计算资源,以支持模型的分布式训练,并且可通过容器化的方式支撑多个AI框架,以保证AI原子能力之间互不冲突[5]。此外,还有能力库可对各种训练好的AI原子能力进行管理。基于AI管理组件,能够有效利用各平台资源来训练基础和场景化的AI原子能力,可方便、快捷、高效地形成面向广电行业的各项智能服务。
2.4 接口标准
统一的接口规范定义了与AI平台其他系统进行数据交换的数据规范和报文规范。建立统一的接口规范,对各厂商AI能力进行封装,平台只需要关注AI算法本身,对于各种应用场景,无需再重复开发接口,能够节约人力、时间成本。
2.5 算法技术层
平台的算法技术层分为基础算法和面向广电业务场景的算法。基础算法包括人脸识别、语音识别、自然语言处理、推荐算法以及知识图谱构建。在这些基础算法上,通过融合推理,推出面向广电业务场景的智能算法,包括镜头语言识别、智能剪辑技术以及视频增强技术等。其中,视频增强技术包括视频超分、色彩变换及图像修复等。
2.6 服务层
平台的服务层主要是基于各项面向广电业务场景的算法,为电视台等广电机构提供智能编片、智能编目、智能拆条、智能审片、智能唱词、智能抹标、智能配音、智能修复、内容推荐以及数据分析等智能服务。
3 结 语
本文详细阐述了湖北省新闻出版广电监管中心建设面向广电场景AI平台的实践中,人工智能可应用于广播电视行业的多个具体应用场景。针对面向广电场景的AI平台进行了探索和应用,给出了平台架构和核心组件,有助于全国各级电视台等广电机构建立自己的AI平台,以推进智慧广电服务,满足城市圈用户多元化需求,全面增强媒体影响力。