媒体融合背景下广播电视节目智慧监管新模式研究
2022-07-28司凯威
司凯威
国家广播电视总局二九三台 河南省 郑州市 451162
引 言
本文系统研究广播电视节目在中短波、有线数字电视、地面无线数字电视、IPTV、互联网电视、短视频平台、移动应用程序等平台的传播特点,利用硬件虚拟化、数据安全传输、数据智能处理与存储等技术,搭建完成一体化的监管平台。利用网络爬虫、区块链、特征识别、多源数据处理等技术,构建具有节目采集、指标判断、内容识别、舆情分析、预警上报、信息传递等功能的应用软件,探索建立融媒体时代网络化、智慧化、协同化的节目监管新模式。
1 传播特点
1.1 传播渠道多元
广播电视机构在不断改善传统传播渠道覆盖效果的基础上,持续加大互联网、移动互联网、IPTV、互联网电视等新媒体的资金和人员投入,达到网上网下同步发力,大小屏联动传播效果。以中央广播电视总台制作的冬奥会节目为例,通过中短波、调频、卫星、有线数字电视、地面无线数字电视等对全国进行有效覆盖,利用央视频等客户端,爱尚传媒等IPTV 播控总平台、互联网电视播控平台、微博和微信等社交软件、快手和抖音等短视频平台等进行网络传播。
1.2 节目信息丰富
在现代互联网和通信技术的带动下,新媒体传播广播电视节目不再受制于频率和时长,可将图文、片花、花絮、动画等与节目进行融合传播。近年来,随着信息推荐算法的兴起和碎片化传播能力的提升,广播电视机构开始建立融媒体创作中心,对节目资源进行二次编辑和传播,进一步提升节目的影响力。以北京冬奥会的相关节目为例,网民不仅能看到直播节目,还能够从多个渠道获取赛事预告、选手信息、精彩视频、网民评论等信息。
1.3 互动频次增加
广播电视媒体纷纷在社交软件、短视频平台、客户端等平台开通了留言、评论等互动专区,为节目制作人员和受众,受众与受众之间提供沟通和交流的平台,以便收集反馈意见和提升节目的影响力。
1.4 传播环节增多
相对于广播电视节目通过无线、有线、卫星等传统渠道进行传输,新媒体的传播渠道使用了大量新的播控和网络设备,开放了远程维护端口,带来了新的网络安全隐患。
2 系统设计
在确保网络安全的情况下,为提升硬件资源的利用率、内容提取和识别效率、监管数据的存取速度、兼顾平台灵活性和可扩展性,将系统划分为节目信息采集、数据安全传输、数据处理与存储、数据应用等4个子系统,如图1所示。
图1 系统结构示意图
2.1 节目信息采集
专网节目信息采集部分主要指中短波、调频、有线数字电视、地面无线数字、IPTV 等监测前端设备。该类设备一般由信号接收装置、解调设备、音视频录像设备、控制主机、通信设备等组成,能够实现信号接收、信号测量、音视频采集、EPG 读取、网络管理、数据库管理等功能。因地域的限制,该类设备一般需要安装在各个地市,通过电信运营商的数据专线与本地技术系统通信。
互联网节目信息采集部分主要是利用本地服务器获取视频网站、互联网电视、移动客户端、社交软件、短视频平台等渠道的节目、标题、评论、弹幕等信息。该类传播渠道的节目信息一般具有数量多、内容丰富、更新速度快、不受地域限制等特点。为防止长时间、高频次、大流量的数据抓取而被监管对象封堵的情况,系统中使用了IP 地址代理等多种反封堵的技术。
协作单位节目信息采集部分主要指从广播电视制作、播控、传输、监测单位获取节目审核信息。因协作单位的技术系统不完全相同,需分别设计单独的通讯接口,以及时的获取节目审核信息。在本系统中,使用区块链的联盟链的技术,将广播电视节目的名称、时间、频率、审核人等信息整合,以便于减少审核的成本和快速定位故障节点。
2.2 数据安全传输
数据安全传输部分主要包括通信线路、网络通信设备、网络安全设备。为确保通信的稳定性和安全性,在专网、互联网节目信息采集中,使用了联通、移动、电信、有线等运营商的MSTP 专线。在与协作单位的数据通信中,使用虚拟专用网技术,建立安全的数据传输通道。在系统内部,使用两台千兆路由器和交换机确保设备间通信的速度。在优化防火墙等安全策略的基础上,引入VPN、IDS 等网络安全设备,防止技术系统的核心数据被窃取。
2.3 数据处理与存储
数据处理与存储部分主要包括多台高性能的数据处理和存储服务器、磁盘阵列。为确保数据的处理速度和网络数据的吞吐速率,利用设备虚拟化技术,对计算和网络资源进行统一的调度和管理,满足对海量文字、图片、音视频、特征值的运算需求。使用专门的调度管理服务器,对虚拟服务器的运行状态进行监控。
为保证数据的存取速度和减少数据冗余,使用实时同步的磁盘阵列和数据库服务器分别保存过程数据和监管结果,使用关系型数据库MYSQL 和非关系型的数据库MONGODB 来分别保存格式化和非格式化的数据。
2.4 数据应用
数据应用部分主要包括网站发布服务器、网络安全设备、用户终端设备和网络通信接口服务器。系统使用支持高并发的发布服务器满足多个用户终端的进行节目审核、预警处理等方面的需求。通过通讯服务器向上级主管部门和协作单位推送监管数据。
3 软件设计
为实现广播电视节目信息采集、指标判断、内容识别、舆情分析、预警上报、信息传递等功能,提供智慧化的技术监测、内容监管、系统运行等预警服务,按照分层设计和面向对象的编程理念,将系统软件分为基础环境层、采集层、存储与处理层、业务应用层,如图2 所示。
图2 系统软件组成示意图
3.1 基础环境层
基础环境层主要包括监测前端、网络设备、磁盘阵列、数据库等技术接口,为上层软件的正常运行提供硬件和软件环境。将所有的接口按照面向对象的编程规范进行封装,以提升软件的扩展性和可维护性。
3.2 数据采集层
数据采集层通过采集程序获取节目名称、内容、制作机构、播出机构、信号指标、传播情况、网民评论等信息。一是远程调用中短波、调频、有线数字电视、地面无线数字电视、IPTV 监测前端的采集程序,对播出信号和内容进行采样,并回传到本地服务器。为便于后期的内容识别,音视频节目均需添加时间戳。二是利用网络爬虫、终端控制、IP 代理等技术,实时采集视频网站、移动应用程序、社交网站、互联网电视等渠道的节目信息,将获取的链接地址、页面内容、节目、下载链接、网民评论等信息保存到数据库和磁盘阵中。为便于任务维护,将网络爬虫的采集广度和深度等规则保存在数据库中。三是调用协作单位的数据交换接口,以获取制作、播出、传输等环节产生的区块链信息,解析得到节目名称、时长、审核结果、审核单位、审核人等数据。
3.3 数据存储层
数据存储层用于存储设备信息、任务参数、指标参数、图文、音视频、运行指标、控制规则、监管结果、反馈意见等数据。利用非关系型数据存储技术,保存海量非标准化原始采集文字、图片、页面、动画等数据。调用音视频指纹生成算法,计算各个节目之间的相似度,减少不同渠道获取的音视频数据的重复保存,以节省存储空间。在数据库中,用存储节目信息的HASH 值,提升数据的查询、比较、更新速度。
3.4 数据处理层
数据处理层对采集到的广播电视信息中的文字、图片、音视频等数据进行处理,获取信号指标、节目内容和系统运行状态预警数据。在处理文字信息时,首先利用分词技术进行数据清洗,对于缺失数据进行补充和异常数据进行修正。利用情感分析和关键词比对技术,判别预警类别和级别,同时为节目内容预警提供线索。在处理获取到的图片时,利用图片指纹特征识别技术,进行相似度的比对,减少对图片识别的次数,节约计算资源。在音视频处理中,除了使用最新的识别算法外,将历史经验数据融入到大数据的处理算法中,提升识别的精准性。为综合利用多个渠道的预警数据,采用基于贝叶斯估计的多源数据处理算法生成一致性的指标、内容和运行状态预警结论。
3.5 业务应用层
业务应用层提供技术监测、内容监管、系统运行等预警信息的查询、修改、审核、上报等功能。按照权限规定,系统将相关信息推送给节目研判员、协作单位、上级部门,并提供数据异议处理和节目联合研判等功能。
技术监测预警模块主要提供停播、劣播、无伴音、马赛克、无载波、无运行图等指标报警信息。系统将广播电视信号实时测量结果与广播电视主管部门批复的指标进行比对,按照事件事故的管理规定,对预警信息进行分级,向节目研判员提供技术指标预警的时间、地点、节目、类型、范围以及预测的事故原因等信息,以便准确定位故障环节,挽救播出事故。
内容监管预警模块主要提供广播电视节目内容、节目舆情和直播等预警服务。节目内容预警提供数据处理层产生的疑似包含违规内容的文字、图片、音视频、广告等节目信息,辅助节目研判员监听监看。舆情预警主要是通过趋势图、词云、热搜榜等形式提供视听网站、移动APP 等平台中的受到关注或增长较快的涉广播电视节目类舆情。直播预警主要是提供广播电视频道直播重大活动时系统内容识别的结果,以发现是否包含违规内容。
系统运行预警模块提供通讯线路、硬件设备、运行程序、网络安全等运行状态预警。通讯线路预警主要提供网络中断、拥塞等预警信息。硬件设备预警反应云计算服务器、前端站点等硬件设备的运行状态。软件预警包括采集、存储和处理程序的更新、运行、维护、非法调用等预警信息。
3.6 系统管理层
系统管理层提供任务、人员、软件、硬件等运行状态的监控和设置功能。按照权限设置,提供设备参数、任务周期、设备型号、存储位置、操作日志等数据的新建、分配、更新、删除等操作。
4 关键技术
4.1 虚拟化技术
广播电视节目信息采集、处理、存储、通信等程序对于CPU、内存、网络、存储等资源需求是动态变化的。为提升硬件的利用率和增强系统的扩展性,使用VMware 的虚拟化技术对多台服务器进行集群式管理。该技术能够将底层硬件和操作系统分开来,将所有的CPU、内存、存储等作为资源池进行统一管理,具有较强的系统恢复能力和扩展能力,适合于灵活多变的监管任务。以广播电视直转播监管任务为例,系统管理员可以将更多的网络和计算资源分配给中短波、调频、有线数字电视等专网数据的采集和处理程序,以提升数据采集和完整性转播的研判的速度。
4.2 区块链技术
为解决媒体融合传播带来节目信息审核需求增加与监管力量有限之间的矛盾,基于区块链体系中的联盟链实现技术设计广播电视节目监管区块链,如表1。通过打通播出、传输、监测机构的数据壁垒,达到共享节目信息审核数据、扩大监管工作的覆盖面、减少人员支出的目的。将有限的计算和网络资源用在对重点节目的审核之中,将集中的监管变成分布式的监管,将原来的事后监管变成了事中监管,及时发现广播电视节目传播中出现的问题。
表1 广播电视监管区块链信息表
4.3 音频特征分析技术
针对主要媒体传播渠道上的多数广播电视节目是一致的实际情况,为节约有限的系统计算和存储资源,对所有的音视频节目进行切片,利用特征分析技术获取每个切片特征值,对通过卫星信号获取的节目进行比对,给出可信度。对于可信度较高的节目,无需进一步的处理,也可准确判断故障节点。
4.4 情感分析技术
为获取网络评论、弹幕等信息中的违规节目和优秀节目的传播线索,将分词技术和关键词比较技术进行结合,对社交软件、评论区等节目信息进行分析,找出带有攻击性和赞扬性的词汇。为提升算法的精准性,需要对关键词的权重进行调整,形成关键词权重动态调整的工作机制。
4.5 多源数据处理技术
为有效整合从专网、互联网、协作单位获取的节目信息,获取一致性的预警数据,提升监管工作速度和准确度,利用贝叶斯估计算法将已知的数据处理结论融入到新的预警数据判别之中,从多源数据中得出估计和判决,进而得到可信度较高的结论。
结束语
为解决媒体融合时代广播电视节目监管遇到的新问题,在系统研究主流传播渠道特点的基础上,利用虚拟化、音视频特征识别、贝叶斯估计、区块链等技术,设计具有数据采集、处理、存储、上报的智能监管系统,探索出了一条广播电视节目智慧化监管的新模式。该系统满足了当前技术监测、内容监管的业务需求,还具有运行稳定、扩展性强、配置灵活等优点,便于下一步引入节目内容AI 识别和大数据处理算法等。