媒体融合背景下互联网电视节目智慧监管新模式研究
2022-12-26司凯威
司凯威
(国家广播电视总局二九三台,河南 451162)
1 引言
媒体融合进程的加快和网络基础设施的完善,互联网电视机和机顶盒、智能投影、电视棒、VR 电视、AR 电视等终端走进千家万户,成为广大人民群众收听收看视听节目的重要途径之一。新冠肺炎疫情爆发以来,阿里等互联网巨头推出大量具有价格实惠、接口丰富、操作简便、观看体验好等特点的产品。华数TV 等互联网电视平台积极开辟抗疫专栏,增加优秀影视剧、动画片、纪录片等视听节目供给,极大地提升了互联网电视的覆盖范围和影响力。截至2020年6月,我国互联网电视终端激活数量已达2.6 亿台,用户超过6.11 亿人[1]。在资本和技术的共同驱动下,互联网电视凭借节目存量多、更新速度快、操作简便、智能化程度高等优点,不断扩大覆盖人群和影响力。与此同时,个别不法分子为谋取商业利益,趁机传播色情、低俗等违规视听节目。
为引导行业规范健康发展和防止违规视听节目传播,国家网络视听管理部门颁布了《专网及定向传播视听节目服务管理规定》、《持有互联网电视牌照机构运营管理要求》等规定,要求互联网电视不得传播宣扬暴力犯罪、危害社会公德、损害未成年人身心健康等视听节目。相关规定的及时出台和严格落实,给互联网电视节目合规化运营指明了发展方向。面对海量的视听节目,原有的人工操作遥控器的工作方法[2],存在劳动强度大、监看周期长、数据统计难度大、节目变动发现滞后、通信数据分析专业性强等问题,难以适应监管工作要求。实践发现,互联网电视终端存在遥控器控制接口不一致、播控平台EPG 版本多、视听节目存量大且更新快、部分终端通信数据加密等情况,也为监管工作带来了新的挑战。
本文提出利用控制主机、多功能控制器、HDMI数据采集卡、镜像交换机、服务器等设备构建通用型的终端监管平台[3]。利用ADB、XPATH 和PYSHARK等功能包,研发具有终端控制、音视频和通信数据采集、节目信息处理和内容研判、监看结果存储和发布等功能的应用软件,以探索建立适应媒体融合要求的互联网电视智慧化监管新模式。
2 硬件设计
为满足对市场主流的互联网终端的自动控制、音视频和通信数据采集、节目信息处理和内容研判、监看结果存储等需求,互联网电视节目监管系统硬件部分主要包括控制主机、多功能控制器、HDMI 采集卡、无线路由器、镜像交换机、图像识别服务器、数据库服务器、HDMI摄像头等设备,如图1所示。
图1 系统结构示意图
2.1 监管对象
监管对象主要包括互联网电视机和机顶盒、智能投影、电视棒、VR 电视、AR 电视等终端。伴随着媒体融合进程的纵深发展,目前境内电子市场上主流的互联网电视终端一般是运行在安卓及衍生系统上。人机交互接口一般都包含有开关机、方向、确认、返回等。基于上述技术特点,可以构建通用的终端自动控制系统。
2.2 控制与采集
控制模块主要包括控制主机、多功能控制器等设备,通过命令控制互联网电视终端开关机、方向切换、确认、返回等操作。利用安卓系统调试工具ADB,可对运行安卓及衍生系统的终端设备进行控制。该种控制方式具有适用范围广、操作简便、响应及时等特点,但需要掌握远程调试模式的开启方法。对于设置有红外遥控装置的终端设备,可以通过与控制主机连接的多功能控制器进行控制。多功能控制器是带有红外收发器的单片机开发板,与控制主机之间通过RS232 接口进行互联,与互联网电视终端通过红外信号进行通讯。该种控制方式具有操作简便、反馈及时等优点,但同时操作多个终端时容易发生信号错乱。
音视频数据采集模块主要包括HDMI 数据采集卡、摄像头等设备。对于带有HDMI 输出的机顶盒,通过线缆与HDMI 数据采集卡直接进行连接。对于电视机、智能投影等不具有HDMI 输出的设备,则通过HDMI摄像头与采集卡进行互联。
通信数据采集模块主要包括无线路由器、镜像交换机、无线网卡等设备,用于采集被控终端的通讯数据。智能终端通过WIFI 连接无线路由器。镜像交换机的下联接口连接无线路由器,监控口连接控制主机的千兆网卡,上联口连接互联网。
2.3 分析与发布
数据分析模块包含有图像识别、音视频识别、页面解析、通信数据解析、任务调度等服务器。为利用最新的违规内容识别算法和降低软件开发的难度,系统远程调用某互联网运营商提供的服务接口,对色情、低俗等内容进行识别。为充分利用服务器的计算、网络、带宽资源,将相关的应用部署在虚拟化服务器上。
数据发布模块主要是包括数据发布服务器、磁盘阵列和数据库服务器。为确保音视频和通信数据的存储速度,采用了高性能的磁盘阵列。为长期保存配置参数、监管结果等信息,使用了支持并发操作的MYSQL数据库。
3 软件设计
为全面排查互联网电视终端的点播节目、直播频道、应用程序的传播情况和变化情况,实现终端的自动控制、音视频和通信数据的实时采集、关键数据的智能提取与分析等功能,并兼顾系统的可扩展性和维护性,该系统可以分为数据源、控制与采集层、存储与处理层、业务应用层,如图2所示。
图2 系统软件组成示意图
3.1 数据源层
数据源层主要是为系统控制和数据采集提供必要的硬件和软件环境。为兼容互联网电视机、机顶盒、投影设备、电视棒等多类型的终端,利用面向对象编程技术将控制开关机、方向、确认、取消、菜单等操作的ADB命令和多功能控制器的操作命令进行封装。
3.2 控制与采集层
控制部分主要是根据用户设定对互联网电视终端进行实时控制。设备管理模块提供生产厂家、系统类型、控制模式、网络设置等终端基础数据的管理服务。操作命令设定模块提供终端操作命令的学习、修改、存储等方法。为摆脱对遥控器的依赖和长期保存控制命令,将终端操作命令存储到数据库表中。为简化控制命令的有效性,操作录制模块提供控制命令的测试功能和操作流程的验证功能。为避免终端长时间运行造成宕机和确保通信数据采集的完整性,终端需要在每次使用前重启和运行中设置合理的等待时间,并且利用采集功能进行监控。
数据采集部分主要是实时采集互联网电视终端的音视频、通信数据、布局文件、故障报警等数据。音视频采集模块通过调用HDMI数据采集卡的驱动程序,将音视频文件保存成带有时间戳MP4格式的文件。通信数据采集模块调用网络数据采集软件WIRESHARK对指定地址的通信数据进行采集,以获取IP、域名、下载地址等信息。布局文件采集模块通过ADB命令获取页面布局等关键信息,以减少对文字识别软件的依赖,确保节目信息的准确性。故障报警信息采集模块主要是获取控制和采集设备和程序发出的异常数据。
3.3 处理与存储层
数据处理部分主要是将采集到的数据进行信息提取、识别和统计,以获取所需的点播节目、直播频道、应用程序的名称、音视频、图片、IP、域名等信息。通信数据采集模块通过调用WIRESHARK 的过滤命令和分析命令,以获取IP、域名、下载地址以及必需的数据文件。页面分析模块通过针对点播节目、直播节目、轮播节目特点分别进行设计处理规则,以获取直播节目名称和截图、点播节目的名称和剧集等、应用程序的信息和下载地址等。为避免相关要素的干扰,在软件中可以定义文字识别的区域,对于特定位置的图片进行识别。音视频处理模块通过调用互联网服务提供商的功能接口,分析节目内容是否存在低俗、色情等违规内容。
数据存储模块主要是将控制文件、音视频、通信数据、应用程序等数据进行存储并建立相互之间的对应。为方便文件进行存储,将音视频文件打上时间戳,并用生成时间对文件进行命名。通过在MYSQL数据库中建立一对一、一对多、多对多映射关系,确保监管数据之间的对应联系。将终端控制代码、设备名称、生产厂家、节目、频道的信息变化等信息分门别类的存储在相应的数据库之中,以便于长期的分析和使用。
3.4 业务应用层
监管数据部分提供点播节目、直播频道、应用程序相关数据的人机交互接口。点播节目模块提供终端EPG 信息、节目数量、节目时长、节目链接地址、热度变化等情况管理功能。通过对点播节目的比较可以区分出播控平台的EPG 数量。为定期分析点播节目的变化情况,系统提供了新增节目的统计和监看功能。在对点播节目分析的过程中,提供点播节目连接服务器通信数据的查询过程。直播频道模块提供频道数量、频道EPG、频道变化、频道运行图等信息的查询功能。因直播节目具有较强的瞬时性,系统在提供音视频观看的同时,提供截图数据的查询功能,以便快速浏览。应用程序模块提供应用程序信息、下载地址、版本信息、下载数量等数据。
任务管理部分主要是提供系统监控、设备管理、任务管理、调度管理、关键字管理、原始数据管理等功能。为了长期分析相关模块的运行状况,均在数据库中建立了相应的表格。
4 系统流程
通过建立全新的互联网电视监管工作流程,实现对主流互联网电视终端的信息录入、任务设定、设备控制、数据采集、内容识别、数据存储、结果发布等操作,如图3所示。
图3 系统流程图
(1)参数设定:将设备生产厂家、软件版本、生产日期等相关信息录入数据库。按照互联网电视终端的接口类型选择合适的控制模式、设定数据采集对应的栏目名称和任务名称。
(2)终端控制:利用互联网电视终端模拟器对控制命令和响应情况进行验证。为提升工作效率,采用操作录制的功能,完整记录操作的步骤。
(3)音视频采集与处理:利用HDMI 数据采集卡对音视频数据进行采集和ADB 命令获取布局文件。利用信息提取技术获取节目的名称、集数、热度、图片等相关信息。经过关键词比对后,将疑似违规的内容调用违规内容识别算法,进而得到点播、直播、应用程序、违规内容以及预警信息表。
(4)通信数据采集与处理:利用网卡获取互联网电视终端与播控平台服务器之间的数据。通过运行指定的过滤命令提取IP、URL、EPG、音视频等数据,进而生成节目服务器、链接地址、EPG等相关信息。
(5)数据发布:通过人性化的交互界面向操作人员提供点播节目、直播频道、应用程序的整体情况和变动情况,并提供相关数据的下载服务。
5 关键技术
(1)终端控制技术
利用主流互联网电视终端运行在安卓及其衍生系统的特点,通过向互联网电视终端指定的端口号发送ADB 命令,模拟遥控器进行方向、菜单、确认、返回等操作。以遥控器的向上按键为例,通过TCP端口传送命令“adb shell input keyevent 19”,即可实现向上滚动。只需按照规定更改后面的数字,可以实现开关机、切换、确认、返回等操作。实践证明,该种操作方式具有适用范围广、实时性强、命令简单等优点,其难点在于打开远程调试的方法。
(2)通信数据提取技术
针对提取EPG、图片、IP、域名等信息的需求,利用python的第三方支持包PYSHARK远程调用网络数据捕获软件WIRESHARK,捕获控制主机上指定IP的通信数据,过滤解析所需的信息。以提取JPG格式的图片为例,使用“http.request and!((http.request.full_uri matches"http://.*.jpg.*"))”即可得到所有JPG图片的链接地址。实践证明,该种方式具有通信数据捕获及时、信息内容丰富、解析规则通用性强等优点。
(3)关键信息解析技术
为减少对图片识别文字识别功能的依赖和提升关键信息识别的准确性,基于点播节目、直播频道、应用程序等信息按照一定规则在互联网电视终端上展示的事实,通过ADB命令获取XML格式的文件后,使用XML文档查找工具包XPATH进行数据提取。以提取某终端的节目名为例,输入“tv_names=driver. find_elements_by_xpath(r′//*[@resource-id="com.youku.phone:id/yk_item_title"]′)”,可实现对点播节目名的查找。该种数据解析方法具有配置灵活、操作简便等优点。
(4)数据管理技术
为方便对节目、图片等相关信息的管理,借助DJANGO数据库的建模技术,在数据库表之间建立一对一、一对多、对对多的映射关系,以便于联合查询、反向查询等操作。
6 结论
为适应媒体融合带来的新变化和落实网络视听主管部门的新要求,通过搭建通用型的终端监管平台和研发具有自动控制、采集、处理、存储、发布等功能的应用软件,实现互联网电视节目的智慧监管系统。实践证明,该系统不仅在终端控制、数据采集与处理、数据分析等方面具有明显的优势,还降低了劳动强度和操作难度,探索出了一条在媒体融合背景下互联网电视节目智慧化监管的新模式。下一步,将重点研究互联网电视终端节目传播的新规律和新业态,挖掘系统的潜在价值。