高清互动监测系统建设方案
2016-02-14苟明宇
■文/苟明宇
高清互动监测系统建设方案
■文/苟明宇
本文主要对高清互动监测系统建设方案进行论述,并从设计原则、总体方案、系统特点优势等方面进行分析,且根据笔者多年来的工作经验和相关知识作出以下探讨,希望能给予相关专业读者借鉴。
高清互动;监测;系统特点;效果
引言
随着高清互动业务的不断发展、高清互动用户的不断增加,目前采用的人工定期对系统进行巡检的方式,由于高清互动系统结构复杂、设备环节多,导致监测出现脱节现象,存在故障感知和发现滞后、互动故障排查难度大的问题。
提供IP组播信号监测、信令推流监测、回看时移及点播监测、直播射频监测功能监测系统很有必要,并提供统一的监测 门户,实现对互动业务从信源准备到回看录制,从信令交互到终端呈现的全流程 的监测,将有效缩短互动点播故障发现和故障定位所需时间,提高运维水平和服务质量。
1.设计原则
1.1 独立性原则
高清互动监测系统主要通过模块之间的交互信令、码流质量、声画质量进行监测,监测点设计和数据链路以分流、旁路、专网为主要技术路线,不影响且不依赖于业务系统而独立工作。
1.2 模块化原则
高清互动监测系统采用模块化设计,以便于分布式部署、快速安装以及系统覆盖范围的扩容和监测对象的扩展,同时便于分期建设、分步实施,也利用根据不同的需求实现不同的展示门户。
1.3 分级部署原则
高清互动监测系统采用省中心、分中心两级部署方案,同时支持扩展到分前端三级部署,适用于分布式部署和分级管理。
1.4 开放性原则
高清互动监测系统提供开放的数据采集接口,以便于第三方探针设备的接入。同时提供丰富的数据访问接口,可供第三方系统调用。能够与日后建成的全省运维管理平台实现对接。
2.系统设计方案
2.1 总体方案
据高清互动平台业务监测系统模块化设计、分布式部署的原则,本方案提供了如下图所示的系统结构图(图1)。
首先,整个高清互动监测系统是一个综合性的运维平台,四个各有侧重又互相关联的子系统能独立工作,并通过监测门户将关键数据、关联数据统一展示出来,通过监测门户可以跳转到各个子系统中进行深入的分析操作。
其次,每个子系统支持分布式部署,根据系统各自功能特点的不同,支持以地市为单位来组织展示页面,提供对地市数据的汇总和实时告警;支持通过分布式架构管理更大规模的网络。
最后,高清互动监测系统采用三层逻辑架构来实现,即采集层、平台层和展示层,利于系统稳定运行和功能扩展。
2.1.1 采集层
采集层是高清监测系统与广播电视网络以及业务系统的接口层,用来完成链路信号和业务系统运行数据的采集与分析,主要包括IP码流分析、互动信令分析、模拟终端和射频分析等功能组件。
2.1.2 平台层
平台层是高清互动运营平台监测系统的功能主体,每个子系统有属于自己的平台层软件及设备,主要为各自子系统提供门户服务、汇聚服务和统计服务。门户服务完成展示层所需的数据预处理工作,包括系统数据综合、业务流程综合、报警关联管理、数据汇聚接口、数据库处理层等逻辑;汇聚服务是平台层与采集层的纽带,完成探针采集数据的收集、预处理、数据入库、数据上传下达等功能;统计服务用来支撑周期性的数据自动统计功能,完成统计任务调度、局部或全局的统计数据处理以及统计数据入库等功能。
2.1.3 展示层
展示层由平台层的WEB服务来实现,监测工作站可通过WEB浏览器来实现高清互动所有的展示与操作。主要包括门户服务器、数据库及报表服务器、集中存储阵列。
2.2 IP组播信号监测
IP组播信号监测子系统的逻辑结构图如下所示,接收IP组播节目流并完成码流监测。监测数据分析汇总后入库存储,并可通过监测门户进行展示查看。
监测报警系统,接收IP组播节目流,完成多画面组合显示,及视音频异态监测。系统可通过语音、日志、OSD、数据库、短信、标题栏、边框等方式进行故障报警。报警数据及关注的节目入库进行存储,并可通过监测门户进行展示查看(图2)。
2.2.1 信令、推流监测
信令及推流监测子系统的逻辑结构图如下所示,采集的结果送入汇聚统计服务器进行分析入库,并为测门户提供相应的支撑数据(图3)。
2.2.2 回看、时移点播监测
时移回看与点播监测系统采用基于互动机顶盒改造而成的拨测终端进行点播、回看业务交互模拟,并将模拟产生的指标、告警进行分析、实时告警展示,形成一套完善的自动监测。
2.3 终端排障
终端排障功能设计的目的,是在已经知道某个互动终端明确的访问故障的情况下,综合利用信令、码流、射频三类探针,对点播的整个过程进行回溯和复现,进而确定故障环节的目的。典型的终端排障实现了根据任意卡号的完整业务链监测和完整码流链监测。终端排障功能的实现,主要由以下几个步骤构成:
2.3.1 用户点播行为抽取
对用户的所有点播信令数据进行分析,提取其中关于跟点播开始停止相关的关键信令,形成用户点播记录,以此作为分析的入口。
2.3.2 服务器内部交互信令提取
根据上面提取的用户点播记录,提取关键字段来关联服务器内部的交互信令,形成完整的点播业务链,主要是根据S1接口中的SessionID去获取SM跟VSS通讯的R2信令。
2.3.3 VSS推流情况获取
根据上面定位的R2信令中描述的VSS推流源地址信息,可以去码流监测探针检测到的推流列表中去定位源地址相同的码流,从而实现将用户信令和VSS推流的关联。
2.3.4 IPQAM调制信息获取
根据上面定位的R2信令中描述的推流的目标地址信息(即IPQAM相应收留信息),同时综合S1接口中描述的点播码流调制后的频点和节目号信息,控制射频监测探针去提取相应频点的节目,从而实现用户信令和IPQAM调制后码流的关联,进而形成完成的码流链路。
3.系统特点优势
3.1 互动业务全链路监测
提供视频、信令、码流、射频的全系列监测,可实现对基于NGOD架构的高清互动系统的全链路监测。
3.2 关键组件故障发现及预警
对 B O、S M、C D N、V S S、IPQAM、空分组等关键业务组件的性能压力、响应时间等重要指标实时监测,提供相对值、绝对值等多种组合监测门限,实现业务层面的故障发现及预警,并以语音、短信等方式第一时间通知运维人员,系统告警平均响应时间最短为1分钟。
3.3 可视化的终端故障定位
以空分组、机顶盒SN为入口,提供可视化的终端故障定位功能,将互动点播相关的信令、码流、射频信息综合分析,准确定位系统故障点。
3.4 软硬结合的拨测方案
采用了拨测管理服务器加互动业务拨测探针相结合的互动电视拨测方案,可实现对机顶盒点播过程的完整模拟。利用软件的方式实现互动平台登录、页面浏览、点播及回看节目列表获取,形成拨测任务;部署于互动机顶盒中间件上的拨测探针软件则负责接收拨测任务,并通过中间件执行,完成实际的点播动作和指标分析。
3.5 丰富的数据呈现及报表统计
提供了趋势图、柱状图、饼图、流程图、接口图等丰富的界面方式,从不同维度呈现互动点播的上线用户数、故障情况、业务组件压力等关键指标。提供可定制化的上线用户报表、故障报表、性能报表等统计表格,为日常决策提供有力依据。
3.6 精准的视音频监测
系统支持视频层面的监测,包含:黑场、静帧、视频丢失、视频解码异常、彩场、彩条、测试图、马赛克、亮度异常、视频比对异常、台标丢失等;能支持音频层面的监测,包含:音频丢失、音量过高、音量过低、音频比对异常。
3.7 实用的报警管理机制
在准确的视音频监测的基础上,高清互动结合了广电机房值班、运维的实际情况,从日常工作的细节出发,提出并完善了一整套的报警管理机制,使得系统能真正的实用、好用、易用。
4.总结
高清互动监测系统实现了IP组播信号监测、信令推流监测、回看时移及点播监测、直播射频监测功能,并提供统一的监测门户,实现对互动业务从信源准备到回看录制,从信令交互到终端呈现的全流程的监测,将有效缩短互动点播故障发现和故障定位所需时间,提高运维水平和服务质量,节省了大量的人力和时间成本,提高了高清互动系统故障定位准确度,降低了系统的维护门槛,为系统提前扩容提供数据依据,提升用户体验,故障分区域分类统计为及时发现系统潜在隐患和瓶颈提供了数据支撑,点播在线用户分区域统计为市场的用户发展策略提供数据支撑,系统按区域统计的活跃用户为市场针对特定用户制订营销手段提供数据依据。
[1]Comcast:Next Generation On Demand (NGOD) Architecture2.0.
[2]GB/T 17975.1-2000 《信息技术 运动图像及其伴音信号的通用编码第1部分系统》.
[3]GB/T 17975.2-2000 《信息技术 运动图像及其伴音信号的通用编码第2部分系统》.
[4]GB/T 17975.3-2000 《信息技术 运动图像及其伴音信号的通用编码第3部分系统》.
[5]Q/ABS101-2002:国家广播电影电视总局.有线广播电视分配网监控设备通用技术要求.
(作者单位:贵州省广播电视信息网络股份有限公司)
P451
A