APP下载

基于软硬探针相结合的IPTV可视化运维保障

2022-05-19牟克璠中国移动通信集团甘肃有限公司甘肃兰州730070

邮电设计技术 2022年4期
关键词:机顶盒探针运维

牟克璠(中国移动通信集团甘肃有限公司,甘肃兰州 730070)

0 引言

互联网电视是运营商数字家庭市场战略的基础业务,相对于其他视频业务和基础网络业务,电视用户对于业务体验质量的敏感性更高,对网络质量的容忍度更低,使质量保障难度更大。由于流程长、码率高、并发量大,互联网电视业务远未达到高品质要求,质量保障和优化面临较大挑战。

受国家政策影响,互联网电视逐渐过渡到IPTV业务,直播业务采用组播承载,业务信令及点播业务用单播承载。组播对网络的要求很高,丢包大于0.03%或时延大于40 ms 就会产生花屏,对用户体验造成影响,而现网大部分网管系统配置的告警预警阈值不足以触发如此细微的问题。

1 软硬探针相结合的可视化运维保障

本方案的主要思路是基于软硬探针结合、聚类告警和自动化工具。现网机顶盒出厂就集成软探针APK,软探针会采集所有用户的收视行为,通过关联数据的聚类分析,产生预告警信息预判。硬探针拉流部署二次验证预告警信息,进行故障定位定界,最终生成告警工单,派发维护人员。智能告警监控是主动发现故障、保障业务质量的重要手段,建立电视业务的汇聚告警体系,可以帮助运维人员更快速、敏锐地发现故障点,提升故障处理时效,保障用户感知体验,提高运营商互联网电视业务的用户满意度。

1.1 电视业务软硬探针部署结合

软探针内置在用户机顶盒中,硬探针分别部署在地(市)CR、CDN 侧节目视频源入流和出流,具体如图1所示。

图1 软硬探针部署图

软探针从底层播放器、网络口和系统采集数据,进行预处理后,根据触发上报的条件向软探针监测平台上报数据。

目前软探针与监测平台的接口如图2 所示,具体功能如表1所示。

表1 软探针与监测平台的接口

图2 软探针与监测平台接口框图

软探针采集功能如下。

a)感知采集、行为分析、运营分析。

b)共性聚合、故障预警。

c)单用户诊断、投诉处理、提供可视化工具。

硬探针采集功能如下。

a)全省层面、整个地(市)高实时性监控。

b)补充软探针能力:解码、调度等。

c)主要用于分段排障定位、割接测试。

1.2 采集层数据的聚类分析

数据采集层主要通过各种方式(系统接口、监测设备、网络探针等)获取质量监控能力层所需要的数据,实现对数据模型、元数据、数据质量的统一管理,同时实现数据的对象化,面向上层能力层模块提供面向对象的数据访问能力。

数据采集层的数据主要来源于以下几个系统。

资管系统:宽带用户相关的网络拓扑信息,包括用户关联的PON 口、OLT、交换机、BRAS 等网元关联信息。

DHCP 系统:包括用户IP 地址获取、上下线行为、Option 82字段。

机顶盒软探针:终端侧采集的收视行为、KPI 和KQI相关指标(见图2)。

网络硬探针:内容源、EPG、CDN、网络链路等端到端组成环节的拨测性能数据。

CDN:中心/边缘节点的调度服务器、流服务器日志、业务话单日志、用户调度信息。

网管/OMC:CMNET、城域网、接入网等设备的性能数据指标及告警信息。

可视化运维系统:可实现从机顶盒-ONU-OLTBRAS-CR-BR-平台IPTV 全路径、端口级的业务故障定位。

1.3 系统能力层

系统能力层主要包含质量监控、质差告警、故障定位、拉流探针拨测、报表支撑等模块,对数据共享层获取的数据进行与业务紧密相关的数据处理,封装成业务能力,并以微服务的形式供上层应用层调用,系统基础能力包括以下几方面。

质量监控能力:包括业务量和业务质量监控,输出互联网电视在线用户数、收视用户数点播直播收视情况、网络性能指标、业务质量指标、业务质量告警等数据。

质差告警能力:根据质量监控指标输出地(市)、区县、CDN、BRAS、OLT 等维度的质量告警,告警可包括在线用户数突变、业务质量劣化、错误码激增、网络性能劣化等信息。

故障定位能力:可通过对不同时间、地区、EPG、CDN 节点、BRAS、OLT、PON 口等多维度的汇聚分析,结合关联节点的相关KPI 指标,判定业务劣化发生的时间、影响范围、定界根因,输出质差分析定界能力。

报表支撑能力:可输出不同时间、区域维度的基础性能指标报表,可输出针对机顶盒、EPG、CDN、BRAS、OLT、直播码率、质差小区的专项质量分析报表。

2 应用效果

2.1 实现4个维度的质量分析

该保障系统可以汇聚出地理、网络、业务、终端4个维度的分级质量数据进行统计分析,结合各地(市)BRAS、CR 及业务中心出入流部署的硬件探针的测试结果,提高聚类告警准确性、实时性。

2.2 软硬探针结合的实时告警

主动监控能力采用“硬探针+软探针聚类”方式,按网络架构分为播控平台、业务平台及CDN、承载网、接入网、终端等5个层次实现端到端故障监控。

2.3 链路级主动监测

硬探针部署全量频道拉流数据,根据监测到的不同频道质量对应不同链路质量。

2.4 端到端全路径端口级故障定位

该可视化保障系统实现从机顶盒-ONU-OLTBRAS-CR-BR-平台IPTV 全路径、端口级的业务故障定位。对接CMNET 获取三层网络组播路由表,获取机顶盒到IPTV 平台的端到端全路径。基于机顶盒软探针+硬探针获取精确到链路级、端口级拓扑路径发现及质量呈现,解决组播流多链路中需要大量人工排查问题,极大提高故障定位效率。基于SQM 聚类查询自动输出全路径链路级、端口级质量、告警数据。

该系统上线以来,互联网电视监测机制更加完善,故障定位定界有了手段,视频服务质量进一步提升,通过规范互联网电视端到端环节,明确职责,完善制度,将牌照方与终端纳入管控,建立了有效的电视运维管理体系,积极赋能一线。互联网电视业务问题平均处理时长降低约30%,用户投诉较之前下降47%,用户满意度提升13%,增值业务订购提升19%。

3 结束语

本文介绍了基于软硬探针相结合的IPTV 可视化运维保障方案,首次提出基于软硬探针相结合的保障系统,此系统极大提高了保障效率,有效支撑维护人员对故障定位定界。

猜你喜欢

机顶盒探针运维
射流预冷试验用温度探针的设计与测试
机顶盒上别盖布
基于GPS的电力运维轨迹定位系统
安全使用机顶盒注意五点
IT运维管理系统的设计及应用
机顶盒上别盖布
What is Apple Watch All About?
通过接触测试来提高探针痕迹的一致性
电子政务甲方运维管理的全生命周期
DNA探针在高中生物学教学中的应用