IPTV故障排除“三定”思路与应用
2017-09-08苏洪娥赵海峰
苏洪娥+赵海峰
【摘 要】IPTV即交互式网络电视,是利用计算机或机顶盒加电视完成接收视频点播节目、时移电视、视频广播及虚拟频道等功能。IPTV故障分为通断类故障、质量类故障,论文主要介绍IPTV故障定性、定界、定位的思路与解决方法。
【Abstract】IPTV is an interactive network TV, which uses computer or set-top box and TV to complete the functions of receiving video on demand program, time shift television, video broadcast and virtual channel. IPTV fault can be divided into on-off fault and quality fault. This paper mainly introduces the idea and solution of IPTV fault qualitative, delimitation and location.
【关键词】IPTV;STB;VOD;BGP
【Keywords】 IPTV; STB; VOD; BGP
【中图分类号】TN948.3 【文献标志码】A 【文章编号】1673-1069(2017)07-0125-02
1 IPTV故障的主要种类
IPTV故障主要有两类:通断类故障与质量类故障。IPTV故障种类如图1所示:
[通断类
故障][质量类
故障][EPG页面显示慢][BTV节目质量差][VoD节目质量差][频道切换时质量差][VoD节目不可看][BTV节目不可看][STB加载EPG失败][STB连接网络失败]
1.1 通断类故障
①STB连接网络失败, STB开机无法获取IP地址或获取到的IP地址错误。STB开机加载过程中停止、显示错误信息、显示错误码。
②STB加载EPG失败,STB开机后能够正常连接到网络,但是无法正常加载电子节目菜单EPG。
③BTV节目不可看,STB启动后能够显示节目菜单,但是选择直播BTV节目时,节目不能播放。
④ VOD节目不可看, STB启动后能够显示节目菜单,但是选择点播VOD节目时,节目不能播放。
1.2 质量类故障
① EPG页面显示慢,STB开机能够从IPTV平台中的EPG Server正常加载电子节目菜单EPG,但是EPG菜单加载慢或操作响应慢。
② BTV节目质量差, BTV节目均能观看,但是节目出现组播黑屏、花屏、卡顿等业务质量差问题。
③ VOD节目质量差, VOD节目均能观看,但是节目出现组播黑屏、花屏、卡顿等业务质量差问题。
④节目切换时节目质量差是指BTV或VOD节目切换时,节目出现花屏、卡顿、切换慢问题。
2 IPTV业务故障排除“三定”思路应用
IPTV问题现象非常多,针对每一类问题的定位方法也不完全相同,但总的来说,可以把故障定位思路归结为:定性、定界、定位[1]。
具体方法:
①如果STB有内置网络诊断功能,指导用户操作进行STB自诊断,收集诊断结果,结合STB错误码,初步判定故障发生在业务流程的哪个阶段,可能的故障位置,便于故障定界定位分析。
②确定故障范围专业工具定界:通过IPTV系统的SQM,可以通过快速分支算法确定故障范围,完成故障定界。
③对比法:在没有部署工具情况下,根据用户报障情况确定故障范围,适用于现网已有大量用户情况。
④DHCP&组播仿真:通过在ONU、OLT、BAS接口模拟用户进行DHCP拨号或模拟组播用户点播节目,通过逐段测试确定故障范围。
3 故障定位排查
①个体问题:重点检查接入设备用户侧的业务配置、端口状态。
②区域问题:检查接入设备网络侧的配置和上行端口状态。
③全网问题:重点检查IPTV业务系统的各服务器是否正常,业务配置是否正确,母局的网络是否正常。
④疑难的问题:需要通过报文头获取分析进行定界定位。
4 质量类故障网络设备定界定位思路
①排查家庭网络问题:第一,和用户沟通确定家庭是否ONT/HGW端口的协商模式不是全双工的,指导用户进行排查;第二,对于用户高速下载时造成的IPTV业务质量差,可能是上网业务和IPTV业务的优先级配置不当,需要网络运维部门重新规划业务的优先级,修改接入设备的QoS;第三,确定故障范围。主要方法有以下几种,首选,专业工具定界,通过运行厂家提供的软件定位;其次,对比法确定,在没有部署工具情况下,根据用户报障情况确定故障范围,适用于现网已有大量用户情况。
②故障定位排查:确定是区域问题、全网问题还是无规律的质量差问题。
5 IPTV业务故障排除“三定”思路运用案例
5.1 组播复制设备故障引起小范围内直播业务中断
现象一:监控设备上发现DSLAM/OLT等有流量超限告警,或者有CPU、内存占用高的告警。
现象二:在SQM上监控到,只有该小区直播体验有异常,其他小区正常。
处理措施:
①在接入网DSLAM/OLT上查询组播流量,确认上层网络是否将组播流转发下来。如果确认DSLAM/OLT没有收到组播流量则需要排查上层链路及上级组播复制设备。
②DSLAM/OLT故障会导致下挂所有终端用户直播业务终端,登录设备检查CPU、内存是否有大量占用,检查设备是否存在致命告警。如果出现CPU占用率高等情况时,需要确认原因、排查网络攻击等情况。
③故障时在DSLAM/OLT上确认终端用户的在线情况,
包括ONT/Modem是否是UP状态、组播用户是否为online状态。
④如果终端用户正常在线但是无法收到节目流,则需要确认DSLAM/OLT的组播转发表项,如果时间紧张则可以尝试重启DSLAM/OLT或将业务割接到备用接入设备上。
5.2 接入网设备链路拥塞导致小范围内直播业务中断
现象一:监控设备上发现DSLAM/OLT等有流量超限告警,或者有CPU、内存占用高的告警。
现象二:在SQM上监控到,只有该小区视频流量质量差,其他小区正常。
处理措施:
步骤一:确认接入设备上行口流量,考虑到流量的突发性,如果实际流量达到上行口总带宽(物理带宽或限速)70%以上则可以尝试增加上行口,观察问题是否改善。
步骤二:查询用户侧流量,如果发现存在大量未知流量占用带宽,则尝试配置未知单播、多播和广播抑制,观察问题是否改善。如果故障改善则需进一步排除未知流量的来源[2]。
步骤三:确认节目的实际流量和承载节目的service-port的流量模板配置,如果节目流量接近或大于流量模板则需要尝试增大流量模板配置。
步骤四:对于铜线接入方式,需要确认实际流量和xdsl的激活速率,如果实际流量接近或大于激活速率则需要尝试增大激活速率。
6 结语
IPTV问题多,问题处理方法多样,将定性、定界、定位思路运用到问题处理中,可以快速分析排除故障,提高效率。
【参考文献】
【1】许永明,谢质文,欧阳春.IPTV 技术于应用实践[M].北京:电子工业出版社,2006.
【2】謝质文,许永明,杨滔.IPTV 产品、运营与案例[M]. 北京:电子工业出版社,2008.endprint