APP下载

基于LSTM神经网络算法互联网电视EPG业务隐患预测的应用研究

2024-04-14班雪飞倪峰周玮马占婕孙忠岩

现代信息科技 2024年1期

班雪飞 倪峰 周玮 马占婕 孙忠岩

DOI:10.19850/j.cnki.2096-4706.2024.01.020

收稿日期:2023-05-24

摘  要:伴随三网融合的深入开展以及智慧物联网技术的发展,家庭宽带加互联网电视已成为新的智慧家庭入口。为了解决互联网电视业务质量监测手段在时序上的先天滞后无法先于用户发现隐患故障的问题,通过引入神经网络LSTM算法实现数据注智业务运维能力,聚焦EPG业务服务质量,从业务历史波动识别异常并做出预测预警,实现EPG业务质差隐患识别和预测,隐患发现时长缩短至0.5小时,隐患识别及时率和准确率均在90%以上。

關键词:互联网电视;EPG业务质量;LSTM算法;隐患预测

中图分类号:TP391  文献标识码:A  文章编号:2096-4706(2024)01-0099-05

Application Research on Prediction of Hidden Dangers in Internet Television EPG Business Based on LSTM Neural Network Algorithm

BAN Xuefei, NI Feng, ZHOU Wei, MA Zhanjie, SUN Zhongyan

(China Mobile Inner Mongolia Co., Ltd., Hohhot  010010, China)

Abstract: With the deepening of the integration of the triple play and the development of smart Internet of Things technology, home broadband and internet television have become a new entry point for smart homes. In order to solve the problem of congenital lag in the timing of internet television business quality monitoring methods that cannot detect hidden faults before users, a LSTM neural network algorithm is introduced to achieve data injection intelligence business operation and maintenance capabilities. It focuses on the quality of EPG business services, identifies anomalies from business historical fluctuations and making predictive early warnings, and achieves the identification and prediction of EPG business quality hidden dangers. The length of hidden dangers discovery time is reduced to 0.5 hours, and the timely and accurate rates of hidden danger identification are above 90%.

Keywords: internet TV; EPG business quality; LSTM algorithm; prediction of hidden dangers

0  引  言

2021年全国互联网电视(OTT)用户10.83亿,交互式网络电视(IPTV)用户超3亿[1],互联网电视用户规模已进入存量经营的稳健阶段,已从流量经营转变为质量经营,需要不断提升用户业务感知,达成提升留存促进活跃的目的。

电子节目单(Electronic Program Guide, EPG)是用户访问互联网电视的入口,EPG业务质量优劣对用户业务感知起到非常关键的作用,质量经营需要重点关注EPG业务质量监测。

目前运营商已建立了较为完善的监控体系,采集了海量的EPG体验数据,形成多维度的监控指标,但监控指标繁多,人工运维无法及时发现异常,也难以确定异常原因[2]。伴随着业务形态的持续发展,运维部门需要考虑和研究如何实现自动化、智能化快速准确地识别EPG隐患,避免出现大面积故障问题。

1  现状和解决思路

1.1  现状

互联网电视特殊的业务模式导致在对EPG内容源的服务质量监控上有明显的滞后性。EPG相关业务需要频繁更新和调整以适应业务和市场发展需求,比如EPG版本更新、热门视频资源更新、EPG模块更新等,业务调整过程中产生的潜在隐患问题造成的影响往往随着活跃用户量增加后才显现出来,同时当前对EPG业务的监测手段主要依靠日志分析,伴随数据处理的延迟使得在EPG业务保障的时效性较差,对隐患故障的检测和发现严重滞后,无法及时或先于用户发现隐患故障。

1.2  解决思路

围绕EPG业务的质差识别和故障分析手段,虽然有数据处理平台提供海量数据处理和阈值告警,可以基于固定规则产生告警但经过人为调试的故障告警信息并不是很准确,只有固定的“数”缺乏动态的“智”。随着人工智能的兴起,深度学习和神经网络等人工智能技术在智能预测与决策领域得到广泛发展[3]。

在神经网络算法选择方面,本次研究选用长短期记忆网络(Long Short-Term Memory, LSTM)算法,文献[4]提供了多种典型时间序列模型的实验对比并验证了LSTM预测模型在故障时间序列分析中具有很强的适用性和更高的准确性[4]。

输入以EPG门户访问过程中产生的可以表征EPG业务质量波动的数据,进行算法训练,预测EPG业务关键指标未来N个周期结果。同时基于关键指标最近历史7个周期的加权平均值,将预测结果与加权平均值进行偏差对比,根据预测值和设定阈值偏差情况输出互联网电视EPG业务是否发生质差隐患的预测结果,实现EPG质差隐患预警并联动业务主管部门进行问题排查与修复,减少大面积故障的发生,形成感知-分析-决策-执行的闭环模式,助力互联网电视业务自保障、自监控、自修复和自优化能力建设。

2  手段实现与验证

以采集机顶盒用户使用过程以及体验信息为原始数据,利用大数据处理手段对EPG业务维度关键指标提炼与汇总,以汇总后的EPG业务维度关键指标作为输入,输出EPG业务质量预测结果。关键处理流程经历数据采集与指标提炼、搭建环境引入LSTM算法模型、预测值与期望偏差管理、预测结论输出与预警四个环节。如图1所示。

2.1  数据采集与指标提炼

对机顶盒软探针上报各类数据的清洗入库,提取EPG业务服务器IP维度关键指标如EPG响应成功率、EPG响应时延,按照5分钟/10分钟/15分钟等不同粒度的N周期(N≥7)数据进行模型训练数据输出。

2.2  实验环境与LSTM算法模型

实验环境:服务器采用云主机,CPU20核心,内存32 GB,存储空间1 TB。操作系统为Ubuntu 16.04 LTS,开发环境部署Python 3.6,使用Keras 2.2.0搭建神经网络及使用TensorFlow 1.10.0后端张量运算软件包。

算法模型:采用LSTM算法模型,它是一种时间递归神经网络(RNN),它可以学习时间序列中的长短期信息,寻找其变化模式,在一些时序信号预测方面获得较好的效果。它的主要结构包含一组记忆单元和三种门结构(输入门、遗忘门、输出门),用于控制历史信息的使用[5]。

LSTM神经网络的逻辑结构如图2所示。

ft表示遗忘门的输出,遗忘门决定上一步传递过来的信息中有哪些信息需要进行丢弃。

输入门由两部分组成:第一部分使用了sigmoid激活函数,输出为it;第二部分使用了tanh激活函数,输出为 。

输入门和遗忘门的输出相结合,构成了LSTM的长期状态信息Ct输出门则决定了当前神经元的输出ot和将要传递给下一步的短期隐藏状态信息ht,输出结果则利用上一时刻的短期状态、长期状态值和当前输入值的保留部分得到[6]。主要實现步骤及关键式[7]如下:

1)遗忘门决定需要从输入的记忆单元中丢弃哪些信息,算式如下:

(1)

2)第二步是要决定将哪些信息存储在记忆单元中,算式如下:

(2)

(3)

3)第三步更新记忆单元,将记忆单元Ct-1更新为Ct,算式如下:

(4)

4)最后基于当前记忆单元决定输出,算式如下:

(5)

(6)

2.3  数据归一化处理

读取连续多个10分钟粒度周期互联网电视EPG业务维度包含两类关键指标的数据并进行数据归一化处理,减小输入的特征数据间数量级差别较大导致的模型预测误差,提升模型精度[8]。EPG内容源指标特征采用的离差标准化(Min-Max Normalization),对原始各个特征值作线性变换,归一化后数据的取值范围在[0,1]之间。转换函数如下:

(7)

其中,max表示一段样本特征数的最大值,min表示该段样本特征数据的最小值,x表示本段样本的当前值,xn表示经过归一化后的特征数据。

对前述样例数据归一化后,根据归一化后的排序,在[0,1]区间上基本符合正态分布。如图3所示。

图3  某段样例数据归一化处理结果

选择双向LSTM神经网络模型(Bidirectional, LSTM),构建神经网络层,配置输入层维度(input_shape)、选择sigmoid作为激活函数、设定输出层维度等;设定学习率(Lr)进行编译,损失函数采用均方差损失函数(Mean Square Error),使用梯度下降算法,通过求解导数找出目标函数值在多维度解空间内能够产生最大变化的方向,并向该方向以一定的步长靠拢,达成目标函数下降或上升的目的,递归性地获取最小偏差模型[9];设定样本分组数、训练次数、屏显模式等,输出并完成预测数据处理。关键参数设置如表1所示。

2.4  预测值与动态期望偏差管理

经过LSTM算法计算的预测值,首先进行数据校正,使其及满足过程约束又与测量值的偏差平方和最小以供使用[10]。利用3σ准则进行约束,确保预测结果的偏差符合正态分布。以EPG请求成功率指标为例,基于连续3月历史数据统计均值为98.3,标准差为±0.8,基于3σ准则,预测值的上下限落在95.9~100.7之间时,表示预测数据可用。若偶有预测值偏离3σ准则,则重新进行预测,若预测值连续7次均偏离3σ准则,则需要调整LSTM算法参数,重新建模进行预测。

动态期望值采用最近连续7个周期实际发生的指标的加权平均数()来表示,如式(8)所示:

(8)

其中,x1为最新周期的指标值,x7为距最新周期之前的第7个周期的指标值;w为对应周期指标的权重,w1的权重为40%,w2的权重为20%;w3的权重为15%,w4的权重为10%,w5、w6、w7的权重均为5%。即最近两个周期的指标对动态期望值影响最大。

若预测的EPG业务服务器IP维度各关键指标与动态期望值的偏差为正向偏差(即预测指标值优于动态期望值),则不产生预警信息;若预测的EPG业务服务器IP维度关键指标的任一指标值与动态期望值负向偏差≥3%或连续三个周期均为负向偏差且偏差值之和≥3%,则产生业务源存在质差隐患预警信息。

预测值与动态期望偏差预警模型如图4所示,指标预测预警触发记录如图5所示。

2.5  预测结果分析

根据训练验证集0.2设定,利用20%数据用于验证,准确度平均指标选用MSE函数,根据指标验证情况,预测EPG请求成功率指标MSE均方误差为0.788 7,EPG请求成功率指标预测值和实际值偏差较小;预测EPG响应时延指标MSE均方误差为10.740 2,由于时延类指标受网络波动影响较大,因此EPG响应时延指标预测值和实际值偏差属于正常。MSE评估情况如表2所示。

2.6  场景部署实现

采用微服务的API方式部署,使用Docker容器化方式进行版本发布,客户端调用本地数据处理平台完成批量预处理,将计算结果实时抽取至业务逻辑层进行逻辑计算并生成预测和判断结果,最后由功能实现层通过HTTP接口将预测和判断结果返回并呈现。

3  方案成效

本研究通过引入LSTM深度学习算法,对EPG业务关键KPI指标进行预测,并引入动态期望偏差对预测结果进行预警管理,提升预测结果可靠性。

在工具和手段提升方面,改变监控手段由“被动”监测变“主动”预测,先于用户发现EPG业务隐患的问题。由单纯依赖人工识别和判断隐患故障变为基于真实用户数据的AI预测为主、人工识别为辅的智能化提升。

在效率提升方面,当EPG业务存在隐患时,基于现网真实数据的反映,可在3个数据上报周期内基于指标的变化做出相应的预测,隐患发现时长由1~6小时缩短至0.5小时,隐患识别及时率和准确率均在90%以上。

互联网电视EPG业务隐患落地效果对比如表3所示。

4  结  论

本研究主要聚焦互联网电视EPG业务隐患预测场景,参考自动驾驶网络理念,引入AI算法实现对传统互联网电视业务运维能力注智,对现有的监控保障手段进行升级。通过对关键指標的智能化处理实现对互联网电视业务源故障的预测和干预,完善了互联网电视用户业务感知管理手段,较好地支撑了业务运维数智化转型建设。

参考文献:

[1] 国家广播电视总局规划财务司.2021年全国广播电视行业统计公报 [EB/OL].(2022-04-25).https://www.nrta.gov.cn/art/2022/4/25/art_113_60195.html.

[2] 谭晓敏,方艾,金铎,等.IPTV用户体验异常的自动化检测 [J].电信科学,2019,35(7):159-164.

[3] 余乐安.基于人工智能的预测与决策优化理论和方法研究 [J].管理科学,2022,35(1):60-66.

[4] 王鑫,吴际,刘超,等.基于LSTM循环神经网络的故障时间序列预测 [J].北京航空航天大学学报,2018,44(4):772-784.

[5] 黄林,王电钢,刘萧,等.基于LSTM的网络流量预测方法 [J].计算机应用研究,2020,37(S1):264-265+272.

[6] 任艺柯.基于改进的LSTM网络的交通流预测 [D].大连:大连理工大学,2019.

[7] 杨星鑫,吕泽均.基于LSTM的无人机轨迹识别技术研究 [J].现代计算机,2020(5):18-22+25.

[8] 庞悦,赵威,张雅楠,等.基于深度学习的LSTM的交通流量预测 [J].单片机与嵌入式系统应用,2019,19(3):72-75.

[9] 程肖冰,曹丽婷,李苏建.基于混合优化神经网络的零售销量预测 [J].统计与决策,2022,38(6):185-188.

[10] 李九龙,周凌柯.基于“3σ法则”的显著误差检测 [J].计算机与现代化,2012(1):10-13.

作者简介:班雪飞(1978—),女,汉族,内蒙古乌兰

察布人,工程师,硕士,研究方向:互联网和传输新技术;倪峰(1993—),男,满族,内蒙古赤峰人,工程师,硕士,研究方向:大数据和人工智能新技术;周玮(1984—),男,汉族,内蒙古呼和浩特人,高级工程师,硕士,研究方向:移动通信系统领域OSS系统规划、建设和项目管理;马占婕(1983—),女,汉族,内蒙古巴彦淖尔人,高级工程师,本科,研究方向:互联网、资源管理、人工智能;孙忠岩(1980—),女,蒙古族,辽宁大连人,高级工程师,硕士,研究方向:移动通信领域项目方案规划、建设和管理。