APP下载

基于深度置信网络的互联网流量预测方法

2023-09-17李冉

中国新通信 2023年13期
关键词:预测

关键词:深度置信网络;互联网流量;预测

随着互联网技术的进一步发展与普及,它广泛应用于人们的日常生活中。近年来,我国宽带网络资费成本逐年下降,但网络流量的规模快速增长,呈线性增长趋势。因此,通过合理规划互联网网络资源,既可以充分利用用户网络资源,又可以保证每个用户网络资源的有效使用价值与质量。通过将实际流量与预测模型进行预测比较,可以准确识别出不规则数量的垃圾邮件,以及数据流量使用过程中涉及的其他安全攻击。基于此,本文重点研究深度置信网络(DBN) 的结构,以实现高预测精度。

一、推动互联网发展的关键性因素

(一)视频

在我国信息技术飞速发展的背景下,3D 电视(3DTV)和超高清电视(UHDTV)技术已经逐渐发展,且高清电视(HDTV)普及得越来越广泛,能够满足人们对于信息资源获取的需求。一般情况下,对于互联网数据的获取而言,一段20 分钟时长、分辨率为7680×4320 像素的UHDTV2 原始视频会占據很大的空间,一般而言可能需要整个空间的4TB。为减小空间占用,需要将其进行相应的压缩,但经过压缩后也至少需要承载250Mbit/s 的实时传输带宽。为满足网络承载需要,就需要提供1020Mbit/s 的接入带宽。

(二)移动

对于我国互联网的使用而言,一般可以将其分为固定和移动两种模式。移动接入互联网的方式是一种有效方式,更是互联网发展的重要特征类型之一。截至2020年上半年,国内的手机上网用户数量有所增加,甚至超过了台式电脑上网用户数的情况。如今,人们主要通过使用各种移动终端设备获取和接收移动互联网信息,其中包括智能手机、笔记本电脑等。这些设备在使用过程中会产生一定的数据流量,而智能手机流量是非智能手机流量的35 倍[1]。经过相关分析,随着未来5 年的发展,移动接入数据流量将会继续增长,并且其增速将是固定网络接入流量增速的三倍。

(三)云计算

云计算涵盖了许多不同的技术,其中包括分布式计算、网络分布式云存储、虚拟化、负载分布智能技术等,这些技术形式都是云计算的一种应用形式。通过利用互联网,用户可以远程获取处理信息能力和存储信息的能力,并实现资源共享的目的。随着我国互联网技术的发展,“终端”这个概念逐渐引入互联网应用中。在此期间,大量的数据可以在本地终端与云端之间进行转化,主要以计算机与视频传输的形式进行。由此可见,云计算技术对互联网的发展有明显的影响。由于云存储系统对整个互联网带宽的要求更高。为了能够满足本地终端实时读取云存储数据的需求,视频技术的应用可以提供相应的解决方案,从而为互联网流量的爆发式增长提供支持。

二、理论背景

由于互联网能够满足人们的精神需求并为人们的生活带来便利,为了提升互联网的有效使用,需要加强对互联网流量的使用监测,为建设安全使用互联网技术奠定基础。深度置信网络算法可以在训练过程中通过让神经网络模型达到特定输入匹配的目标,从而保证其能够适应各种不同的输入。同时,还可以选择网络理论中目标输入参数,并基于这些参数直接推导出给定目标输入参数之间的非线性关系。为了提高人工神经网络中神经元计算的效率,需要增加神经元的数量以及增加隐藏层,并构建一个具有深层抽象结构的神经元计算模型。其中一个或多个隐藏层可作为更多抽象层单元被执行。深度置信网络的更深层架构可以借助该方式,在实际应用期间具有强大的优势。在深度置信网络建立期间,应基于隐藏层所具有的深度特征对神经网络进行分析。神经网络会涉及许多非线性层,这些非线性层的建立构成神经网络系统。深层网络在层次结构方面存在不同的性质,这些性质均可以表示为高度可变的非线性模型。然而,目前为止人们还不清楚如何进一步设计深度网络算法,为了解决这一实际的问题,需要采用一种全新的算法,有效提升互联网流量预测的效果[2]。对于深度置信网络而言,在构建期间,通过训练一层深度网络的方式。这种深度架构算法的实际应用可以通过叠加RBM(RestriCted Boltzmann Machines)网络来实现,从而有效实现深度置信网络模式。此外,DBN 算法也是当前最简单、常见、有效可行的设计方法。通过构建DBN 模型,可以将若干个RBM 节点叠加组合而成,如图1 所示。

三、构建模型

基于深度置信网络的流量预测模型主要包括三种不同的网络架构模式,可以选择其中一种来建立模型。在建立网络模型之后,可以利用该模型来预测相关的互联网流量信息。具体可以根据模型预测未来超过1 小时的时间序列深度网络流量数据,从而帮助人们更好地使用网络。深度置信网络对提升互联网流量预测效果具有重要作用,具体结构可以按照图2 所示进行构建。该模型可以分为4 层,用于预测未来的流量负荷情况。在确定模型隐藏层宽度大小及其选择因素时,需要考虑隐藏神经元数目的范围和DDBN 模型的神经元数目设置方式。

例如,可以通过蒙特卡罗模拟,计算第一隐藏神经元数目范围为100—600 时效果最好。表1 展示了DDBN模型的神经元数目首选设置方式。由表1 可知,通过预训练可以获取参数值的具体情况,并为第一层神经元构造一组初始输入参数值。然后,在掌握相关参数值的基础上,从上一层获得的输出作为另一个新输入的特征层集,并将参数值作为下一层的新输入。在构建模型期间,要想获得更多的非线性表示内容,需要进行相应的训练,并可以重复使用相关内容进行实际训练,以达到参数初始化的目的。当前所涉及的DBN 网络模型并没有进行深入分析,其中RBM 层模型也尚未进行训练模式。为解决这一问题,就需要进行微调训练干预,以有效解决存在的问题。此外,在互联网流量预测过程中,可以利用监督学习算法进行训练,这种微调训练主要针对整个网络模型,旨在有效确定预测模型的目标[3]。

四、基于深度置信网络的互联网流量预测方法

(一)预测智能手机和功能手机的用户

在基于深度置信网络的流量预测中,应对涉及的一定时间内换机用户数量进行相应分析。在分析期间,需要保证换机用户占总用户数的比例,并确保这个比例在分析期间保持不变。这说明用户的换机需求稳定且有一定的增长空间。因此,可以利用相对稳定的换机率来预测换机用户数量,只需要将总用户数乘以换机率即可。还需要预测通话用户总数,这是普通用户的预测。由于用户换机比例是稳定的,可以根据历史数据来确定。转机用户模型为: 转机用户数= 呼叫用户总数× 转机用户比例。其中,总通话用户数根据总用户数的预测模型计算,转机用户占比使用历史数据。

为了显著提高互联网流量预测的计算精度,只需要将输入集的数据进一步简单拆分,转化为一个小时、月、天、时刻以及一个t、t-1 和两个t-2 的互联网流量。目前,手机终端可分为智能手机和功能手机两类。根据两类手机在换机用户中的占比分析,这两类换机比例基本上与终端厂商的出货量占比相对应。这说明终端厂商的出货量结构直接影响用户对换机的选择。因此,在模型中,可以根据终端厂商的出货结构来确定更换用户中智能手机和功能机用户比例。

(二)预测TD和非TD换机用户

除了智能手机和功能手机的分类外,目前手机还能分为TD终端和非TD终端。因此,移动终端类型又可以进一步分为TD智能手机、非TD智能手机、TD功能机和非TD 终端。TD 功能手机市场部调研显示,影响用户终端选择的主要因素是渠道推广。针对TD 和非TD换机用户模型可以推断:换机TD 智能手机用户= 换机智能手机用户× 换机TD 智能手机用户比例。其中,涉及的TD 智能手机换机用户也具有一定比例,其比例也会占TD 功能机换机比例。具体的比例取决于市场部门对TD 终端发展态度,而补贴方式则是由市场部根据发展战略来确定。

(三)城乡各类终端用户到达量预测

在对城乡各类终端用户到达量进行预测时,可以根据移动公司的TD 网络建设情况进行相应分析。分析后发现,在TD 网络的实际应用中,其覆盖主要针对城市地区,而没有覆盖农村地区。基于当前TD 和GSM 网络的实际情况,还需要将替代用户划分为城乡,并根据市场部的研究来评估城乡替代率。影响城乡替代率的主要因素是市场部对城乡发展的战略。同时,市场部门对城乡终端的评价指标基本一致,城乡换机用户可以按照以下方式计算:城市各类换机用户= 各类换机用户× 占比(城市中此类用户的数量)。其中,城乡终端置换用户比例取决于市场部门对城乡终端的发展战略,可以通过市场部门的考核指标和发展战略综合确定。需要注意的是,换机用户是指使用新IMEI 号码的手机用户,但不等同于净增用户。例如,某用户是TD 智能手机用户,更换TD 智能手机后成为TD 智能手机换机用户,但这并不表示TD 智能手机用户的净增,通过分析换机用户和净增用户可以发现两者存在一定的相关性。

(四)各类终端流量预测

各类终端的流量预测是根据用户数乘以单个用户流量。常用的单个用户流量预测方法有回归分析和类比法,但这些方法都没有考虑流量和移动应用开发对用户的影响。目前,在预测单用户流量时,通常会考虑流量、速率和应用之间的相关性。因此,各终端类型的流量预测模型可以表示为:各类终端流量= 各类终端用户数× 该类终端单个用户流量。在这个模型中,可以通过回归分析、类比法和关联分析等方法综合判断单个用户的流量大小。

(五)预测TD 和GSM 网络承载流量

通过以上预测模型,城市TD 智能手机、城市非TD智能手机、城市TD 功能手机、城市非TD 功能手机、农村TD 智能手机、农村非TD 智能手机在实际使用期间,均会产生一定的流量数据,这些流量数据都是使用手机的主要形式。在使用期间,TD 网络只会覆盖在城市地区,城市地区使用时也会产生相应的数据。农村地区所有终端的数据流量都在GSM 网络上进行,虽然城市有TD 网络覆盖,但在实际使用期间,部分地区也会存在覆盖盲点的情况,或者存在信号差的问题。通过分析DTT 客户在GSM 网络上承载的流量,传输率与DTT 网络的覆盖范围和质量有关,可以根据历史数据和TD 网络优化策略综合确定检测率。

(六)后端网络反推市场策略

在深度神经网络模型检测期间,由于投入其中使用的相关数据资源具有有限的特点,这样就会严重影响市场的建立效果,导致当前建设的网络模式无法满足市场的实际需要。当前互联网网络数据在运行期间,市场部需要制定有关的TD 智能手机。在智能手机建设期间,相关人员只会考虑到自身的评价指标。但是在网络分析期间,并没有考虑到涉及网络的实际分配需求,这样就会导致TD 网络无法将网络流量有效分配。而在深度置信网络模型建立期间,也可以基于GSM 网络容量具有一定特点的情况下,通过模型建立的方式,有效推断城市TD 网络应分流的数据流量。在对流量数据分析期間,也可以获得功能手机用户数。在用户数的建立之下,就可以形成一种前后端联动体系。在体系建立之下,也可以实现逆向计算的目标。不仅能够反推出相应的市场策略模式,还可以推算每个终端类型的用户数。

五、结束语

综上所述,本文提出了一种基于DBN 的神经网络模型,用于预测互联网流量数据的使用。深度置信网络模型具有更好的预测性能,能够减小误差,主要是由于DBN 模型具有明显的特征提取能力。同时,WLAN 业务作为CMNET 的核心业务,是中国移动三网协同战略的重要组成部分。而GSM、TD-SCDMA 网络数据业务承载能力不足的问题,集团客户专线、家庭宽带等业务也是中国移动全业务竞争的必要手段之一。中国移动互联网作为上述业务的承载网络,在带宽提速、全业务承载、电信级以太网演进等发展趋势的推动下,正面临前所未有的发展机遇。CMNET 核心网建设应注意保障有效网络带宽,积极引入网络资源,并适时推广高带宽链路和路由器集群技术。

作者单位:李冉 中国电信股份有限公司北京分公司

猜你喜欢

预测
无可预测
基于PCC-CNN-GRU的短期风电功率预测
选修2—2期中考试预测卷(A卷)答案与提示
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(B卷)答案与提示
“预测”得准
不可预测