APP下载

人工智能在场景识别及智能优化中的应用

2021-11-08刘洋吴威宋伟林彬

广东通信技术 2021年10期
关键词:话务智能优化

[刘洋 吴威 宋伟 林彬]

1 背景

随着大数据、云计算、智能化、平台化的信息革命时代的到来,传统网优行业有着难以承受的痛:风险大、效率低、效果不一。现代通信行业的工作模式已经逐渐向平台化、系统化、自动化和智能化的模式转变。安全、高效、全面、智能是未来通信行业发展的方向。随着4G 网络用户的增长与网络规模的扩大和无线网络传播环境的日趋复杂,LTE 网络优化难度增加。本文引入人工智能相关算法,介绍人工智能在场景识别及智能优化中的应用。

2 人工智能在场景识别及智能优化中的应用

随着中国移动从2G 到5G 不断地演进式的发展,目前所有的移动业务都是通过无线网接入,想要保持良好的网络质量,就需要不断对网络进行大量的优化调整,同时无线网络中业务场景实时变化,从众多KPI 指标中判断业务类形态,工作量大、无法与话务模型实时匹配,优化调整策略仅通过工程师个体经验难以保证质量。通过智能算法引入,实现两个维度的智能优化策略。

(1)满足场景识别、海量参数修改需求。例如在KPI 指标恶化或者在大型会议、比赛、通信保障等特殊场景下,采用人工识别场景并修改参数,效率较低。我们的产品通过CNN(卷积神经网络)实现网络画像深度学习,通过时间序列可以对高容量、大话务、CBD 商业区、高速、高校进行快速准确的智能网络画像,从而识别出网络场景,自动匹配策略进行参数自动修改,可节省大量工作并提高优化精度。

(2)预测参数调整后指标情况、推荐最优策略。结合历史数据,通过多元线性归算法对效果进行预测,寻求最优调整策略并执行。摆脱了以往单纯依靠人工经验的形式,使得网络调整更科学、精确。

3 场景识别主要过程

通过MR、话统指标等数据进行相关性分析并降维处理,利用PCA 主成份分析法将多维数据降至一维并绘制网络模型,根据网络模型绘制场景图片,并使用CNN 卷积神经网络进行模型训练识别小区场景特征并进行场景分类,场景识别过程如图1 所示。

图1 场景识别过程

3.1 相关性分析法

聚类算法相关性分析:采用该算法完成了海量数据的精准定位。通过协方差及相关性系数的计算,找出了最直接影响网络状况的几类指标。

“相关系数”正的协方差表达了正的相关性,负的协方差表达了负的相关性。对于同样的两个随机变量来说,计算出的协方差越大,相关性越强。

以吞吐量等跟话务高相关的指标为主,筛选出相关性高于90%相关字段。

3.2 主成份分析法

降维算法PCA 主成分分析法:通过该算法计算出了话务模型矩阵(T=ABT其中A是元件矩阵,B是源数据。)。将庞大的数据量压缩为一维数组,结合时间序列形成网络画像。

通过归一化、球形、卡方检验通过后进行PCA 降维。压缩为一维数组,该数组为“话务模型因子”。

模型简单理解是录入数据后,模型输出影响指标因素多个矩阵。各个矩阵依次以影响大小排序(如图2 所示)。一般取用影响最大的几个(例如得分高于1)。图2的情况仅有一个字段得分高于1。因此可以降为一维。(降为几维是根据结果决定而不是事先决定。但是数据筛选时可以加以干涉,例如相关性分析。)

图2 数据降维处理

将得到的元件矩阵带回原先的数据中得出一维的“话务模型因子”

公式:话务模型因子T=ABT

其中A是元件矩阵,B是源数据。

3.3 绘制话务模型

如图3 所示为例,该部分是以某一基站通过算法计算后得出的网络画像(与该图像相似的基站约占试点区域总基站数的18%)。其网络规律非常显著并且常年保持该图形分布。其规律分别在0~8 点期间以及20~24 点期间为低谷,8~20 点期间为相对高峰。该活动规律与写字楼区域的活动规律类似(分为上班时间和下班时间)。因此将此类分布定义为“写字楼型”方便理解记忆。

图3 场景绘制样例

通过话务模型,分析不同话务模型特征,并定义其对应的场景类型,进入深度学习网络中需要剔除各类噪声。(例如坐标轴、数字、边框,特征需要尽可能明显。)大致类型分为:

①Break 故障型(通信行为全天几乎为零);

② Office 写字楼型(上班时间通信行为为高峰其余时间为低谷);

③Line 离散型(全天的通信行为处于震荡式可以理解为待定);

④ Market 商场型(中午吃饭时段及晚上六点至九点处于通信行为高峰,其余时间为低谷);

⑤ Pub 酒吧型(夜晚及凌晨时间通信行为为高峰,其余时间为低谷);

⑥ Uptown 住宿区型(除去午夜凌晨时段外,其余时间都处于高峰的通信行为);

⑦ Village 乡村型(全天有通信行为,但皆处于低谷);

试点的90%为以上类别的分布,其余10%类别归入Line 离散型当中。经过各个月的抽检,同一基站的图形性质不变。

期间会出现识别过程中图片同时与其余类别趋于一致的问题。默认交由深度学习网络自动识别,由于类别间相似因此调整参数的策略误差在可以接受的范围内,场景绘制结果如图4 所示。

图4 场景绘制结果

3.4 深度学习模型训练

CNN 可以用来识别位移、缩放及其它形式扭曲不变性的二维或三维图像。CNN的特征提取层参数是通过训练数据学习得到的,所以其避免了人工特征提取,而是从训练数据中进行学习;其次同一特征图的神经元共享权值,减少了网络参数,这也是卷积网络相对于全连接网络的一大优势。共享局部权值这一特殊结构更接近于真实的生物神经网络使CNN 在图像处理、语音识别领域有着独特的优越性,另一方面权值共享同时降低了网络的复杂性,且多维输入信号(语音、图像)可以直接输入网络的特点避免了特征提取和分类过程中数据重排的过程。

在实践中,我们搭建CNN 卷积神经网络框架,以约10 万张训练图片,学习率0.000 1,批量大小15 完成60 000 次迭代后形成最终的深度学习模型。该模型能以高精度、高效率、全智能方式完成各大网络画像的场景识别,为智能优化打下坚实的基础。

4 场景智能优化过程

4.1 多元线性回归预测法

训练数据来源于先前的策略经验积累,模型通过预测结果以及不断获取的现有网络动态完成模型优化以及策略库的经验积累。最终通过预测实施的方式计算出各大场景各个时段各个人流量下的最佳的优化策略。并结合场景识别的监控模式实时完成参数自动调整。

第一步:根据优秀网优工程师经验设定每类场景常用优化参数、调整步长和参数调整范围,参数设置区间及步长如表1 所示。

表1 参数设置区间及步长

第二步:根据不同场景特征制定关联指标并设置相关权值。

表2 指标健康度计算

低于基准值得0 分,高于挑战值的满分,基准值和挑战值之间按照线性得分计算。指标健康度计算如表2 所示(峰值利用率只有一个门限,大于等于50%得0 分,小于50%得满分)。

4.2 算法说明

多元回归分析预测法,是指通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。当自变量与因变量之间存在线性关系时,称为多元线性回归分析。

写字楼类的最终得分的多元回归方程:

多次迭代计算已知值便可求出所有的系数b,以及误差范围e。J函数是惩罚函数加了正则项。已知值指的是工程师判断的结果。

4.3 计算过程

通过不同参数组合数次迭代预测指标变化情况,根据给定的指标权限计算小区健康度得分,得分最优的参数组合即为机器建议值,智能优化过程如图5 所示。

图5 智能优化过程

5 结论

随着人工智能在各个行业中的应用,网优智能化发展已实在必行,本文从场景识别和智能优化方面进入手,探讨人工智能在网络优化中的应用,并给出合理的算法和可行性,为后续人工智能在网络优化中大规模应用提供思路。

猜你喜欢

话务智能优化
超限高层建筑结构设计与优化思考
民用建筑防烟排烟设计优化探讨
关于优化消防安全告知承诺的一些思考
一道优化题的几何解法
浅析电信话务控制
智能前沿
智能前沿
智能前沿
智能前沿
“互联网+”高速公路客户服务话务平台研究