基于神经网络的用户满意度评估方法研究
2016-05-30王苏卫
王苏卫
摘 要:提升用户满意度是运营商优化网络的目标,而准确把握网络性能指标和业务质量指标与用户的满意度之间的相关性是关键。本文提出一种非线性的基于神经网络的用户满意度评估方法,经仿真表明,其能较准确地实现用户满意度的评估。
关键词:用户满意度;神经网络;网络性能指标;业务质量指标
1 背景
提升用户满意度一直以来都是运营商努力的方向,但要提升用户的满意度,就必须对影响用户感知的各类因素有深入的理解。目前运营商能掌握的这些因素就是网络性能指标(KPI)和业务质量指标(KQI),运营商希望通过监控这些KPI和KQI,构建用户满意度模型,来进行用户满意度评估。但随着业务地不断发展,网络性能地不断提升,用户期望也将不断发生改变,用户满意度的评估也必须随着这种变化而改变[1]。
因此,基于运营商现成的KPI和KQI数据,充分考虑运营商网络中出现的影响到用户满意度的因素,提出一种具有非线性映射功能的基于BP神经网络的用户满意度评估方法,利用该方法成功建立用户满意度评估模型,能较准确地对移动运营商的用户满意度进行评估,该模型可进一步指导运营商进行网络质量的提升工作。
2 BP神经网络
BP(Back Propagation)神经网络模型是一种采用BP学习算法的多层前馈神经网络。BP算法是利用输出后的误差来估计输出层的直接前导层的误差,再利用这个误差估计更前一层的误差,如此一层一层的反传下去,就获得了所有其他各层的误差估计。因此,BP神经网络由数据的正向传播和误差的反向传播两个流程组成。正向传播就是输入样本->输入层->各隐层->输出层。若输出层的实际输出与期望的输出不符时,则转入反向的误差传播阶段,误差以某种形式在各层表示,修正各层单元的权值,直到网络输出的误差减少到可接受的程度。
3 用户满意度建模
本节将以LTE网络的用户感知评估为例进行基于BP神经网络进行用户满意度建模和仿真。具体流程主要包含建模过程和模型应用两部分。在建模过程部分中,采用某省级运营商一个月份的网络性能指标和业务质量指标数据,以及对应的用户满意度调查数据;模型应用部分,主要是应用确定的建模方法,建立场景级客户感知指数模型。
3.1 指标选择
在LTE系统中,涉及用户满意度的指标很多,如果全部纳入到建模中,一是会加重建模的复杂性,二是指标之间的相关性会影响到建模的结果。因此在指标选择方面,本文基于前期的业务经验从众多的指标中,精心挑选出39个最能反映网络性能和业务质量的指标作为建模的原始数据,具体网络性能和业务质量指標集如表1所示。
3.2 数据规范化处理
上述的评估指标具有不同的量纲及量纲单位,如平均时延、成功率和速率的量纲都不相同,这种情况会影响到建模的准确性。为了解决指标之间的可比性,提高建模的准确性,对数据进行规范化处理,以消除指标之间的量纲影响是有必要的。另外,由于BP神经网络的隐层通常采用Sigmoid激励函数,为了有效避开Sigmoid函数的饱和区,并提高模型的灵敏性与训练的速度,通常要求输入的指标范围在[0,1]区间内。因此,也需要对输入数据进行规范化预处理操作。
本文采用最简单的最小-最大规范化处理,处理函数如下:
其中xmax为某指标数据集中的最大值,xmin为某指标数据集中的最小值。通过规范化后,将输入的指标数据控制在[0,1]区间内。
3.3 指标间的相关性检测
输入的指标有可能是共线性的,说明这些指标具有相关性,而这种相关性有可能导致最终结果的非唯一性。也就是说由于指标之间的相互作用,将他们的相关关系传递到权值,又使自由参数的最优化变得越来越复杂,从而使得权值有多解存在。因此有必要在构建BP神经网络前,对输入的指标进行相关性的检测。
通过计算输入指标之间的相关系数可以判断输入指标之间是否存在相关关系。相关系数r是两个指标关联强度的度量。相关系数越大,相关性越强;相关系数为正数代表正相关,r为负数代表负相关。平均数分别为x1,x2的两个变量x1,x2的相关系数可以表示为:
相关系数是一个绝对值在[0,1]之间的小数,一般情况下当相关系数的绝对值在[0.8,1]可认为指标之间存在强相关关系,[0.2,0.8]可认为是弱相关关系,[0,0.2]可认为是不相关。
3.4 BP神经网络建模
据统计,在所有的神经网络应用中,BP神经网络的应用占比超过80%。BP神经网络因其具有良好学习能力,而且学习的效率高且速率快,以及非线性逼近能力和泛化能力。BP神经网络采用的BP算法也是目前在前馈神经网络中研究得最成熟且应用最广的一种有导师学习算法。
本文BP神经网络建模中,其中隐层的节点转换算法采用tansig 算法,这个非线性函数式如下:
输出层算法采用logsig,算法函数式如下:
两个函数都属于S型函数,采用S型函数可以处理和逼近非线性输入/输出关系,一般情况下,均是在隐含层采用S型激活函数,而输出层采用Purelin函数,但这里我们考虑到输出值的范围在[0,1]之间,因此输出层采用S型函数logsig,那么整个网络的输出被限制在[0,1]范围内。
因为输出仅为用户满意度指数,所以,输出层的神经元就只有一个,而隐层神经元个数可以从理论与实践两方面共同确定。而相邻层之间的连接权值,只有通过计算预测样本的数据与样本的预测值的方差进行判断。
3.5 训练网络
在神经网络训练过程中选择均方误差MSE较为合理,函数如下:
其中:m为输出节点的个数,p为训练样本数目,y'ij为网络期望输出值,yij为网络实际输出值。
输入预先准备的训练样本数据后,网络信号正向传播将按期望输出与实际输出进行比较,如果误差值低于预期的设置,则将误差反向传播,从而逐层调整权值矩阵的阈值向量。当误差减小到预设范围时,系统则停止学习,此时得到的权值矩阵与阈值向量就形成了LTE 用户满意度的评估模型。
我们初步设置停止训练的误差限为0.001,通过用预先准备的测试样本数据对网络进行验证测试,并通过观察对每个测试数据的仿真输出和期望输出的比较,得出该BP神经网络仿真误差的大小,以直观地反映出仿真得出的结果与理想值之间的关系,综合评估后,得出采用BP神经网络模型对用户满意度进行评估具有较高的精确度。
4 总结
本文根据传统用户满意度评估中存在的问题,提出了基于BP神经网络的用户满意度评估方法,针详细描述神经网络建模的过程。分析结果表明,基于BP神经网络方法,采用网络性能指标和业务质量指标作为用户满意度评估的数据源,为运营商主动发现网络质量问题,并及时解决问题提供有效支撑。
参考文献
[1]许福永,申健,李剑英.网络安全综合评价方法的研究及应用[J].计算机工程与设计,2006,27(8):1398-1400.
[2]高广燕.基于用户感知的网络评估考核算法及应用研究[D].吉林大学.2013.
[3]党志恒.基于用户感知体系的神经网络算法研究[J].数字技术应用,2013,(10):136-137.