基于递归分析的移动电话业务数据混沌特性分析
2017-09-27张军范珍艳
张军+范珍艳
摘 要:对移动电话用户呼叫数据的分析是提高通信服务质量的重要依据之一。本文针对移动转换中心的日常高峰期来电数据和日常呼叫掉话数据,使用递归分析方法,对它们的非线性特征和混沌性进行分析,从而对无线移动网络呼叫数据的复杂性进行了评估。本文采用递归图和递归定量分析方法揭示了用户呼叫数据中的非平稳性、非线性和混沌特性的存在,为进一步的移动电话用户数据建模提供了一定的依据。
关键词:递归分析;移动电话业务数据;混沌特性
DOI:10.16640/j.cnki.37-1222/t.2017.19.225
1 引言
由于用戶不断提高的对移动通话网络低成本多样化服务的需求,电话服务商需要持续的更新技术和基础设施来提高服务质量。在可允许范围内来限制掉话率和拥堵率,是直接关系到顾客满意度的重要服务质量参数。要想提高服务质量,使系统接近最优性能,需要对移动电话网络动态有清晰的了解和分析。电话网络流量的动态参数主要受到高峰时刻来电率和掉话率的影响。了解、分析理解这两个参数的波动特性是掌握它们变化动态的重要方式。近年来,非线性和混沌特性逐渐成为评估特定系统动态复杂程度的重要指标。本文针对日常高峰期的呼叫来电和日常掉话的时间数据序列,对其非线性和混沌特性进行研究。使用递归图和递归定量分析来确认这两个时间数据序列中混沌特性的存在及特征,为进一步的建模分析提供基础。
2 移动电话用户数据的基本统计分析
本文研究中使用了在某移动交换中心记录的日常移动电话用户呼叫的相关数据,包括:呼叫初始化、呼叫保持时间、掉话信息等。本文中以小时为单位统计每小时内的各项数据,分析每小时内呼叫初始化和掉话这两种数据,并对这两组数据进行基本的统计特性分析。这两组数据的曲线图如图1所示。数据的基本统计特性计算结果在表1中。
3 递归图与递归定量分析方法
3.1 递归图
递归图从几何上是一个方阵的二维图形表示,其中的矩阵元素对应于一个动态系统的递归状态,它提供了一种研究相空间轨迹的周期特性的方法 [1-3]。相空间由d维的延迟向量组成, d维相空间的状态轨迹由用白点和黑点的二维方阵表示,其中白点代表1,黑点代表0。递归图的两个坐标轴均为时间轴。基于Takens定理,相空间轨迹可由单标量时间序列通过向空间重构来分析 [4-6]。递归图的数学表达式为:
式中,是递归图中位于(i,j)位置的值,N是相关状态的数量,是阈值,是Heaviside函数,是时间序列。相空间向量是由一维数据序列基于Takens时间延迟定理重构得到的,即,嵌入维数为d,时间延迟为。维数d由虚假邻点基本原理确定,时间延迟由互信息方法得到 [1,5,6]。虚假邻点方法的基本原理是减少嵌入维数d,增加邻点数量投影到到相空间中。然后通过消去虚假邻点的方法降低嵌入维数d,并尽量使d达到最小。时间延迟与嵌入延迟成线性比例关系,时间延迟是由乘以数据序列的采样率得到。本研究中,由于相邻两个观测值的采样间隔是一天,所以时间延迟和嵌入延迟相等。的最优值由互信息理论来确定。通过计算,本文中使用的上述两个参数值见表2。阈值取尽可能小的适当值。周期信号的递归图有很长的对角线,而混沌信号有很短的对角线或者没有对角线,因此递归图从几何上对数据信号的混沌特性有直观的展现。
3.2 递归定量分析
尽管递归图的图案纹理从几何上直观的展示时间数据序列的性质,但是当纹理很复杂时,直观观察不能得到准确的结论,递归定量分析则可以在递归图基础上,定量准确的得到相关分析结果。在递归定量分析中使用的量化指标主要有:REC,DET,LMAX [7]。REC定义为递归图的黑点和递归循环状态数在所有可能的状态中的比例,它的范围可以从0%(无递归点)到100%(所有点递归循环):
DEC定义为形成对角线结构的递归点在所有递归点中的比例。对于周期信号,DEC接近于100%;对于随机信号,DEC趋向于0%。然而对于混沌信号,它的值介于周期信号和随机信号的值之间,其数学定义是:
LMAX定义为递归图中除主对角线(i=j)之外的最长的对角线段的长度。艾克曼等人通过研究发现它和李雅普诺夫指数相反,因此混沌特性越强的信号会在递归图中产生越短的对角线长度。如果是对角线数量,是第i条对角线的长度,则:
4 移动电话用户数据的递归分析结果
图2和图3分别显示了两组日常掉话数据和日常高峰期呼叫初始化数据的递归图。递归阈值在递归图分析中是一个非常重要的参数,本文中递归阈值是相空间最大直径的5%。两个数据信号递归图中的中断(白色区域)意味着两个数据信号都是非平稳的。从递归图中白色区域的密度来看,日常掉话数据是严格意义上的非平稳,然而日常高峰期来电数据不是严格意义上的非平稳,掉话的波动变化率比高峰期来电的波动变化率更大。图3中线条的均匀分布表明在高峰期呼叫初始化数据信号可能存在周期性,而另一方面日常掉话数据信号可能会有类似的周期性。单个独立黑点的存在表明在这两个过程中有时会有突发的大的波动。表3分别显示了日常掉话数据和高峰期呼叫初始化数据的递归定量分析结果。日常掉话数据和日常高峰期呼叫初始化数据的REC值分别是19.68%和33.20%,既不接近0%,且距离100%比较远。高峰期呼叫初始化序列的DEC值比掉话序列的值更大,表明前者比后者相对更具有确定性。高峰期呼叫初始化数据的LINEMAX值比掉话数据的LINEMAX值更大,表明前者更加规律和平稳。
5 结论
上述分析中的两组数据信号都是非平稳信号,虽然日常高峰期呼叫初始化数据表现的更有规律性,日常掉话数据表现出更强烈的混沌特性,但在日常高峰期呼叫初始化数据也会有微弱的混沌特性存在。这表示两种数据均是非线性的。混沌信号是非周期的,因而带宽比较宽,混沌信号可以提供一个构建高容量通信系统的机制,并能降低目前在多级移动通信网络中掉话率增加的趋势,为提高网络通信的服务质量提供依据。
参考文献:
[1]Eckmann JP,Kamphorst SO,Ruelle D.Recurrence plots of dynamical systems. Europhys Lett,1987,4(09):973-7 .
[2]Marwan N,Kurths J.Cross recurrence plots and their applications.Benton EC,editor.Hauppauge:Nova Science Publishers,2004 .
[3]Marwan N,Romano MC,Kurths J.Recurrence plots for the analysis of complex systems. Phys Rep,2007(438):237 .
[4]Kennel MB,Brown R,Abarbanel H.Determining embedding dimension for phase-space reconstruction using a geometrical construction.Phys Rev A,1992,45(06):3403-11 .
[5]管红立,王博文,赵智忠,基于相空间重构和Lyapunov指数电弧电流混沌特性分析[J].电工电能新技术,2017,36(03):35-40.
[6]王建平,郝钊,朱程辉,基于相空间重构的光纤周界信号识别算法研究 合肥工业大学学报(自然科学版),2017,40(05):643-648.
[7]Zbilut JP,Webber CL.Embedding and delays as derived from quantification of recurrence plot.Phys Lett A,1992(171):199-203.