移动计算环境下远程用户体验数据挖掘方法研究
2017-02-27秦永俊
秦永俊
(桂林师范高等专科学校 数学与计算机技术系,广西 桂林 541001)
移动计算环境下远程用户体验数据挖掘方法研究
秦永俊
(桂林师范高等专科学校 数学与计算机技术系,广西 桂林 541001)
在移动计算环境下,通过对远程用户的体验数据优化挖掘,满足远程用户的个性化需求,提高对远程用户QoS服务质量;传统的数据挖掘方法采用显著特征关联信息提取算法,当远程用户体验数据之间的差异性特征不明显时,挖掘的准确性不好;提出一种基于关联用户自适应链路跟踪补偿的移动计算环境下远程用户体验数据挖掘模型,进行远程用户体验数据挖掘模型的总体设计和数据结构特征分析,对采集的远程用户体验数据进行非线性时间序列分解,对数据序列通过自相关特征匹配和特征压缩实现挖掘数据的指向性信息优化提取,采用关联用户自适应链路跟踪补偿方法实现对数据挖掘误差的控制和补偿,提高了数据挖掘的准确性和有效性;仿真结果表明,采用该挖掘方法进行移动计算环境下远程用户体验数据挖掘的准确度高,实时性较好,满足了移动远程用户的个性化需求,提高了对用户服务的针对性。
移动计算;用户体验数据;数据挖掘;特征提取;QoS
0 引言
随着大数据信息处理技术和移动网络通信技术的发展,大量的数据信息流通过移动网络进行传输。在移动计算环境下,远程用户对移动服务的体验和要求不一致,移动远程用户的体验数据有效地反应了用户的个性化需求,需要对在移动计算环境下对远程用户体验数据进行有效挖掘,通过对数据的关联信息的特征分析,挖掘出能有效反应移动远程用户的个性化体验特征,满足远程用户的个性化需求,提高对远程用户QoS服务质量。因此,研究移动计算环境下远程用户体验数据挖掘方法具有重要意义。
传统方法中,对移动计算环境下远程用户体验数据挖掘方法主要有基于演化博弈的移动计算环境下远程用户体验数据挖掘算法、基于统计信号分析的移动计算环境下远程用户体验数据挖掘算法、基于语义特征提取的数据挖掘算法、基于自适应粒子群算法的数据挖掘算法、基于相空间重构及混沌时间序列分析的移动计算环境下远程用户体验数据挖掘方法等[1-3],上述算法通过求得移动计算环境下远程用户体验数据的特征空间,对训练样本和测试集进行时间序列分析,通过特征提取实现数据挖掘,移动计算环境下远程用户体验数据的具有较强的自耦合性非线性特征,在受到较大的环境干扰下,挖掘难度较大。对此,相关学者进行了移动计算环境下远程用户体验数据挖掘算法设计和改进,其中,文献[4]提出一种基于语义本体特征指向性波束聚类的移动计算环境下远程用户体验数据挖掘算法,实现移动计算环境下的数据挖掘和信息检索,但是该算法计算开销较大,对数据挖掘的实时性不好。文献[5]提出一种基于模糊C均值聚类的移动计算环境下远程用户体验数据挖掘算法,采用模糊C均值聚类算法实现语义本体特征指向性波束聚类,实现数据挖掘算法改进,在云计算平台下实现移动计算环境下远程用户体验数据挖掘,具有较好的精度,但是该算法抗干扰能力不好,且收敛性受到限制。文献[6]提出采用显著特征关联信息提取算法,当远程用户体验数据之间的差异性特征不明显时,挖掘的准确性不好。针对上述问题,本文提出一种基于关联用户自适应链路跟踪补偿的移动计算环境下远程用户体验数据挖掘模型,进行远程用户体验数据挖掘模型的总体设计和数据结构特征分析,对采集的远程用户体验数据进行非线性时间序列分解,对数据序列通过自相关特征匹配和特征压缩实现挖掘数据的指向性信息的优化提取,采用关联用户自适应链路跟踪补偿方法实现对数据挖掘误差的控制和补偿,提高了数据挖掘的准确性和有效性。最后通过仿真实验进行性能测试,展示了本文方法对移动计算环境下远程用户体验数据挖掘的准确性和实时性,得出有效性结论。
1 移动计算环境下远程用户体验数据挖掘总体模型设计及数据特征分析
1.1 移动计算环境下远程用户体验数据挖掘总体模型设计与数据时间序列分析
为了实现移动计算环境下远程用户体验数据挖掘,首先进行数据挖掘模型的总体设计。在移动云平台和物联网等环境下,通过求得移动计算环境下远程用户体验数据的特征空间,对训练样本和测试集进行时间序列分析,通过特征提取实现数据挖掘。由于移动计算环境下远程用户体验数据的具有较强的自耦合性非线性特征,在受到较大的环境干扰下,挖掘难度较大,且数据挖掘的特征空间维数较高,需要进行特征提取和特征压缩[7-10],在高维特征空间中,通过对移动计算环境下远程用户体验数据的状态识别和数据测试,实现对数据的准确挖掘,在移动计算环境下,远程用户体验数据分成3×3拓扑结构,设置4个负载区域层次的输入输出通道,以近邻点为中心构建移动计算环境下远程用户体验数据的向量量化特征编码模型,通过伴随跟踪器进行数据挖掘的性能修正分析。本文采用基于关联用户自适应链路跟踪补偿的移动计算环境下远程用户体验数据挖掘模型,进行远程用户体验数据挖掘模型的总体设计和数据结构特征分析,对采集的远程用户体验数据进行非线性时间序列分解,根据上述描述,得到本文设计的移动计算环境下远程用户体验数据挖掘总体模型如图1所示。
图1 移动计算环境下远程用户体验数据挖掘总体模型
根据图1所示的移动计算环境下远程用户体验数据挖掘总体模型设计,进行数据挖掘算法改进设计,进行移动计算环境下远程用户体验数据时间序列分析,移动计算环境下远程用户体验数据的语义检索的控制参量采用I(x,y)表示,采用关键词查询指向性曲线C划分移动计算环境下远程用户体验数据的特征分布区域R1和R2,其中一个移动计算环境下远程用户体验数据的文本区域,一个为移动计算环境下远程用户体验数据挖掘的干扰背景区域。在移动计算环境下,远程用户体验数据的特征信息流采样模型为:
(1)
式中,a(t)称为远程用户体验数据的复信号时间序列,z(t)的瞬时幅度,移动计算环境下远程用户体验数据包络为φ(t),在,域徙动抑制的情况下,采用H(f)为用户体验数据的相群合成传输函数,由此实现了移动计算环境下远程用户体验数据的时间序列分析。
1.2 移动计算环境下远程用户体验数据特征分析及预处理
移动计算环境下,对远程用户体验数据的链路状态模型T的子模式为X=I1I2…Ik,对于一个正整数k,采用离群因子p来表示远程用户在第k距离的体验差异性,表示为k_distance(p),测量数据zt对用户对象p的关联度主特征量为:
(2)
求移动计算的每个用户点的第k距离邻域,对于给定的正整数k,移动计算的用户体验数据对象p能有效传递对数据挖掘的关联度主特征量,由此构建移动计算环境下远程用户体验数据特征分解模型为:
(3)
假设移动计算环境下远程用户体验数据的标量时间序列x是集合X中的一个数据对象,那么移动计算环境下远程用户体验数据的状态链路集合Y中存在一个数据对象y使得关联度主特征量满足|k_distance(y)-k_distance(x)|=Δk_distance(X,Y),则有:
(4)
对数据信息流的标量时间序列在时域上进行时频分解,对采集的远程用户体验数据进行非线性时间序列分解,得到结果为:
(5)
其中:
(6)
假设待挖掘的远程用户体验数据具有d个特性,在特征相空间中,通过特征提取,进行移动计算环境下远程用户体验数据挖掘优化。
2 移动计算环境下远程用户的体验数据挖掘的优化实现
2.1 问题描述及数据信息流特征提取
在上述进行了移动计算环境下远程用户体验数据挖掘总体模型设计及数据特征分析的基础上,进行数据挖掘算法改进设计,满足远程用户的个性化需求,提高对远程用户QoS服务质量。传统的数据挖掘方法采用显著特征关联信息提取算法,当远程用户体验数据之间的差异性特征不明显时,挖掘的准确性不好。为了克服传统方法的弊端,本文提出一种基于关联用户自适应链路跟踪补偿的移动计算环境下远程用户体验数据挖掘模型,对采集的远程用户体验数据进行非线性时间序列分解,对数据序列通过自相关特征匹配和特征压缩实现挖掘数据的指向性信息的优化提取,定义移动计算环境下远程用户的体验数据数据对象p的差异性特征因子,记为OF(p),定义如下:
(7)
通过对数据信息流的差异性特征提取,求远程用户每个点的第k距离邻域,假设x是集合X中的一个数据对象,数据挖掘的相异性特征变量为O(nk2),在关键词查询指向性曲线约束规则下,得到移动计算环境下远程用户体验数据结构:
Ecv(c1,c2)=μ·Length(C)+ν·Area(inside(C))+
(8)
其中:c1和c2分别表示移动计算环境下远程用户体验数据挖掘的目标特征区域和干扰区域的自适应特征匹配特征系数,Length(C)表示待挖掘的移动计算环境下远程用户体验数据的语义状态信息归一化耦合系数,时间复杂度为O(nlogn),采用关联度主特征提取方法,得到移动计算环境下远程用户的体验数据的解空间基函数可以描述为:
(9)
对数据序列通过自相关特征匹配和特征压缩实现挖掘数据的指向性信息的优化提取,数据挖掘的子空间特征响应迭代函数为:
(10)
采用匹配投影法进行移动计算环境下远程用户体验数据的横向链距离估计,得到t时刻节点i对节点j的可靠性挖掘的QoS预测结果为:
(11)
将每个点的远程用户体验数据行合并,引入调和平均值F-measure实现数据挖掘链路通道中的信道均衡,提高数据挖掘的精度。
2.2 基于关联用户自适应链路跟踪补偿的数据挖掘误差修正及优化
(12)
关联用户自适应链路通过横向和竖向两个梯度方向分解进行误差的渐进补偿,补偿的控制变量为:
(13)
(14)
采用跟踪补偿方法实现对数据挖掘误差的控制和补偿,实现移动计算环境下远程用户的体验数据挖掘优化,其中,数据挖掘的收敛性判决式为:
(15)
设定阈值进行数据挖掘过程中的收敛性判决和控制,提高了数据挖掘的精度。
3 仿真实验与结果分析
为了测试本文设计的基于关联用户自适应链路跟踪补偿的移动计算环境下远程用户体验数据挖掘模型在进行数据挖掘优化中的性能,进行仿真实验。实验的硬件环境为:处理器Intel(R)Core(TM)2 Duo CPU 2.94 GHz,内存:8.00 GB。采用Matlab仿真软件,进行移动计算环境下远程用户体验数据挖掘算法的编程设计。移动计算环境下远程用户体验数据的测试数据来自于移动通信网络的大型用户集团数据库KDP2016。移动计算环境下远程用户体验数据采样样本的个数为1 024,采样的周期为T=0.04 s,数据的采样带宽为25.8 Bit, 离散采样率为fs=10*f0Hz=10kHz,正交解调的带宽B=1 000Hz,干扰数据项为22.4dB的强度进行特征分区。根据上述仿真环境和参数设定,进行数据仿真分析,对采集的远程用户体验数据进行非线性时间序列分解,得到原始采集的移动计算环境下远程用户体验数据的时间序列波形如图2所示。
图2 原始采集的移动计算环境下远程用户体验数据的
时间序列波形
以上述采样数据为测试样本训练集,进行数据挖掘仿真分析,对数据序列通过自相关特征匹配和特征压缩实现挖掘数据的指向性信息的优化提取,得到提取结果如图3所示。
从图可见,采用本文算法进行移动计算环境下远程用户体验数据挖的特征聚焦性能较好,提高数据挖掘的指向性增益,为了定量对比性能,采用本文算法和传统算法(分别为文献[4]和文献[6]的ALE测试算法和AdjHCFCOM算法),以数据挖掘的精度为测试指标,得到对比结果如图4所示。
图4 数据挖掘性能分析
图3 移动计算环境下远程用户体验数据挖掘特征提取结果
对相关技术指标数据进行整理分析,得到详细的性能对比结果见表1。
表1 不同算法下进行数据挖掘的技术指标分析
分析上述结果可知,采用本文算法进行移动计算环境下远程用户体验数据挖掘的收敛精度为100%,收敛时间迭代步数较小,时间较短,计算开销较低,各项技术指标具有优越性。
4 结束语
为了满足了移动远程用户的个性化需求,提高了对用户服务的针对性,本文提出一种基于关联用户自适应链路跟踪补偿的移动计算环境下远程用户体验数据挖掘模型,进行远程用户体验数据挖掘模型的总体设计和数据结构特征分析,对采集的远程用户体验数据进行非线性时间序列分解,对数据序列通过自相关特征匹配和特征压缩实现挖掘数据的指向性信息的优化提取,采用关联用户自适应链路跟踪补偿方法实现对数据挖掘误差的控制和补偿,提高了数据挖掘的准确性和有效性。仿真结果表明,采用该挖掘方法进行移动计算环境下远程用户体验数据挖掘的准确度高,实时性较好,性能优越。
[1] 余晓东,雷英杰,岳韶华,等.基于粒子群优化的直觉模糊核聚类算法研究[J].通信学报,2015,(5):2015099.
[2] 刘经南,方 媛,郭 迟,等.位置大数据的分析处理研究进展[J].武汉大学学报·信息科学版,2014,39(4):379-385.
[3] 李 鹏, 刘思峰. 基于灰色关联分析和D-S 证据理论的区间直觉模糊决策方法[J]. 自动化学报, 2011, 37(8): 993-999.
[4] Eldemerdash Y A, Dobre O A, and Liao B J. Blind identification of SM and Alamouti STBC-OFDM signals[J]. IEEE Transactions on Wireless Communications, 2015, 14(2): 972-982.
[5] Xu Y, Tong S, Li Y. Prescribed performance fuzzy adaptive fault-tolerant control of non-linear systems with actuator faults[J]. IET Control Theory and Applications, 2014, 8(6): 420-431.
[6] Huang X, Wang Z, Li Y, et al. Design of fuzzy state feedback controller for robust stabilization of uncertain fractional-order chaotic systems[J]. Journal of the Franklin Institute, 2015, 351(12): 5480-5493.
[7] 崔永君,张永花.基于特征尺度均衡的Linux系统双阈值任务调度算法[J].计算机科学,2015,42(6):181-184.
[8] 刘 俊,刘 瑜,何 友,等. 杂波环境下基于全邻模糊聚类的联合概率数据互联算法[J]. 电子与信息学报, 2016, 38(6): 1438-1445.
[9] 陆兴华,陈平华.基于定量递归联合熵特征重构的缓冲区流量预测算法[J].计算机科学,2015, 42(4): 68-71.
[10] 黄国顺,文 翰. 基于边界域和知识粒度的粗糙集不确定性度量[J]. 控制与决策, 2016, 31(6): 983-989.
Research on Remote User Experience Data Mining Method in Mobile Computing Environment
Qin Yongjun
(Department of Mathematics and Computer Science, Guilin Normal College, Guilin 541001, China)
In the mobile computing environment, through the optimization of the remote user experience data mining, to meet the personalized needs of remote users, improve the quality of QoS service for remote users. The traditional data mining methods use significant feature association information extraction algorithm, when the difference between the remote user experience data is not obvious, the accuracy of mining is not good. Put forward remote user experience data mining model based on a associated with the user adaptive link tracking compensation of mobile computing environment, remote user experience data mining model of overall design and data structure feature analysis, on the acquisition of the remote user experience data of non linear time series decomposition, the sequence of data by self correlation feature matching and feature compression to achieve data mining point of information optimization extraction, associated user adaptive link tracking compensation method to realize the error control and compensation of data mining is used to improve the accuracy and efficiency of the data mining. Simulation results show that using the mining method for mobile computing environment remote user experience data mining of high accuracy, real-time well and meet the personalized needs of remote mobile users, the increase of user services targeted.
mobile computing; user experience data; data mining; feature extraction; QoS
2016-06-28;
2016-09-13。
秦永俊(1966-),男,广西桂林人,硕士,讲师,主要从事数据挖掘、人工智能方向的研究。
1671-4598(2017)01-0111-03
10.16526/j.cnki.11-4762/tp.2017.01.032
TP391
A