面向个性化通讯云的移动互联用户大数据可信服务推荐算法
2018-05-28万年红王雪蓉
万年红,王雪蓉
(浙江东方职业技术学院信息传媒与自动化学院,浙江温州 325000)
移动互联环境下的文本、语音、表情、图片、位置、视频、文件、语音电话等用户大数据具有高度不确定性、难控性、混合性、复杂性,而现有的通讯云服务中心并没有提供信任机制的个性化服务,出现了信任推荐危机.因此,建立面向个性化通讯云的移动互联用户大数据可信服务推荐系统从而实现个性化、智慧化的即时通讯已成为一个热点问题.目前国内外已有许多与此有关的研究,例如基于通讯云技术的Android即时通讯系统[1](RIIS);基于云计算的移动互联网大数据用户行为分析引擎设计模型[2-3](DMIB).文献[4-6]分别提出了可信云服务模型(TCSM)和基于可验证计算的可信云计算模型(RTCC)、大数据场景下基于可信社团的服务推荐模型[7](SRTC)、基于信任和推荐关系的可信服务发现模型[8]、基于社会网络面向个性化需求的可信服务推荐模型[9](PROTS).传统研究方法在降低系统复杂程度、提高推荐速度、精度和减少计算量等方面都有优势,具有较高地参考价值.但是,传统研究方法还只是“玩具”系统,性能开销过大,仍无法真正用于实际场景中.
本文针对已有研究的不足,综合已有方法某些优势,从通讯云个性化与移动互联用户大数据可信服务之间的依赖与耦合关联性、面向个性化通讯云的移动互联用户大数据可信服务等角度,提出面向个性化通讯云的移动互联用户大数据可信服务推荐算法(Trusted Service Recommendation Algorithms on User Big Data of Mobile Internet Oriented Personalized Communication Cloud,简称TSRA).
1 相关定义
定义1:个性化通讯云.
假设移动互联空间中,设U是一个定量论域,Cd是U上的定性概念,表示U上的文本、图片、多媒体随机概念,根据文本、语音、表情、图片、位置、视频、文件、语音电话频等用户多媒体大数据需求的非线性粒子群,定量值ee∈U是定性概念Cd的一次随机实现,选择适当的精度参数δ,ee对Cd的确定度μ(ee)∈[0,1]是有稳定倾向的随机数,使非结构化模糊控制器输出变量x(i)以明确精度δi逼近增量通讯会话管理结果,且当μ:U→[0,1],有∀ee∈U,ee→μ(ee),可信样本集合为Sample;由可信服务推荐结束条件组成的数据元DFi模糊命名方式集合ZA={za1,…,zai,…,zan}满足用户滚动反馈函数GDF(x)=的映射关系;运用主观偏差函数[9]ZGPC(i)发现、分析、识别、评价推荐期望与实际结果的变化偏差CMSi,并待误差最小化后形成稳定的数据集JGJ,则x(i)在论域U上的分布称为个性化通讯云,记为C(ee),每一个ee称为一个云滴.
定义2:移动互联用户大数据信任服务.
假设个性化通讯云的通讯联系人信息、会话信息、朋友圈信息分别用向量表示;各节点的个性化集成指数为异构变量xi,并分别用 0、1表示反对、支持;不同时点ti上随意通讯的增量演进矩阵运用二维逻辑表达规则[2]EL(x,y)合成搜索指数HSIi和索引大数据库IDB,若Q1、Q2、Q3可按xi信任对方并向靠近对方MDD峰值方向调整,则表示服务存在依赖与耦合关联性,从而获得移动互联用户大数据服务信任关系.
2 面向个性化通讯云的移动互联用户大数据可信服务算法
步骤1:改进基于可验证计算的可信云计算法[6]和用户行为交互法[7],验证移动互联用户大数据源,统计可信推荐结果对个性化依赖关系、可信的相关结构、需求离散指标的影响.
假设用户大数据原始依赖关系可用一个四元组QM表示,可信服务相关结构用R表示,需求离散指标用L表示,轨迹随机函数为Frandom,个性化通讯抽取速度为v,状态信息向量S=<S1,S2,…>;用户主动分享可信服务的位置为I,个性化通讯云服务的数理统计样本数为Num,多目标增量异构的用户大数据集为XD1={O,T,P},其中O={o1,o2,…}表示可信服务数据源动态集;T为移动互联用户大数据可信服务动态演化时间;P={p1,p2,…}表示服务的原始属性.则基于可验证计算的可信云计算法和用户行为交互法的改进形式分别用式(1)、式(2)表示:
其中符号“⋅”表示点乘(也叫内积),运算结果是以标量表示的函数值域的相乘;Σ表示求和,⊕表示异或,表示输入变量值不相同时取真值;⊙表示同或运算,即两个输入变量值相同时取真值.相比改进前,式(1) - 式(2)实现了移动互联用户大数据服务由杂乱无章向耦合、个性化推荐、信任推荐、用户位置可信的转化.
步骤 2:基于多目标识别的网络社区发现函数DMWF(x)[3,8],改进基于异常行为相关分析的网格融合函数EBS(x)[9]和基于泛互联网化大数据的灰色可信融合函数FDDH(x)[4-5],从各个角度A(a)融合可信服务网格距离信息,根据参与主体CYZi之间的交互大数据轨迹,提取可信关键因素FRXAi,将个性化通讯云服务集中较多的变量FRXVi以较少的综合变量FRXZi来代替,并尽可能保证彼此相关,删除“噪声数据”[10].但EBS(x)和FDDH(x)存在每个子集只有原数据服务集中对影响结果有价值的某些属性等问题,为此需要进行优化改进.
设个性化服务的平面角度集为A={a1,a2,…},可信距离向量为D=<d1,d2,…>,通讯云个性化服务的加权值为Wi,属性集合为V={v1,v2,…},移动大数据服务结构集为CB={cb1,cb2,…},通讯云服务综合变量集合为CV={cv1,cv2,…},可信服务数据划分状态对为DR=<dri,drj>,可信相关系数为δ,则改进的EBS(x)函数和FDDH(x)函数分别用式(3)WGM(i)、式(4)WDXD(i)表示:
∏表示从加权值Wi开始的可信距离向量求积、累项相乘.
相比改进前,式(3) - 式(4)降低了维度、在一定程度上消除了原始服务集的模糊性,实现了多目标增量异构的用户大数据向可控维度、可控规则耦合和可视化优化转换.
步骤3:采用灰色分析的高斯牛顿法[1-2]和模糊耦合方法[7]以求解多元多次函数方程形式使WDXD(i)达到极大值,保证在线服务行为与推荐结果间的相关演化关系达到“紧致关联”.若WDXD(i)全局最大值由截取的级数系数展开近似获得,级数系数JSXS可用如下公式表示:
其中lim表示极限,即表示向量与极限之间位对齐且不相同时JSXS取真值,最终实现个性化通讯云与移动互联用户大数据可信服务的有效耦合.
3 TSRA模型和算法
TSRA模型如图1所示.
TSRA算法如下:
步骤1:通过式(1) - 式(5),假设通讯云个性化服务的指数关键因子集合为GJ、时间综合变量为t、相关系数为δ,动态随机游走的特征学习参数为ω,相关用户搜索大数据特征矩阵为TJ=(tj1,tj2…),x是TJ上的一个向量,其表达式为ω0tj0+…+ωntjn=ωTJ.其中ωntjn具有一定的特殊含义,它表示结果取真的概率.因此关键因子对可信服务推荐结果的影响相似度公式为:
图1 面向个性化通讯云的移动互联用户大数据可信服务推荐模型Fig 1 Trusted Service Recommendation Model for User Big Data of Mobile Internet with Individuation Communication Cloud Orientation
步骤2:通过式(6),计算影响度向量QX=<XSDM(i),ωntjn>,基于个性化通讯的指数映射,得出如式(7)所示的可信服务分配函数:
其中 表示ωntjn在区间[i,n]上的积分.
步骤3:根据式(7),设计具有横、纵向序列上可比性的用户大数据风险识别压力指数YS,设计可信结构树集合GT={gt1,gt2,…,gtn},计算个性化通讯云服务的结构对数似然函数S(ωntjn)=(TJ+GJ)PF(x),且顶点y在GT中的路径LJ(y)=(y,ωTJ).
步骤4:根据步骤3,基于动态用户大数据异构信息网络XG=(LJ(y),S(ωntjn) )及个性化通讯云的结构关系类型GR,设计如式(8)所示的云通讯个性化交流函数,估计最大似然值,从XG中搜索路径为LJ(y)的子结构的最短路径长度dT(u,v),推断可信服务的结构组成.
步骤5:设计面向个性化通讯云服务的数据项聚类[9]的分形矩阵FXJ=<fxj1,fxj2,…,fxjn>,生成结构分形矩阵特征向量,使得数据项聚类簇间的最短路径长度dT(u,v)的影响相似度达到最大值S(fxji,fxjj)max,同一个簇内部数据项之间的影响相似度达到最小值S(fxji,fxjj)min,解决数据区域聚散性和稀疏性导致的结果失真,实现分形函数DGF(fxji,fxjj)的值域上限为结构关系类型GR演化峰值和推荐测度[6].
步骤6:利用消息中间件,构建个性化通讯云服务节点之间的分布式消息机制,设计如式(9)所示的移动互联用户大数据可信服务推荐函数,将若干期望可信服务推荐结构归入搜索路径不同的并行处理结构树,实现通讯云平台中不同个性化通信节点之间的耦合,有效解决不同用户服务程序以及同一用户服务程序不同进程之间的同步问题[1-2],实现移动互联用户大数据服务在时空区域、数量聚类与协同过滤,为移动用户提供个性化网络服务推荐,满足个性化通讯云服务的需求.
其中Log表示求对数.
4 实证应用分析
根据图1所示的模型,依据B/S网络模式,构建以Visual C#语言实现前台交互界面编程、以Oracle或MySQL或SQL Server为后台数据库、基于通用开源脚本语言PHP的移动用户大数据可信服务推荐系统.
4.1 实证样本数据来源分析与整理
本文实证样本来源于Twitter、微博、微信、移动互联网开放平台[9]等,数据集共有20类服务,共得到10 000条数据.基于协整理论[10],得到数据协同矩阵[9]DXS,计算每个关键词与相应推荐结果的关联系数[5,8]SXGS,采用网络服务推荐压力指数错位逐步合成函数[7]YCBH(x)把数据值归一化到[-1, 1]区间,补全、修正、清洗数据,规范数据格式.
4.2 实证结果及其性能分析
4.2.1 算法改进前后性能对比分析
根据仿真实验数据,采用线上线下增量定性方法[8-9],以移动互联用户大数据可信服务推荐结果的结构分形矩阵特征变量XA及个性化通讯云服务引导函数FXA(XA)为性能参考,即使用一次搜索指数YCBH(x)个性化错位逐步合成通讯时与使用一次可信服务移动平均法一样,通过FX(XA)错位逐步合成异构变量xi推荐误差的线性方程:Bω=(b1ω1+b2ω2, …, +bnωn),FXA(XA)=Bω+XA来确定求解GDF(x)的最大峰值.求解公式如下:
据式(10)分析、验证式(1) - 式(5)的性能合理性、可靠性和科学性,保证关键因子数据在相对独立和无重叠情况下的个性化通讯云与移动互联用户大数据可信服务融合结果的有效性.算法改进前后的性能对比分析见图2.
图2结果表明:相比改进前的竖直变化,改进后的算法耦合结果是比较平稳的和水平的,当模型发生变化时,一次需求搜索逐步错位合成时P指数平滑融合效果是比较好的,需要参与计算的Frandom、Wi、v观察数据相对较少.这种融合模型统计模糊位置数据I一般随会话管理、通讯录管理、朋友圈管理等通讯云需求进行个性化变动,移动互联用户大数据可信服务具有较高的优化状态<dri,drj>的协整度,当以这种融合算法作为随机引导模型进行移动互联用户大数据可信服务推荐时,效率可以最优化,效果要明显优于改进前的方法.
4.2.2 TSRA算法和模型性能分析
图2 算法改进前后性能对比分析图Fig 2 Performance Contrast Chart Before and After Algorithm Improvement
验证TSRA算法步骤1-6的性能优势和应用伸缩性,分别通过80%的仿真实验数据及20%的实际推荐参考数据进行随机分布的个性化通讯云服务推荐和基于多目标增量演进的移动互联用户大数据可信服务推荐.综合分析、引用文献[1-10]的相关参数,得出实证结果的评价指标参数如表1所示.评价指标参数值的具体计算公式分别按顺序用KXXDA、MHSB、RCRL、WCGL、XTGL、TCZD表示(论证推演过程见文献[1-10]).
表1 评价指标及说明Table 1 Evaluating Indexes and Instructions
验证过程如下:
首先,保证提取对个性化通讯云服务影响较大的移动互联网用户大数据可信服务兴趣点和特征点,所有推荐结果的极大极小值采用增加一个交叉算子权重系数ηi来插值估值,过滤极点污染数据和误差,使用各特征因子影响相似度构成的影响度向量Q=<XSDM(i),ωntjn>分解方法,使通讯空间距离表现为抽象空间中个体之间关系的亲疏性和个性化,用一个实数ε来表示推荐的有限信任原理,并使两人之间的推荐差异值小于ε,由此得出式(11),通过该式计算式(6)可信相似度,验证TSRA算法步骤1 - 2及式(6)的有效、合理:
其中ln表示求自然对数.
其次,通过GR、基于错位合成指数映射得出移动互联用户大数据服务的可信相似度序列,逆向反推进行最大似然值估计,从XG中搜索子结构的dT(u,v),估计极值路径,按照一定的反铁磁规则[3],说服者将成功说服其邻居采用与之相同的推荐信任值,若模型较充分拟合,即以获取回归分析数据为目的的偏差较小时,面向个性化通讯云服务需求的偏差应近似具有推荐误差累积的白噪声序列性质,服从独立的具有相同均衡值和方差的正态分布,得出式(12) - (13)并根据式(12) - (13)验证TSRA算法步骤3 - 4及式(7) - (8)的有效、合理:
其中∬表示二重积分.
最后,根据FXJ和dT(u,v)对随机、均匀、平稳、可控关联推荐关系的影响,对于移动互联用户大数据可信服务任意初始的磁化强度的平均时间可以精确计算,使得任何时间段的通讯云个性化需求误差都保持最小且平稳,且与系统的大小成正比,将区域聚散性控制在[S(fxji,fxjj)max,S(fxji,fxjj)min]区间,说明在较短的收敛时间内,有限系统达到一致相(即推荐系统中所有节点拥有相同的信任值和个性化概率)的推荐容错和误差具有概率性、协同关联性,得出式(14) - (16),验证TSRA算法步骤5 - 6及式(9)的合理性.
其中∮表示闭合路径的曲线积分.
实证过程需要随机实施240次(实证步次),相应各参数的最终的实验数据以无效重叠误差、协同关联误差来计算,公式分别如式(17)WCGR(x)、(18)WXCW(x)所示:
误差曲线见图3.从图3可以看出,随机分布的个性化通讯云服务和基于多目标增量演进的移动互联用户大数据可信服务推荐具有非线性规律性,WCGR(x)、WXCW(x)两种曲线图均呈现随实验步次的增加而单调递减,说明实验次数越多,得到的推荐结果与已有的实际数据推荐误差较小,推荐效果总体比较平稳.
TSRA性能分析结果及与本文开头部分提及的算法模型(RIIS[1]、TCSM[4]、RTCC[6]、SRTC[7]、PROTS[9])的实验综合对比结果如表2所示.模型对比实验使用同一数据集.
图3 误差曲线图Fig 3 Error Curve Chart
分析表 2,对比其他模型和算法,TSRA算法中,随机分布的个性化通讯云服务和基于多目标增量演进的移动用户大数据可信服务推荐在结构和内容、联系人管理、会话管理、朋友圈管理等方面不随某些偶然随机因素而波动,推荐算法和模型包含较长的高斯牛顿、灰色分析、异常行为相关分析、网格融合、模糊耦合、用户行为交互、多元回归、主成分分析、时间序列的模糊逻辑数据信息,推荐指标值与实际值的KXXDA、MHSB、RCRL、WCGL、XTGL、TCZD均符合预设的指标要求,这表明TSRA算法相比传统算法的优势和应用伸缩性.本文所提出TSRA算法和模型是有效、科学合理的,因此具有一定的应用价值.
表2 实验结果评价指标参数值及实验综合对比结果Table 2 Parameter Values of Experimental Result Evaluation Indexes and Experimental Comprehensive Comparison Results
5 结 语
本文提出的TSRA算法和模型在可信相似度、模糊性辨识度、容错概率、个性化程度、协同关联度、时间复杂度等指标上均达到了预期效果,具有动态演化性和鲁棒性,实现了面向个性化通讯云的移动互联用户大数据可信推荐.但由于对移动互联网、大数据、云计算的融合研究实际上是一个很少探讨的问题,受到网络环境、软件技术等各种因素的限制,本文研究仅仅为面向通讯云个性化需求的移动互联用户大数据可信服务推荐提供了比较粗糙、抽象的参考方法,还有许多方面需要作者进一步探讨.
参考文献
[1]唐苏.基于通讯云技术的Android即时通讯系统的研究与实现[D].成都:西南交通大学,2016:2-58.
[2]Walter C N, Maria L H A, Rafae V G, et a1. Social knowledge-based recommender system application to the movies domain [J]. ESA, 2012(39): 10990-11000.
[3]陶彩霞,谢晓军,陈康等.基于云计算的移动互联网大数据用户行为分析引擎设计[J].电信科学,2013(3):27-31.
[4]丁滟,王怀民,史佩昌,等.可信云服务[J].计算机学报,2015,38(1):133-146.
[5]Pawar P S, Rajamjan M, Nair S K, et a1. Trust model for optimized cloud services [C]// ACM. Proceedings of the 6th IFIP WG 11.11 International Conference. Surat: ACM Publisher, 2012: 97-112.
[6]王佳慧,刘川意,王国峰,等.基于可验证计算的可信云计算研究[J].计算机学报,2016,39(2):286-300.
[7]王海艳,金伟晟.大数据场景下基于可信社团的服务推荐[J].华中科技大学学报(自然科学版),2016,44(3):22-26.
[8]刘迎春,郑小林,陈德人.基于信任和推荐关系的可信服务发现[J].系统工程理论与实践,2012,32(12):2789-2794.
[9]张佩云,陈恩红,黄波.基于社会网络面向个性化需求的可信服务推荐[J].通信学报,2013,34(12):49-58.
[10]卢文涛.基于时间阈值的区域快递网络优化[J].温州大学学报(自然科学版),2016(2):46-54.