手机用户网络行为预测方法研究
2017-12-15,,,
,, ,
(常州大学 信息科学与工程学院,江苏 常州 213164 )
手机用户网络行为预测方法研究
朱正伟,黄晓竹,刘晨,陈阳
(常州大学信息科学与工程学院,江苏常州213164 )
传统离线方法对手机网络耗电量进行的优化不能准确判断用户网络消耗状态,对用户正常使用手机带来很大影响,针对这个问题,提出基于用户习惯的网络行为在线预测方法;该方法分析用户使用网络的历史数据,建立对用户使用网络行为进行在线预测的数学模型,使用0-1背包算法求该模型的最优解,预测用户使用网络情况;并在此基础上对最优解进行模糊处理,以增强预测方案的适应能力;实验结果表明,所设计的方法能够有效预测手机用户网络的使用状态,为基于用户习惯的手机网络节电研究奠定了坚实的理论基础。
手机网络;节电;背包算法;预测
0 引言
随着WIFI覆盖面的增加和手机网络的发展(如4G网络的发展),智能手机网络耗电问题变得越来越严峻,续航能力短成为智能手机的通病,然而目前电池的密度在未来几十年内却不会有突破性的发展[1]。很多学者对手机耗电问题进行了研究,发现手机各个部件中网络耗电量占总耗电量的很大一部分[2]。在网络方面采取节电措施,将会对手机节电有重要意义。
文献[3-5]对近万名用户手机网络使用情况进行了调查,调查结果显示,用户使用网络的行为是多样的,并且具有一定的规律。Qian等人[6]对手机网络进行了深入研究,发现手机在屏幕关闭活动下无线网络能耗占总网络能耗的30%,而进行的网络传输量只占总传输的1.7%,这部分网络活动存在很大的优化空间。同时在屏幕开启的状态下,用户使用网络的总时间占屏幕开启的总时间百分比也很低,如果对其进行优化,将会有很好的节电效果。
文献[7]采用通过软件监测屏幕关闭时关闭手机网络的方式来达到节电目的,但这样严重影响了屏幕关闭下某些通信软件信息的接收。文献[8-9]分别采用延迟100秒和延迟180秒,对网络数据进行批处理的方法达到网络节电的目的。虽然文献[8-9]中的方法对手机续航有一定的效果,但是他们均采用离线方式对网络进行处理,忽略了用户的习惯,严重影响了用户对手机的正常使用。
针对上述问题,本文提出了一种在线预测手机用户网络行为的方法。
1 手机用户网络行为相关性分析
用皮尔森参数[10]判断用户行为习惯的相关性。ρx,y表示总体的相关系数,rx,y表示样本的相关系数,总体相关系数的定义式是:
(1)
其中:Cov(X,Y)是随机变量X和Y的协方差;Var(X)和Var(Y)分别为变量X和Y的方差。总体相关系数是反映两变量之间线性相关度的一种特征值,表现为一个常数。-1 ≤rx,y≤ 1。rx,y大于0时正相关,rx,y小于0时负相关,rx,y的绝对值越接近于1,两要素的关系越密切;越接近于0,两要素的关系越不密切。
通过自主开发的Android手机APP“Collect”,对10位不同年龄段和职业的用户使用网络的情况进行为期一个月的采集。其中Collect采集的数据有:1)手机自出厂时到采集时刻接收的总流量;2)手机自出厂时到采集时刻发送的总流量;3)采集数据的时刻。Collect将采集的数据最终存储到SQLite数据库中[11],且默认采集数据的最小时间间隔为1 s。
图1为10个用户为期一周的皮尔森参数分析图,从图中可以看出,用户之间的皮尔森参数基本在0.4以下,即不同用户使用手机网络行为相关性很低。因此,同一种离线算法可能于用户1来讲有很好的用户体验,但对用户2来讲就会影响手机的正常使用。
图1 10位用户之间的皮尔森参数图
图2为一个用户在为期10天里使用手机流量数据中每两天之间的皮尔森参数值;从图1可以看出,同一个用户在不同天里使用手机数据的皮尔森参数基本在0.65以上,即单个用户使用手机网络行为相关度很高并具有很高的可预测性。因此,根据用户手机网络习惯设计在线算法,预测用户手机网络行为是可行的。
图2 一位用户10天的皮尔森参数图
进一步分析图2,可以发现天数越接近,皮尔森参数的值越高,即用户手机网络的相关度越高。从而采用天数越接近的网络历史数据进行预测,准确度相对越高。
2 手机用户网络行为预测算法的设计
2.1 0-1背包数学模型的建立
将一天的时间分成N个相等的时间段,每个时间段用Ti表示,其中i∈{1,2,…,N}。将每个Ti中有网络传输的总时间记为TOi。假设每个Ti中,有n个最小采集时间tj,j∈{1,2,…,n},这里的tj不一定相等。每个tj中网络产生的数据流量用lj表示,其中lj是网络发送和接收流量之和。本文取一个时间段Ti的网络使用情况作为样本,对其数据进行分析。
针对手机网络节电问题,对网络进行的操作一般只有开启网络和关闭网络两种状态,因此把时间段tj的网络状态用xj表示,且xj∈{0,1}。其中xj= 0表示tj时间段关闭网络,xj= 1表示tj时间段开启网络。
设(x1,x2,…,xn)是上述背包问题的最优解,如果这个最优解包含了物品n,即xn= 1,那么(x1,x2,…,xn-1)一定构成子问题物品(1,2,…,xn-1)在容量(C-wn)时的最优解。如果这个最优解不包含物品n,即xn= 0,那么(x1,x2,…,xn-1)一定构成子问题(1,2,…,xn-1)在容量C时的最优解。设m(j,w)表示背包容量为w时,j个物品导致的最优解的总价值,如公式(2)和(3)所示,需要求出m[n,w]。
(2)
当j> 0且wi≤w时,
m[j,w]=max{m[j-1,w-wj]+vj,m[j-1,w]}
(3)
判断m[j,w]与m[j- 1,w]是否相等,若相等则设置xj= 0,否则设置xj= 1。于是便求出了最优解向量(x1,x2,…,xn),xj∈{0,1}。
2.2 0-1背包最优解的在线模糊处理
对0-1背包求出的最优解向量进行在线模糊处理[14],以增强预测方案的适应能力。当手机网络开启时,应用会自动检测网络关闭期间的网络请求,如QQ、微信等,并将滞后的信息重新处理。因此将最优解向量中大片为零的区域参照实际流量使用情况,按一定的方法把0变为1,则在“0”向量时间段的流量会自动加载到其后最近的“1”向量中。
假设最优解向量中有m个连续为零的区域,用UCk表示每一个连续为零的向量集合,用TCk表示每一个集合UCk所对应的所有tj之和,其中k∈{0,1,…,m}。定义TS为给定的时间参数,TM为监测间隔,且TM初始值为TS。在TM (4) 如果TM内L= 0,则将监测间隔TM变为2TS;如果继续判断时L仍然为0,则将监测间隔变为4TS,以此类推以2n增加监测间隔TM的值。如果TM内,L> 0,则将监测间隔TM复位为原始的TS。求出预测向量(y1,y2,…,yn),yj∈{0,1}。图3(a)为向量xj的分布情况,其中黑色表示“1”,白色表示“0”;图3(b)为当前流量的使用情况,其中实际有流量传播的时间用黑色填充,没有流量传播的时间用白色填充;图3(c)为求解出的向量yj分布情况,其中黑色表示“1”,白色表示“0”。 图3 向量对比图 取连续两天相同时间段用户使用手机网络的数据作为样本进行分析。如图4中(a)和(b)分别为同一个用户前一天在10:00-11:00之间和后一天相同时间段实际使用网络情况图,从两图中可以看出,数据呈离散状态,且分布很不规则。 图4 用户前后两天10:00-11:00网络使用情况图 本设计通过Matlab设计相关程序,求出最优解向量xj和预测向量yj以及其对应的时间段tj内预测产生的流量lj的值。图5中(a)(b)(c)分别为TS的值取30 s,15 s和1 s的预测效果图。将这三幅图中的预测效果与图4(b)用户实际使用网络图对比,可以看出,TS的值越小,预测网络效果与实际网络使用情况约接近,即预测效果越好。 图5 TS取不同值时网络预测情况图 为了对预测效果进行量化分析,令Фi为Ti段时间内网络预测延迟参数。将预测向量yj= 0的时间段tj内实际产生的网络流量记为lj。将时间段tj距离其后最近的yj= 1的时间记为ttj,则:在时间段Ti内网络延迟参数Фi的计算方法如公式 (5)所示。 (5) 其中:Фi越小表示对用户网络行为预测效果越好。如图6所示为TS取不同值时对应网络延迟参数Фi的不同结果。 图6 TS取不同值时网络延迟参数图 由于本设计的实用价值是为节约手机网络耗电量做贡献,所以在选择TS参数时还需要考虑节电的效果,不能单一的追求卓越的预测效果。根据初步测量可知,4 G模块空载功率大概为Pe= 500 mW;4 G模块网络传输功率大概为Pb= 3 500 mW。在Ti时间段内,将预测的结果中,yj= 1且没有流量传输的tj集合记为TTi,用公式(6)求出Ti时间段内手机网络节电百分比的理论值。 (6) 图7 预测结果理论节约手机网络耗电量图 图7为TS取不同值时预测结果理论手机网络节约的耗电量百分比图,从图中可以看出,TS的值越大,节电效果越好。结合图6中TS取不同值时对应Фi的不同结果,选择TS= 20作为初始监测间隔时间且当TS= 20时,Фi= 337 Byte,ξi= 83.6%。 分别利用本文方法和文献[8-9]方法,对10个用户同一时间段Ti内网络使用情况进行对比实验,比较预测结果延迟网络参数Фi和理论节约手机耗电量百分比ξi。 图8 不同方法网络延迟参数图 图8为10个用户预测结果网络延迟情况图,从图中可以看出,本文方法中平均网络延迟参数 Фi= 383 Byte,文献[8]方法中平均网络延迟参数Фi= 1 921 Byte,文献[9]方法中平均网络延迟参数Фi= 2 925 Byte。本文方法的平均网络延迟参数比文献[8]方法的平均网络延迟参数减少了80.1%;比文献[9]方法的平均网络延迟参数减少了86.9%。也就是说,本文方法对用户网络行为预测效果比文献[8-9]有很大的提高。 图9 预测结果理论节约手机网络耗电量图 如图9所示为预测结果理论节约手机网络耗电量百分比图,其中本文方法平均节约网络耗电量百分比ξi= 84.3%,文献[8]方法平均节约网络耗电量百分比ξi= 84.7%,文献[9]方法平均节约网络耗电量百分比ξi= 85.6%。本文方法平均节约网络耗电量与文献[8-9]相差不大,有一定的实用效果。 实验结果表明:本文方法对用户使用手机网络有着很好的预测效果,并且理论节电效果与现有方法节电效果相差不大。在手机节约网络耗电量的同时,最小化对用户正常使用手机产生的影响。 对用户使用手机网络的行为进行分析,发现不同用户使用手机网络的行为相关性很低,同一用户不同天数使用手机网络的行为相关性很高,因此对用户使用手机网络的行为进行在线预测是可行的。提出了一种基于0-1背包算法与模糊处理相结合的方法,对用户使用手机网络的行为进行预测。实验结果表明,所设计的方法能够在不影响用户正常使用手机的前提下,达到对手机节电的目的。为节约手机网络耗电量、提高手机续航能力奠定了坚实的理论基础。 [1] 李 泓,郑杰允.发展下一代高能量密度动力锂电池——变革性纳米产业制造技术聚焦长续航动力锂电池项目研究进展[J]. 中国科学院院刊, 2016, 31(9):1120-1127. [2]钱红艳,王 玲,刘琳,等.4G手机待机耗电机理与预测模型分析[J].内江科技,2017,(2):54-55. [3]Trestian I, Ranjan S, Kuzmanovic A, et al. Measuring serendipity: connecting people, locations and interests in a mobile 3G network[J]. Acm Sigcomm, 2009:267-279. [4]Maier G, Schneider F, Feldmann A. A First Look at Mobile Hand-Held Device Traffic[A]. Passive and Active Measurement, International Conference, PAM 2010, Zurich, Switzerland, April 7-9, 2010. Proceedings. DBLP[C]. 2010:161-170. [5]Fukuda K, Asai H, Nagami K. Tracking the Evolution and Diversity in Network Usage of Smartphones[A]. Internet Measurement Conference[C]. ACM, 2015:253-266. [6]Qian F, Wang Z, Gao Y, et al. Periodic transfers in mobile applications:network-wide origin, impact, and optimization[A]. Proceedings of the 21st international conference on World Wide Web[C]. ACM, 2012:51-60. [7]方 葵. 基于Android系统网络耗电量优化方法的研究[J]. 通信技术, 2012(10):33-35. [8]Pathak A, Hu Y C, Zhang M. Where is the energy spent inside my app?:fine grained energy accounting on smartphones with Eprof[A]. Proceedings of the 7th ACM european conference on Computer Systems[C]. ACM, 2012:29-42. [9] Huang J, Qian F, Mao Z M, et al. Screen-off traffic characterization and optimization in 3G/4Gnetworks[C]. Proceedings of ACM IMC, 2012:357-364. [10] 贾俊平,何晓群,金勇进,统计学(第6版)[M]. 北京:中华人民大学出版社,2015. [11]郭 霖,第一行代码——Android[M].北京:人民邮电出版社,2014. [12]Zhang Y, He Y, Wu X,et al. NetMaster:Timing Energy Devourers on Smartphones[J].IEEE computer society, 2014:301-310. [13]王晓东, 算法设计与分析(第2版)[M]. 北京: 清华大学出版社, 2008. [14]唐骏宇,冯长江. 基于模糊辨识算法的蓄电池荷电状态测量方法与模块设计[J]. 计算机测量与控制,2017(2):39-42. ResearchonPredictionofUsers’BehaviorswhenUsingNetworkonMobilePhones Zhu Zhengwei,Huang Xiaozhu,Liu Chen,Chen Yang (College of Information Science and Engineering, Changzhou University, Changzhou 213164, China) An online prediction method was put forward which based on users’ network habits when using network since traditional offline method to optimize mobile phone network energy consumption cannot indicate users’ network consumption, which leads to a compromised users’ experience. This method analyzes the history data of users’ usage of network, established mathematical model to predict users’ behaviors when using network online and then get the optimized solution of prediction of the status of users’ network by leveraging the 0-1 knapsack algorithm, fuzzily processes the optimized solution. Simulation has shown that our method can predict the users’usage status when using network efficiently without compromised users’ experience, which set a solid theoretic foundation for saving phones’ network power consumption and improve the span time of navigation on mobile phones. mobile phone network; energy saving; knapsack arithmetic; predict 2017-05-06; 2017-05-23。 国家自然科学基金青年科学基金资助项目(61501061)。 朱正伟(1963-),男,江苏常州人,教授,博士,研究生导师,主要从事计算机网络技术、嵌入式系统及应用方向的研究。 1671-4598(2017)11-0212-04 10.16526/j.cnki.11-4762/tp.2017.11.054 TP301 A2.3 最优TS参数的选择
3 对比实验分析
4 结论