APP下载

概率缓存策略的网络传输机制研究

2017-03-01珞,薛

电子设计工程 2017年2期
关键词:命中率路由器概率

常 珞,薛 念

(河南医学高等专科学校 河南 郑州451191)

概率缓存策略的网络传输机制研究

常 珞,薛 念

(河南医学高等专科学校 河南 郑州451191)

针对网络传输过程中数据资源以高流行度缓存在路由器内,以提高资源获取的传输效率和资源利用率的问题。本研究考虑网络拓扑对缓存的影响,利用网络传输过程中固定时间段内资源流行度的差异性,结合资源本身的收益因素,提出一种基于概率缓存策略PCS(Probabilistic Caching strategy)的网络传输机制。通过该资源数据请求路径进行概率缓存,以提高网络传输过程中的缓存性能。仿真表明该缓存策略有效地避免了非热门内容的不必要缓存,当缓存容量5%时,平均命中率可达25%,平均跳数仅为3.42,有利于网络传输整体性能的提升。

概率缓存;网络传输;资源价值;流行度;缓存命中率;平均跳数

近年来,随着网络设备的普及,用户对数据资源的使用需求日益增长[1]。与此同时,IP网络规模指数式增长而带来的对网络管理和维护的迫切需求[2],研究数据资源缓存是资源共享网络传输研究中的一个关键技术[3],也是面向未来网络研究领域的热点问题[4]。资源缓存是网络传输中的重要特征,对于提升用户访问共享资源的性能具有重要影响[5]。共享资源下的网络传输旨在利用内置缓存提高资源获取的传输效率和网络资源的利用率[6],在网络传输过程中,通过分布式的内容缓存机制[7],允许节点路由器对传输的资源进行缓存,这样Interest请求就不会再被转发到远处的数据资源[8],从而不必每次都从源获取资源,提高资源传输效率,使得网络传输能够有效地支持内容业务。

本研究考虑网络拓扑对缓存的影响,利用网络传输过程中固定时间段内资源流行度的差异性,结合资源本身的收益因素,提出一种基于概率缓存策略PCS(Probabilistic Caching strategy)的网络传输机制。在用户发送资源请求沿原路径返回时,由资源收益因素得到符合的高流行度资源,再由资源数据包沿请求路径返回时进行概率缓存,避免非流行资源的不必要缓存,因此,提高网络传输过程中的缓存性能。

1 网络传输的资源缓存与价值

1.1 资源缓存

在网络传输过程中进行资源缓存设计,需要遵循两个基本原则:1)为了减小海量用户的下载平均时延,需要将流行度高的内容缓存到边缘节点以提高网络资源整体利用率[9];2)为了尽量使得用户请求由同一资源运营商提供的缓存节点,需要提高整个网络缓存系统的缓存多样性,从而大幅降低域间流量[10]。PCS在共享资源的基础上,依据内容的流行度,在内容返回的路径上,将满足高流行度的共享资源价值约束条件下,概率地缓存在靠近边缘的路由器上。通过有效地数据缓存,充分利用路由器的缓存空间,减小了网内缓存冗余,提高的网络传输效率[11]。

假设在网络传输过程中缓存时间t0为0时,且缓存过程中节点V1至V7的缓存空间均为空。在一段时间T中,用户A至D分别对资源f1进行访问请求操作,同时用户B和C也对资源f2进行了请求操作。假设资源f1和f2满足共享资源条件,则资源f1和f2返回的路径上进行节点缓存。如何有效地将资源缓存到适当的路由器上,同时减少资源内容的缓存冗余,是研究的关键问题。在资源返回的路径上,节点V2和V4的介数最大,同时资源f1和f2分别缓存在V2和V4也最为合适。PCS结合了节点的介数和共享资源的流行度,通过预判路由器节点的介数,将流行度高的资源缓存在靠近用户的边缘节点上[12]。这种方法使得满足共享资源价值约束条件的不同热度的内容以合理的概率缓存到不同的介数路由节点上,从而节省了路由器节点的缓存资源,高中介度节点的缓存次数减少,缓存副本在缓存中的存储时间增大,命中率提高。拓扑结构如图1所示的。

图1 网络缓存的传输拓扑模型

1.2 共享资源价值

PCS在网络传输过程中,资源缓存与否的先决条件是该内容是否满足资源共享价值因素[13]。资源的流行度越高,代表了对该资源请求的用户越多,对此从该内容获取的价值因素也就越大,同时路由器缓存该资源的概率也就越大。PCS联合考虑了资源访问请求价值和资源存储成本进行了价值因素的设计。

假设资源k首次与第Tik次经过路由器vi的时间分别为Ti0(k)与Ti1(k)。资源k自Ti0(k)以来经过路由器vi的总次数为fik,即资源k被用户访问请求的总次数。当路由器效益等于缓存成本时,得到用户资源请求总次数的阀值,然后路由器根据这个阀值来决定是否缓存该资源,在Ti0(k)到 Ti1(k)时间内,路由器vi缓存资源k的成本Cik如下[14]:

其中,Dk经过路由器的资源k的大小,路由器vi每秒缓存每比特资源的成本为pic,表示用户每次下载缓存资源k时,路由器vi获得的效益,则效益Sik为:

其中,当Sik=Cik时,路由器vi决定是否缓存该资源k:

当请求资源k的总次数fik满足(3)式时k,路由器缓存资源,否则不缓存。

2 概率缓存策略(PCS)

2.1 概率缓存

在一段时间T内,PCS是用户对资源访问请求的统计,得到满足共享资源访问条件的高流行度资源,从而进行重要路由节点的概率缓存[15]。即多个用户发送资源k的访问请求,对资源i请求经过节点时,进行次数统计和资源价值评估,当资源i满总价值提升标准时,记录当前节点在请求路径L上的位置vik,并添加到访问请求记录中,同时将访问请求记录中的变量cnt加1,初始值为0。当再次得到满足价值条件的节点时,和上次操作一样将该节点的位置添加到访问请求记录中,并使cnt加1。

访问请求记录命中缓存节点时,将访问请求中所记录的节点位置和变量cnt依次添加到数据包中。当数据包经过满足收益需求的节点时,以概率P进行内容缓存,同时将该节点的位置信息从数据包剔除。

其中i为一个计数器,每当经过一个满足收益标准的节点是,i值加1。因此,高流行度的内容以更高的概率缓存至用户边缘节点。

2.2 性能评价

文中的缓存目标是为了提高用户请求资源的命中率和网络的传输效率,为了更好的反映PCS的性能,需要测量缓存命中率和平均跳数作为性能评价指标。

平均跳数反映了内容缓存的节点与用户节点之间接近程度,平均跳数值越小,反映资源缓存的节点越接近用户节点,大量的用户请求可以靠近边缘获取资源,减轻了资源服务器的负载,与之相应的的网络传输开销较小,带宽消耗降低,有利于提高网络传输资源的利用率。假设hi(t)表示时间t-1到时间t内用户资源访问请求到资源节点的路由跳数。则平均跳数为:

3 仿真和性能分析

3.1 仿真环境

为了验证概率缓存在网络传输过程中是否能够达到预期的效果,利用ndnSIM仿真平台进行了资源中心网络仿真环境的搭建,对提出的策略进行了仿真验证。同时参考现有网络传输中的LCE缓存策略和Prob缓存策略,结合LRU缓存替换策略[16],在ndnSIM仿真平台中,对上述策略的缓存性能进行了比较评估。

由于真实环境中的网络拓扑是不规则的,因此,文中采用ER随机拓扑图,网络节点数量为100个,节点均具备缓存能力。节点分为3类:用户节点、服务器节点和中间节点。为了便于仿真,网络传输过程中假设所有的节点都使用相同介质SSD,即路由器缓存资源的成本为Pic=0.003。网络传输过程中总的内容文件数M=1 000个,资源热门度模型满足参数α=0.8的Zipf分布。资源访问请求由用户节点发出,节点请求的频率服从λ=10req/s的泊松分布。为了便于性能分析,文中采用单径路由进行缓存策略仿真。

3.2 仿真结果

网络传输仿真中,所有路由器的CS总容量是全部内容大小的1%,2%,3%,4%,5%,请求转发方式选择洪泛模式。每个CS都执行PC、LCE和Prob(0.8)存储策略的比较。当缓存空间已满时,使用平台自带的LRU替换策略,仿真时间为200 s。平均命中率如图2所示。

图2 平均命中率

在图2中可以出,3种缓存策略的系统性能均随着网络节点缓存资源的增大而上升。在缓存资源较小时,节点缓存的内容较少,用户请求必须到源服务器才内容发生命中,故节点 的命中率较低。随着缓存资源美女的增大,路由器节点缓存的资源种类越多,因此服务器缓存节点的请求命中率增高。文中PCS呈现出比LCE与Prob(0.8)更加优越的性能,LCE策略处处缓存造成网络的缓存冗余度过高,Prob(0.8)缓存没有考虑到资源的流行度,造成不流行的资源被缓存了。PCS缓存策略提高了高流行度资源模块的缓存命中率,当网内缓存资源占资源总数的3%时,3种方案的命中率最高,这是因为PCS避免了LCE策略中高流行度资源的频繁替换,保证了高流行度的资源缓存至离用户最近的路由节点,从而大量减少源服 务器的负载和平均访问跳数,平均跳数如图3所示。

可从图3显示出,与LCE和prob(p)方案相比,PCS机制减少了用户获取资源的距离,保证了用户请求能够较快的获取获取,减小了用户获取资源的平均时延,有利于提高用户的满意度。同时,也符合了网络传输将流行度高的资源推送至用户边缘区域的准则,提高了网络传输的缓存性能。

4 结束语

本研究提出一种基于概率缓存策略(PCS)的网络传输机制,实现了路由节点的缓存资源优化配置,结合网络拓扑的差异性,将高流行度的资源缓存至用户接近的边缘节点上,有效地减少资源在网络传输过程中缓存冗余,提高了网络传输过程中的缓存性能。仿真结果表明,该概率缓存策略可以有效的降低用户访问资源的平均时延,且避免非流行资源的不必要缓存,因此,提高网络传输过程中的缓存性能。

图3 平均跳数

[1]郁峰.软件定义网络架构下的安全问题综述[J].现代计算机,2014(16):13-20.

[2]刘琼,刘珍,黄敏.基于机器学习的IP流量分类研究[J].计算机科学,2010,37(12):35-40.

[3]姚金成,张世栋,史玉良,等.基于Chunk Folding的多租户数据库缓存管理机制 [J].计算机学报,2011,34(12):2319-2331.

[4]史玉良,王捷.一种多租户云数据存储缓存管理机制[J].计算机研究与发展,2014,51(11):2528-2537.

[5]杨茂林,雷航,廖勇.一种共享资源敏感的实时任务分配算法[J].计算机学报,2014,37(7):1455-1465.

[6]张国强,李杨,林涛,等.信息中心网络中的内置缓存技术研究[J].软件学报,2014,25(1):154-175.

[7]秦秀磊,张文博,魏峻,等.云计算环境下分布式缓存技术的现状与挑战 [J].软件学报,2013,24(1):50-66.

[8]何智聪,谷光昭,王新,等.基于可重构路由器上缓存的流媒体协作分发策略[J].通信学报,2012,33(6):82-90.

[9]姜艳,曾学文,孙鹏.基于资源缓存的应用快速切换技术[J].网络新媒体技术,2013,2(4):33-38.

[10]张全明,张新有.基于会话劫持的HTTP资源缓存系统设计[J].成都信息工程学院学报,2013,2(4): 33-38.

[11]朱轶,糜正琨,王文鼐.一种基于内容流行度的内容中心网络缓存概率置换策略[J].电子与信息学报,2013(6):1305-1310.

[12]王道谊,周文安,刘元安.内容分发网络中内容流行度集中性的研究[J].计算机工程与应用,2011,47(6):102-104.

[13]霍如,刘江,黄韬,等.基于相关性概率的信息中心网络协作缓存策略[J].北京邮电大学学报,2015(1):16-20.

[14]王家尧,王桂玲,张鹏.基于缓存的复合数据服务更新优化方法 [J].微电子学与计算机,2013,30(3):80-84.

[15]吴大鹏,张普宁,王汝言.带有消息投递概率估计的机会网络自适应缓存管理策略[J].电子与信息学报,2014(2):390-395.

[16]曲桦,王伟萍,赵季红.内容中心网络中一种改进型缓存机制[J].计算机工程,2015(3):41-46.

Research network transport mechanism based on probability caching strategy

CHANG Luo,XUE Nian
(Henan Medical College,Zhengzhou 451191,China)

For network transfer data cache resources to high popularity in the router,access to resources in order to improve the problem of transmission efficiency and resource utilization.In this study,to consider the impact of network topology cache,the use of network resources during transmission fixed period of popularity differences, combined with profit and the resource itself proposed network transmission scheme based on probability caching policy PCS(Probabilistic Caching strategy)of.By request of the resource data path probability cache to improve network transfer performance cache.The simulation shows that the cache policy effectively avoid unnecessary cache non-popular content,when the cache capacity is 5%,the average hit rate of 25%,the average number of hops is only 3.42,in favor of the overall performance of the transmission network upgrade.

probability cache;network transmission;resource value;popularity;cache hit ratio;the average number

TN393

:A

:1674-6236(2017)02-0159-04

2016-04-07稿件编号:201604073

国家自然科学基金(61372180)

常 珞(1975—),男,河南杞县人,讲师。研究方向:计算机科技。

猜你喜欢

命中率路由器概率
买千兆路由器看接口参数
第6讲 “统计与概率”复习精讲
维持生命
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
路由器每天都要关
夜夜“奋战”会提高“命中率”吗
2015男篮亚锦赛四强队三分球进攻特点的比较研究
无线路由器的保养方法