APP下载

基于云计算的PageRank算法之研究

2015-08-08赵妍

电脑知识与技术 2015年15期
关键词:云计算研究

赵妍

摘要:云计算在目前的发展中,已经成为了网络时代的新宠儿,其在很多方面都推动了网络时代的进步和发展。相对而言,云计算在具体的操作中,会利用诸多的算法来完成计算和整理工作。在云计算当中,PageRank算法是比较常用的一种算法,该算法结合了以往算法的一些优势和研究成果,并且在运用过程中,表现出了较多的便利性,是云计算不可或缺的组成部分。目前,关于PageRank算法的研究不断的深入,更多的是对其进行优化处理,以此来确保云计算的发展是不断前进的。日后,应将PageRank算法与其他算法共同研究,联合优化,促使云计算在各方面的表现更加突出。

关键词:云计算;PageRank算法;研究

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2015)15-0210-02

随着网络信息技术的发展,用户可以便捷的获得各种信息,但是也面临着如何从大量的网络信息中获得有用信息的问题。目前,用户数量的激增,给网络信息技术提出的新的挑战,虽然云计算在该方面适当的缓解了信息方面的压力,但终究没有从根本上解决问题。我们在具体的工作中,还是要从算法方面着手。PageRank算法作为云计算的重要组成部分,其产生的影响是绝对性的,而且在很多方面都表现出了较大的积极意义。随着时间的推移,PageRank算法的固有成果已经不能满足用户的需求,必须在固有成果的基础上,对其进行一定的优化,并加深研究,才能推动云计算的更大发展。在此,本文主要就基于云计算的PageRank算法展开研究。

1 算与PageRank算法

云计算是在近几年才兴起的一种技术,虽然总体上表现出了非常突出的成绩,但仍有很多方面是有待考究的,优化空间非常大,未来的拓展范围也不小。网络技术的发展永远是以速度著称的,当下的网络基本上已经很健全了,可仍然无法满足广大用户的需求,证明用户的需求速度远远比云计算的发展速度更快。为此,如果想在将来取得更大的成果,就必须对云计算的核心开展研究——算法。从概念上来分析,算法是一个比较广义的词汇,其既包括了各种技术,也包括了计算方法,还包括了各种模式和公式等等。在此,本文对云计算与PageRank算法进行论述。

1.1计算

作为网络信息技术的一种集中体现,云计算的含义是非常广泛的。简单来讲,我们所指的云计算,是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。云计算能够给用户带来更多的体验和帮助,相比一般的网络技术而言,云计算的“人性化”更加突出。目前,云计算被简称为“云”,“云”是网络、互联网的一种比喻性质的说法。从特点上来分析,云计算在使用的过程中,能够促使用户体验每秒10万亿次的运算能力,该能力的使用领域非常广泛,甚至可以模拟核爆炸、预测气候变化、预测市场发展趋势等等。例如,现阶段的天气预报软件,相对过去而言,能够在不同时间段预测出不同的天气情况和温度,并且提供的指示也在增多,这些都是云计算的功劳。

1.2 PageRank算法

云计算在使用过程中,算法的决定性作用是不容忽视的。PageRank算法是目前云计算的主流算法之一,该算法是谷歌专有的一种算法。PageRank算法的主要作用在于,衡量特定网页相对于搜索引擎中的其他网页而言的重要程度,并且在客观上实现了将链接价值概念作为排名因素。PageRank算法在使用过程中,非常的简便、快捷,其在很多方面都具有较大的积极意义。PageRank算法在使用过程中,比较突出的一项成绩在于,该算法能够让链接来进行相应的“投票”。简单来讲,一个页面的“具体得票数”,主要是由所有链向它的页面的重要性所决定的。在日常的用户浏览过程中,到一个页面的超链接以后,就相当是投了该页面的一票。在实际的工作中,一个页面的PageRank,主要是由所有链向它的页面的重要性来决定的,并且会经过算法来得到。所以,我们在运用PageRank算法后,无论是云计算的数据方面,还是云计算的信息方面,都能够得到更高的工作水平,在很大程度上解决了计算复杂和信息量大带来的影响。

2 传统PageRank算法的问题

PageRank算法在云计算的使用过程中,的确表现出了较大的积极意义,但并不意味着该算法就是完美无缺的。相反的,长久的应用后,发现PageRank算法还是存在一定问题的,一方面是因为用户需求的提升,另一方面是因为算法本身没有优化处理,所以才出现了一定的问题。传统的PageRank算法服务了相当长的一段时间,以现代的观点来看,传统的PageRank算法,主要是表现出以下几点问题:第一,对于海量的网页而言,传统的PageRank算法会花费大量的时间,这就导致云计算的速度在减慢,并且得到的结果并不是特别的权威,长此以往将会失去用户的信任和支持。第二,计算PageRank的过程中,只要求在合理的误差范围内即可。但传统的PageRank算法并没有考虑到这一点,具体的数值计算是不断的精确化,即便是已经达到了精度较高的标准,依然会持续的精确计算,导致云计算陷入了一种恶性循环,这对用户而言,并不是最好的选择。

3 基于云计算的PageRank算法改进

云计算与PageRank算法是密不可分的关系,二者在很多时候都是相互促进的,并且表现出了相互依偎的特点。基于云计算的PageRank算法,与传统PageRank算法有很大的不同,其在日常的使用当中,一方面充分发挥出算法的积极作用,另一方面会照顾到云计算的各项条件和要求,以此来确保日常的使用符合用户的需求。值得注意的是,我们在对基于云计算的PageRank算法实施改进时,必须考虑到多方面的因素,不能单纯的在理论上有所改进,还要考虑到实际情况以及后续的发展。在此,本文主要对基于云计算的PageRank算法改进进行论述。

3.1改进算法的基本思想

为了能够更好的改进PageRank算法,通过对计算跨度为2的公式进行递推,最终得到了以下公式:PRk+2=(1-d)I+dATPRk+1=(1-d)I+d(1-d)AT+(dAT)2PRk。对PageRank算法实施改进,并不是一件容易的事情,其要考虑到的影响因素较多,结合以往的工作经验和当下的工作标准,我们在PageRank算法的改进思想上,主要是从以下几点出发的:第一,利用Mapreduce框架得到 AT。第二,通过AT计算( AT)2。第三,计算Pagerank值。此步骤中,把公式分为两个部分。如果Map函数输入的是AT,计算( 1-d) I+ d( 1-d) AT,那么每个目标节点key所对应的value为( 1-d) I + d( 1-d) AT;如果Map函数输入的是( AT)2,计算( dAT)2PRk,那么每个目标节点key所对应的value为( dAT)2PRk。框架对Map函数的输出结果进行处理,是每个目标节点key对应的所有value形成一个list,作为reduce函数的输入。Reduce函数对每个目标节点key所对应的value list进行相加就可以得到新的 Pagerank向量 PRk+2。由此可见,按照以上思想来改进PageRank算法,基本上还是可行的,并且在部分工作中,已经得到了结果。

3.2性能分析

基于云计算的PageRank算法在得到改进后,并不能直接的应用,即便是思想正确、成果稳定,也不能投入,而是要对性能展开分析,了解其是否能够满足用户和云计算的需求。经过大量的讨论和分析,认为PageRank算法在改进后,性能分析主要是集中在以下几项工作。第一,对于PageRank算法改进后,应经过三个阶段的Mapreduce过程分析。一般而言,在第一阶段的时候需经过1次的分析;在第二阶段的时候,需经过1次的分析;在第三阶段的时候,需经过50次的分析,一共是52次。第二,对具体的执行时间进行分析。从得到的结果来看,传统的PageRank算法仅仅是计算AT,但是在对PageRank算法改进后,还会计算(AT)2,这样一来,在具体的执行时间上,就节省了大概50%的时间。这是我们非常想要看到的结果。第三,通过运用改进后的PageRank算法,云计算在速度和效果上更加突出,满足了更多用户的实际需求,并且在客观上和主观上都有所改变。

4 总结

本文就基于云计算的PageRank算法展开研究,从现阶段得到的结果来看,运用改进后的PageRank算法,是比较适合云计算研究和拓展的,并且改进后的PageRank算法,也将云计算作为一个跳板,获得了更大的成功,在很多方面实现了健全和发展,告别了传统PageRank算法的很多问题,未来的研究空间还是很大的。

参考文献:

[1]甘枥元.基于云计算的数据挖掘算法的研究[J].电子技术与软件工程,2015(7):195.

[2]陈建峡,李志鹏.基于移动终端的博客搜索引擎系统研究与应用[J].湖北工业大学学报,2015(2):89-94.

[3]张恺.一种改进的基于云计算的PageRank算法[J].佛山科学技术学院学报(自然科学版),2015(2):66-70.

[4]万年红.基于云模型的协同过滤推荐算法[J].计算机系统应用,2015(5):140-146.

[5]贺元香,史宝明,杨生举,吴万琴.基于用户行为模型的网页排序算法[J].兰州文理学院学报(自然科学版),2015(3):63-67+111.

[6]谭鹤毅.基于云计算环境下的密文搜索算法研究[J].计算机光盘软件与应用,2015(2):21-22.

[7]孙艳秋,王甜宇,曹文聪.基于云计算的医疗大数据的挖掘研究[J].计算机光盘软件与应用,2015(2):11,13.

[8]穆瑞辉.基于云计算的虚拟机在线迁移算法[J].安阳工学院学报,2015(2):49-51.

猜你喜欢

云计算研究
FMS与YBT相关性的实证研究
2020年国内翻译研究述评
辽代千人邑研究述论
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
新版C-NCAP侧面碰撞假人损伤研究
志愿服务与“互联网+”结合模式探究
云计算与虚拟化
基于云计算的移动学习平台的设计
实验云:理论教学与实验教学深度融合的助推器