基于云计算系统使用率的能耗模型的研究与设计
2016-09-23卢彪李悦张万礼
卢彪 李悦 张万礼
(宿州学院信息工程学院 安徽宿州 234000)
基于云计算系统使用率的能耗模型的研究与设计
卢彪李悦张万礼
(宿州学院信息工程学院安徽宿州234000)
文章针对云计算系统的CPU使用率、内存使用率和存储使用率三个能耗模型的分析,结合非线性回归分析方法:拉索回归分析、拉索变量多元回归分析和方差齐性回归分析数学方法,设计了基于云计算平台的系统使用率的能耗模型。通过实验环境搭建和模型测试,基于系统使用率的能耗模型的误差率和实际监测结果相差较小达到了94%左右。结论是基于系统使用率的能耗模型能够满足能耗优化的具体需求。
云计算;能耗模型;系统使用率;拉索回归
云计算平台中心需要使用一定技术手段针对云计算中心能耗过大问题来采取相应的节能措施,从而达到优化云平台持续存储过程中的能耗问题[1]。能耗模型的建立是云计算系统的能耗优化的关键之一,精确高效的能耗模型能够为云计算系统的资源调度和能耗优化提供重要的技术支撑[2]。本文针对云计算系统的CPU使用率、内存使用率和存储使用率三个能耗模型的分析和结合非线性回归分析方法,设计了基于系统使用率的能耗模型。最后,通过实验环境搭建和模型测试,得出了该能耗模型的误差率和实际监测结果相差较小,能够满足能耗优化的具体需求。
一、云计算平台的能耗模型
(一)能耗模型建立的原则。设计一个准确高效的云平台能耗模型能够为云存储资源调度、能耗优化提供重要的技术支撑,能耗模型设计原则主要包括[3]:(1)能耗模型采样数据应该是整个云系统的能耗情况统计;(2)能耗模型精确度决定了模型实际使用效果,所以能耗优化算法必须设计合理;(3)能耗模型具备实时预测功能;(4)能耗模型具备通用性;(5)数学模型具备伸缩性,能支持实时变化。(6)数学模型在设计的过程中在不影响能耗整体效果情况下尽量不要过度复杂化。
(二)能耗模型设计流程。能耗模型的设计流程主要包括3个步骤[4]:(1)数据采样:在云平台正常工作的情况下收集云存储系统的能耗情况和分析影响能耗数据因子,这里我们主要是通过对云平台的系统使用率来进行数学分析建模包括了CPU、内存和硬盘的使用情况参数;(2)模型建立:根据不同的回归方法建立能耗模型,提取预测需要的采样参数。(3)预测系统能耗。能耗建模的基本流程见图1。
图1 能耗建模的基本流程图
(三)能耗采样硬件平台。智能电表能够采集能耗模型服务器的电流以及电压信息上传至后台数据存储服务器上,能耗采样平台要确保智能电表和数据存储服务器只能为能耗模型服务器进行服务以确保数据采样的可靠性[5]。通过P=UI可以得到能耗模型服务器的电能消耗情况,服务器也可以通过特定的数据采集手段来存储自身硬件CPU、内存和硬盘使用率信息。通过对电能消耗数据和系统使用率信息的数据采样,能耗模型的数据来源便得到了可靠性保障。能耗采样平台示意图见图2。
图2 能耗采样平台
能耗模型服务器B的性能参数是通过在该服务器上运行一组操作程序Benchmark来实现的,Benchmark程序主要完成的功能是采集计算机硬件的性能参数。在云存储平台中的系统CPU、系统内存和系统硬盘运转是最为耗能的且状态可调节的硬件。我们选取这三个部件的使用率作为能耗模型基本参数,并将使用率参数引入到多种回归模型中。
二、基于云存储技术的系统使用率能耗建模
云系统能耗模型的系统使用率参数来源主要包括[6]:CPU处理器使用率、内存使用率和存储使用率三个方面。系统使用率数据主要为能耗模型提供相应的参数,所以能耗模型的数据采样只采集与云系统能耗关系最主要的部分。随着硬件技术的演进,云平台的能耗数据与系统使用率之间的关系从简单的线性关系逐渐演变成非线性关系。
(一)基于CPU使用率的能耗模型。CPU处理器使用率占据了云系统的主要能耗,通过对CPU使用率的调整来控制云系统的整体能耗是云系统节约能耗的主要方向之一[7]。
数学模型1的设计是利用云系统的CPU使用率参数来预测能耗模型,如公式(1)所示。能耗预测数学模型设计为CPU使用率的线性函数,M为代表的是网络硬盘能耗数据,它作为常数来对待。i表示CPU处理器使用率对云系统能耗的经验参数,通过简单的线性回归得到基于CPU处理器使用率的能耗模型如公式(1)所示:
数学模型1描述的是能耗与CPU使用率的线性相关,但是线性关系模型已经不能正确描述二者之间的关系。通过对数学模型1的改进,在数学模型2中引入影响因子j和N+CPU来调整能耗与CPU使用率之间的关系,改进模型公式表示方法如公式(2):
(二)基于内存使用率的能耗模型。系统内存使用率是云计算系统的硬件能耗来源之一,内存耗能在一定条件下可以占据云平台总能耗的70%左右。多核CPU处理器在进行业务处理时大量使用内存虚拟方法造成了云存储数据中心的整体能耗大幅度提高[8]。
内存的能源消耗数据与CPU处理器的能源消耗数据之间存在着正比关系,当CPU使用频率增加时会导致内存的能耗随之增加。云系统内存与云CPU处理器相关的线性能耗模型记为公式(3)所示。
(三)基于存储使用率的能耗模型。系统硬盘存储使用率也是云硬件系统的能耗来源,硬盘存储耗能在一定条件下可以占据云平台总能耗的65%左右。传统存储主要通过自动调节磁阵技术来实现磁阵空闲不工作状态的转换,基于闪存的磁阵存储技术也可以降低网络存储的能耗。由于云平台服务器可以为多个云存储磁阵进行相关服务并且存储磁阵是具备扩展功能的,存储磁阵的数量越多导致存储消耗的能耗也就越多。在云计算存储集群系统中,磁盘阵列的互相备份等安全保护技术也会增加云计算平台的能源消耗[9]。
考虑到磁盘阵列在云计算系统能耗的工作影响程度,基于存储使用率的云系统存储与云CPU处理器相关的线性能耗模型记为公式(4)所示。
通过对云系统的能耗情况深度分析,CPU处理器、内存使用率和存储使用率的能耗模型能耗数据在云系统工作过程中存在很大的波动情况,是能耗模型的主要参数来源。
(四)能耗模型数据回归分析应用。能耗数学模型的数据回归分析技术主要研究内容是能耗变量P与CPU处理器、内存Memory和存储Disk的使用率(用x来表示)之间的非线性关系,找到能耗变量P与x之间的函数P=f(x)的具体表达式是回归分析技术在本文中的主要目标。f(x)称为能耗P对使用率x的回归函数,或者称为能耗P对使用率x的回归[10]。
由于能耗与资源使用率之间存在非线性关系,我们通过对线性关系的研究改进推导出能耗非线性目标函数模型。通过对线性回归的函数转换和添加因子的处理,非线性模型的目标函数可以用公式(5)表示:
1.变量多元拉索回归分析模型(PWL)。变量多元拉索模型的基础函数由自变量形式表示。为了防止非线性数学模型的数据采样参数过多影响能耗模型结果,这里使用拉索回归进行参数选取。
2.变量多元+指数拉索回归分析模型(PEWL)。在多形式模型的基础上,f(x)还增加了指数函数ex,在这里同样使用拉索回归进行资源使用率参数的选取。
3.方差齐性回归分析模型(SVM)。方差齐性(SVM)是从多维角度来使用非线性函数进行最优化目标的实现,回归分析与SVM的结合能到得到更优的能耗非线性数学模型。
给定一组测试样本集 (Mi,Ni,1≤i≤n),Mi为因变量,Ni是自变量,n是样本数目。对于实验数据集为非线性的情况,通过非线性能耗目标函数f(x)将实验数据到高维线性特征空间。在此情况下,能耗估计目标函数f(x)为如公式(6)形式:
能耗模型目标函数的最优化条件为公式(7)所示:
在上式中引入弹性因子ξi和ξj,公式(10)最优化条件改进为公式(8)
三、基于系统使用率的能耗模型设计
在Unix系统中,通过局部变量clockis的值来计算出系统CPU使用率(用户clockis+系统clockis)/总clockis。在本次试验中服务器使用Linux操作系统,我们通过系统文件/Process/start文件来提取量clockis值计算系统CPU使用率。/Process/start文件中还能查看本次试验的CPU负载情况。
通过上述方法可以得到CPU使用率UtilizationCPU,/process/information文件里可以提取相应的参数可以计算出系统内存使用率和存储使用率。当计算出CPU、内存和存储使用率的数据之后,进一步研究三者之间的联系。通过收集系统各个时间段的300多组能耗数据,能耗数据由CPU能耗、内存能耗和存储能耗三部分组成,能耗数据使用率的值如图3所示。
图3 内存使用率、CPU使用率对系统能耗的影响
根据采样到的CPU使用率、内存使用率和存储使用率的非线性模型拉索回归分析、变量多元指数拉索回归分析和方差齐性回归(SVR)的回归分析和数学模型特点,我添加了针对本文的数学模型影响因子如图4所示。
通过回归分析技术对能耗模型的影响以及采样数据对能耗模型的影响,我们最终设计了能耗数学模型,能耗模型的目标函数f(U)表示方法如公式(10)所示。
图4 能耗模型影响因子
四、能耗模型实验结果测试分析
本次实验云平台的主控制芯片采用SUN公司生产的同构四核处理器Athlon64,该64位处理器由2组Athlon64 X2内置芯片和2组Athlon64X4内置芯片组成,系统核心内存值为 96G,Unix平台的操作系统版本为 2.6.18-128. ELsmp,编译环境为Cygwin。
本次试验判定一个能耗模型目标函数公式(10)是否精确标准是使用相对误差率Q误差的值来判定,Q估计表示我们能耗模型预测得到的结果,Q电表表示用电表监测到的实际能耗。误差结果用公式(11)表示。
通过对比能耗目标Q误差值,就可以推断各个能耗模型的误差率。具体能耗模型误差率的实验测试结果见图5。
图5 能耗模型精确度测试
从上图中可以看出线性模型的回归分析误差率达到了30%,其误差明显高于非线性模型的回归分析。回归分析中的变量多元拉索回归分析和变量多元指数函数回归分析的误差范围在(-10%,+10%)左右,将CPU处理器和内存使用率的指数函数ex引入变量多元中对能耗模型结果基本上没有任何影响。方差齐性回归(SVM)的误差值范围在(-6%,+6%)之间,是线性回归的偏差的一半,也是3个回归分析技术中误差范围最小的。实验结果表明,方差齐性回归分析的能耗模型在系统稳定后只监控系统使用率的情况下,能耗预测精度可达到94%以上。
五、结语
云计算平台在系统应用时产生了大量的能耗浪费,针对云计算平台的能耗优化问题是当前云技术发展重点研究的对象之一。本文针对云计算系统的CPU使用率、内存使用率和存储使用率三个能耗模型的分析,结合非线性回归分析数学方法,设计了使基于云计算平台的系统使用率的能耗模型。通过实验环境搭建,得出了基于系统使用率的能耗模型的误差率和实际监测结果相差较小,能够满足能耗优化的实际需求。
[1]金海,吴松,廖小飞,等.云计算的发展与挑战[M].中国计算机学会学术工作委员会.中国计算机科学技术发展报告.北京:清华大学出版社,2014:15.
[2]KAYZRH.Highperformancenetworkandchannelbased storage[J].ProceedingsoftheIEEE,2014,23(2):128-135.
[3]孙民,沈红松.论云计算的体系结构[J].云计算通讯技术,2014,18(1):38-39.
[4]王庆波,等.虚拟化与云计算[M].北京:电子工业出版社,2015:112.
[5]张虹.含风电场的连续潮流法研究[J].吉林化工学院学报,2014,31(5):59-61.
[6]PAYYERSON D A,GIBSON G,KAYZ R H.A nice for redundant arrays of inexpensive disks(RAID)[J].SIGMOD RENORD,2013,12(2):58-60.
[7]孙明革.HART智能仪表通用组态软件开发[J].吉林化工学院学报,2014,31(3):56-60.
[8]CACHIN C,KEIDAR I,SHRAER A.Trusting the cloud [J].ACM SIGACT News,2006,35(1):28-35.
[责任编辑郑丽娟]
TP393
A
2095-0438(2016)09-0148-04
2016-05-16
卢彪(1985-),男,安徽毫州人,宿州学院信息工程学院助教,硕士,研究方向:物联网及云计算。
安徽省高校自然科学研究重点项目(KJ2016A777);安徽省大学生创新创业项目(201510379098);安徽省级质量工程教学研究重点项目(2014jyxm380)。