基于时间序列预测的跨组织资源链监控
2015-10-28王正成
王正成 咸 达
浙江理工大学,杭州,310018
基于时间序列预测的跨组织资源链监控
王正成咸达
浙江理工大学,杭州,310018
建立了以时间、成本、服务能力、信誉度综合最优的监控模型,并利用改进的粒子群算法优化支持向量机参数对监控模型进行时间序列预测,当监控模型的实际值与预测值在规定的误差范围内时,该资源服务是正常运行的。最后通过一个算例进行监控预测研究,以均方根误差(RMSE)作为评价监控模型的预测精度,研究结果及分析对比表明,该方法有效、可行。
跨组织资源链;粒子群算法;支持向量机;时间序列预测
0 引言
随着网络科技的快速发展,制造业面临着资源、人才、技术、全球化市场的竞争,在这种竞争条件下,企业已经不可能从资源获取、生产加工到产品服务全部由企业自身完成,企业必须按需集成各种资源,广泛开展跨组织间的协作,有效地对资源进行共享以及优化配置以解决资源占有不平衡性、组织之间重复投资的问题。在跨组织协同制造资源集成共享过程中,首先需要对跨组织资源服务链进行构建,当构建完成之后,为确保资源任务能在规定的时间内完成,需要对每个资源服务进行监控,一旦出现某些突发情况,比如机器故障、费用超支等,可以立即采取有效的措施,进行生产安排、调度等,避免产生重大的损失。
企业内部资源监控主要体现在车间生产过程的监控,如对生产设备、生产任务的安排、人员协作、内部资源利用率等方面的监控。跨组织资源链监控是对企业组织间协作、资源的优化配置以及资源间共享等方面的监控。从系统整体性方面来讲,企业内部监控属于局部监控,主要负责某一方面或某一区域的资源监控,不能有效地实现全局的资源优化配置;而跨组织资源链监控是从全局出发,对资源链的各个资源服务点进行整体监控,构建系统性的综合方案,从而实现对不同组织间的资源优化配置和监控。
目前大多数文献对跨组织资源链监控问题的研究,主要分为对网络监控架构和监控算法的研究,如:Adinolfi等[1]在云计算平台上设计和实现了利用QoS进行监控的可移植应用程序QoS-MONaaS,减少了对平台的依赖性;谢圣献等[2]将基于语义P2P的无线传感器网络应用架构与RFID技术相结合,构建了供应链管理的语义监控平台;刘志中等[3]提出了一种基于事例推理的QoS动态预测方法,该方法将Web服务的QoS与服务的外界环境、所处理的任务类型、任务大小关联起来,利用事例推理技术预测Web服务处理新任务时的QoS;张海腾等[4]采用面向方面的编程,将方面代码植入业务流程执行语言的Web服务消息调用处,以收集服务实例执行状态、时间、事件信息,据此进一步计算出服务性能指标;Zadeh等[5]按照时序记录QoS参数值,并利用神经网络进行训练,预测出下一个时间段的QoS参数的变化趋势,从而实现网络服务的监控;孙明杰等[6]提出了一种基于用户监控需求的Web服务运行时监控方法,并设计出一个端到端的监控实施原型框架,对Web运行时监控和改善服务质量状况起到积极作用。本文提出了一种监控策略,首先建立以时间、成本、服务能力、信誉度为监控指标的数学模型,在资源服务链运行过程中,利用该数学模型进行计算,并将结果按时间序列(可以是天数,或者任务执行的周期)进行记录,根据该时间序列记录,利用机器学习理论,使用改进粒子群算法的支持向量机对时间序列的下一天或者下一个周期进行整体监控指标预测,并对实际值与预测值进行评估,若有很大的偏差,则可以认为当前资源链运行过程中可能出现问题,应立即调查原因,以免造成不必要的损失。
1 数学模型
跨组织资源链是指服务于跨组织协同制造总任务根据产品形成过程分解形成的时序与约束关联的一系列原子任务执行过程中的各种制造资源所构成的资源有向网络结构。本文是基于跨组织资源链构建完成之后的研究,关于跨组织资源链的构建问题,本文不再阐述,可参考文献[7]。
在实际的跨组织资源链监控中,有很多指标需要被监控,如时间、成本、生产质量、服务能力、信誉度等诸多因素,这些因素动态多变且复杂,很难用统一的数学模型加以描述,为不失一般性,本文通过对问题本质的分析,将问题一般化,建立以时间、成本、服务能力、信誉度为监控指标的数学模型,并做以下假设:
(1)本问题不考虑企业组织内部生产线上的作业监控以及调度、订单分类问题。
(2)企业内部生产加工能力、生产任务的安排、订单的变更可以反映到完成资源任务的快慢上,因此可以将该类问题统一归结到时间模型上。
(3)服务能力将体现在快速精准地制定完成资源任务的时间、成本、面向客户的物流能力以及对一些突发情况的应急能力等。
为此,本文将对资源链中的单个资源服务企业进行监控,从而可以扩展成为整条资源链的监控,下面将分别对时间、成本、服务能力、信誉度这四个指标进行介绍,并相应地建立数学模型。
资源服务企业的实际执行时间T主要由资源任务的生产制造时间T1和与其有连接点的协调时间T2构成,因此定义时间模型为
T=T1+T2
(1)
跨资源服务企业的实际执行成本C是由资源任务的生产制造成本C1和与其有连接点的协调时间C2构成的,因此定义成本模型为
C=C1+C2
(2)
服务能力F在模型中具体可以表现为服务的可用性,由一段时间内服务的平均正常工作时间Tnor和平均故障时间Terr(包括故障处理时间)完成,因此定义服务能力模型为
F=Tnor/(Tnor+Terr)
(3)
信誉度R是指所有用户对资源服务的评价的均值,因此定义信誉度模型为
(4)
其中,n为所有参与服务评价的用户数量。Ri为第i个用户的评价值。
在资源服务环境中,用户需要对资源服务使用后的评价进行反馈、校正和检测并对最终的服务信誉度进行评估[8-9],本文对信誉度指标进行归一化处理,使该信誉度模型能够与不同的信誉度评价系统相结合,即
Rrat=(R-Rmin)/(Rmax-Rmin)
(5)
式中,Rrat为归一化的信誉度值;Rmax、Rmin分别为信誉度评价指标的最大值和最小值。
因此,为了衡量整体指标,建立以下模型:
Z=αT+βC+γF+δRrat
(6)
其中,Z为综合指标;α、β、γ、δ为相应指标的权重,且α+β+γ+δ=1。
当监控指标模型建立后,需要按照时间序列进行记录,可以按照天来记录,也可以按照周来记录,需要根据整个服务链的交货期或者特定的生产安排来设定。所记录的监控指标值是资源服务实际运行中的指标值。
2 时间序列预测
时间序列预测[10-11]是根据自然科学或社会科学中的某一变量的指标值或观测值,按照其出现时间的先后次序,对该变量的未来指标值进行预测。设一个时间序列为{xn},n=1,2,…,N,则对未来的时间序列指标值预测可以根据之前的k个时间序列数据进行预测:
xn+s=f(xn-1,xn-2,…,xn-k)
(7)
式中,s为预测的步数;f()为非线性映射函数。
此时,可以得知,对时间序列预测的关键是对函数f()的准确模拟,本文利用支持向量机对输入的时间序列{xn-1,xn-2,…,xn-k}进行训练,使训练后的支持向量机逼近f(),进而实现对时间序列数据{xn+1,xn+2,…,xn+s}的预测。
2.1支持向量机
(8)
其中,ω为权值向量;c为正则化参数;e为回归误差;b为常值误差;φ()为非线性映射函数,将输入数据映射到高维特征向量空间。
为求解此问题,需建立相应的拉格朗日函数,并将其转化成为求解线性方程组:
(9)
l=[11…1]Ty=[y1y2…yN]T
a=[a1a2…aN]T
其中,Ω为核函数矩阵,Ωij=K(xi,xj)为核函数,I为单位矩阵,ai为拉格朗日权值。求解式(9)可得支持向量机回归函数:
(10)
本文将核函数设为径向基函数,即
K(xi,xj)=exp(‖xi-xj‖2/r)
(11)
式中,r为核参数。
此时需要优化的参数分别是式(9)中的正则化参数c和式(11)中的核参数r,只要对这两个参数进行优化,就可以减小支持向量机训练的误差,从而提高时间序列的预测值的精确度,本文将利用粒子群优化算法对参数进行优化。
2.2改进的粒子群算法
(12)
(13)
由于粒子i在D维空间进行搜索,惯性权重w决定了粒子先前速度对当前速度的影响程度,直接关系到PSO算法的搜索能力与收敛速度,当惯性权重较大时,有利于全局搜索,且收敛速度快,但不易得到精确解;当惯性权重较小时,有利于局部搜索,但容易陷入局部最优解。本文中w将采用线性递减策略计算,公式为
(14)
其中,wmax、wmin分别为惯性权重的最大值和最小值,Tmax为最大迭代次数,t为当前迭代次数。并将粒子的初始速度设为
(15)
其中,rand()为随机数生成函数,用来生成0~1之间的随机数,这样在迭代开始时,可以很快地进行全局搜索,定位最优解的大致位置,随着w的减小,粒子速度减小,开始进行局部搜索,寻找最精确的最优解。
若粒子的速度超出vmax,可能会使粒子飞过最优解;若粒子的速度太小,则导致粒子收敛速度过小,可能被局部最优解所吸引,无法找到最优解,因此对超过[vmin,vmax]的粒子速度,按照下式进行修正:
(16)
2.3算法步骤
优化支持向量机参数的步骤如下:
(1) 将式(9)中的正则化参数c和式(11)中的核参数r构成一个粒子,即X(c,r),并初始化种群规模、学习因子、速度最大值和速度最小值,采用标准粒子群算法参数进行设置,利用式(15)初始化速度。
(2)根据适应度函数,计算各个粒子的适应度值,将各个粒子的位置与适应度值存储在个体极值中,将种群中适应度值最优的粒子个体位置和适应度存储在全局极值中。迭代次数t=1。本文中的适应度函数将采用均方根误差,即
(17)
(3)利用式(12)和式(13)对速度和位置进行更新。
(4)更新速度和位置后,利用适应度函数重新计算各个粒子的适应度值;并更新个体极值和全局极值。
(5)令t←t+1;查看是否满足终止条件,若不满足则重复步骤(3)~(5);若满足则迭代终止,输出群体中最优的粒子位置与全局极值。
(6)将最终优化好的参数(c,r)代入式(10),从而获得支持向量机模型,并可以对时间序列进行预测。
3 应用算例
以某企业作为跨组织资源链的节点进行监控,采集了该企业连续100天的执行时间、执行成本、服务能力与信誉度数据作为实验数据,并利用式(6)计算综合指标,其中,α=0.3,β=0.3,γ=0.2,δ=0.2。100天的时间序列如图1所示。
图1 采集100天的时间序列数据
最后在MATLAB平台上进行仿真计算,利用改进粒子群算法优化支持向量机参数,其中,粒子数为30,迭代次数为200,学习因子c1=c2=1.494 45,wmax=0.9,wmin=0.4;vmax=6,vmin=-6,本算例将前90天的综合指标值作为时间序列预测的训练样本,后10天作为测试集,并将利用改进后的粒子群算法优化支持向量机(PSO-SVM)和未经优化的支持向量机进行对比预测,结果如图2所示,同时表1给出了这两种算法的预测误差对比。
图2 预测对比图
预测方法预测误差(RMSE)PSOSVM0.2474SVM0.3510
结果表明,利用改进粒子群算法优化后的支持向量机比未经优化的支持向量机所预测的精度要高一些,即当利用本文算法进行实施监控时,若资源服务正常运行,实际值与预测值不会有太大的差值;若发现某一天实际值与预测值相差较大,则有可能是资源服务运行出现问题,应该立即查找原因,采取相应的措施。
4 结语
本文通过对跨组织协同制造资源链监控的研究,将问题抽象化,把时间、成本、服务能力,信誉度列为跨组织协同制造资源链监控的首选评价指标,由于每个企业作为首选的评价指标可能各不相同,故本文所涉及的数学模型具有一定的局限性,但是不失一般性,本文可以为将来的研究,即把跨组织资源服务链监控的各个指标考虑到具体的实际生产运作模型中提供一种有效的解决办法。
[1]AdinolfiO,CristaldiR,CoppolinoL,etal.QoS-MONaaS:aPortableArchitectureforQoSMonitoringintheCloud[C]//8thInternationalConferenceonSignalImageTechnologyandInternetBasedSystems.Naples,2012:527-532.
[2]谢圣献,贾保先.P2P环境下基于WSN和RFID的供应链管理语义监控平台[J].数学的实践与认识,2010,40(11):86-91.
XieShengxian,JiaBaoxian.SCMSemanticMonitoringPlatformBasedonWirelessSensorNetworkandRFIDunderP2PEnvironment[J].MathematicsinPracticeandTheory, 2010, 40(11):86-91.
[3]刘志中,王志坚,周晓峰,等.基于事例推理的Web服务QoS动态预测研究[J].计算机科学,2011,38(2):119-121.
LiuZhizhong,WangZhijian,ZhouXiaofeng,etal.DynamicPredictionMethodforWebServiceQoSBasedonCase-basedReasoning[J].ComputerScience,2011,38(2):119-121.
[4]张海腾,邵志清,郑红.Web服务运行时的监控和性能数据动态采集[J].计算机集成制造系统,2011,17(8):1654-1659.
ZhangHaiteng,ShaoZhiqing,ZhengHong.RuntimeMonitoringandDynamicPerformanceAttributesDataAcquisitionofWebServices[J].ComputerIntegratedManufacturingSystems,2011,17(8):1654-1659.
[5]ZadehMH,SeyyediMA.QoSMonitoringforWebServicesbyTimesSeriesForecasting[C]//3rdIEEEInternationalConferenceonComputerScienceandInformationTechnology.Chengdu,2010:659-663.
[6]孙明杰,李必信,张鹏程.一种基于监控需求的Web服务运行时监控方法[J].东南大学学报(自然科学版),2009,39(4):716-722.
SunMingjie,LiBixin,ZhangPengcheng.MonitoringRequirements-basedMethodforRuntimeMonitoringofWebServices[J].JournalofSoutheastUniversity(NaturalScienceEdition),2009,39(4):716-722.
[7]王正成,潘晓弘,潘旭伟.基于蚁群算法的网络化制造资源服务链构建[J].计算机集成制造系统,2010,16(1):174-181.
WangZhengcheng,PanXiaohong,PanXuwei.ResourceServiceChainConstructionforNetworkedManufacturingBasedonAntColonyAlgorithm[J].ComputerIntegratedManufacturingSystems,2010,16(1):174-181.
[8]王尚广,孙其博,杨放春.Web服务选择中信誉度评估方法[J].软件学报,2012,23(6):1350-1367.
WangShangguang,SunQibo,YangFangchun.ReputationEvaluationApproachinWebServiceSelection[J].JournalofSoftware,2012,23(6):1350-1367.
[9]孙素云.Web服务信誉度评估模型的研究[J].计算机工程与设计,2008,29(9):2259-2261.
SunSuyun.ResearchonReputationEvaluationModelofWebService[J].ComputerEngineeringandDesign,2008,29(9):2259-2261.
[10]DashevskiyM,LuoZ.TimeSeriesPredictionwithPerformanceGuarantee[J].IETCommunications,2011,5(8):1044-1051.
[11]Martínez-RegoD,Fontenla-RomeroO,Alonso-BetanzosA.EfficiencyofLocalModelsEnsemblesforTimeSeriesPrediction[J].ExpertSystemswithApplications,2011,38(6):6884-6894.
[12]HuangSC.OnlineOptionPriceForecastingbyUsingUnscentedKalmanFiltersandSupportVectorMachines[J].ExpertSystemswithApplications,2008,34(4): 2819-2825.
[13]DunisCL,RosilloR,FuenteD.ForecastingIBEX-35MovesUsingSupportVectorMachines[J].NeuralComputingandApplications,2013,23(1):229-236.
[14]WangLing,WangXiuting,FuJingqi,etal.ANovelProbabilityBinaryParticleSwarmOptimizationAlgorithmandItsApplication[J].JournalofSoftware,2008,9(3):28-35.
(编辑陈勇)
Cross-organizational Resources Chain Monitoring Based on Time Series Prediction
Wang ZhengchengXian Da
Zhejiang Sci-Tech University,Hangzhou,310018
This paper established time, cost, service capability, credibility integrated optimal monitoring model and the improved particle swarm algorithm was used to optimize parameters of support vector machine,the monitoring model was predicted by time series prediction.When the actual and predicted values of the model error ranges satisfied monitoring requirements, the resource service was normal. Finally, through an example, using the root mean square error(RMSE) as prediction accuracy of evaluation model,the results and comparative analysis show that the method is effective and feasible.
cross-organizational resources chain;particle swarm algorithm;support vector machine;time series prediction
2014-04-24基金项目:国家自然科学基金资助项目(71271192);浙江省自然科学基金资助项目(LY12G01008);浙江省科技厅公益计划资助项目(2013C31036)
TP165;TH166DOI:10.3969/j.issn.1004-132X.2015.10.018
王正成,男,1974年生。浙江理工大学经济管理学院教授、博士后研究人员。主要研究方向为先进制造模式、企业信息化。咸达,男,1988年生。浙江理工大学经济管理学院硕士研究生。