任务求解驱动的Web服务优选模型
2012-06-08范宝亮黄孝鹏
范宝亮,黄孝鹏
(1.91404 部队,河北 秦皇岛 066000;2.中国船舶重工集团公司第七二四研究所,南京 210003)
0 引言
在决策(使命)任务求解过程中,当某一子任务提出的服务请求与服务库中所提供的服务相匹配时,会遇到有若干具有类似功能描述的Web服务均基本满足要求,并且这些服务的服务质量(Quality of Service、QoS)评价体系(价格、响应时间、可靠性、信誉度等)中的某些参数(如可靠性、信誉度等)不能准确地用数字量化,即信息的不完备性和不确定性使其具有“灰”特征。在此情形下,如何参照服务的理想(最佳、满意)状态对服务进行关联度排序,然后快速优选和调用满意的服务,这对于决策任务快速求解具有实践意义。
灰色关联分析弥补了采用数理统计方法进行系统分析所导致的缺憾,对样本量的多少和样本有无规律都同样适用,而通常采用简单算术平均法来确定权重的传统灰关联模型会在一定程度上造成计算结果与实际的误差偏大。综合考虑问题的结构特征、数据的结构特征等因素,利用灰关联分析和熵值法的组合模型对服务进行优选。该优选模型更接近于实际问题的结构特征,方法选取较为合适,为决策任务快速求解的服务优选策略提供了一种综合性的、易操作的管理定量方法。
1 相关知识
1.1 Web服务的形式化描述
Web服务(Web Service)可形式化描述如下:WSi={Id,Name,Function,Inputs,Outputs,QoS}其中Id,Name,Function,Inputs,Outputs,QoS分别表示表示服务的标识符、名称、功能描述、输入、输出、服务质量。
根据属性设置的完备性、可鉴别性、独立性、客观性、可测性等原则,可将QoS 形式化描述为
这里,选取属性Q1,Q2,Q3,Q4分别表示服务的价格(Price)、响应时间(Time)、可靠性(Reliability)、信誉度(Reputation)等,其中Price 表示服务执行一次所需费用;Time 表示响应时间,即服务响应一次请求所需时间;Reliability 表示可靠性,即服务调用成功且返回正确结果的次数与服务总的执行次数之比;Reputation表示信誉度,用来衡量用户对服务的评价指标,可根据具体服务的实际运行情况给出相关属性值。
1.2 灰色关联分析
灰色系统法是基于灰色系统理论的一种新的建模方法,主要用于概率统计、模糊数学无法解决的“小样本、贫信息、不确定性”系统建模[1]。灰色关联分析的基本思想是根据序列几何形状的相似程度来判断其联系是否紧密。曲线越接近,相应序列之间关联度就越大,反之就越小[2]。灰色关联分析方法计算量小,十分方便,更不会出现量化结果与定性分析结果不符的情况。
目前,灰关联分析的实践应用主要体现在宏观经济管理、企业管理、农林经济管理、岩土工程、作战指挥等领域的预测和决策,但应用于Web服务的分析与研究还很鲜见。
1.3 熵值法及其改进
科学、合理地确定各评价指标的权重对综合评价结果具有重要意义。权重的确定方法有主观赋权法(专家评判法、点估计法、判断矩阵法等)、客观赋权法(熵值法、形心法、线性规划法和离差最大化法等)、组合赋权法(方差最大化赋权法、最佳协调赋权法等)、交互式赋权法(基于方案达成度和综合度的交互式赋权法等)等类型[3]。这些赋权法在多属性决策中被广泛使用。
信息熵概念的提出源于1948年,美国的通信工程师Shannon 在研究信息传输过程中的不确定性问题时将信息定义为不确定性的减少,并通过信息熵来度量不确定性[4]。在信息论中,信息熵是系统无序程度的度量,信息量是系统有序程度的度量,两者绝对值相等,符号相反。某项指标的指标值变异程度越大,信息熵越小,该指标提供的信息量越大,该指标的权重也应越大;反之,某项指标的变异程度越小,信息熵越大,该指标提供的信息量越小,该指标的权重也越小[5]。
熵值法通过获取服务的QoS 属性信息效用(属性)值来映射权重,比较符合服务的决策功能体现,可使权重更客观、更符合实际。
(1)传统的熵值法计算
传统的熵值法通常采用下面方法计算[6]。设定第j 项指标下第i个对象的参数值xij的比重:
为使lnpij有意义,一般需假定当pij=0时pijlnpij=0,但当pij=1时也有pijlnpij=0。这显然不切合实际,与熵的含义相悖,故需对pij重新加以修正。
因此,需要对该项指标数据用标准化法进行变换:
(2)计算第j 项指标的熵值ej
其中ej∈[0,1]。
(3)计算第j 项指标的差异系数gj
其中,gj越大,指标越重要。
(4)确定权重wj
2 计算步骤
若干具有类似功能的服务优选问题结构特征与灰关联和熵值法的组合模型特征较吻合,故可用来进行服务优选,其具体步骤如下:
(1)确定指标
针对服务优选,选取服务的价格、响应时间、可靠性、信誉度等QoS 属性作为影响服务优选的指标。
(2)获取参数
在QoS的属性值中,价格是由服务商提供;响应时间是由系统自测;可靠性是由服务提供商根据以往服务的调用情况统计得出;而信誉度是通过用户评价得出的语言值定性信息{极好、非常好、很好、较好、好、一般、差、较差、很差、非常差、无},可分别将其量化为{10,9,8,7,6,5,4,3,2,1,0}。
(3)求各序列的像
根据指标与数据特征,选取相应的灰关联算子D,令
(4)求差序列
(5)求两极最大差与最小差
(6)求关联系数
其中ξ∈(0,1)。
(7)计算关联度
计算流程如图1所示。
3 实 例
针对某一决策子任务求解,选取具有类似功能的服务序列WSi={WSi0,WSi1,WSi2,WSi3,WSi4,WSi5,WSi6},其中服务WSi0为服务优选指标(参数)的最理想(最佳、最满意)状态,故选取为参照序列。计算其他服务与WSi0的关联度,关联度越高,说明其越贴近于最佳服务状态。
图1 计算流程
针对原始数据信息(见表1),结合公式(5)~(8)可分别计算得到均值像、差序列、两级最大差及最小差、关联系数及熵值等结果。运用公式(9),计算得到服务的灰关联度排序如表2所示。
表1 原始数据信息表
表2 灰关联度计算
根据表2,灰关联计算结果显示:γ06≻γ04≻γ05≻γ02≻γ03≻γ01,表明服务WSi0,WSi1,WSi2,WSi3,WSi4,WSi5,WSi6与最佳状态WSi0的关联度排序是:
WSi6≻WSi4≻WSi5≻WSi2≻WSi3≻WSi1
因此,选取和调用WSi6进行决策子任务求解,同时WSi4≻WSi5≻WSi2≻WSi3≻WSi1也是该决策子任务对应的备选服务排序。
此组合模型对于服务优选是可扩展的。服务QoS体系中的属性选取可根据各被评服务的不同而加以调整,要具有灵活性,以提高服务优选的针对性、质量与可信度;可推广应用到Web服务组合的优选,辨识出不同服务提供者所提供的类似功能组合的差异,以提高服务调用效率,更有效地进行决策任务快速求解。
4 结束语
以任务求解为驱动,参照服务的最佳状态,运用灰关联分析和熵值法的组合模型对服务进行优选,为决策任务快速求解提供了有效的方法支撑。其特点体现在:
(1)使用灰关联分析研究服务的优选问题,其结果比通常单纯采用硬性指标更为合理。
(2)采用熵值法来确定指标权重,比通常采用的专家评价法更为客观,避免了主观效用的影响。值得注意的是,本文探讨的权重与指标本身的重要性无关。
(3)此优选模型可提升服务调用的效率,更有效地进行决策任务快速求解。
[1]刘兴堂,梁炳成,刘力,何广军,等.复杂系统建模理论、方法与技术[M].北京:科学出版社,2008.
[2]刘思峰,党耀国,方志耕,谢乃明,等.灰色系统理论及其应用[M].5 版.北京:科学出版社,2010.
[3]徐泽水.不确定多属性决策方法及应用[M].北京:清华大学出版社,2004.
[4]Shannon C E.A Mathematical Theory of Communication[J].Bell System Tech,1948(27):623-656.
[5]Thomas M C,Thomas J A.信息论基础[M].阮吉寿,张华译.2版.北京:机械工业出版社,2008.
[6]黄孝鹏,李德强.基于灰色关联理论和熵权法的企业人力资源风险评价[J].价值工程,2009(4):120-123.