APP下载

基于博弈论的多资源供应商动态资源策略研究

2020-06-04杨凯莉吴紫涧何伟铭

科技创业月刊 2020年3期
关键词:均衡点理性调度

杨凯莉 吴紫涧 甘 屹,2 何伟铭,2

(1.上海理工大学 机械工程学院,上海 200093;2. 日本中央大学 理工学部精密工学科,日本 112-8551)

0 引言

随着智能制造技术发展,制造资源共享逐渐社会化成为不可阻挡的趋势,由于制造资源的供需双方更加积极、合理地加入到产品制造过程中,即制造资源数量增加使得资源调度问题变得越来越复杂。博弈论是解决智能理性决策者之间的冲突与合作的理论方法[1],文献[2]~[4]已有研究。

实践证明,博弈论在寻找均衡点的多目标优化问题中表现较优,尤其在不涉及智能制造的多客户多供应商场景应用方面。Wu 等[5]基于博弈论的基本假设,即决策者确定一个明确的目标去追求和预测其他参与者基于他们自己的知识所作出的决策,从而将博弈模型应用于考虑供需关系的制造过程中公差设计方面。Cournot[6]研究了寡占型市场中的博弈模型,此后,寡头竞争博弈模型在经济领域得到进一步的探讨。寡头垄断市场的经典模型有Cournot模型、Bertrand模型、Stackelberg模型,这些模型都是静态博弈模型。模型之间的区别如下:

(1)Cournot模型和Stackelberg模型的变量是产量,Bertrand模型的变量是价格。

(2)Stackelberg模型受策略序列的影响。Elsadany[7]通过3个非线性差分方程研究了以3个有界理性参与者为特征的动态Cournot博弈,并分析离散动力系统平衡点的稳定性;Wang 等[8]基于熵理论和混沌理论,考虑到3家企业的有限理性,在资源约束下使用成本函数,建立价格博弈模型;Wang等[9]提出了信息不对称环境下的多企业产出博弈模型;Sun等[10]调查了代理商行为及其对供应链的影响,并分析了人的表现与风险素养之间的相关性。动态博弈理论被用来解释市场行为和价格机制,为进一步研究这一机制,Bischi 等[11]引入了一个动态市场份额吸引模型,其中代理商是有限理性的;Agiza 等[12]通过两个非线性差分方程分析了有限理性离散动力系统平衡的稳定性;Cavalli等[13]提出并比较了3种非均匀的古诺式双寡头,采用基于不同理性程度的最佳反应机制,同时研究收敛到纳什均衡所需的条件以及当这些条件不满足时可能导致不稳定的途径,表明单个参与者理性程度提高并不能保证稳定性提高;Sun[14]研究了在需求不确定性下的价格竞争动态寡头模型。通过构建供需双方的关系,相互之间的策略选择对基于市场机制的制造过程会产生影响。

不同于大多数集中在单一福利制造任务场景的研究,本文考虑制造资源约束,采用博弈论研究调度问题中所有参与者基于利益问题上会妥协的均衡点。本文提出一种动态博弈模型,在已有研究基础上,进一步讨论当成本函数不同时,基于有限理性下及延迟有限理性下的策略调整问题,对系统稳定区域进行分析,同时通过计算李雅普诺夫指数得到纳什均衡解,从而为资源决策提供参考。

1 模型描述

智能制造过程中,制造资源通过考虑价格和利润决定是否响应调度中的调用。由于竞争机制,制造服务价格会随着供求关系而变化,这一变化影响了制造资源供需双方的策略选择。考虑到智能制造不是一次性交易,资源之间存在竞争关系,而策略和决策会影响后续交易,为作一步研究,本文提出以下假设:

(1)竞争机制只发生在提供同质制造服务的制造资源之间。这场竞争是寡头政治,在有限时间域内为特定调度提供同类制造服务的可用制造资源数量是有限的。

(2)假设存在市场和竞争机制。制造资源服务价格由制造资源市场供求关系决定。

(3)制造资源的竞争目标是最大化利益及赢得交易机会。

在市场竞争中,价格与供求关系有关,价格由能够提供同质制造服务的资源数量决定。这种关系可以用平方形式的反需求函数加以描述,见式(1)。

p=p(Q)=m-nQ2

(1)

式中,m、n是反需求函数的系数;p是制造服务的价格;Q是需求中包含的同质服务数量。

考虑边际效应时简化该模型,制造资源成本与交易中的制造服务成正比。资源X的成本函数如式(2)所示。

CX=aX+bXqX

(2)

式中,aX、bX是成本函数系数;CX是交易成本;qX是某一资源在某一交易中提供的服务量。

由式(1)和(2)推导出利润函数如式(3)所示。

πX=qX·p-CX=qX[m-nQ2]-[aX+bXqX]

(3)

式中,πX是某一交易中资源X的利润。智能制造平台上的交易是长期动态的,假设交易信息透明,在(t+1)时刻,资源将根据t时的信息调整策略。动态调整可以描述如式(4)所示。

(4)

式中,αX是资源X的调整速度,0SymbolcB@αXSymbolcB@1;△qX是资源X的调整量;是资源X的复制因子。

2 解决方法

假设同质制造服务的一次竞争涉及两种资源,即资源X、资源Y,X和Y的利润与动态调整如式(5)和式(6)所示。

(5)

(6)

式(7)可由式(6)进一步计算得到:

(7)

当△qX=△qY=0时,模型达到均衡点。由于调整速度不能等于0,得到式(8)。

(8)

处于均衡点的雅可比矩阵模型如式(9)所示。

(9)

式中

(10)

(11)

(12)

(13)

由式(14)计算特征方程:

F(λ)=λ2-(2+d11+d22)λ+(1+d11)(1+d22)-d12d21

(14)

根据Jury定理,为了使模型在均衡点保持稳定,应满足以下不等式:

(15)

3 实例研究

3.1 成本函数相同的两种资源

博弈模型参数如表1所示。

表1 数值案例1中参数

可得均衡解:

3.2 成本函数不同的两种资源

当资源负载增加时,资源成本也会增加。假设资源X的成本函数是二次函数,如式(16)所示。

(16)

在这个数值例子中,涉及到相对于q线性变化的固定成本,线性系数用γ表示。因此,利润函数被改写为:

(17)

X、Y的利润和动态调整如式(18)所示。

(18)

表2 数值案例2中的参数

该数值案例在均衡点处的雅可比矩阵如式(19)所示。

(19)

式中:

(20)

(21)

(22)

(23)

将α1、α2分别作为X坐标和Y坐标绘制工作曲线。稳定区域的意义在于无论这两种资源在当地选择了多少初始产量,都可以在有限的博弈时间内改变策略满足纳什均衡解。

图1 系统稳定区域

3.3 延迟有限理性下的两种资源

基于有限理性下的博弈模型,假设这两种资源由于市场信息延迟需要在延迟有限理性下进行策略调整。根据延迟系数ω修改式(6)如下所示。

(24)

此时,均衡点的雅可比矩阵如下所示。

(25)

式中:

由式(26)计算特征方程:

F(λ)=λ4+A3λ3+A2λ2+A1λ+A0

(26)

式中:

根据Jury定理,为了使模型在均衡点保持稳定,应满足以下不等式。

(27)

式中:

稳定区域如图2所示。

图2 系统稳定区域

分析调节速度αi(i=1,2....)在资源调度和制造业中具有重要意义,当调节速度太快以至于工作曲线上的点超过分叉曲线时,系统将变得不稳定和混乱,制造资源将进行无序竞争。因此,当调节速度改变时,可以通过引入李雅普诺夫指数研究系统的非线性动力学特性。

设α2=0.3,图3表示李雅普诺夫指数(简称LI)值随α1值增加的变化趋势,当0<α1<0.3282时,max(LI)<0,根据LI和混沌系统的特性得出,该博弈在均衡点是稳定的;当0.3282<α1<0.3610时,max(LI)>0,系统混乱,博弈不稳定。设α1=0.15,图4表示LI值随α2值增加的变化趋势,当0<α2<0.4198时,max(LI)<0,该博弈在均衡点是稳定的;当0.4198<α2<0.4601时,max(LI)>0,博弈不稳定。

图3 李雅普诺夫指数α2=0.3时

图4 李雅普诺夫指数α1=0.15时

综上,调节速度α1和α2之间存在相互影响,调节速度越大,系统越趋于混沌和不稳定,资源承担的风险就越大。

4 结语

为了提高智能制造效率,制造过程竞争中的资源反应是资源调度研究的关键问题。因此,本文提出了一个动态博弈模型,需求者策略由反需求函数表示,这些策略相互作用和影响,再根据资源产出和利润,讨论策略调整问题。同时,在给定数值参数的情况下,通过计算李雅普诺夫指数得到均衡解,为一笔交易中的资源决策提供参考。未来计划整合该博弈模型中的其它动态特征,如奇怪的吸引子等,此外,可以对传达周期性任务分配和调度展开研究。

猜你喜欢

均衡点理性调度
“双减”的路向反思与理性审视
《调度集中系统(CTC)/列车调度指挥系统(TDCS)维护手册》正式出版
电力调度自动化中UPS电源的应用探讨
基于强化学习的时间触发通信调度方法
交易成本理论在油田企业小修业务自营和外包决策中的应用分析
基于动态窗口的虚拟信道通用调度算法
人人都能成为死理性派
三级供应链投资模型的评价管理
改革牛和创新牛都必须在理性中前行
交通拥堵均衡点分析