模糊二人零和对策的纳什均衡求解

2015-11-03安京京南江霞卜红

经济数学 2015年3期

安京京+南江霞+卜红

摘要用三角模糊数刻画二人零和对策支付值的不确定性，提出了计算模糊二人零和对策纳什均衡解的多目标规划方法.给出了一种基于区间数比较的三角形模糊数排序方法，根据该方法将模糊二人零和对策转化为多目标线性规划.通过一个数值实例说明了该方法的有效性和实用性.

关键词二人零和对策；三角形模糊数；区间数；多目标线性规划

中图分类号C934 文献标识码A

The Solution of the Nash Equilibrium

of Fuzzy TwoPerson ZeroSum Game

AN Jingjing1，2， NAN Jiang xia1，2，BO Hong1，2

（School of Mathematics and Computing Science， Guilin， Guangxi541004，China；

Guangxi Colleges and Universities Key Laboratory of Data Analysis and Computation，

Guilin University of Electronic Technology， Guilin， Guangxi541004，China）

AbstractThe payoffs of twoperson zerosum game were presented as triangular fuzzy numbers. We presented a new methodology for solving twoperson zerosum games with payoffs of triangular fuzzy numbers. Based on the ranking of interval， we provided a new ranking method of triangular fuzzy number. Then the solution of the fuzzy twoperson zerosum games can be obtained through solving a pair of multiobjective linear programming models. The validity and applicability of the proposed methodology were illustrated with a numerical example.

Key wordstwoperson zerosum game； Triangular fuzzy number； Interval； Multiobjective linear programming

1引言

关于支付值为三角形模糊数的二人零和对策[1]（简称模糊二人零和对策）已有大量的研究和应用，Bector et al.[2]，Campos[3]，Campos et al.[4]都是运用一种模糊数的排序方法将支付值中的模糊数进行去模糊化转化成实数，进而把原问题的模糊线性规划模型转化为求解一般的线性规划模型，这样求得的对策值是一个实数.因为局中人的支付值是模糊数，所以在模糊二人零和对策中，局中人的最优策略和对策值也应是一个模糊数.目前只有少量的文献涉及这部分的研究.Clemente[5]运用了标准排序函数将模糊二人零和对策的模糊线性规划模型转化为与之等价的多目标线性规划模型，利用这种排序函数所得最优解也是模糊数.Li[6]研究了支付值是三角形模糊数的约束二人零和对策，证明了局中人的对策值与支付值满足单调线性关系，运用模糊数的0-截集和1-截集，通过求解三个线性规划模型得到局中人的最优策略和对策值，所求得的局中人的最优策略和对策值也是一个三角形模糊数.提出了一种新的基于区间数比较的三角形模糊数的排序方法，将支付值为三角形模糊数的模糊二人零和对策的求解转化为一个含有参数α的多目标线性规划模型，所得最优策略和对策值是三角形模糊数.

本文组织结构如下，第二部分是预备知识，给出了三角形模糊数的定义、截集及运算法则，介绍了区间数的比较，并提出了一种新的基于区间数比较的三角形模糊数的排序方法.第三部分运用三角形模糊数的比较方法将模糊二人零和对策的求解转化为求解带有参数α的多目标线性规划模型.第四部分给出了关于商业销售策略选择的一个数值实例，并建立模型，给出了数值结果.

经济数学第 32卷第3期

安京京等：模糊二人零和对策的纳什均衡求解

2预备知识

2.1三角形模糊数的截集及运算法则

定义1设=a，a，是一个三角形模糊数，那么它的隶属函数定义为

μx=x-a/a-a，a≤x

1，x=a；

-x/-a，a

0，x∈，其他.（1）

若a≥0，a，a和至少有一个不为零，则称=a，a，是一个非负的三角形模糊数.

定义2设=a，a，和=b，b，是两个非负的三角形模糊数.它们的代数运算和数乘分别为

+=a+b，a+b，+，（2）

λ=λa，λa，λ，λ≥0，λ，λa，λa，λ<0. （3）

三角形模糊数=a，a，的α-截集定义为α=xμx≥α，其中α∈0，1.记为α=aLα，aRα.

2.2区间数的比较

区间是实数集R的一个特殊子集[7]，记做=[aL，aR]={x∈RaL≤x≤aR}，其中aL和aR分别是区间的左、右端点.区间数也可表示为=〈m（），r（）〉，其中m（）=（aL+aR）/2是区间数的中点，r（）=（aL-aR）/2是区间数的半径.

设=[aL，aR]和=[bL，bR]是两个区间[7].‘≤I是一个模糊集，它的隶属函数为：

φ≤I=1，aR≤bL，

1-，aL≤bL≤aR≤bRr，且>0，

bR-aR/2r-r，aL≤bL≤aR≤bR且r>r，

0.5，r=r且aL=bL.（4）

同样地，也可以定义≥I.

设=aL，aR和=bL，bR是2个区间[7].‘≥I是一个模糊集，它的隶属函数φ≥I=1-φ≤I，即

φ≥I=0，aR≤bL，0-，aL≤bL≤aR≤bR且r>0；aL-bL/2r-r，aL≤bL≤aR≤bR且r>r，0.5，r=r且aL=bL.（5）

区间不等式≤I的弱等价形式为[7]：

aRx≤bR，φ≥I≤α，

这里α∈0，1，表示违背区间不等关系≤I的可接受程度.

同样地，定义区间不等式≥I的弱等价形式为：

aLx≥bL，φ≤I≤α.

2.3基于区间数比较的三角形模糊数的排序方法

基于区间数的比较，给出一种新的三角形模糊数的排序方法.

定义3设=a，a，和=b，b，是两个三角形模糊数，

1）若aIb，≤α，则

2）若a>b，a>b，且φa，TFN；

3）若a=b，a=b，=，则=TFN.

其中，符号 “TFN”和“=TFN”表示三角形模糊数的模糊不等关系.φa，>Ib，

SymbolcB@ αα∈01是关于对违背a，Ib，<1，那么就认为决策者对违背Ib，=1，那么就认为Ib，=0，说明决策者完全同意TFN和=TFN.

定义4设=a，a，是一个三角形模糊数.模糊目标函数的极大值问题可描述为

maxs.t.∈Ω1

等价于下面的区间多目标数学规划问题：

maxa，a，s.t.∈Ω1.

上述规划问题可等价于下面的多目标数学规划问题：

maxa，a，a+2s.t.∈Ω1.

这里Ω1是变量在实际问题中应该满足的约束集合.

同样地，模糊目标函数的极小值问题可描述为：

mins.t.∈Ω2.

可等价于下面的多目标数学规划问题：

mina，，a+2s.t.∈Ω2.

这里Ω2是变量在实际问题中应该满足的约束集合.

3模糊二人零和对策及求解方法

设局中人1和2分别具有纯策略集S1=α1，α2，…，αm与S2=β1，β2，…，βn，当局中人1和2分别选取纯策略αi∈S1、βj∈S2时，局中人1获得的支付值为三角形模糊数ij=aij，aij，iji=1，2，…，m；j=1，2，…，n，而局中人2相应地损失的支付值为三角形模糊数ij=aij，aij，ij.局中人1在所有局势下的支付值可直观地用表表示为：

=ijm×n.

假定局中人1和2分别以概率xi和yj选取纯策略αi∈S1和βj∈S2，记x=x1，x2，…，xmT，y=y1，y2，…，ynT，称x和y分别为局中人1和2的混合策略.称

X={x∈Rm∑mi=1xi=1，xi≥0，i=1，…，m}

和Y={y∈Rn∑ni=1yi=1，yi≥0，i=1，…，n}分别为局中人1和2的混合策略空间.

在混合策略x，yx∈X，y∈Y下，局中人1和2的对策值分别为=Ex，y=xTy

和=-Ex，y=xT-y.因为支付表中的元素为三角模糊数，所以局中人1和2的对策值也为三角模糊数，分别记为=v，v，和=w，w，.

不难得到在模糊二人零和对策中，则有

*=maxx∈Xmminy∈YnEx，y

≤TFNminy∈Ynmaxx∈XmEx，y=*

根据前面所述理论，模糊二人零和对策的最优解可以通过下面一对区间数学规划来求解：

maxv，v，s.t.∑mi=1aijxi≥v，∑mi=1aij，ijxi≥Iv，，j=1，2，…n；∑mi=1xi=1，xi≥0i=1，2，…，m.（6）

和

minw，w，s.t.∑nj=1aijyj≤w，∑nj=1aij，ij≤Iw，，i=1，2，…，m；∑nj=1yj=1，yj≥0，j=1，2，…，n. （7）

根据定义4，区间数学规划模型（6）可转化为下面的多目标规划模型：

maxv，v，v+2s.t.∑mi=1aijxi≥v，∑mi=1aijxi≥vj=1，2，…，n，-∑mi=1ijxi-v-∑mi=1ijxi-∑mi=1aijxi≤α，j=1，2，…，nv≤，∑mi=1xi=1，xi≥0，i=1，2，…，m.（8）

多目标规划模型有许多的求解方法，在这里，用加权平均法可将上述多目标数学规划转化为下面的带有参数α的单目标规划：

min12v+13v+16

s.t.∑mi=1aijxi≥v，∑mi=1aijxi≥v.1-α∑mi=1ijxi+α∑mi=1aijxi≥1-α+αvj=1，2，…，nv≤，∑mi=1xi=1，xi≥0，i=1，2，…，m. （9）

根据定义4，并用加权平均法，区间多目标数学规划模型（7）可转化为下面的带有参数α数学规划模型：

min16w+13w+12s.t.∑nj=1aijyj≤w，∑nj=1ijyj≤，1-α∑nj=1aijyj+α∑nj=1ijyj≤1-αw+αi=1，2，…，m.w≤，∑nj=1yj=1，yj≥0j=1，2，…，m.（10）

显然，如果模糊矩阵 A ～中的所有三角模糊数ij=aij，aij，ij退化为一个实数，即aij=aij=ij，那么v*和w*也是一个实数，即v=v=，w=w=.因此，方程（9）和（11）分别退化为经典的二人零和对策的线性规划.从而说明的模型是经典二人零和对策模型的推广.

4数值分析

现有公司C1和C2欲占领某一产品市场，各自拟定下一年度产品的销售计划，以便增加自己产品在市场上的销售量.假定该市场对这类商品的需求为大致稳定，故一家公司销售量增加，则会引起另一家公司销售量减少.每家公司都在考虑采用两种策略之一来增加自己产品在市场上的销售量.策略α1：进行产品广告宣传；策略α2：改进产品包装.两个公司之间策略的选择可以看成是二人零和对策，即公司C1和C2分别看成是两个局中人.由于市场环境的复杂性和信息的不确定性，两个公司管理者只能给出下一年度各种局势下销售结果的近似值.假设

公司C1在所有局势下的支付值表示为如下的三角形模糊数：

=1751801901501561588090100175180190

利用前面所述理论，根据式（9）和（10）可分别建立局中人1和局中人2的期望收益模型如下：

max1/2v+1/3v+1/6s.t.180x1+90x2≥v，156x1+180x2≥v；175x1+80x2≥v，150x1+175x2≥v；1-α190x1+100x2+α175x1+80x2≥1-α+αv；1-α158x1+190x2+α150x1+175x2≥1-α+αv；v≤，x1+x2=1，x1≥0，x2≥0. （11）

和

min1/6w+1/3w+1/2s.t.180y1+156y2≤w，90y1+180y2≤w；190y1+158y2≤，100y1+190y2≤1-α175y1+150y2+α190y1+158y2≤1-αw+α；1-α80y1+175y2+α100y1+190y2≤1-αw+α；w≤，y1+y2=1，y1≥0，y2≥0.（12）

对于给定的参数α∈0，1的特定的值，利用线性规划的单纯形法[8，9]分别求解式（11）和（12），可得到局中人1的最小最大策略x*和其最小收益*=v，v，与局中人2的最大最小策略y*及其最大损失*=w，w，，不妨设α=0.6，可以得到x*T=（0.791 7，0.208 3），*=（155，161，165），y*T=（0.262 3，0.737 7），*=（157，162，166）.显然*

5结束语

根据Li[7]提出的区间数的比较方法，提出了一种新的基于区间数比较的三角形模糊数的排序方法，将支付值为三角形模糊数的模糊二人零和对策的求解转化为求解一个含有参数α的多目标线性规划模型，所得的局中人的最优策略和对策值是三角形模糊数，这个结果与Bector et al.[2]，Campos[3]，Campos et al.[4]中所求得的局中人的最优策略和对策值是不同的.尽管所提出的模型和方法在一个数值实例中具体阐述了，这种方法也可以运用于解决其他的竞争对策问题，如在经济，金融和管理等领域.此外，提出的三角形模糊数的排序方法可以推广至梯形模糊数的排序，并且提出的排序方法和模型也可以运用到支付值为三角形模糊数的多目标二人零和对策.今后将进一步研究更多有效的求解模糊二人零和对策的方法.

参考文献

[1]李登峰.模糊多目标多人决策与对策[M].北京：国防工业出版社，2005.

[2]C R BECTOR， S CHANDRA， V VIDYOTTAMA. Duality in linear programming with fuzzy parameters and matrix games with fuzzy payoffs[J]. Fuzzy Sets and Systems，2004，146（2）： 253-269.

[3]L CAMPOS. Fuzzy linear programming models to solve fuzzy matrix games[J]. Fuzzy Sets and Systems，1989，32（3）：275-289.

[4]L CAMPOS， A GONZALEZ， M A VILA. On the use of the ranking function approach to solve fuzzy matrix games in a direct way[J]. Fuzzy Sets and Systems，1992，49（2）：192-203.

[5]M CLEMENTE， F R FERNANDEZ， J PUERTO. Paretooptimal security strategies in matrix games with fuzzy payoffs[J]. Fuzzy Sets and Systems，2011，176（1）：36-45.

[6]D F LI， F Y HONG. Solving constrained matrix games with payoffs of triangular fuzzy numbers[J]. Computers and Mathematics with Applications，2012，64（4）：432-446.

[7]D F LI， J X NAN， M J ZHANG. Iterval programming models for matrix games with interval payoffs[J]. Optimization Methods and Software，2012，27（1）：1-16. [8]王正东.数学软件与数学实验[M].北京：科学出版社，2010.

[9]张宜华.精通matlab5[M].北京：清华大学出版社，1999.

经济数学

2015年3期

模糊二人零和对策的纳什均衡求解

杂志排行

经济数学的其它文章