一种面向移动三支决策模型的有效性度量方法研究
2021-12-08郭豆豆姜春茂
郭豆豆,姜春茂,杨 翎
(哈尔滨师范大学 计算机科学与信息工程学院,哈尔滨 150025) E-mail:hsdrose@126.com
1 引 言
决策是人类生产和生活中的普遍行为.当人们在进行接受、拒绝、暂不做决定三者间利弊权衡时,会自发地运用一种三支策略.基于粗糙集理论中一个概念的正域、负域和边界域的语义解释,特别在决策粗糙集中,姚一豫教授提出三支决策理论[1].三支决策的基本思想是将一个整体划分成3个两两互不相交的部分,然后根据每个部分的特点来做出相应的策略,从而实现特定的目标.三分而治是一种符合人类认知的问题处理策略,是一种有效的决策和信息处理模式,其广泛应用吸引了大批专家学者对此进行研究,产生了众多的研究成果,并成功应用于多个学科领域[2-6].进一步地,姚一豫教授分析了三支决策的基本成分以及和其它理论的关系,提出三支决策理论基本框架[7,8].对于三支决策,决策可以进一步解释为处理、分析、求解、计算等,近些年来,基于三支决策理论出现了大量的”三支+”成果.胡宝清教授[9]提出三支决策空间问题,李小南教授[10]提出了三支拟阵,祁建军、李金海和魏玲等人[11,12]提出三支概念分析,姚景涛教授[13,14]提出了三支博弈论,折延宏等人[15]提出了多值逻辑的三支近似,刘盾、梁德翠等人[16,17]提出了三支决策的时空性以及三支决策的直觉模糊集理论,于洪教授[18-20]提出了三支聚类,方宇和闵帆等人[21]提出一种基于代价敏感的三支属性约简,孙秉珍等人[22]提出了基于多粒度模糊决策理论的三支决策粗糙集,李华雄等人[23,24]提出了序贯三支决策.这些研究成果极大的拓展了三支决策的研究视野,促进了该领域的发展.
三分而治是三支决策的基本思想,分、治、效是三支决策的3个基本要素.三支决策模型的有效性依赖于合理的三分以及对三分区施加的策略,一个基本的研究热点在如何去度量分和治的有效性.当前在对于三支决策的研究主要集中于分和治,关于效的研究少之又少.在关于”效”的研究方面,2017年高聪和姚一豫[25]提出一种基于对象移动策略的三支决策,2018年,姜春茂和姚一豫[26]首次提出”效”的度量,开辟了三支决策TAO模型中的”效”的研究,通过权衡治略对象在移动前后产生的收益和代价来进行治略效果的评价,然而在文末仅仅给出一个效用度量的框架,并未涉及如何进行效用度量的研究.本文关注于治和效这两步,在文献[26]效用度量框架基础上,提出一个基于移动的三支决策模型的比例效用度量方法.
本文组织如下:第2节对三支决策及其相关工作进行了回顾,介绍了两类最新三支决策模型;第3节给出了基于比例效用函数的三支决策模型治略的有效性度量方法;第4节建立了移动三支决策模型的效用度量方法,详细讨论了在基于对象独立治略、等价类独立治略以及区域独立治略的效用度量方法,并在第5节分别给出相应的实例分析;最后给出了全文总结以及下一步要开展的研究工作.
2 三支决策及其相关工作
三支决策作为一种朴素的同时包含 “分”、“治”和“效”的三层次决策理论[28],其相关研究可以分别关注于分、治、效3个不同阶段,每个阶段都有其各自的研究热点,而三者又是缺一不可,密不可分,完整统一的.
首先回顾两类最新的三支决策模型,即三支决策TAO模型以及基于移动的三支决策模型.
2.1 三支决策TAO模型
三支决策的TAO模型在原有的分治模型基础上,增加了第3个要素—效,形成分治效结合的三支决策TAO模型,三支决策也由原来的两步:第1步合理划分三分区域,第2步根据划分后的三分区域制定最优的策略,进行三分区的治略,增加了第3步,对治略后的三支决策模型进行有效性度量.
图1表示由分、治、效三步结合的三支决策TAO模型,展现了分、治、效这三者之间的关系.它包含自上而下和自下而上的两种模式,其中自上而下模式,也就是一种通过三分来设计策略的三支决策模型,目前绝大多数的三支决策理论的研究都是基于这种自上而下的模式,通过一个合理的三分区域的划分来设计具有针对性的策略;另一种是自下而上的模式,是通过对三分区的对象施加策略来调整三分区域.目前在自上而下的三分设计治略的模型的研究中,可以看到一种三支决策分治模型.对于自下而上的治略调整三分的研究中,可以看到一种基于移动的三支决策模型.在基于移动的三支决策模型中,通过对三分区域的对象施加治略,对象的位置发生变化,使得对象在三分区域间发生移动,从而形成一个新的三分区域.本文在这种基于对象移动的三支决策基础上,进行治略的有效性度量研究.
图1 三支决策TAO模型Fig.1 Trisecting-acting-outcome model of three-way decisions
2.2 基于移动的三支决策模型
从广义三支决策的视角出发,定义一个将整体分成3个独立部分,并对每一个部分进行分别治略的三支决策模型.
定义1.假设OB是一个有限非空集合,C是一个有限的标准集.基于标准集C,OB被划分成3个两两不相交的部分P1,P2,P3,记为π={P1,P2,P3},即f:OB→π其中,P1∪P2∪P3=OB,且P1∩P2=∅,P1∩P3=∅,P2∩P3=∅.
文献[25]提出一个基于移动的三支决策模型的基本框架,文献[26,27]进一步研究了基于对象移动的三支决策模型,三分区域在治略的作用下,区域中的对象会发生移动,对于治略促使下的对象移动有如下定义:
定义2[26].给定三分区域π={P1,P2,P3},分别用P1,P2,P3表示对象在区域P1,P2,和P3中的位置.对于∀x∈OB,让pπ(x)表示一个对象x在三分区域π中的位置,即:pπ(x)=pi,i=1,2,3.
在基于移动的三支决策模型中,区域中的每个对象可能会有3种移动结果,对于三分区而言,会发生9种不同的移动:
P1~→P1,P1~→P2,P1~→P3,
P2~→P1,P2~→P2,P2~→P3,
P3~→P1,P3~→P2,P3~→P3.
其中对于pi~→pj,pi表示对象移动之前在三分区的位置,pj表示对象移动之后在三分区的位置.
3 基于比例效用函数的三支决策模型有效性度量
在本节介绍了基于比例效用理论的有效性度量方法,通过比例效用函数进行治略的有效性度量,并提出一种基于比例效用函数的三支决策模型的有效性度量方法.
3.1 比例效用理论
在现实的决策过程中,由于客观事物发展的不确定性和人类认知能力的有限性,一个决策的做出,通常需要根据决策者的心理行为,需要在客观因素基础上,充分考虑到决策者的经验、才智、胆识以及决策力等多种主观因素.如果仅仅根据期望值大小作为决策的依据,往往不能很好的达到决策者的心理预期.效用是带有决策者主观意识的体现,而效用值可以直接体现出决策者对决策的满足程度,可以用来度量决策者对决策方案的满意度.
在传统的期望效用理论中,效用函数通常是根据实际的收益值或损失值来确定,通过概率形式表现.然而在现实决策中这往往不能很好的达到决策者的心理预期.例如一个经典的实 验案例,对于包含两种状态变量的两种决策方案I1={4000,0.8}和I2={3000,1},分别表示方案I1以80%的概率获得4000收益,方案I2以100%的概率获得3000收益.在传统的期望效用理论中,可以得到0.8×U(4000+X)>U(3000+X),其中U(X)为期望效用函数,但其具体形式目前尚未明确.显然通过期望效用理论可以得出结论,方案1的期望效用值高于方案2的期望效用值,然而在实际中,人们却更多的倾向于方案2,尽管也存在一部分人选择了方案1.再例如对于获取1000元的收益,对于拥有巨额财富的富人而言很难动心,但是对于一无所有的穷人而言是很难抗拒的.而比例效用理论[29-31]的提出可以很好的解释诸如上类问题.
比例效用理论提出根据决策前后的决策对象质量变化量ΔQ和最终状态量Q0+ΔQ的比例值作为效用值,即:
(1)
其中,Q0表示决策对象质量初始量.
相比于传统的效用理论,它最大的优点是同时考虑绝对量和变化量作为效用的度量,并且效用函数形式明确,基于此,本文将以比例效用函数作为治略的效用度量依据,进行治略效果的有效性度量.
3.2 比例效用的度量框架
在众多的三支决策模型中,对模型优劣的评价,往往依赖于对三分和治略效果进行定量和定性的衡量,需要分别对三分和治略进行有效性的度量.目前,在三支决策模型的有效性度量上,有一个统一的框架[32]:
Q(π′|π)=Q(π′)-Q(π)
(2)
在这Q(π′|π)表示通过对三分区π施加策略后促使新的三分区形成后的质量变化,即治略的效果,Q(π)和Q(π′)分别表示三分区和新的三分区的质量.在这质量可以解释为收益、损失、风险、效用等.目前的研究中,文献[26]是通过衡量收益和损失,给出一种移动治略的有效性度量方法,并提出了一个基于效用函数的三分区度量框架:
(3)
基于上述效用度量,本文介绍一种三支决策模型的效用度量方法—比例效用度量,给出如下假设:
假设1.比例效用函数中,对象质量在治略后,增加量无上限,损失量最多为其本身的质量.
假设2.敏感度的设立,决策者对治略效果的效用值的敏感度不是无限的,存在上限和下限.当效用值高于某个数值或者低于某个数值时,决策者不再敏感.
鉴于比例值的范围是0-1.做如下几点考虑:
iii)敏感度的上限通常小于1,一个很好的解释,投票选举中,当票数超过一半的时,效用值的增加,不会使得决策者敏感.
基于上述i)-iv)的描述,在这给出一个基于对象移动的三支决策模型的效用度量定义如下:
定义4.对于∀x∈OB,对于三分区域的比例效用度量u:OB×∏→R,定义如下:
(4)
根据公式(4),讨论两个边界条件.当治略后,对象U治略后质量的增加量趋近于无穷大时和质量减少量趋于于对象本身的初始量时,效用值分别如下:
(5)
根据边界条件,不难发现,当治略对象的质量初始值固定时,治略产生质量增加量接近于正无穷时,此时效用值为1;当治略产生质量减少量接近于治略对象的初始值,此时效用值为负无穷.基于此,可以得出如下结论:
结论1.在三支决策模型的比例效用度量中,给定三分区的治略,治略产生的比例效用值存在上限,但不存在下限.
上述结论1满足决策者在度量收益和损失时具有损失厌恶的性质,即损失给决策者带来的效用大于同等收益带来的效用,并且当损失到对象本身质量时,决策者的效用达到极低值.
3.3 基于收益和代价的治略度量框架
在三分区域上施加一个动作a,会导致对象发生正移动或者负移动,在移动前后对象的质量对比上,正移动的治略变化量记为Q+,Q+,根据不同实际中质量的解释,可以是如下两个不同的定义:
Q+=Q(π′)-Q(π)
(6)
或者:
Q+=Q(π)-Q(π′)
(7)
通常,在基于风险,信息熵,基尼系数等情况下的评价函数,使用公式(7),在基于收益,方差等情况下的评价函数使用公式(6).不失一般性,讨论基于公式(6)的度量框架,令Q(π′)>Q(π)表示正移动,即正移动使得质量增加,记正移动为~→+;令Q(π′) 通过对发生移动的对象进行正、负移动的讨论,给出了如下的一个矩阵定义: 定义5.对于∀x∈OB,对象x发生正负方向移动被如下3×3二元组的移动矩阵给出: (8) 在本文讨论的移动三支决策模型中,即便同一区域中对象发生相同的移动也会有不同的移动效果.移动矩阵通过二元组的形式考虑了一个对象所有可能发生的移动,但是实际上一个对象在移动前后的三分区位置是固定的,也就是说在移动矩阵中仅仅存在一个元素会被用到. 为了研究移动产生的收益和成本,文中假设在正移动中,相同的移动有着相同的收益,在负移动中,相同的移动有相同的代价.使用b表示收益,c表示损失,其中q0(pi(x))表示位于区域pi的对象x的质量初始值.下面给出一个收益矩阵和代价矩阵的定义: 定义6.在基于移动的三支决策模型中,对象移动产生的收益通过一个3×3的移动收益矩阵表示: (9) 其中,b(pi,pj)>0. 对象移动产生的代价通过一个3×3的移动代价矩阵表示: (10) 其中,c(pi,pj)≤0. 基于移动的角度研究三支决策的治略变化,首先需要考虑到移动度量的主体,既可以从单个对象的角度,也可以从多个对象的角度,包括但不局限于划分类、三分区等等.从度量的视角,这也自然可以看作是一个从粒度由细变粗的思考过程. 本节在移动三支决策模型的基础上研究治略的有效性度量方法,不失一般性,分别讨论基于对象独立治略、基于等价类独立治略和基于区域独立治略的三支决策模型的效用度量方法.其中,在基于对象独立治略的三支决策中,每个对象作为独立个体进行治略,讨论其受到策略施加的影响,并且个体间变化情况是相互独立、互不影响的;同样的,在基于等价类独立治略的三支决策中,每个等价类作为独立个体进行治略,讨论其受到策略施加的影响,但是等价类中的单个对象受到治略影响不尽相同,因此存在同一等价类采取相同策略,然而类内对象变化情况不同的情况;此外,在基于区域独立治略的三支决策中,仅仅考虑区域整体受到策略施加的影响,考虑了一种特殊情况:同一区域中的对象发生相同移动会带来相同的收益和代价,区域中所有对象都服从同一移动矩阵.因此,可以说三者相互区别又相互联系. 在基于对象独立治略的三支决策模型中,考虑区域中单个对象的收益损失值,例如在军事伤员救治中,每一个伤员都是一个独立的个体,需要对每一个对象分别进行救治. 定义7.根据移动前后对象的移动效果,定义发生正向移动的对象,产生正效用: (11) 发生负向移动的对象,产生负效用: (12) 定义8.在基于移动的三支决策模型中,正移动产生的正效用通过一个3×3的移动正效用矩阵表示: (13) 其中,u+(pi,pj)>0. 负移动产生的负效用通过一个3×3的移动负效用矩阵表示: (14) 其中,u-(pi,pj)≤0. 如果对象x从区域pi移动到区域pj是发生了正移动,则t(pi,pj)(x)=1;如果对象x从区域pi移动到区域pj是发生了负移动,则t(pi,pj)(x)=0.根据正负移动的划分,正移动产生正效用值,负移动产生负效用值,对象x产生的移动效用值为: u(p(x)~→p′(x))= (15) 在基于对象独立治略的三支决策模型中,根据单个对象移动的收益和损失来计算,记效用值为: (16) 在基于对象独立治略的三支决策模型中,一个动作a产生效用度量记为: [1-t(pi,pj)(x)]u-(pi,pj)] (17) 在基于等价类独立治略的三支决策模型中,通过等价类的划分进行独立治略.例如医疗诊断中,需要通过将相同症状的患者来进行统一治疗,即等价类划分的方式来进行治略. (18) 发生负移动的对象集合产生的代价计算如下: (19) 记等价类[ot]治略前后的变化量为: (20) 定义9.在基于等价类独立治略的三支决策模型中,一个等价类治略后产生效用度量定义如下: (21) 因此,在基于等价类独立治略的三支决策模型中,三分区在一个动作a作用下产生效用度量定义如下: (22) 在基于区域独立治略度量中,同一区域中的对象发生相同移动会带来相同的收益和代价,区域中所有对象都服从同一移动矩阵,此时,考虑一个区域的整体收益损失来进行治略的有效性度量. Pπ′(x)≻Pπ(x)⟺Pπ′(x)偏好于Pπ(x) 通过区域之间的偏好关系,对象移动被如下定义: (23) 也就是说,当一个对象移动到一个比移动前更偏好的区域时,以及当对象从最高偏好的区域移动到本身时,记对象发生的移动是正移动;否则记对象发生的移动是负移动. 文献[33] 充分考虑3个区域之间的结构,给出3种三分区域之间可能存在的结构.根据区域之间的偏好关系可以给出一个正负方向的移动矩阵,例如在三分区域满足全序关系P1≻P2≻P3时,对象的正负方向移动矩阵如下: (24) 则区域Pi中对象发生负移动产生的代价记为: (25) 则区域Pi治略后的质量变化量记为: (26) 定义10.在基于区域独立治略三支决策模型中,一个区域治略后产生效用度量定义如下: (27) 因此,在基于区域独立治略的三支决策模型中,三分区域在动作a作用下产生的效用度量定义如下: (28) 在带有偏好关系的3个区域中,在这讨论全序关系下的治略效用度量,假定三分区域满足全序关系P1≻P2≻P3. 已知动作作用下可能会产生9种移动结果.基于移动策略,对象x发生区域位置变化,使得3个区域的对象基数发生变化.表1是区域治略后,对象发生移动的各区域基数. 表1 区域基数Table 1 Cardinality of the region 根据对象正负方向的移动矩阵,3个区域由于对象发生移动产生的质量变化量分别计算如下: (29) 因此,3个区域治略后产生效用值如下: (30) 在基于区域独立治略的三支决策模型中,三分区在一个动作a作用下产生效用度量定义如下: U(π~→aπ′)=u(P1)+u(P2)+u(P3) (31) 实例1.在医院的患者分类中,通常需要根据患者病情等级划分到3个区域:严重,中度,轻度.分别用P1,P2,P3表示这3个区域,不同的区域采用不同的治疗方案,同一对象如果被分到不同的区域,可能会有不同的治疗成本以及治疗效果.假设OB={o1,o2,o3,o4},π={P1,P2,P3},其中,P1={o1,o2},P2={o3},P3={o4},记这4个对象的初始值分别为:3,5,5,90.假设决策者对于4个对象治略后效用值的敏感度下限分别是0.1,0.1,0.2,0.3.假设4个对象的移动矩阵分别为: 对象移动产生的收益矩阵和损失矩阵如下: 根据公式(11)、公式(12),可以计算如果对象o1发生移动是正移动,则产生的正效用值为: 如果对象o1发生移动是负移动,则产生的负效用值为: 则根据公式(15),可以计算对象o1发生移动效用值为: 1×0.4+(1-1)×(-0.5)=0.4>0.1 类似地,可以计算对象o2,o3和o4移动产生的效用值为: 根据给出的敏感度下限,不难发现,仅有对象o1治略后的效用值达到决策者的预期,对象o2,o3和o4不能满足决策者的预期,尽管对象o4的治略结果是收益的. 实例2.在医疗诊断中,通过对病人的病情诊断,需要将症状属性相同的病人划分到一类,然后对每一类病人分别进行治疗,即通过划分等价类的方式来分类治疗.如实例1,假设等价类[o]={o1,o2,o3,o4},对象发生正负移动的移动矩阵,收益矩阵和代价矩阵均和实例1相同,即已知: 假定决策者对于效用值的敏感度下限是0.2,根据公式(20),等价类[o]的变化量可以计算得到: bc([o])=2+(-1)+(-2)+30=29 动作施加后等价类[o]的初始量可以计算得到: q([o])=3+5+5+90=103 根据公式(21),等价类[o]的效用可以计算得到: 通过对等价类的治略,产生效用值为0.220>0.2,即治略的效果达到决策者的预期,满足决策者的治略效果要求. 实例3.在投票选举中,候选者通常需要通过采取一些措施来影响选民的选举.对于选民来说,在某一时期,可以将选民集合划分到3个区域中:支持,不确定,反对.分别用P1,P2,P3表示这3个区域.候选者通过对不同区域分别采用不同的措施来增加自己的选票.此时,3个区域满足严格的偏好关系,P1≻P2≻P3,根据对象的移动矩阵、收益矩阵和代价矩阵,直接给出治略后,对象在区域间移动产生的代价或收益,记对象移动产生的变化量为v(Pi~→Pj).当对象移动是正移动时,v(Pi~→Pj)=b(Pi~→Pj),当对象移动是负移动时,v(Pi~→Pj)=c(Pi~→Pj),表2表示在不同区域中的对象移动变化的质量变化. 表2 质量变化Table 2 Change of quality 假设共有选民1000名,在某一时期,有600名支持,250名不确定,150名反对,记3个区域的质量初始值分别是600,250,150.经过对3个区域分别施加策略,形成新的三分区,表3表示由于移动引起的区域变化后的各区域基数矩阵. 表3 区域基数Table 3 Cardinality of the region 此时,选民中支持的人数增加到700,不确定的人数下降到220,反对的人数下降到80.根据公式(29)和公式(30),对于3个区域的治略方案的度量结果可以计算如下: 区域P1在相应策略下产生的质量变化量以及比例效用值为: =580·1+10·(-0.5)+20·(-1) =555>0 区域P2在相应策略下产生的质量变化量以及比例效用值计算如下: bc(P2)=|P2∩P1|·1+|P2∩P2|·(-0.5)+|P2∩P3|·(-1) =40·1+200·(-0.5)+10·(-1) =-70<0 区域P3在相应策略下产生的质量变化量以及比例效用值计算如下: =80·1+10·(-0.5)+50·(-1) =25>0 当决策者对3个区域的效用值敏感度下限分别为0.5,0.1和0.1时,不难发现对于区域和区域的策略的效用值在敏感度下限之下,也就是说,单纯从这两个区域的策略效果来看,不能满足决策者需求. 本文给出一种三支决策模型的有效性度量方法,基于比例效用函数的移动三支决策模型效用度量,进一步扩充了三支决策TAO模型中效的理论研究.通过文中讨论可以发现,当治略主体(包括单个对象、划分类、三分区域等)不同,度量方式不同,决策者对于效用值的敏感度也不同.然而文中在对于决策者的效用值的敏感度上仅仅介绍了敏感度存在下限,并未涉及对敏感度的上限讨论,以及敏感度的存在用处.在今后的研究工作中对于决策者对治略效果的敏感度问题仍需要进一步详细讨论. 三支决策理论是一类符合人类认知的粒计算模型,“3”是一个基本的思考出发点.在三支决策TAO模型中,T、A、O关注从3个不同的角度、3个不同的层次、3个不同的视角描述了现实问题解决过程的3个基本阶段.当前在三支决策理论研究中,众多专家学者聚焦于T&A的研究,关于O的研究少之又少.然而,2018年TAO模型的提出,引发了越来越多的专家学者对“效”的研究,O逐渐出现在人们的视野中.本文考察一种特定三支决策模型有效性度量,从移动三支决策的视角出发,介绍一种面向移动三支决策模型的有效性度量方法--比例效用度量. 在未来的研究工作中,我们将进一步研究其它情况下的三支决策有效性的度量方法,例如通过更多的度量方法来评估三支决策.当前三支决策正处于快速发展时期,方兴未艾,有许多理论和应用都需要并且值得我们进行深入研究和探索.4 基于移动的三支决策模型的有效性度量方法
4.1 基于对象独立治略的移动效果度量
[t(pi,pj)(x)]u+(pi,pj)+
[1-t(pi,pj)(x)]u-(pi,pj)]4.2 基于等价类独立治略的移动效果度量
4.3 基于区域独立治略的移动效果度量
5 实例分析
6 总结与展望