三元思维: 三支决策理论与实践
2022-06-07索郎王青杨海龙姚一豫
索郎王青,杨海龙*,姚一豫
(1 陕西师范大学 数学与统计学院, 陕西 西安 710119; 2 加拿大里贾纳大学 计算机系, 里贾纳 S4S 0A2)
三元思维反映了人类认知的普遍习惯, 即从多种角度思考问题。 Yao提出的三支决策的基本哲学是三元思维, 即通过三个独立且相关的部分来解释和处理一个整体[1-2]。 三支决策的主要思想就是三分而治, 将一个整体合理地分为3个部分, 并采取有效的策略处理每个部分, 从而获得所需要的效果。 三支决策自提出后, 引起了国内外诸多学者的关注并对其模型进行了研究和拓展。
1 三元思维与广义三支决策
思维是人对客观事物本质特征和内在规律的反映,是智力的核心。 常见的思维模式包括一元思维、二元思维和三元思维, 分别可以理解为只考虑单个个体的特征、考虑2个个体之间的关系和考虑3个个体之间关系的思维。 其中,三元思维更符合日常处理问题的实际情况。受三元思维启发并提取不同领域中三元思维的思想, Yao提出了广义三支决策,其主要思想是以三为本、基三思维、用三而治, 是基于“三”的思维方式、基于“三”的问题求解方法和基于“三”的信息处理模式[3-7]。三支决策的哲学思想是一分为三和三合为一, 既有分, 也有合。“一”表示整体,“三”表示部分, 将一个整体分为3个部分,将3个部分归为一个整体。 分分合合, 从部分观整体, 从整体察部分, 周而复始, 循环上升。 三分而治从形式上给出了三分法的一个范式, 三分指将一个整体W分解为3个部分, 其结果是一个三元组(X,Y,Z),其中X、Y、Z表示3个部分; 治又分为两部分, 其一是采用一个策略集合S处理三元组(X,Y,Z),其二是对处理结果的聚合, 得到对整体W的一个综合结果。 因此, 三分法范式可以简单地记为“分、解、合”范式。针对不同的问题, 三分的方法不同, 对于三元组的解释也不同; 针对不同的策略集, 处理三元组的方法不同, 聚合处理的结果也不同。 三元组的结构和解释是基础, 基于对三元组的多重理解, 从三分法范式可以导出很多具体的三分法, 例如三层法、三维法、三角法、三部法、三段法等。因此, 三分而治的一般方法具有普适性, 这种普适性源于对三分法范式的不同解释。 基于三分法的“分、解、合”范式的机制和原理, 其中三元组(X,Y,Z)是核心,X、Y和Z之间的相互作用和依赖关系是关键。借助多项式的形式简单明了地解释“分、解、合”的机制和原理,加运算表示“分”和“合”, 乘运算表示部分之间的相互作用关系。 故三支决策是由三元论、三分法和三项式这三要素组成的。
综上所述, 三支决策是基于不同文化和思维体系的三元思维, 具有更广义的解释与更常用的策略和方法。 根据不同的应用, 三支决策中的“三”有多种解释, 例如,三要素、三部分、三层次、三维度、三步骤、三种类、三侧面、三粒度等。同样, 三支决策中的“决策”也有多种解释, 例如处理、分析、求解、计算等。 这说明三支决策具有更广泛的应用前景。
2 三支决策的TAO模型
三支决策的主要思想是三分而治[5]。三分是将一个整体(论域)分为3个部分(子集),3个部分并起来必须是该整体。为这3个部分制定相应的策略, 把策略实施在这3个部分上以达到最优结果。三分而治就是一个从“分”开始、以“治”结束的过程。进一步,Yao考虑了“效”的问题, 提出了三支决策的TAO(trisecting-acting-outcome)模型[6]。TAO模型就是在“分”和“治”的基础上加上了“效”而组成(如图1所示), 其基本思想是:(1)将整体分为3个部分; (2)设计处理这3个部分的策略; (3)取得理想的结果。TAO模型中的三分同样是指由这3个部分构成的三元组。其中一个或两个部分可以为空集。根据这3个部分之间的关系和性质,将三元组分成了7个类别,分别是一般三分、非空三分、不相同三分、不相交三分、不相同且不相交三分、三覆盖、三划分。目前大部分的三支决策模型使用的是三划分和三覆盖的三分方式, 而另外5种三分的方式及其特点为后续的研究提供了新的方向。
图1 三支决策的TAO模型
由图1可知,TAO模型包括三划分、行动和结果评价3个组成部分。实线表示三划分, 即将一个整体分为3个相关且相对独立的部分, 所得的3个部分称为整体的三划分。虚线表示行动,采取一套相应的策略来处理这3个部分,将产生预期的结果, 而结果评价则衡量了三支决策的有效性。TAO模型提供了三支决策的体系结构框架。基于TAO模型的基本框架,Yao研究了三支决策的集合论模型,说明了在非标准集(如粗糙集、区间集、模糊集、粗糙模糊集、阴影集、区间模糊集以及软集)上构造三支,一般先根据非标准集提供的信息定义评价函数, 再利用基于评价的三分模型将全集中的对象进行三分[7]。三支近似使得在接受或者拒绝的同时,有了第3个决策——不承诺。这为人们在不确定性下做出决策提供了有效的方法和工具。
对于三分的方法,Yao提出了2种基于对象评价的三划分模型, 一是用一对评价函数去三分, 二是用一个评价函数去三分[8]。假设U是一个有限非空的论域,基于一对评价函数和基于一个评价函数的三支决策模型分别如下。
定义2[8]设(R,≤)是一个偏序集,函数v:U→R 称为接受-拒绝评价函数。若R+、R-(R+∩R-=∅)是R的2个子集,分别称为接受的特定值与拒绝的特定值,则由v诱导的三支决策的3个区域定义为
如果(R,≤)是一个全序集,则基于一对评价函数和基于一个评价函数的三支决策模型定义如下。
定义3[8]设vp:U→R+和vn:U→R-分别是接受评价函数和拒绝评价函数。对于x∈U,vp(x)和vn(x)分别表示x的接受值和拒绝值。给定一对阈值(αp,βn),满足αp∈R+且βn∈R-,则有
定义4[8]设v:U→R是一个评价函数。对于x∈U,v(x)是x的评价值。给定一对阈值α,β∈R满足β<α,则有
对这两种模型用两极(正极与负极)做一个解释, 评价函数对论域中每个对象提供的正极或负极的信息进行相应的评价。一对评价函数的模型可以看作是用两个相反极值进行独立评价的过程, 例如使用“好坏”“上下”“黑白”“真假”“左右”“友善与敌意”;而一个评价函数的模型可以看作是一个同时考虑正负极的聚合评价过程。选择适当的评价函数对于三支决策的有效性至关重要, 根据对评价函数进行不同的语义解释,可以得出很多不同的三支决策模型。基于评价函数的模型反映了人类常用的判断、推理和决策思维, 符合两极分化的普遍做法。无论是基于一对评价函数还是基于一个评价函数的三支决策模型,都满足划分得到的3个区域是两两互不相交的,并且它们的并是整个论域U,有可能存在1个或2个区域为空集。如果仅有一个区域为空集时,则三支决策就退化为二支决策。基于评价函数的模型涵盖了三支决策适用的一大类问题。在某些情况下,该关系“≤”可以直观地解释为“优于或相同”关系。亦即,如果v(y)≤v(x),则“x优于y或与y相同”。
3 其他三支决策模型
在经典三支决策模型的基础上结合实际应用的需求, 学者们陆续从不同视角研究了许多三支决策的其他模型。
3.1 基于信息表的三支决策模型
在许多不确定性决策问题中, 决策的对象往往会涉及2个不同但又相互关联的论域。如在一个医疗诊断系统中,其同时涉及症状与疾病这2个彼此相关的不同集合。因此,学者们研究了很多基于双论域上的三支决策模型。Li等提出了基于双论域上的一般三支决策模型, 此模型将已有的基于双论域上的三支决策模型进行了统一[9]。在0-1表上定义的上下近似与论域的三划分是等价的,且评价函数加上一对阈值可以诱导出一个三划分,所以各种双论域模型就是一个0-1表加上一个特殊的评价函数和一对特殊阈值。进一步,Li等研究了一般信息表上的三支决策模型[10]。此外, 在实际应用中除了完备的信息系统外,还有很多问题面临着不完备的情形,即信息缺失或者丢失的情况,所以研究基于不完备信息系统中的三支决策模型很有必要。Liu等提出了一种基于不完备信息系统的三支决策模型,定义了一个新的关系来描述不完备信息的相似程度, 针对不完备信息系统中存在的缺失值,利用区间数获得损失函数,采用一种包含不完备信息和损失函数的混合信息表对新的三支决策模型进行处理[11]。Luo等研究了基于不完备的多粒度信息系统动态变化的三支决策更新问题,利用相似关系引起的决策粒子的更新机制,由细化和粗化来进行挖掘, 从而利用演化的粒度结构来估计条件概率的动态趋势[12]。Huang等研究了在动态环境下基于不完备混合信息系统的三支决策模型,提出了一种三支邻域决策模型[13]。更多关于不完备信息系统中三支决策的研究参见文献[14-15]。
3.2 三支决策空间
基于三支决策理论,Hu提出了三支决策空间。从决策度量、决策条件和决策评价函数这3个关键问题出发, 通过公理化方法给出了决策评价函数的定义[16]。引入了一种新的三支决策类型并讨论其特性,例如基于模糊集、随机集和粗糙集的三支决策,这些现有的三支决策都是三支决策空间的特例。三支决策空间提出之后, 学者们分别从代数结构和对评价函数的构造方面进行了推广研究。Hu等证明了基于二型模糊集、区间值二型模糊集、犹豫集和区间犹豫集的三支决策包含在三支决策空间中[17-19]。Hu介绍了从半决策评价函数到决策评价函数、从多个决策评价函数到决策评价函数的构造方法[20]。更多关于三支决策空间的研究参见文献[21-22]。
3.3 三支形式概念分析
1982年,Wille提出了形式概念分析理论。形式概念反映了内涵与外延之间的统一、彼此拥有的共同特点,但直观上还有一种信息没有被反映出来,就是作为外延的对象集所共同不具有的属性[23]。对于一个对象集而言,若同时考虑共同具有的属性和共同不具有的属性,就会很自然地将属性全集划分为三部分。因此, Qi等提出了三支形式概念分析, 从元素、集合和序的角度分别分析了对象/属性导出三支概念格与经典概念格之间的关系[24-25]。Ren等研究了对象/属性导出三支概念格的4种属性约简问题及计算方法[26]。从认知的角度,Li和Huang等提出了利用多粒度描述三支概念的公理化方法,并设计了三支认知计算系统寻找三支认知概念, 同时利用集合近似的概念模拟从给定线索学习三支认知概念的认知过程,从信息融合的角度, 针对海量数据和多源数据研究了学习三支概念的并行计算技术[27-28]。Singh研究了三支模糊概念格的描述问题, 利用单值中智集探讨了其性质[29]。另外, 在不完备形式背景方面,Yao引入不完备背景的完备化思想, 利用区间集理论, 给出了部分已知概念的外延和内涵的区间-集合表示[30]。Li等基于三支决策提出了由2个模型来构建不完备形式背景中的近似概念, 并揭示了两者的等效性[31]。Long等讨论了三支粒概念, 这是将粒计算、形式概念分析和三支决策相结合形成的概念,并提出了一种新的三支粒概念的动态更新方法, 设计了4种算法来比较所提方法和传统三支粒概念更新方法[32]。
3.4 三支聚类
聚类分析是数据挖掘与机器学习领域中的重要技术之一, 作为一种无监督学习技术, 在识别无标签数据结构方面发挥了极大的作用。聚类将数据集中的样本划分到不同的类簇中, 使得相同类簇中的样本相似度高, 而不同类簇中的样本相似度低。三支聚类是将三支决策应用到聚类分析中, 将确定的元素放入核心域中, 将不确定的元素放入边界域中,有效地降低了决策风险[33]。自Yu等提出三支聚类之后, 学者们发展了各种三支聚类算法[33]。Yu等基于三支决策与增量数据提出了一种能够处理重叠的软增量三支聚类算法,该算法采用一棵树记录初始聚类结果中的相关信息, 定义查找更新搜索树的策略完成对增量数据集的聚类[34]。Afridi等提出了使用博弈论粗糙集模型处理缺失数据的三支聚类方法[35]。Wang等提出了基于收缩和膨胀的三支聚类框架, 称为CE3[36]。Yu等提出了通过低秩矩阵实现主动三支聚类的方法,可以随着聚类过程的进行而提高高维多视图数据的聚类精度,并在真实数据集上的实验结果验证了该方法的有效性[37]。
3.5 三支冲突分析
在冲突情形中制定合理的方案,可在很大程度上降低损失。Pawlak提出了基于粗糙集的冲突分析模型, 用辅助函数和距离函数在三值信息表上建立了联盟、中立和冲突3种关系[38-39]。因为冲突分析中的联盟、中立和冲突这3种关系与三支决策中的3个域有着密切的联系, 所以学者们开始了对三支冲突分析的研究。Yao提出了一种三支冲突分析模型,通过对Pawlak模型的重新构造与扩展, 对代理的三划分和代理对的三划分进行研究, 提出了冲突的3个层次, 即强冲突、弱冲突和无冲突[40]。该模型阐明了冲突的概念和语义解释, 并消除了Pawlak模型中存在的不一致性。对于冲突分析有4种三划分:1)对代理集的三划分;2)对代理对的三划分;3)对问题组的三划分;4)对问题对的三划分。最后, 说明了基于单个问题三划分时1)和2)是等价的,基于多个问题进行三划分时1)和2)不一定等价。Lang等将Pawlak模型中的单个阈值0.5推广到了一对阈值α和β[41]。Lang等提出了基于Pythagorean模糊信息系统上的三支冲突分析模型[42]。Li等提出了基于三角模糊信息系统的三支冲突分析模型[43]。Lang等给出了一般的三支冲突分析模型,通过使用一对评价函数, 把现有的三支冲突分析模型进行了统一[44-45]。此外, 冲突分析存在3个基本问题:1)冲突的内在原因是什么?2)如何找到可行的共识策略?3)是否可以使所有代理商满意? 从这些问题出发, Sun等使用基于双论域上的三支决策模型,在双论域的框架下构建冲突决策信息系统, 并设计出找到最优可行共识策略的算法,该模型不仅提供了解决冲突分析问题的新视角和新方法,而且克服了原始模型的局限性[46-47]。
3.6 三支拟阵、三支凸系统和三支推荐系统
除了上述模型之外, 还有学者将三支决策与拟阵、凸系统和推荐系统进行结合,为三支决策的应用提供了更多的可能性。Li等提出了三支拟阵的概念,由基于子集评价的三支决策模型对原始模型进行了概括[48-50]。利用公理化方法, 用评价函数的形式描述特征拟阵, 在此特征上定义三支拟阵。随后,将三支拟阵推广到三支模糊拟阵,提出了三支模糊拟阵的等价描述和双粒度结构。Zhang等提出了三支凸系统的概念, 并给出了三支凸系统的等价刻画;另外, 根据L-凸系统提出了三支模糊凸系统的概念并建立了三支凸系统与三支模糊凸系统之间的一一对应关系[51]。Zhang等分别提出了构建三支推荐系统的框架方法和基于回归的三支推荐系统, 旨在通过调整不同行为的阈值来最小化平均成本[52-53]。这是通过分步进行的, 从简单的问题开始, 逐步发展为更复杂的问题:首先, 采用基于内存的回归方法进行二进制推荐,最大程度地减少损失;其次, 考虑分类错误的成本, 并调整方法以最小化平均成本;最后,介绍了带有促销费用的优惠券分配行为, 并给出了基于三支决策模型的两种最优阈值确定方法。
4 三支决策应用
随着三支决策模型研究的逐步加深, 三支决策的实际应用也越来越广泛。三支决策在缺乏足够的证据或准确信息难以做出决策时, 添加了延迟决策选项提供了进一步检查和调查不确定和可疑案件的灵活性。因此, 三支决策已应用于各行业各领域, 并取得了显著进展。例如, 在医疗诊断、图像识别、广告过滤、数据挖掘、机器学习等领域均有应用[54-57]。
4.1 三支决策在医疗诊断中的应用
在医疗诊断问题中, Yao等构建了基于三支决策的医疗网络支持系统模型[58]。在这个模型中, 结合博弈粗糙集对诊断中的不确定性进行了讨论, 并增加了用于风险分析的决策模块。通过对患者的症状数据与诊断错误代价的整体评估, 从三支决策的角度建议患者基于最小风险进行决策, 即立即治疗、免于治疗或者进一步评估诊断。在不同的医疗保健数据集上使用该方法的实验结果表明, 该方法可以提高医学领域以及其他领域决策的整体质量。此外, Li等根据决策者3种不同的决策风险偏好提出了一种风险三支决策模型,并为各种风险偏好决策提供了有效的解释[59]。Sun等使用双论域的三支决策概念推导决策规则,给出了2种特殊的乐观与悲观模型,通过使用不同的参数, 提出了一种解决多属性群决策问题的新方法[60]。Liang等提出了对偶犹豫模糊环境下的三支决策方法[61]。一般的三支决策模型是有2个状态3个动作的二分类问题,然而在医疗诊断中, 决策者可能面临的状态集是多分类的情形。因此, Liu等研究了多分类的三支决策模型[62],Zhou提出了一种多分类三支决策的新公式[63],为用户提供了进一步检查可疑对象的灵活性,从而减少了错误分类。这些方法都应用于医疗诊断和紧急血液运转问题当中, 充分说明了其有效性。
4.2 三支决策在投资管理中的应用
Liu等研究了三支决策在投资管理决策中的应用, 其中正域表示投资,负域表示不投资, 边界域表示延迟投资, 搜集到足够的有用信息时再做决定[64-66]。这种方法降低了投资风险,同时可以很有效地对投资者进行风险管理。在三支决策的应用当中确定损失函数的损失值是关键问题之一, 损失函数可以用其他更直观的概念定义和解释, 比如时间、金钱、人力资源等度量或者是不同后果的危险程度。从这个角度出发,Liang等给出了当损失函数分别为犹豫模糊数、直觉模糊数、Pythagorean模糊数和对偶犹豫模糊数等不确定性度量时的三支决策方法, 并分别应用于能源项目的选择、农业生态地区的投资决策、软件开发、项目开发以及项目投资评估当中[67-71]。通常, 在投资开发新产品前需考虑如何选择要投资的产品。为此,Liang等把语言评价引入到三支决策中设计了一种支持多属性群决策一致性改进的自适应算法, 这为投资提供了一种保障[72]。另外, Ye等提出了基于模糊邻域算子一种新的三支决策方法, 应用于项目投资[73]。
4.3 三支决策在人脸识别与邮件过滤中的应用
为了有效地对面部图像进行识别, 通常将需要的信息先进行分类以达到预期效果,因此找到一种精确的分类器以实现较低的误分类误差很重要。在已有的人脸识别研究中假设所有误分类成本均相同,而在实际应用中, 由于不正确的分类错误成本和高质量的面部图像信息不足,这种假设是不合理的。为了解决此问题,Li等将序贯三支决策应用于人脸识别中, 在决策过程中制定顺序策略。在每个决策步骤中都寻求一个将误分类成本最小化的决策, 并将边界决策合并到决策集中, 以便在可获得的高质量面部图像信息不足以进行精确定位时可以做出延迟决策[74]。随后, Li等提出了基于深层神经网络的序贯三支决策, 考虑了不同决策阶段的误分类成本和测试成本[75]。 序贯三支决策方法为人脸识别中的人类决策提供了适用的模拟方法, 可模拟从粗糙粒到精确粒的序贯决策策略。通过在面部图像数据库上的实验, 验证了所提方法的有效性。更多关于三支决策在人脸识别中的应用研究参见文献[76-77]。
而在邮件过滤问题中, Zhou等提出了基于三支决策的邮件信息过滤系统[78]。在三支垃圾邮件过滤系统中,三支决策的3个域分别描述用户对邮件信息感兴趣、不感兴趣和中立。在原有的2个电子邮件文件夹的基础上添加了一个可疑文件夹, 以允许用户进一步检查可疑电子邮件,从而减少错误分类的可能性。该方法降低了将合法电子邮件误分类为垃圾邮件的错误率, 并在成本敏感性方面表现出更好的性能。
4.4 三支决策在其他方面的应用
三支决策除了上述应用之外, 还在其他方面得到广泛应用。Liang等提出了基于群决策的三支决策方法, 并应用于供应管理[79]。Sun等提出了基于语言信息的三支决策方法, 该方法应用于非常规突发事件的应急决策问题[80]。Jiao等提出了基于单值中智信息下的2种新的三支决策模型, 应用于早餐店选址问题[81]。Zhang等根据多粒度三支决策原理提出了基于双论域上的可调整的方法, 应用于人与工作之间是否匹配的问题[82]。 在多阶段的决策问题方面,Liu等把三支决策与逻辑回归相结合提出一种新的判别分类方法, 应用于企业失败预测和学生选课预测[83]。Li等提出了基于三支决策新的邻域分类器,由信息和知识粒度的概念将序贯三支决策解释和实现为多层次的三分法和行动框架, 从而可以更快地进行决策且决策过程的成本更低[84]。Yang等使用序贯三支决策进行多类别决策,并提出了一个统一的动态三支决策框架,可以更低的总体决策成本实现更快的决策过程[85-87]。Hao等利用序贯三支决策研究在动态多粒度决策表中最优规模选择问题[88]。这些方法分别应用于数据挖掘和机器学习等领域,扩展了三支决策的应用范围。
5 总结与展望
本文提出了三元思维的概念,并从三元思维的角度回顾了三支决策的现有工作。三支决策的主要思想是将一个整体划分为3个两两不相交的部分, 并且对不同的部分根据具体情况采用不同的处理方法。因其思想的朴素性与实用性, 三支决策遍布于生活中的各个方面。三支决策作为三元思维的理论普遍适用于许多学科和领域, 它为复杂问题的求解提供了一种有效的策略, 现已成为诸多领域的研究热点。
目前,三元思维在自然科学和工程技术当中的研究较少, 在自然科学和工程技术中对三元思维进行形式化表示是未来的工作方向。另外, 由于三支决策是一种符合人类认知的决策模式,具有非常强的普适性和应用性,为人们提供了一种很好的处理问题的方法。三支决策以三为本,聚焦三元哲学、三元方法和三元机制; 基三而思, 探索三分而治的理论和模型; 依三而行, 寻找三分而治在不同领域的实践和应用。从模型、理论以及应用3个方面对三支决策进行拓展是未来的一个研究方向。在模型和理论方面, 进一步从不同的学科视角进行思考与融合, 将三支决策与其他更多的理论相结合。在应用方面,需尽可能将三支决策应用领域扩大, 比如在情感分析、智能系统、人工智能等中的应用。