基于Agent的多属性决策模型及其在高校实验教学中的应用
2021-04-23伍京华耿翠阳韩佳丽
伍京华,耿翠阳,韩佳丽
中国矿业大学(北京)管理学院,北京100083
基于Agent的自动谈判通过发挥Agent的主动自治等人工智能特性模拟人们开展实际商务谈判,在降低谈判成本的同时帮助人们提高谈判效率和效果,因此一直处于商务智能研究前沿[1]。2020 年突发的新冠肺炎疫情横扫全球,更是迫使人们不得不采取该方式代替传统的面对面商务谈判,在保证复工复产的同时降低传染风险,这就为该领域的发展带来了前所未有的机遇和挑战[2]。
实际商务谈判往往是多属性的,但由于谈判属性性质不同,决策模型也不同,导致基于Agent 的自动谈判中的多属性决策问题一直未能很好解决[3],进而导致Agent的人工智能优势在其中发挥还不够理想,所以对其中多属性决策的研究具有重要的理论意义和实际价值。
现有的多属性决策研究主要集中于权重设定和方案的感知价值计算,但都有进一步提升的空间。例如,在权重设定方面,刘小弟等根据属性值的均值、方差以及属性间的关联度建立属性权重确定模型[4]。陈业华等采用TODIM法,综合考虑方案和属性两个层面,构造相应的权重优化模型[5]。王铁旦等提出将准则相对重要程度以犹豫模糊数表示,通过形成犹豫模糊偏好关系计算最终属性权重[6]。以上研究仅关注决策信息的模糊性,且仅从客观角度确定权重,均有待改进。在方案的感知价值计算方面,包顺等结合前景价值函数,通过转化价值矩阵对备选方案排序[7]。闫书丽等提出一种基于累积前景理论和灰靶思想的决策方法,通过构造正负椭球灰靶模型对方案排序[8]。马庆功针对属性指标值为犹豫模糊信息且权重未知的决策问题,提出基于新的决策参考点和前景理论的多属性群决策方法[9]。王应明等考虑决策者对指标集的偏好和决策者的风险心理因素,提出逼近理想解和前景理论相结合的多属性决策方法[10]。以上研究仅考虑决策者对待损失时的规避程度,容易夸大风险,从而影响决策结果的准确性。
上述研究除具备以上提升空间外,与基于Agent的自动谈判结合并进行基于Agent 的多属性决策的研究也还不多见,这就为该领域进一步拓展留下了更多宝贵的改进机会。例如,吴静杰等基于Agent的态度偏好及心理特征,构造新直觉模糊得分函数,并结合直觉模糊熵构建相应决策模型[11]。危小超等结合心理学,以后悔理论为基础,设计出一种能够根据历史信息建立学习规则的Agent 体系,从进化博弈的角度构建决策模型[12]。Ghorbani等基于模糊最小二乘策略,结合博弈论提出新的基于Agent的迭代学习方法,并通过构造内部策略模型和近似最优策略学习模型构建相应决策模型[13]。以上研究虽然从不同角度构建了相应的决策模型,但对模型中的权重设定及感知价值计算合理性方面的推进程度仍旧不大,因此亟待解决。
针对以上不足,本文结合Agent 的人工智能优势,首先采用犹豫模糊数,将属性分为外部因素属性和内在价值属性,建立相应的犹豫模糊评价矩阵并进行评价值规范后构建相应主观权重算法;其次结合目标优化模型和拉格朗日函数构建相应客观权重算法,进而提出改进的综合权重算法;再次,在前景理论基础上,引入损失规避因子,将正负理想点作为双参考点,设定相应算法计算各属性与正负理想解的距离,并将其作为新参数加入感知价值函数,从而提出基于改进综合感知价值函数的总体优势度算法,最终构建出基于Agent的多属性决策模型;最后,以某高校实验教学设备采购谈判为例,通过对结果的敏感性分析和与相关研究的比较分析验证模型的有效性和优越性。
1 模型
构建合理有效的基于Agent的多属性决策模型,首先要建立合适的多属性犹豫模糊评价矩阵,并对其中的属性评价值个数进行规范化处理;其次要设计相应的权重确定算法及对该方案的综合感知价值算法,并将二者结合后得出最终针对各方案的总体优势度,最后根据总体优势度的大小完成决策。
在构建模型之前,假设基于Agent的多属性决策中有m个方案A={A1,A2,…,Am}(i=1,2,…,m)和n个属性G={G1,G2,…,Gn}(j=1,2,…,n),属性权重集W={W1,W2,…,Wn} ,且满足,犹豫模糊数hij表示方案Ai满足属性Gj的程度。
1.1 犹豫模糊评价矩阵及评价值个数规范
现有的基于Agent 的多属性决策研究多从成本收益角度出发,将属性分为成本型和效益型[14],而实际还存在其他类型。由于犹豫模糊集对不确定决策信息表达具有明显优势,因此,本文采用犹豫模糊数,将属性分为外部因素属性和内在价值属性,并将这两种属性的犹豫模糊评价值分别设为hij=hij和补集hij=hcij,建立相应的犹豫模糊评价矩阵为:
此外,在基于Agent 的多属性决策中,不同专家对不同属性评价值不同会导致评价值个数不同,不利于决策。因此,本文采用公式(2),对同一属性下评价值个数不同的任意两个犹豫模糊数进行规范,使其个数相同。
其中,γi为犹豫模糊数中第i种类型的元素个数,ni为对应元素个数为γi的个数,ε为调节参数,取值范围为0~1,且所有调节参数之和为1。
1.2 基于犹豫模糊数和目标优化模型的综合权重确定法
现有的基于Agent 的多属性决策多采用客观权重[4],而鲜有的采用主观权重确定法的研究也只给出单一偏好值[15]。但实际上,不同Agent受认知环境、知识及信息不同等影响,对权重的确定也会有差异。因此,本文一方面采用主客观权重相结合的方法确定属性权重值;另一方面,在计算主观权重时采用犹豫模糊数,综合考虑不同Agent的意见,再通过一致性检验及修正给出相应的主观权重确定法,并在计算客观权重时通过构造目标优化模型[16]后对其求解,给出更符合实际的客观权重确定法。
(1)基于犹豫模糊数的主观权重确定
首先,采用1~9 标度法确定属性Gj相对于属性Gt的犹豫模糊偏好关系,构造犹豫模糊偏好矩阵:
其次,确定矩阵H*=(hjt)n×n的特征偏好关系,并进行一致性检验。本文在模糊一致性计算[17]的基础上进一步考虑元素间的特征偏好关系,引入加性一致性,构造公式(4)表示上述犹豫模糊偏好矩阵的不一致程度。
若CI(H(σ))≤(为一致性指数阈值),则通过一致性检验,否则未通过检验;若未通过检验,令σ=σ+1,采用下面的迭代公式(5),对犹豫模糊偏好关系进行修正,并再进行一致性检验,直至通过检验。
综上,可得各属性的主观权重W主j为:
其中,Wjt表示与hjt正相关的相对权重,通过比较hjt的大小进行比较。
(2)基于目标优化模型的客观权重确定
首先,计算犹豫模糊数hjt(1 ≤j≤n,1 ≤t≤n)的得分值S(hjt),可得相应的得分值矩阵为:
其次,结合目标优化模型,可得各属性的客观权重为:
其中,S(hij)表示犹豫模糊数hij的得分值,V(hij)表示方差,Wj表示各属性的主观权重。
再次,通过构造相应的拉格朗日函数对该模型求解:
(3)综合权重确定
现有综合权重确定多采用乘法合成法与加权汇总合成法[18],偏向于单纯将主客观权重相加或相乘,不仅权重系数确定不合理,而且难以综合反映Agent 的意见。因此,为弥补这些缺陷,本文提出公式(11)并通过归一化来计算各指标综合权重值,公式中的aj和bj分别表示主客观权重的重要程度系数:
且:
其中,xj表示第δ个Agent 对第j项属性的模糊评价值,且
1.3 基于改进的损失规避因子的感知价值函数
现有的基于Agent的多属性决策中,多采用TODIM法计算方案的感知价值,仅考虑Agent对待损失时的规避程度,容易造成夸大风险[19],且由于对各属性分类不合理,使比较方案感知价值的α和β取值相同[20],这些都导致感知价值计算的不合理。为此,本文在前景理论基础上,引入损失规避因子,在以上研究基础上,提出将正负理想点作为双参考点,设定相应算法计算各属性与正负理想解的距离,并将其作为新参数加入感知价值函数,在解决以上问题的基础上使Agent的决策更符合实际。
首先,属性Gj下,方案Ai相较Av的感知价值函数为:
其中,α和β(0 <α,β<1)表示Agent对“收益”或“损失”的敏感程度,θ(θ≥1)为损失规避因子,表示Agent 面对“收益”比“损失”更敏感的损失规避心理特征。pj、qj表示Agent在各风险敏感度条件下对属性类型的偏好程度。
其次,pj、qj的确定需要设定正负理想解作为双参考点,设为属性Gj的正理想解集,为属性Gj的负理想解集,且:
则有:
且:
1.4 基于综合感知价值函数的总体优势度
综合以上研究,可得所有属性下方案Ai相较Av的综合感知价值函数为:
从而可得方案Ai(1 ≤i≤m)的总体优势度为:
最后,Agent根据Φ(Ai)的大小对方案进行决策,从而确定最佳方案。
2 模型在高校实验教学中的应用
为验证以上模型,本文以代表某高校购买商Agent的实验教学设备采购谈判为例,拟定相应数据,进行计算和分析。其中,A1、A2、A3、A4为代表四家供应商Agent 提供的方案,包括的属性分别为外部属性品牌声誉G1和价格合理性G2,以及内在价值属性信息化程度G3和灵敏性G4,这些属性的相应权重分别为W1、W2、W3、W4。
首先,假设购买商Agent 对四家供应商Agent 报价属性进行评价后的犹豫模糊评价矩阵如表1。
假定其风险态度是乐观的,即ε1=0.9,可得评价值规范化后的犹豫模糊评价矩阵如表2。
其次,可得犹豫模糊偏好矩阵如表3。
表1 犹豫模糊评价矩阵
表2 规范化后的犹豫模糊评价矩阵
表3 犹豫模糊偏好矩阵
由表3可得:
令σ=0,H(0)=H,0.01,ρ=0.3,计算H(0)的加性一致性特征偏好关系矩阵为:
计算得CI(H(0))=0.018,H(0)不满足加性一致性条件,修正后可得:
计算H(1)中元素的得分值,按列进行集结(δ=0.1),可得(1.112,2.495,2.127,2.203),并可得各属性的主观权重依次为0.541、0.156、0.145、0.157,客观权重依次为0.262、0.223、0.258、0.257,从而可得各属性的综合权重为Wj=0.171,0.278,0.286,0.265。
再次,在各属性下对方案进行两两比较,可得表4,其中,D代表收益,L代表损失。
表4 方案的比较情况
最后,计算cj、dj分别为(0.358,0.354,0.356,0.354)、(0.642,0.646,0.644,0.646)。取θ=1,α=0.88,β=0.92[21],可得各属性下方案比较的感知价值为:
3 分析
3.1 敏感性分析
本文提出的模型中,当θ取不同值时,表示Agent对损失的规避程度不同,是模型中的重要参数。因此,本文对θ取不同值,并进行敏感性分析,以进一步验证本文研究的有效性,得表5、图1及相应分析如下:
表5 损失规避因子θ取不同值时方案的总体优势度比较
图1 损失规避因子θ取不同值时方案的总体优势度比较
综上,可得各方案总体优势度为:Φ(A1)=-0.648,Φ(A2)=-0.576,Φ(A3)=0.803,Φ(A4)=0.936,则A4>A3>A2>A1,购买商Agent 选择从方案A4的供应商Agent处采购实验教学设备。
(1)θ取值不同,Agent的决策结果不同
当θ=1,θ=1.5,θ=2 时,总体优势度排序为A4>A3>A2>A1,但当θ=4,θ=6 和θ=10 时,总体优势度排序变为A4>A3>A1>A2,此时A1和A2的顺序发生了变化。
(2)方案风险程度不同,θ的影响不同
对A1、A2、A3来说,损失规避程度越强,即θ越大,其总体优势度越低,反之越高;但对A4来说正好相反。这是由于A1、A2、A3为风险型,A4为稳健型,风险程度不同。
综上,Agent 可以根据自身对损失的敏感程度及风险偏好,调节损失规避因子θ的大小,计算方案的总体优势度并进行决策,使决策结果更符合实际。
3.2 与相关研究的比较分析
为进一步验证本文模型的有效性和优越性,将模型所得决策结果分别与文献[5]和[6]的决策结果进行对比分析,如表6和图2所示。
表6 采用本文模型与文献[5]和[6]的决策结果对比
图2 采用本文模型与文献[5]、[6]的决策结果对比折线图
由表6和图2可得:
(1)采用本文模型所得决策结果与文献[6]不一致,但与文献[5]所得决策结果一致。这是由于文献[6]仅考虑Agent的主观权重,而文献[5]则在一定程度上考虑了Agent的客观权重。因此,相比之下,采用本文提出的模型帮助Agent做出的决策更合理。
(2)采用本文模型所得决策结果与文献[5]和[6]相比,差距更大,表现为图中曲线更曲折,这不仅更有利于Agent 在现有方案中做出快速决策,而且能在节约谈判时间的基础上保证谈判效果。另外,即使方案增多,Agent也会由于曲线更曲折仍能做出更好决策。
4 结语
本文综合采用犹豫模糊数、目标优化模型和拉格朗日函数等,在设定相应的主客观权重算法后构建出相应的综合权重确定算法,随后结合前景理论,在引入损失规避因子后提出将正负理想点作为双参考点,设定相应算法计算各属性与正负理想解的距离,并将其作为新参数加入感知价值函数,从而提出基于综合感知价值函数的总体优势度算法,最终构建出基于Agent的多属性决策模型。设计的算例、敏感性分析及与相关研究的比较分析表明,该模型不仅能帮助Agent 做出更合理决策,而且有助于Agent在更多方案中做出更快速决策,并且方案越多越能体现该模型的这些优势。