APP下载

基于Agent的信任的情感劝说决策模型

2021-04-12伍京华王佳莹张富娟韩佳丽叶慧慧

计算机集成制造系统 2021年3期
关键词:信任度排序信任

伍京华,王佳莹,张富娟,韩佳丽,叶慧慧+

(1.中国矿业大学(北京)管理学院,北京 100083;2.中国联合网络通信有限公司北京市分公司,北京 100052)

0 引言

随着全球经济和互联网的快速发展,人类商务活动变得越来越频繁,谈判作为其中必不可少的商务活动,正日益受到重视。基于智能体(Agent)的情感劝说作为商务智能中的新型自动谈判模式,将Agent模拟人的情感和劝说的人工智能优势相结合,以模拟人类商务谈判,不仅能较好地解决其中的远程异地谈判问题,还能较大地节约谈判成本,提高谈判效率,并能使谈判结果与人类商务谈判拟合程度得到有效提高,已经成为该领域研究重点[1-2]。但作为人工智能中的重要代表,Agent还具有另一项重要的优势,即模拟人的信任,这对促进基于Agent的情感劝说更好地完成,使其决策与人类商务谈判拟合程度更高,都具有至关重要的作用,因此研究基于Agent的信任的情感劝说决策模型,意义更加重大。

在基于Agent的信任决策方面,曹慕昆等[3]将信任引入基于Agent的自动谈判,并在信任评价机制中加入候选对象与竞争者的交互记录,以使Agent能更好地决策。刘义春等[4-5]根据直接交互经验和推荐者的评价相似度,计算Agent的信任值,并建立了信任更新和奖惩机制。杨兴燚[6]将信任引入基于Agent的自动谈判,提出了新的信任获取模型,对供应商进行选择,并建立了基于Agent的信任的谈判模型,即当谈判完成后要对对方Agent进行评分,并存入数据库中,以备接下来的评价更新,从而构建了较为系统的基于Agent的信任的谈判和评价模型。以上研究均考虑了交互过程对基于Agent的信任的影响和反馈,并提出了信任更新方法,但没有考虑Agent的情感及劝说对决策的影响。

在基于Agent的情感决策方面,郭尚波等[7-8]指出Agent的情感影响因素主要包括性格、外界刺激和情感衰减等,提出了由Agent的基本情感到扩展情感的结构模型,系统构建了基于Agent的情感测量和决策模型。江道平等[9-10]以Agent的情感对决策的影响为出发点,将Agent的外部刺激与内部状态相结合,构建了基于Agent的情感决策模型。代凯峰[11]、Rincon等[12]提出一种多层情感认知模型,构建了具有理性和感性的拟人Agent,研究了基于Agent的情感决策过程。李静等[13-14]通过Agent模拟人的不完全理性行为,引入前景理论和后悔理论,构建了基于Agent的情感决策模型。以上研究均以Agent的情感对决策的影响为主线,研究了基于Agent的情感决策过程,但较少考虑信任及劝说对决策的影响,因此还有待进一步完善。

在基于Agent的信任的情感劝说决策方面,Salgado等[15]针对如何测量Agent的情绪状态方面存在的不足,综合考虑Agent的情感、交互和学习过程,结合马尔可夫博弈,提出了基于Agent的适应性情绪框架模型。Ghusoon等[16-17]将信任与证据信息相结合,引入基于Agent的决策,通过仿真进行了验证。杨件等[18-20]采用支持向量机的方法,对候选Agent在以往交易过程中的偏好、个性和情感等进行学习,建立了基于Agent的信任模型,最后综合预期收益和信任度进行决策。汪矿[21]将Agent的情感分为正面情感、负面情感和中性情感,通过隶属度表示情感强度,将情感分析与信任评价相结合。提出了相应模型。以上研究虽然都提出了一定模型,但采用的方法难以对Agent的情感、劝说及信任综合起来进行有效量化,因此更无法体现其对基于Agent的情感劝说决策的有效性。

因此,本文计划在已有研究的基础上,结合情感相关理论如大五性格、OCC(ortony,clore,collins)情感模型、情感强度第一定律等,以及信任和评价相关方法如语言评价法、将模糊数转换为具体分数(Converting Fuzzy data into Crisp Scores,CFCS)算法、信任更新因子、交互式多准则决策(TOmada de Decisao Interativa e Multicritévio,TODIM)法等,进一步深入研究信任和情感对决策的影响,构建基于Agent的信任的情感劝说决策模型。

1 模型的主要算法

在基于Agent的信任的情感劝说中,Agent的决策主要受其自身情感强度变化(简称Agent的情感强度)和候选Agent的交易质量,以及相应的信任更新影响[18,22]。从已有研究来看,目前较有代表性的是文献[23-25]。其中,文献[23]对候选对象的信任度进行了一定研究,提出了相应的合作对象筛选方法。文献[24-25]对模拟谈判双方的Agent的情感劝说过程进行了研究,提出了相应的模型,并进行了验证。因此,本文拟在这些研究的基础上,分别针对情感强度、交易质量、信任更新构建相应算法,并最终构建出基于Agent的信任的情感劝说决策模型。

1.1 Agent的情感强度算法

在基于Agent的信任的情感劝说中,Agent的情感强度变化主要来自于自身和外界两方面。从自身来看,其性格和情感衰减是主要影响因素;而从外界来看,对方Agent的提议则是主要影响因素[7,22]因此本文对Agent的情感强度的算法建立在Agent自身性格、情感衰减以及外界刺激这3个变量基础上。

1.1.1 基于Agent的自身性格的情感强度

大五OCEAN(openness(开放性),conscientiousness(谨慎性),extraversion(外向性),agreeableness(宜人性),neuroticism(神经质))性格模型是目前心理学界最被认可的性格模型,该模型认为人的性格通过五个维度来体现:开放性、谨慎性、外向性、宜人性、神经质性[26]。因此,Agent的性格可以通过五元组Ocean=(Oo,Oc,Oe,Oa,On)表示。其中,Oo,Oc,Oe,Oa,On分别表示其中的五个特质取值,且一般情况下Oo,Oc,Oe,Oa,On∈[0,1]。

心情空间模型目前应用最广泛的是Mehrabian提出的PAD(Pleasure(愉悦度)、Arousal(激活度)、Dominance(优势度))心情空间,包含愉悦度、唤醒度和支配度3个特质,三者相互独立,构成三维心情空间,以此描述心情[27]。因此,Agent的心情状态可以通过三元组Pad=(Pp,Pa,Pd)表示。其中,Pp,Pa,Pd分别表示其中的3个特质取值,且一般情况下Pp,Pa,Pd∈[-1,1]。

因此,Agent的个性与心情之间的映射关系可通过式(1)表示[27]:

结合以上研究及著名的OCC情感模型[28],可将Agent的情感分为24种状态,且每一种情感都有与之对应的PAD心情空间值,如表1所示[29]。

表中Agent的PAD心情空间与OCC情感之间的映射关系通过式(2)表示[7-8]:

式中:VOCC=[V1,V2,…,V24]表示Agent的24种情感强度,表示其PAD心情到OCC情感的转化矩阵,即表1中的量化关系。

表1 Agent的OCC情感对应的PAD值

经典的Ekman分类将人的基本情感分为喜悦、悲伤、愤怒、惊奇、恐惧、厌恶6类[30],本文依据该分类,将Agent的OCC 情感映射到这6 类基本情感[31]中,得到基本的情感强度向量:I=[Ijoy,Isadness,Ianger,Isurperise,Ifear,Idigust]。其中:

综上所述,本文进一步将Agent的6种基本情感分为正向情感和负向情感,如表2所示。

表2 Agent的正向情感和负向情感

由此可得Agent的正、负向情感强度的计算分别为:

综上可得基于Agent的自身性格的情感强度为Ipersonality=I正-I负。

1.1.2 基于Agent的情感衰减的情感强度

研究表明,情感具有瞬时性,随着时间的推移,情感的衰减程度非常明显,与指数形式y=e-x较为接近[7]。另外,根据马尔科夫理论,在计算t时刻的情感强度时,只需考虑前一时刻(t-1时刻)衰减后的情感强度值,t-2时刻及更早之前的情感衰减到t时刻的情感强度值与t-1时刻衰减到t时刻的情感强度值相比可以忽略不计[7]。由此可得基于Agent的情感衰减的情感强度为

式中:ψ(It)表示前一时刻情感衰减到当前时刻的情感强度值,It-1表示前一时刻的情感强度值,Δt为时间间隔。

1.1.3 基于Agent的外界刺激的情感强度

情感强度第一定律表明,情感是事物价值率高差在人脑的主观反应[32],即

式中:Ie表示情感强度,km表示强度系数,Δp表示价值率的高差。

在基于Agent的信任的情感劝说中,外界刺激主要来源于与对方Agent谈判成功时的议题值,因此价值率

式中:xm为Agent与对方Agent的谈判成功议题值,xm∈[xmin,xmax];xmax,xmin分别为Agent所能接受的议题最大值和最小值;xexp为Agent对议题的期望值,xexp=(xmin+xmax)/2,x,xmin,xmax∈[0,10]。

综上可得基于Agent的信任的情感劝说中,Agent的情感强度算法为:

1.2 Agent的交易质量算法

交易质量是对谈判以及合同执行过程质量好坏的综合衡量。目前来看,还没有较好的方法对其进行合理表达和量化。例如,文献[33]提出的评价方法对于定性指标而言很难直接合理量化;文献[34-35]采用的直觉语言评价法需要同时给出语言变量及其隶属度和非隶属度,但(非)隶属度没有统一的衡量标准,难以判断合理性;文献[36]虽然考虑到采用语言变量对指标进行评价,并通过三角模糊数量化,但没有进一步深入研究相应的去模糊化过程。

因此,本文采用较有代表性的语言评价,对其进行合理表达,如“好”、“较好”等[37],随后采用三角模糊数,将语言变量与数值对应,从而将其合理量化[38]。最后,为保证将该三角模糊数转化为确定值的同时,还能保证去模糊化过程信息丢失较少,采用CFCS算法对其进行去模糊化处理[39],从而构建出相应的Agent的交易质量算法,具体如下:

首先,构建Rg={r0,r1,…,rg}为有序语言评价集,相应的三角模糊数为[38]:

式中rk∈Rg为该集合中的第k+1个语言变量,且k∈{0,1,…,g},g为有限偶数。

其次,假设共有m个候选对象Agent、p个关于交易质量的评价指标、Agent邀请D名专家Agent、第d个专家采用语言评价集对第i个候选对象Agent的第q个指标进行评价。通过式(9)计算得出相应的三角模糊数,表示为

再次,采用CFCS算法[39]对该三角模糊数进行去模糊化处理,具体步骤如下:

(1)三角模糊边界值的规范化处理。

(3)指标值的去模糊化处理。

(4)指标值的确定。

式中viq为第i个候选对象Agent在第q个指标下的评价值。

综上可得基于Agent的信任的情感劝说中,Agent对各候选对象Agent的交易质量评价值为:

式中:Qi表示第i个候选对象Agent的交易质量评价值;wq为第q个交易质量评价指标的权重,由较有代表性的专家打分法获得。

1.3 Agent的信任更新算法

基于Agent的信任的情感劝说中,交易质量的好坏也会使Agent对各个候选对象Agent的信任度产生一定反馈,进而对后续的情感劝说产生一定影响。因此,本文首先假设Agent对各个候选对象Agent的信任度为Ti(i=1,2,…,m),且Ti∈[0,1];其次在文献[4]中提出的信任更新因子算法的基础上,以Qi/Ti大小为依据,分Qi/Ti<0.5、0.5≤Qi/Ti<1、Qi/Ti≥1这3种情况建立信任更新因子,并引入对数函数,具体如下:

(1)若Qi/Ti<0.5,则候选对象Agent的信任度迅速降低至原来的0.1倍,即若候选对象Agent在此次交易中表现很差,将严重影响自身的信任度,因此候选对象Agent在交易中会做出尽可能好的表现。

(2)若0.5≤Qi/Ti<1,则候选对象Agent的信任度会有一定程度降低,Agent在此次交易中表现越好,信任度降低越少,反之则降低越多。

(3)若Qi/Ti≥1,则候选对象Agent的信任度会有所提高,提高值随着Qi/Ti的增加而缓慢增长,但能避免候选对象Agent仅在一次交易中表现很好而使其信任度得到过分提高。

从而给出相应的信任更新因子ρ的算法如下:

最后,给出基于Agent的信任的情感劝说中Agent的信任更新算法,即第i个候选对象Agent更新后的信任度为:

2 模型

TODIM 法考虑了人类的损失规避心理行为,能辅助不同心理偏好的决策者调整参数,从而作出符合自身心理特征的决策,具有较强的灵活性[40-41]。熵权法通过信息熵原理确定权重,能获得较为客观的权重结果,避免人为确定的主观性[42]。因此,本文在构建以上算法的基础上,采用TODIM法建立基于Agent的信任的情感劝说决策模型,并采用熵权法对模型中的属性权重进行设定,具体步骤如下:

(1)建立Agent的情感强度、交易质量及更新后的信任度的综合评价矩阵为:

(2)对各个属性值进行标准化处理:

(3)得到新的标准化矩阵:

(4)对Z进行归一化处理:

(5)计算第j个属性的信息熵:

(6)计算第j个属性的权重为:

(7)计算属性的相对权重:

假设Agent的情感强度、交易质量和更新后的信任度的权重分别为w1,w2,w3,w*=max{w1,w2,w3}为参照权重,则Cj相对于参照属性C*的相对权重为:

(8)计算属性Cj下候选对象si相对于候选对象sk的优势度:

式中:i,k=1,2,…,m;j=1,2,3;θ为损失规避因子,表示Agent对待损失的心态,θ越小,Agent对损失的规避程度越大,即Agent对损失越敏感[43]。

(9)计算候选对象si相对于其他候选对象的总体优势度:

(10)将总体优势度按以下公式规范化,并根据D(si)值对候选对象进行排序:

3 算例

为更好地阐述以上模型,假设煤炭行业供应链管理中的采购商Agentα和5个供应商Agents1、Agents2、Agents3、Agents4、Agents5正在就无烟煤的交易进行自动谈判,为节约谈判成本和得到更好的谈判结果,双方采用基于Agent的信任的情感劝说模式进行,并假设这5个供应商的信任度初始值及谈判成功议题值如表3所示,Agentα上一时刻的情感强度为It-1=0.1,距当前时间间隔为Δt=5。

表3 候选对象Agent的信任度以及与Agentα的谈判成功议题值

首先,参考网址http://www.apesk.com/bigfive/index.asp?language=cn的测试方法,对Agentα进行性格测试,得到Agentα的大五OCEAN 性格测试结果为Ocean=(22,15,20,24,10),将所得测试值除以30,得到标准值Ocean=(0.733,0.5,0.667,0.8,0.333),再分别由相应算法,可得Ipersonality=-0.085 9、ψ(It)=0.000 7、=(-0.063 5,0.052 8,-0.041 4,0.055 9,-0.067 6),i=1,2,…,5,综合可得Agentα 的情感强度为IAgentsi=(-0.148 7,-0.032 4,-0.126 5,-0.029 3,-0.152 8),i=1,2,…,5。

其次,假设Agentα邀请3名专家Agent对这5个候选对象Agent的交易质量进行评价,指标为劝说过程愉悦度[23]、合同执行度[44]、信息共享度[44]和劝说沟通度[45],取语言评价集为R8={r0=极差,r1=很差,r2=差,r3=较差,r4=一般,r5=较好,r6=好,r7=很好,r8=极好},并将相应的语言评价转化为三角模糊数,最后采用CFCS算法进行去模糊化处理,得到这5个候选对象Agent的指标评价值,具体如表4所示。

表4 3名专家Agent对这5个候选对象Agent的指标评价

则相应的交易质量评价值为:Qi=(0.663 0,0.724 1,0.642 6,0.632 4,0.693 5),i=1,2,…,5,更新后的信任度值为T'i=(0.831 1,0.830 3,0.897 2,0.851 0,0.837 3),i=1,2,…,5。

综上可得Agentα的情感强度、交易质量及更新后的信任度的综合评价矩阵为:

将该矩阵标准化后为:

计算各属性权重,可得w1=0.326 2,w2=0.241 2,w3=0.432 6。其中w3最大,因此为参照权重,属性Cj(j=1,2,3)相对于参照属性C3的权重分别为:w'1=0.754 2,w'2=0.557 6,w'3=1。

假设Agentα属于风险中立者,即对损失的规避程度一般,θ=1,可分别得到3个属性下,这5个候选对象Agent两两比较之后的优势度矩阵,具体如下:

最后,可得这5个候选对象Agent的总体优势度为T(s1)=-9.113 2,T(s2)=-0.040 2,T(s3)=-4.330 6,T(s4)=-4.066 2,T(s5)=-6.444 1,进行规范化处理后可得D(s1)=0,D(s2)=1,D(s3)=0.527 1,D(s4)=0.556 3,D(s5)=0.294 2,因此候选对象Agent的最终排序为Agents2>Agents4>Agents3>Agents5>Agents1,Agents2即为Agentα选出的最优对象。

4 分析

4.1 参数θ取不同值得到的决策结果

损失规避因子θ是模型中最重要的参数,如图1所示为θ取不同值的决策结果。

(1)Agentα的损失规避程度与θ成反比。θ越小,候选对象Agent的优势度越低,反之则越高。例如,θ=0.5的Agentα要比θ=0.75的Agentα对损失更敏感,即损失规避程度更强,因此θ=0.5的Agentα对5个候选对象Agent的优势度评价更低。

(2)当Agentα的损失规避程度很强时,候选对象Agent的优势度可能均为负值。随着损失规避程度的减弱,候选对象Agent的优势度可能出现正值,故随着损失规避心理行为的减弱,Agentα可能更关注候选对象Agent带来的收益。

(3)θ取不同值时,各候选对象Agent的优势度不同,导致最后排序可能也不同。例如,当θ≤1.5时,5个候选对象Agent的优势度排序为s2>s4>s3>s5>s1,而当θ≥2时,5个候选对象Agent的排序变为s2>s3>s4>s5>s1,此时Agents3和Agents4的顺序发生了变化。

(4)损失规避因子θ越小,即Agentα对损失越敏感,各候选对象Agent的优势度差距越明显,越有利于Agentα进行比较,从而越有利于Agentα确定最优候选对象Agent。

4.2 参数km取不同值得到的决策结果

谈判议题权重km也是模型中较为重要的参数,如表5所示为km取不同值的决策结果。

表5 km取不同值的决策结果

(1)当km取不同值时,候选对象Agent的优势度和排序也不同。这是由于谈判议题的重要性改变时,刺激影响下Agent的情感强度也会变化,进而影响最后的结果。

(2)当km取不同值时,Agents2的优势度也不同,但因为其他候选对象Agent与它差距较大,所以Agents2始终属于最优候选对象,其排序不受影响。

4.3 参数wq取不同值得到的决策结果

交易质量的评价指标权重wq也是模型中的重要参数,如表6所示为wq取不同值的决策结果。

表6 wq取不同值的决策结果

(1)当wq取不同值时,候选对象Agent的优势度和排序也会随之变化。这是由于指标权重的改变导致交易质量综合评价值的变化,进而对信任的反馈及最后结果都有影响。

(2)当wq取不同值时,Agents2的优势度也不同,但因为其他候选对象Agent与它差距较大,所以Agents2始终属于最优候选对象,其排序不受影响。

4.4 与不考虑情感的决策结果的比较分析

将不考虑Agentα对候选对象Agent的情感所得到的决策结果与考虑情感时的决策结果比较,结果如表7所示。

表7 不考虑情感与考虑情感的决策结果比较

(1)候选对象Agent的优势度和排序发生了变化。这是由于在不考虑情感的情况下,Agentα仅对交易议题价值率进行比较,而未考虑其对Agent α的刺激所产生的情感并进行比较,因此两种情况下候选对象Agent的优势度和排序会有所不同。

(2)情感作为人类思想的重要组成部分,对决策具有重要影响,因此利用Agent来模拟人类情感,能使其更好地模仿人类决策行为,从而做出更符合人类行为的决策,更进一步发挥其在人工智能方面的优势。

4.5 与熵权-TOPSIS决策模型的比较分析

将本文提出的模型与熵权-TOPSIS 决策模型[42]进行比较,可得结果如表8所示。

(1)当θ<1和θ=1时,分别表示Agentα厌恶风险和中立态度,本文提出的模型与熵权-TOPSIS决策模型的排序结果相同。而实际情况下,决策者面临风险时大多采取损失规避或中立的态度,因此本文所提出的模型与实际相符。

表8 本文模型与熵权-TOPSIS决策模型的比较

(2)当θ>1时,表示Agentα偏好风险,更关注获得较大收益,本文提出的模型会出现两种排序结果:

1)1<θ<1.67时,Agentα对风险的偏好程度较小,候选对象Agent的排序为s2>s4>s3>s5>s1,与θ≤1时的排序结果相同。

2)θ≥1.67时,Agentα对风险的偏好程度较大,候选对象Agent的排序为s2>s3>s4>s5>s1,与θ≤1时的排序结果不同。

(3)熵权-TOPSIS决策模型是完全理性下的决策模型,任何风险态度的Agentα通过该模型进行决策,都会获得相同的决策结果。而本文提出的模型可以使Agentα根据不同心理状态调整参数θ,从而获得不同决策结果,灵活性和适用性更强。

5 结束语

经过归纳和梳理,与本文相关的代表性文献有文献[15-25]。与这些研究相比,本文做出的改进和得出的结论总结如下:

(1)通过大五OCEAN 性格-PAD心情-OCC情感的映射,构建了基于Agent的情感劝说中,Agent模拟人具有的性格及其所产生的情感强度及相应算法,进一步发挥了Agent的人工智能优势。相比之下,文献[23]虽然对基于Agent的信任的情感劝说进行了研究,但并没有涉及到Agent的性格,也没有在这方面构建有效模型。

(2)考虑到Agent在上一时刻的情感会随时间逐渐衰减,从而对当前时刻Agent的情感产生影响,结合指数形式构建情感衰减函数,对该因素对Agent的情感强度影响进行了更好的量化和计算。相比之下,文献[24-25]虽然对Agent的决策进行了建模,但仅考虑了Agent在当前时刻的情感,没有进一步考虑情感随时间逐渐衰减对Agent的情感强度的影响。

(3)引入心理学中的情感强度第一定律,对外界刺激影响下的Agent的情感强度进行合理量化和计算,从而更进一步发挥了Agent的人工智能优势。相比之下,文献[15]虽然通过马尔科夫模型计算外界刺激影响下两个Agent之间的情感距离,但侧重于对情感亲密程度的研究,没有进一步考虑适合本研究的由外界刺激引起的Agent的情感强度变化。

(4)综合运用语言评价、三角模糊数和CFCS算法,对Agent的交易质量进行评价。既对其中的各项指标进行了合理表述和量化,又使其过程和结果与人类谈判思维拟合程度更高。相比之下,文献[22]虽然运用了模糊综合评价法,但对评语等级划分不够详细,不利于模糊评价的充分发挥,也没有结合有效算法,没有对这些算法进行较好的去模糊化处理。

(5)考虑到交易质量对信任的反馈,对文献[4]中提出的信任更新因子进行改进,并引入对数函数,给出更适合本研究的Agent的信任更新因子及算法。相比之下,文献[16-17]仅对其中的信任进行了静态评价,没有从动态角度建立信任更新算法,文献[18-20]虽然通过机器学习模拟了信任更新过程,但没有考虑交易质量对信任的反馈。

(6)将Agent的情感强度、交易质量和信任更新有效聚合,并运用TODIM 法进行比较,使Agent能根据自身的损失规避心理行为进行参数调整,做出科学决策,因而更具灵活性和适用性。相比之下,文献[21,23-25]仅对其中一个或两个属性进行了相关研究,且模型中对Agent人工智能特性的发挥不够,未考虑Agent模仿人类的心理行为。

本文虽然构建了基于Agent的信任的情感劝说决策模型,丰富了该领域各项理论,但仍然存在一定的不足之处,将其和下一步研究方向归纳如下:

(1)Agent的情感影响因素有很多,本文虽然对3个较重要的因素——Agent的自身性格、情感衰减和外界刺激进行了初步探索,但对于其他影响因素尚未考虑。因此,下一步计划考虑更多的Agent的情感影响因素,进一步丰富该领域相关理论。

(2)虽然进行了算例分析,对其实际应用领域进行了探索,但由于研究重点在于模型的构建,采用的数据以假设为主,且还没有开发相应的仿真系统。因此,下一步计划在进一步完善该模型的基础上,采用实际数据,并进行更深入和彻底的仿真系统开发及分析。

猜你喜欢

信任度排序信任
排序不等式
恐怖排序
节日排序
全球民调:中国民众对政府信任度最高
嘤嘤嘤,人与人的信任在哪里……
汽车养护品行业运行环境分析及提高客户信任度的途径
信任
2014,如何获得信任