基于Agent的情感映射的劝说模型及系统
2020-05-08伍京华王竞陶叶慧慧
伍京华,王竞陶,刘 浩,叶慧慧
(中国矿业大学(北京) 管理学院,北京 100083)
0 引言
在商务智能领域,自动谈判是人们解决争端和达成一致的重要途径,能够根据外部环境的动态变化实现复杂的谈判,从而节省不必要的人力物力财力,因此自动谈判成为人工智能领域的研究热点[1-2]。基于Agent的情感劝说是基于Agent的自动谈判发展到更加智能和高级的模式,这种谈判方式不但利用Agent模拟人的情感、意识和行为,而且利用劝说的人工智能特点完成自动谈判,能节约谈判成本和提高谈判理性程度[3]。例如:在国际煤炭行业供应链管理的采购及销售中,由于谈判各方处于不同国家,导致谈判发生的时间、地点等不同,如果采取传统谈判方式,不仅会耗费谈判各方的时间、人力、物力等成本,谈判过程及结果也可能因为以上因素影响而难以达到最优[4]。采取自动谈判的方式,能在一定程度上避免以上因素影响,较好地解决以上问题,但目前真正能将谈判与人工智能优势结合并深入的研究还较少[5],因此需要进一步挖掘更加完善的自动谈判模式。
国内外该领域中不同学者和专家从不同角度对基于Agent的情感劝说进行了研究:
(1)在自动谈判领域。张京敏[6]考虑到对手分类算法与Q-learning算法能够更好地适应动态变化的环境,提出了基于对手分类的强化学习双边多议题相关的协商算法。杨兴燚[6]向基于Agent的系统引入了信任评估机制,所建立的信任模型,着重解决信任获取问题,建立了多Agent的信任信息获取与集结模型,并将信任机制与自动谈判系统相结合。曹慕昆[7]利用多目标优化算法NSGA-Ⅱ获得谈判双方的Pareto出价组合,通过基于时间的固定谈判策略沿Pareto边界对出价进行修正,构建了一个能使谈判双方以较高效率实现双赢的多属性谈判模型。
(2)情感量化及将情感引入人工智能方面。吴伟国[8]针对人—机器人交互构建了人工情感计算模型,该模型能有效模拟人类情绪的变化过程。Jiang Hong[9]利用PAD心情模型构建了Agent情感辩论模型,并讨论了情感对辩论结果的影响。郭尚波[10]研究了影响情感产生的认知条件以及OCEAN、PAD、OCC三个情感模型之间的相互作用,提出一种考虑了人类性格的情感产生模型。谢丽君[11]基于马尔可夫链理论研究了情感维度理论,应用该理论建立了HMM情感模型并应用到了家庭服务机中。
(3)针对产生模型,张鸽[12]提出了候选辩论集的产生策略和基于冲突分析的辩论目标产生模型,分析了基于多Agent商务谈判决策过程,并给出系统验证。董学杰[13]针对Agent对动态变化的谈判环境缺乏适应性的问题,建立了情感产生模型和决策模型,并在单属性自动谈判环境下,运用模型和实际数据进行试验,实证了数据模型的有效性。Santos MR[14]为了更好地建立Agent情感的产生和评价模型,将性格模型、心情空间模型、情绪模型与群体决策支持系统相结合,并通过对比展示了基于Agent的情感劝说的优势。
(4)针对策略模型,李静[15]针对辩论的产生、评估和策略缺乏系统化研究的现状,将前景理论引入多Agent辩论协商模型中,制定出了相应的辩论协商策略。Carolis B[16]提出一种将Agent情感劝说与理性劝说相结合的计算模型,根据该模型对Agent的性格特征和生活习惯进行推理,并使Agent根据相应的推理结果选择相应的劝说策略。
(5)针对评价模型,伍京华[17]给出了Agent劝说中舆论的定义和分类,然后结合形式逻辑理论,提出了Agent劝说中的积极舆论模型以及相应的评价体系,并通过算例进行验证。Jiang Hong[18]等将情感融入BDI理论中,建立了EBRI Agent来描述Agent情感产生,并结合情感层次理论对Agent情感进行评价。伍京华等[19]将情感作为评价因素,提出了Agent主体情感的评价模型,构建了Agent合作主体选择模型。
(6)针对让步模型,伍京华[20]基于Agent辩论谈判的流程进行了算例分析,提出了相应的让步模型,并实现了相关的系统。孙华梅[21]等对Agent劝说进行分类,在让步影响幅度的基础上构建了让步模型。董学杰[22]将情感理论与情感模型引入多Agent辩论谈判领域,基于期望效用评价提出了情感的产生模型、评价模型,并提出了情感决策过程中相应的让步模型和策略选择。研究表明,在谈判过程中,不同权利不同情感下的谈判者会做出不同的让步。
在动态变化的谈判环境中,上述已有研究主要存在以下问题:
(1)对情感的研究不够全面,不够深入,尤其是情感的量化方面,已有研究在情感量化方面,有的仅仅是考虑情感的分类以及不同情感对劝说的影响,有的只将情绪和情感联系起来,并未考虑性格因素对情感产生的影响,有的虽然考虑了性格和情绪对情感的影响,但是并未研究性格对情绪的影响。
(2)将情感理论应用到Agent劝说领域的研究较少,存在Agent对动态变化的谈判环境缺乏适应性的问题。
(3)对Agent劝说的研究更多的是针对单一模型或算法的研究,对基于映射的劝说过程研究较少,尤其是考虑情感这一因素对基于Agent的映射的劝说过程的影响的研究较少。
针对现有研究中Agent情感劝说的动态变化方面存在的问题,本文重点考虑Agent劝说过程中的情感因素,首先在艾克曼[24]经典情感分类的基础上提出新的Agent情感分类后,利用已有情感理论中典型的OCEAN-PAD-OCC的层次映射模型[23],构建了基于Agent的情感映射的劝说产生模型;其次,通过对Agent劝说策略、主导情感和情感阈值的定义,提出了相应的策略模型;再次,对Agent情感强度进行了定义,分析其影响因素为劝说策略和情感衰减,在对情感衰减进行定义的基础上,提出了基于Agent的情感映射的劝说评价模型,并通过对受情感影响的让步步长的计算构建了相应的让步模型;最后,综合以上模型,构建了相应的框架流程图。情感和劝说的加入,让本文提出的各个模型更能适应复杂的动态谈判环境。
为了说明上述劝说过程及模型的有效性,本文以煤炭行业供应链管理中的采购商和销售商的谈判为背景,构建了相应算例并进行了分析,再结合JADE平台,使用JAVA语言,对以上模型进行了系统实现。算例结果表明,情感映射对基于Agent的劝说的全过程都有着重要影响。与基于Agent的劝说相比,基于Agent的情感映射的劝说在考虑情感映射之后,不但依据情感映射来进行策略选择,而且依据情感映射在交互过程中进行让步,使劝说过程变得更加智能,更加接近人类的思维和情感变化,使劝说结果更加符合劝说实际。基于此,验证了本文模型的有效性,也说明了情感映射对基于Agent的劝说产生的重要影响。
1 基于Agent的情感映射模型
Agent情感产生的过程就是Agent模拟人的情感产生的过程,由于人类情感的产生受到性格、心情、情绪等多方面的影响,因此Agent情感的产生也会受到性格、心情和情绪等多个因素的影响。Agent性格指的是某个Agent个体特有的,受先天性因素和环境因素所影响的长期存在的心理特征;Agent心情是指Agent个体受外在环境所影响的能持续一段时间的一种感受;Agent情绪是指是一种瞬间变化的、短暂的、不稳定的心理。
在影响Agent情感的分量中,Agent的性格相对稳定,Agent心情的稳定性介于Agent的个性与Agent的情绪之间,Agent的情绪最不稳定。心理学研究表明,在相互作用方面,人的心情形成与个体性格有关,而心情会影响情绪的形成,从对决策的影响性来看,情绪对人的决策影响是显式的,即个人的决策与情绪有着直接的关系,而个性和心情对人的影响却是隐式的[25]。相应地,Agent的性格、心情和情绪也具有以上关系。
1.1 OCEAN到PAD的映射模型
Agent情感的变化会受到性格的影响,不同性格的人处于相同的环境下会产生不同的情感。得到最多相关领域学者和心理学家们认可的,是大五OCEAN性格模型,该模型通过Openness(开放性)、Conscientiousness(谨慎性)、Extraversion(外向型)、Agreeableness(宜人性)、Neuroticism(神经质)五个因素对Agent个性进行描述。本文根据OCEAN大五性格模型定义了一个五元组ocean来度量Agent的性格,如式(1)所示:
ocean=(oo,oc,oe,oa,on)。
(1)
式中(oo,oc,oe,oa,on)分别表示Agent五种性格特征值。Agent在其中的某一维向量的取值越大,表示该Agent性格中的这个方面的表现越明显。
在影响情感的分量中,性格相对稳定。心情的稳定性和变化介于性格与情绪之间。为了科学合理地计算Agent的性格对情感的影响,引入应用最广泛的Mehrabian[26]提出的PAD心情空间作为中间层将性格与情绪联系起来。该心情空间包含3个特质分别是:愉悦的程度P(pleasure)、被唤醒的程度A(arousal)、可支配的程度D(dominance),P、A、D∈[-1,1]。Mehrabian提出了PAD三维心情空间,并根据PAD每一个维度的正负值组合,定义了8种心情类型。本文引入三维心情空间变量Pad来表示Agent的心情状态,如式(2)所示:
Pad=(Pp,Pa,Pd)。
(2)
式中Pp,Pa,Pd表示Agent心情的愉悦度、唤醒度和支配度的值。
由矩阵运算规则可得OCEAN性格模型到PAD心情空间的映射,如式(3)所示:
(3)
因此,通过式(3)就可以将OCEAN性格模型中的5种性格因素量化后映射到PAD情感空间中。
本文参考杨国亮[27]和Gebhard P[28]经典研究中的各个系数取值,得到Agent的心情转换矩阵,如式(4)所示:
∏OCEAN→PAD=
(4)
因此,如假定Agent在劝说中的性格取值为ocean=[0.4 0.8 0.6 0.3 0.4],则可由式(4)计算得其心情为PAD=[0.38 -0.08 0.5]。
1.2 PAD到OCC的映射模型
与性格和心情相比,情绪是影响Agent的情感分量中最容易变化的分量。本文选用的是易于在计算机上实现的、受到计算机专家和心理学专家一致肯定的基于认知的情感模型——OCC模型。Ortony等[29]人以情感产生的认知为研究出发点,以事件、主体和对象为评价标准,提出了包含22种情绪状态的OCC层次结构情绪模型。为了简化计算,本文选取模型中的12种情绪:joy、hope、relief、pride、gratitude、love、distress、fear、disappointment、remorse、anger、hate进行映射计算,并用式(5)来表示Agent对应12种情绪的取值,
occ=(o1,o2,…,o12)。
(5)
式中occ代表Agent情绪变量。
由12种OCC情绪模型和PAD心情空间的映射关系可得PAD心情空间映射到OCC情感模型的12×3的过渡矩阵,如式(6)所示:
(6)
根据文献[28]中OCC情绪和PAD心情空间的映射关系,可得到PAD心情空间映射到OCC情感模型的值如式(7)所示:
(7)
2 基于Agent的情感映射的劝说产生模型
基于Agent的情感映射的劝说产生模型的核心是产生相应的Agent情感。因此,首先要对其中的Agent情感进行分类,然后根据上文的映射模型建立相应的情感产生模型。以往的研究主要按不同维度将Agent情感进行分类,可以产生多达几十种不同的情感,这导致模型往往比较复杂,不适合劝说谈判中的Agent。艾克曼(Ekman)[24]将情感分为恐惧、愤怒、悲伤、高兴、厌恶和惊奇6种基本类型,该分类较为经典,在心理学界和管理学界占有主体地位。因此,为了简化研究,本文在此基础上,将劝说过程中相应的Agent情感归纳为喜悦、悲伤、愤怒、恐惧4种基本情感,还有一种平静的无情感状态。将OCC情绪模型中选定的12种情绪映射到这4种基本情感中,建立相应的映射,如表1所示。
表1 OCC中12种情绪与4种基本情感的映射
综合以上分析和研究,可以用一个四维向量来表示各情感的分量值[12],从而得出基于Agent的情感映射的劝说产生模型,即对以上四种情感的综合计算,如式(8)所示:
(8)
3 基于Agent的情感映射的劝说策略模型
在基于Agent的情感映射的劝说中,选择合适的策略是保证劝说顺利进行的重要条件,其核心是构建相应的策略模型,首先要对劝说策略进行定义。
定义1Agent劝说策略。是指Agent为了达到自身目的,而对其他Agent使用的呼吁、引诱等策略。
由定义1可知,Agent劝说策略是影响Agent情感变化的最重要因素。积极的劝说策略会给双方Agent带来正面的积极情感,消极的劝说策略会给双方Agent带来负面的消极情感。从上述产生模型来看,实际劝说中,Agent有4种情感,而构建相应的策略模型,主要根据其中某种情感来确定。因此,构建相应的策略模型,其次还要定义Agent的主导情感。
定义2Agent主导情感。是指Agent在劝说的产生模型中取值最大的情感,Agent需要根据该情感确定相应的策略,用Imax来表示。
再次,构建相应的策略模型,选择合适的策略,还要对其中的Agent情感阈值进行定义和合理计算。
定义3Agent情感阈值。是指Agent由于性格不同而具有的激发情感的临界值。
由定义3可知,判断Agent某一情感是否被激发,主要看是否超过该阈值。显然,个体情感阈值越大,表明个体情感越稳定。邱林[30]和郑雪等[31]研究表明,外倾性和神经质对幸福感影响最大,其中外倾性与主观幸福感有显著正相关,神经质与主观幸福感有显著负相关。因此,借助大五模型性格测定结果,可以通过式(9)计算Agent的情感阈值:
m=|oo-on|/10。
(9)
综上所示,可以通过式(10)表示基于Agent的情感映射的劝说策略模型:
φ(T)={Si,j|Ei,T,Imax,m}。
(10)
式中:Si,j表示不同的劝说策略,φ(T)表示Agent选择该劝说策略后产生的影响值。根据以上公式选择相应策略,Agent完成后面的评价和让步。
4 基于Agent的情感映射的劝说评价模型
与人类情感类似,Agent的情感不是一成不变的,会随着环境、对方策略、自身性格等各种因素的影响而产生动态变化,并且Agent的情感会对Agent的评价造成一定程度的影响,因此,在构建了基于Agent的情感映射的劝说产生和策略模型后,需要构建相应的评价模型完成劝说,而基于Agent的情感映射的劝说评价模型的核心是评价相应的Agent的情感强度。根据情感强度第三定律,首先对Agent的情感强度定义如下:
定义4Agent的情感强度。是用来描述Agent在劝说中某时刻的情感的强弱,用Ir=(I1,r,I2,r,I3,r,…,In,r)表示。其中,Ii,r表示在第r轮劝说时Agent第i种基本情感的强度,强度的大小反映了Agent在劝说某轮中的情感的强弱,影响Agent情感强度的主要因素为劝说策略和情感衰减。
定义5情感衰减。是指Agent在劝说过程中受对方劝说影响而导致情感强度逐渐减弱的过程。
考虑情感衰减的前提是Agent已经有被激发的情感,平静状态不会产生情感衰减。马尔可夫无后效应,适用于随机过程,因此Agent的情感衰减只考虑前一时刻情感对当前时刻情感的影响,对于更早时刻的情感不做考虑[10],如式(11)所示:
ψ(T-1)→T(Ii,T-1)=Ii,T-1e-T0。
(11)
式中:ψ(T-1)→T(Ii,T-1)表示的是Agent在前一时刻情感衰减到当前时刻的强度值,Ii,T-1表示Agent前一时刻的情感强度的向量值,e-T0为衰减系数,T0∈[1,+∞]为常数,表示当前劝说持续的时间,T0越大,情感衰减的越快。衰减系数随时间T0变化的函数图像如图1所示。
根据文献[10]可知,前一时刻情感衰减后的分量与前一时刻的情感强度成正比,前一时刻的情感强度值越大,保留到当前时刻的情感强度值也就越大,对当前时刻的情感影响也就越大,反之则越小。
综合以上分析和研究,可以得出基于Agent的情感映射的劝说评价模型,即对Agent的情感更新后的情感强度计算,如式(12)所示:
(12)
式中:Ii,r表示Agent在r轮劝说时的第i种情感的强度;ψi(Ii,T-1)表示情感i在T-1时刻的情感强度的衰减;φ(T)表示外界刺激对情感强度的影响;Ei,T表示性格对情感的影响,是产生模型中得出的4种基本情感的分量表示。
5 基于Agent的情感映射的劝说让步模型
在对Agent的情感和策略进行相应评价之后,需要进一步研究Agent在实际的劝说交互过程中的让步模型,Agent需要根据情感劝说等因素的动态变化不断进行相应让步,以达成合作。因此,本文对动态环境影响下,基于Agent的情感劝说的让步模型进行了量化研究,建立了基于Agent的情感映射的劝说让步模型,以配合上述模型完成劝说。具体如下:
如果Agent的情感被激发,则让步步长会受到影响而发生动态变化。因此,该让步模型中,关键是根据Agent双方的情感被激发情况,对各劝说属性的让步步长的计算。根据主导情感与情感阈值之间的关系,可构建相应的让步模型如下:
(13)
综上所述,本文建立的基于Agent的情感映射的劝说过程,首先利用已有情感理论中典型的OCEAN-PAD-OCC的层次映射模型,建立OCEAN到PAD的映射模型和PAD到OCC的映射模型,构成了基于Agent的情感映射模型;其次,对Ekman的经典情感分类进行改进,提出了相应的Agent情感分类和基于Agent的情感映射的劝说产生模型,并对Agent的主导情感和情感阈值进行定义,提出了相应的策略模型;再次,根据情感强度第三定律,对Agent的情感强度进行了定义,研究得出其关键影响因素为劝说策略和情感衰减,在对后者定义的基础上,结合马尔可夫理论,提出了相应的评价模型,并通过对让步步长的算法构建,提出了相应的让步模型;产生模型、策略模型、评价模型和让步模型共同构成了基于Agent的情感映射的整个劝说过程,如图2框架流程图所示。
6 算例分析
6.1 基于Agent的劝说
为使研究有代表性和便于理解,本文以煤炭行业供应链管理中的采购商和销售商的谈判为背景,采购商(买方)为Agent a,销售商(卖方)为Agent b,双方就煤炭产品的价格(单位:元)和交货期(单位:d)两个主要属性进行劝说谈判,Agent对这两个属性的要求以及让步步长如表2所示:
表2 Agent对价格和交货期的报价、极限值以及让步步长
考虑到最快的劝说结果,只有在双方Agent不断进行让步的情况下,双方Agent要至少经过7次劝说(第一次为报价)交互后才会得到成交的最优结果:价格36元,交货期5天。这个结果相对Agent a来说,是Agent a的最高限度,但并不是其最优结果,因为并没有达到Agent b报价的最低限度35.5元和4.5 d。
6.2 基于Agent的情感映射的劝说
在基于Agent的情感映射的劝说中,随机选择若干个Agent,包括Agent a和Agent b及其他Agent,以网址:http://www.apesk.com/bigfive/index.asp?language=cn的测试方法为参考,对这些Agent进行大五性格测试,测试得分分别见表3和表4,由此可分别得到如图3和图4所示的Agent a和Agent b的得分与该Agent群体平均得分的比较图。
表3 Agent a大五性格测试数据
表4 Agent b大五性格测试数据
由图3可知,Agent a的5个因素得分都低于该Agent群体的平均值,因此,Agent a具有低开放性、低谨慎性、低外向型、低宜人性和低神经质的性格,说明Agent a保守但冲动,谨慎且多疑,尤其是宜人性这一数值低于该Agent群体的平均值9分,证明Agent a不关心别人,不乐于帮助其他Agent,且经常怀疑其他Agent的动机。
O=[-0.318 5-0.165 7-0.105 7-0.363 8-0.340 7
-0.318 50.362 90.327 10.217 20.239 40.169 00.219 9],
由图4可以看出,Agent b的前4个性格因素得分都低于该Agent群体的平均值,而神经质的得分高于该Agent群体的平均得分,证明Agent b具有低开放性、低谨慎性、低外向型、低宜人性、高神经质的性格,表明其保守但冲动,谨慎且多疑。但是神经质这一性格特点高于该Agent群体的平均值,证明Agent b对外界刺激的反应比该Agent群体的其他Agent强烈,对情绪的调节能力比较差,经常处于一种不良的情绪状态下。并且该Agent的思维、决策、以及有效应对外部压力的能力都比较差。
由图5可以看出,Agent a的开放性、宜人性、神经质得分都低于Agent b,说明和Agent b相比,Agent a更保守、多疑、情绪更平静;而Agent a的谨慎性得分高于Agent b,说明和Agent b相比,Agent a的自律能力更强且不容易冲动;Agent a的外向型得分与Agent b相等,但是都低于该Agent群体的平均得分,这证明双方Agent都是相对内向的性格,比较安静和谨慎,不喜欢与外界过多接触。由情感阈值和对双方Agent的性格分析可以判断出,Agent a和Agent b都处于平静状态,且Agent a的情绪较Agent b不稳定,更容易受外界的影响。
为更加完善和适合本文的研究,本文在文献[14,35]的基础上,对相应的劝说策略分类进行改进,如表5所示。
表5 劝说策略分类
根据以上模型及数据,分别设定Agent a和Agent b的Si,j和φ(T),如表6和表7所示。其中:E1,T表示喜悦,E2,T表示悲伤,E3,T表示烦躁,E4,T表示害怕。同时,为研究方便,取ε=0.5,得到双方的让步步长如表8和表9所示。
表6 Agent a的Si,j和φ(T)
表7 Agent b的Si,j和φ(T)
续表7
表8 Agent a的让步步长
表9 Agent b的让步步长
假设每一轮持续的时间T∈[2,10](单位:min),双方进行基于Agent的情感映射的劝说,过程如下图6所示。
针对上述煤炭行业供应链管理中的采购商和销售商的算例,本文首先将基于Agent的情感映射的劝说模型(Persuasion model of Agent-based Emotional Mapping, PAEM)与传统既定步长的基于Agent的劝说模型(Traditional Set Step persuasion model, TSS)针对价格属性进行了以下对比分析,如图7所示,图中柱状图表示利用PAEM模型的谈判过程,折线图表示利用TSS的谈判过程,从图中可以看出利用PAEM在第五轮就达成了合作,TSS模型在第6轮才达成合作,并且从采购商的角度看,达成合作时PAEM的结果比TSS的结果更优。同样可以对两种模型针对供货期属性进行对比分析。
其次本文将基于Agent的情感映射的劝说模型(Persuasion model of Agent-based Emotional Mapping,PAEM)的劝说轮次与传统既定步长的基于Agent的劝说模型(Traditional Set Step persuasion model, TSS)的劝说轮次进行了以下对比分析。
为便于分析,本文取每轮劝说中双方提议的差值,再取价格和订货期的差值为每轮的劝说结果值(第一轮为初始提议),即差值为0时劝说结束,如图8所示。结果表明,基于Agent的情感映射的劝说达到0值的速度更快,经过6轮就能得到最优结果。而在基于Agent的劝说中,双方Agent在既定让步步长下进行劝说,至少要经过7轮劝说才能得到最优结果。而且相对Agent a来说,PAEM的最终结果更优。这就证明了本文提出的基于Agent的情感映射的劝说模型比基于Agent的劝说中的模型更加符合实际劝说过程和效果。最后,情感及其映射的引入也使得该模型更加符合人的特性,最优提议值更容易被接受。
7 系统实现
为进一步验证上述模型及过程,本文选用Jade平台,利用Java语言,对以上模型及过程进行了系统实现。
系统初始界面如图8所示,图9~图13则展示了双方Agent从第一轮到最后一轮的劝说过程。
8 分析讨论
经过归纳和梳理,与本文研究相关的该领域代表性文献有[8-12,15,17,19,21-22,27,32-33,35-36]。与这些文献相比,本文做出的改进和相应的结论如下:
(1)本文的研究是将情感与Agent的结合。文献[8,11,27]针对Agent的PAD空间情感体验和OCC情感模型,虽然提出了相应的情感虚拟人评价模型和E-learning系统模型等,并有部分应用到了机器人领域,但仅限于人工智能领域,并未把基于Agent的情感劝说应用到商务谈判领域,缺乏更广的应用性。因此,相比之下,本文的研究是将更有代表性的Agent的情感和劝说等人工智能特性应用到了人们日常商务活动的智能化自动谈判,既是对人工智能领域的实际应用,也探索了更加合理有效的解决实际商务谈判问题的方案。
(2)本文的研究是运用情感映射,将Agent的情感特性融入了基于Agent的劝说中。文献[10,32,36]研究了OCEAN、PAD、OCC情感模型之间的相互作用,提出一种考虑了人类性格的情感模型,但是并未结合基于Agent的劝说领域的相关理论和方法进行研究,因此与本文的研究还存在一定的差距;文献[12,33,35]考虑了将Agent的情感和劝说相结合,但文献[12]没有考虑情感映射对基于Agent的劝说产生的动态影响,文献[35]只是简单的研究了Agent的消极情感方面,文献[33]则只考虑了正面情绪的变化,提出了相应的劝说模型,但并未对Agent的情感进行有针对性的分类。本文则在上述文献的基础上,对艾克曼经典情感分类进行改进,并通过考虑相应的情感影响因素如情感阈值、刺激因子、情感衰减等更进一步对情感强度进行量化,建立了更为复杂且情感计算更具说服力的情感强度模型。
(3)本文系统性的分析并提出了基于Agent的情感映射的劝说产生、策略、评价和让步模型。
首先,针对产生模型,文献[12]针对基于辩论的多Agent商务谈判,提出了“候选辩论集的产生策略”和“基于冲突分析的辩论目标产生模型”,但与本文相比,不仅缺乏对劝说这种更加理性的方式的研究,而且没有考虑情感映射对产生模型的影响;本文结合情感映射模型以及Ekman情感分类理论,提出了相应的产生模型,更具说服力。
其次,针对策略模型,文献[15]基于前景理论,融入Agent的心理偏好,提出了基于前景理论的多Agent辩论协商策略模型,但是文中只是粗略的分析了谈判中Agent对收益和损失差值的感知,并未对Agent主体情感进行详细分类,研究的策略模型具有一定的局限性;与文献[9]相比,本文通过建立情感映射模型提出了新的Agent情感分类,构建了劝说的产生模型后,定义了Agent主导情感和情感阈值,主导情感主导Agent进行策略选择,使Agent能根据主导情感与情感阈值的不同关系做出相应的策略选择,这种策略模型更加符合人的行为和实际情景。
再次,针对评价模型,文献[17]提出了基于期望效用评价的情感产生和评价模型,但仅将Agent情感粗略分为正面情感和负面情感,模型较为简单,有待深入研究。本文提出的评价模型由情感强度和情感衰减的概念界定,在分析了影响情感强度和情感衰减的因素及其如何影响后,提出了相应的更有应用价值的评价模型。
最后,针对让步模型,文献[21]通过对基于Agent的劝说的分类,在让步影响幅度的基础上,构建了让步模型,但是研究表明,在谈判过程中,不同权利不同情感下的谈判者会做出不同的让步,因此本文通过计算更进一步量化研究了Agent在劝说中由于主导情感变化导致与情感阈值之间的关系变化而做出的相应让步。
另外,在以上各阶段模型研究的基础上,文献[22]初步将情感理论与模型引入基于Agent的劝说,采用期望效用评价理论,系统提出了基于Agent的情感劝说产生、策略、评价和让步模型。但一方面,该研究没有根据实际情况对其中的Agent的情感进行合理有效分类,因而无法系统建立相应的与基于Agent的劝说相关的情感模型;另一方面,该研究没有结合基于Agent的劝说实际展开,导致最后提出的模型虽然都有所涉及,但仅局限于Agent的情感,涉及劝说较少;最后,该研究中采用的理论和方法过于简单,导致模型中的定量分析不够,对Agent的情感量化不够全面深入,使该研究的系统性仍然不够,缺乏说服力度。文献[19]则在该研究的基础上,对情感进行了分类,提出了相应的情感产生的形式化模型,并结合情感强度第一定律,对Agent情感进行量化,提出了Agent情感强度的计算方法,但一方面,该研究只是将情感作为评价因素,提出了主体Agent的情感评价模型和相应的Agent合作主体选择模型,建立的模型不够全面系统;另一方面,该研究建立的形式化模型较为简单,量化说服力度不够。本文的研究和提出的模型则较好的解决了以上问题。
综上所述,本文首先结合Agent的性格、心情和情绪,通过矩阵转换运算,构建了系统的基于Agent的情感映射模型;其次根据实际情况,对心理学中经典的Ekman情感分类进行了改进,在改进的情感分类的基础上,构建了基于Agent的情感映射的劝说产生模型;然后对基于Agent的劝说策略、主导情感和情感阈值进行了定义,并提出了相应的策略模型;再次,对Agent的情感强度进行了定义,分析其影响因素为劝说策略和情感衰减,并在根据马尔科夫理论对情感衰减进行定义的基础上,提出了基于Agent的情感映射的劝说评价模型;最后通过对受情感影响的让步步长的计算构建了相应的让步模型,并以算例及系统实现的方式进行了验证。情感和劝说的加入,让本文提出的各个模型更能适应复杂和动态变化的劝说环境。
9 结束语
本研究对企业商务智能中的自动谈判领域及人工智能情感研究领域都有一定的理论和实践意义。
(1)在理论方面,首先本文引入Agent的性格、心情、情绪,结合大五模型和马尔可夫模型等有代表性的心理学模型,结合提出的情感映射概念,利用情感第三定律对基于Agent的劝说中的Agent的情感进行了量化计算,对情感的量化可以推动情感理论及模型的应用研究;其次本文利用Agent在情感劝说动态变化影响下理性调整自身情感劝说的优势,模拟人类商务谈判中的思想和理性行为,是对商务智能中基于Agent的劝说研究的进一步拓展,对丰富和发展商务智能领域的理论及模型具有重大意义;最后本文结合经典的Agent开发平台Jade和Java语言,研发出了相应的系统,从系统实现和应用的角度丰富和发展人工智能领域相关理论知识。
(2)在实践方面,实际商务谈判环境复杂,谈判结果不确定性高,开发符合企业谈判需求的系统一直是企业管理人员尤其是相应的系统开发人员所追求的重点。目前有关商务智能中自动谈判系统的理论还只是简单的将讨价还价的功能封装在对应的Agent内,并没有充分体现其作为人工智能的心智和态度,开发出的系统针对的也是企业的特定业务或特征,通用性不强。而且目前存在基于Agent的自动谈判系统实际应用较少的不利局面,导致企业管理者难以体会到该系统的优势。本研究充分考虑了Agent的情感的人工智能特性,对企业实际谈判人员的情感及情感变化进行模拟,并计划利用已有相关研究的应用基础和项目申请依托单位在煤炭行业积累的大数据优势,将该系统应用于煤炭行业供应链上下游企业之间的采购或者销售,从而体现该研究的应用价值。
由于本文提出的模型具有一定的通用性,建议企业在实际应用中,结合自身业务特点,对实际谈判中的情感更进一步分类,采用以上模型进一步开发和使用更适合本企业管理特色的同类系统。此外,建议企业管理者在开发使用该类系统前,能充分掌握采用该类系统能给企业带来的益处,同时能将其作为企业管理理念,对企业所有人员进行培训。
由于本文的研究是对该领域的初步探索,因此所提出的模型相对简单直观,今后的研究将分别针对这些模型进行改进,提出更加复杂有效的模型。另外,由于不同的情感会对劝说过程产生不同的影响,因此笔者拟在今后研究的基础上,基于不同的情感类型,对情感进行更深入有效的分类,如积极情感和消极情感,研究在本文模型的基础上不同类型的情感及其映射对基于Agent的劝说的影响。