基于Agent的映射的情感劝说行为产生模型
2021-05-07伍京华叶慧慧
伍京华,叶慧慧,李 岩
(中国矿业大学(北京) 管理学院,北京 100083)
0 引言
随着人们对于电子商务的智能化、个性化提出更迫切的需求[1],商务智能成为科研人员的重要研究方向,而自动谈判系统是商务智能领域的重要研究内容[2]。基于Agent的劝说系统是两个或两个以上Agent为达到共赢而进行竞争性的决议和让步过程,Agent之间彼此交换提议,当某个提议被双方接受或者达到最大劝说时间时,劝说结束[3]。Agent情感是指Agent具有模拟人类情感的能力,使Agent除了理性决策还能够表现出感性行为,即个性、心情和情绪产生的非理智行为[4]。被赋予情感的Agent能够更准确地模拟人与人之间的相处沟通方式,也能更加灵活地进行决策,而不是机械化地执行交互算法[5]。因此,将情感引入基于Agent的劝说中,进一步发挥Agent模拟人的情感特性,研究基于Agent的情感劝说成为商务智能领域的热点和难点。
在基于Agent的情感映射方面,Santos等[6]为了更好地展示Agent情感的产生,将Agent的性格、心情、情绪映射模型与群体决策支持系统相结合,提出了相应的决策模型;李海芳等[7]对Agent个性、心情、情感三者之间的关系进行量化,建立了基于Agent的多层次情感计算模型;何海鹏[8]结合个性对心情和情感的影响,构建了多层情感模型;Hortensius等[9]结合心理学和神经科学,提出了Agent的情绪产生模型;Rincon等[10]结合三维心情空间(Pleasure-Arousal-Dominance, PAD)心情模型研究Agent如何基于个性、同理心和亲和力改变其他Agent的情绪,并提出了社交情绪的概念;韩晶等[11]利用三维情感模型(Arousal-Valence-Stance, AVS)和大五性格模型,提出了基于高斯混合模型(Gaussian Mixture Model, GMM)的增量式情感映射模型,实现了对用户真实情感的有效映射;王浩等[12]结合心理学知识,利用隐马尔可夫模型(Hidden Markov Model, HMM)过程,提出了一种能模拟人类情感变化过程的情感转移模型。
在基于Agent的情感劝说方面,Van Kleef等[13]研究了情感对基于Agent的劝说行为的影响;Adler等[14]研究认为情感在劝说中可能促进合作,也可能引发冲突甚至导致劝说的失败;Jiang等[5]研究了PAD模型中各维度对劝说行为的影响,并建立了情感决策函数;Broekens等[15]研究了情感在谈判中的哪些阶段起主要作用,并通过情感计算技术讨论了情感谈判支持系统可提供的更具体的与情感相关的功能;Sergio等[16]运用模糊隶属函数,赋予Agent情商,建立了情感计算模型;杨佩等[17]通过对信念修正算子进行量化和排序,提出了相应的Agent劝说方法;伍京华等[18]首次将情感和Agent劝说相结合,提出消极情感变化度的概念,构建了基于Agent的劝说的消极情感影响模型;伍京华等[19]结合情感强度第一定律,运用模糊隶属度函数,通过建立Agent主体提议评价模型、信度评价模型和情感评价模型构建了基于Agent的情感劝说的合作主体选择模型。
在基于Agent的映射的情感劝说行为产生模型方面的研究较少,目前只有Santos等[20]将性格模型、心情空间模型、情绪模型与群体决策支持系统相结合,通过对比展示了基于Agent的情感劝说的优势;董学杰等[21]根据Agent情感决策的过程,构建了基于Agent的情感产生和决策模型。情感作为人和机器最主要的区别,对劝说行为有极为重要的影响,实现情感的模拟不仅能使机器人或计算机具备更快的信息处理速度和更高的处理效率,还能赋予机器创造力、思维能力和决策控制力。根据相关心理学理论[6-10,22-23]和何海鹏[8]对多层情感模型的研究,如果个性、情绪等存在差异,产生的情感也会有所差别,然而文献[19]和文献[21]只是将情感简单分为积极情感和消极情感,建立的情感产生模型缺乏对Agent性格、心情和情绪等因素考虑。因此,目前所研究的基于Agent的情感劝说产生模型还存在一定的局限性。
虽然目前基于Agent的劝说系统可以模拟人进行一些判断决策,但是存在对情感量化不深入,模拟人类决策不准确等问题。针对这些不足,本文拟结合多层情感模型,研究基于Agent的情感劝说行为产生模型,建立基于Agent的映射的情感劝说行为产生模型。
1 基于Agent的情感映射模型
基于Agent的情感映射是Agent情感产生的前提和核心。根据王岚等[24]的研究,定义基于Agent的情感映射是Agent根据个性—心情—情绪的映射产生相应情感的过程。首先对个性、心情、情绪的相关心理学机理及数学量化模型进行如下研究分析。
1.1 Agent的个性、心情、情绪模型
(1)在心理学中,个性又称为性格和人格,是在成长过程中逐渐形成的稳定的、独特的个体特征[6]。可用n维向量Oe来表示Agent的个性集合,如式(1)所示:
(1)
式中:αi表示Agent的第i维度个性特征值,其强度用[-1,1]间的数值表示,αi的绝对值越大,表示此Agent在这一维度的个性特征越明显,αi=0表示不存在某种个性。
Goldberg[25]提出的大五个性模型(Openness,Conscientiousness,Extraversion,Agreeablenes,Neuroticism, OCEAN)受到了心理学家的普遍认可,本文采用该模型描述Agent的个性特征,因此公式(1)中的n取5。大五个性模型利用5种特质描述个性,如表1所示。
表1 大五个性及对应的个性特征
(2)Agent的心情指受性格因素和外界环境影响的能影响Agent行为的心理状态[7]。在影响Agent情感的因素中,个性最为稳定,心情的稳定性和变化介于个性和情绪之间,其持续时间比情绪更久。可用m维向量Pe来表示Agent的心情状态,如式(2)所示:
(2)
其中βi表示Agent的第i维度的心情特征值,βi∈(-1,1),i∈[1,m],其在t时刻的强度用[-1,1]间的数值表示。
(3)在情绪心理学中,Agent的情绪是Agent对客观事物的态度体验和短暂的、易变化的行为反应,具有瞬时性的特点,易随时间快速衰减。情绪有很多种,但心理学家认为只存在有限种基本情绪,其组合产生了所体验到的各种情绪,并且各种情绪之间具有连续性[8]。为了体现Agent的情绪状态的连续性,假设存在N种基本情绪状态,用集合Me={mi|i=1,2,…}表示Agent所有的情绪状态,如式(3)所示:
(3)
式中mi表示Agent基本情绪状态的情绪强度。
1.2 基于Agent的情感映射模型
心情的形成与个性及情绪经历有关[22,28],而情绪的形成与心情有关[7-8],因此,要实现Agent个性到情感的映射,应首先将Agent的个性映射到心情,再将心情映射到情绪。情绪经历指的是当前时刻之前所经历的情绪类型,而情绪指的是当前时刻的心理状态。根据马尔科夫链[29]理论,初始情绪经历取Agent的初始情绪,交互过程中的情绪经历取上一轮的主导情绪。因此,建立如下OCEAN到PAD的“个性—心情”映射模型和PAD到OCC的“心情—情绪”映射模型。
1.2.1 基于P-GMM的Agent“个性—心情”映射模型
参照基于GMM模型的增量式情感映射模型[11],利用层次分析法建立基于个性化GMM(Personalized Gaussian Mixture Model, P-GMM)的Agent的“个性—心情”映射模型,即围绕大5个性模型的5个维度,引入个性参数,利用GMM模型建立“个性—心情”情感映射模型。首先建立如图1所示层次分析结构,底层是Agent个性特征,用P=[P1,P2,P3,P4,P5]表示,中间层是Agent个性和心情的关联关系,顶层是心情特征的属性。
(1)对实验样本采用最小二乘法进行估计,即
(4)
(5)
(3)由Svensson等[31]的研究可定义Agent的个性参数如式(6)所示:
(6)
其中kPe为认知强度系数,取值范围是(0,1)。
(4)Agent在第k类心情的GMM概率如式(7)所示:
(7)
式中μPek=(μpk,μak,μdk)由文献[32]得到。
(8)
(5)初始心情更新。根据万超岗[28]的研究,在情感映射过程中,Agent的初始心情会受到初始情绪的影响。结合初始心情Pe0和初始情绪m0,心情更新过程如式(9)所示:
Pe=ω1Pe0+ω2m0。
(9)
式中:ω1和ω2为心情和情绪经历对心情更新的影响权重,ω1+ω2=1;Pe为更新后的心情特征值,初始情绪m0取初始主导情绪所对应的PAD值。
1.2.2 基于修正矩阵的Agent“心情—情绪”映射模型
每个情绪状态都对应于PAD心情空间的一个点,选取OCC情绪模型中适用于商务谈判的12种情绪,由PAD三维心情空间与其对应关系[33],可得PAD心情空间到OCC情绪模型的转换矩阵,即
(10)
由“个性—心情”映射模型可得心情的坐标值为(p,a,d),利用倒数归一化方法对心情与基本情绪状态间的距离进行量化,可得Agent心情映射到OCC情绪模型的修正矩阵,利用修正矩阵和转换矩阵实现PAD到OCC的映射,具体过程如下:
(1)设基本情绪状态在PAD三维心情空间中对应的点的坐标为(pi,ai,di)i=1,2,…,N,则Agent心情与基本情绪状态间的距离可表示为:
(11)
(12)
(3)由此可得Agent的心情到情绪的映射模型如式(13)所示:
(13)
式中mT为Agent的情绪值。
2 基于Agent的映射的情感产生模型
基于Agent的情感产生模型是基于Agent的情感劝说行为产生模型的核心,因此先在已有情感研究的基础上对基于Agent的情感进行合理分类,然后根据上述情感映射模型构建相应的基于Agent的映射的情感产生模型。
2.1 Agent的情感分类
情感分类是情感领域的关键问题,Ekman等[34]将情感分为Joy、Anger、Disgust、Fear、Sadness和Surprise六类,这种分类在心理学界和工程学界得到了普遍认可。结合OCC模型的产生过程和主成分分析法,在Ekman情感分类的基础上得到了如图2所示的4种适用于基于Agent的劝说过程的基本情感类型,以及情绪与情感的对应关系。
2.2 基于Agent的映射的情感产生模型
Mehrabian研究表明[33],Agent的情绪对情感有直接影响作用,而Agent的情绪会受到心情的调节,当Agent心情和情绪方向相同时,情绪会被心情增强,相反,情绪会被心情减弱。例如,心情好时,可能会对某些坏的行为不去计较;心情不好时,别人的好意可能也会让人理解为歹意。因此,首先对情绪调节过程进行定义,然后由调节后的Agent情绪产生情感。
(1)情绪调节。
(14)
(2)情感产生。Agent情感受情绪的影响,可由如图2所产生的4种情感,用一个4维向量表示Agent的情感状态,即
(15)
考虑到每个情感维度中的各个情绪对情感的影响不同,首先运用熵值法得出第i个情感状态中各个情绪的权重,然后由各个权重与情绪值获得该情感状态值,具体过程如下:
1)数据标准化处理。情绪的绝对值越大,对情感的影响越大,因此第i种情感中第j种情绪的比重为:
(16)
2)计算第j种情绪的信息熵。
(17)
式中n表示j列Yij≠0的值的个数。由于情感是4维向量,令c=1/ln(4)。
3)根据信息熵冗余度,计算各个情绪的权重值。
(18)
4)计算各情感值。
(19)
3 基于Agent的映射的情感劝说行为产生模型
基于Agent的映射的情感劝说行为产生模型是基于Agent的情感劝说得以顺利进行的前提。在基于Agent的情感劝说产生的过程中,买卖双方Agent通过基于Agent的映射的情感产生模型产生相应的Agent情感,然后由对方的历史交易信息判断对方Agent的劝说风格,进而根据Agent认知库中提取出来的Agent对各属性的期望值和极限值的信息产生相应的劝说行为。
3.1 基于Agent的情感劝说行为分类
3.2 基于Agent的映射的情感劝说行为产生模型
根据模糊认知逻辑[23,38],定义Agent认知是指Agent在劝说过程中的知识和意图。Agent首先按照本身个性特征和情绪状态,使用基于Agent的映射的情感产生模型映射出相应的情感,再利用所处的情感状态、认知状态和劝说规则产生合适的劝说行为,整个基于Agent的映射的情感劝说行为产生模型如图3所示。
3.2.1 基于Agent的映射的情感劝说行为产生
基于Agent的情感劝说行为的产生规则可用逻辑语言表示如下:
G(T)={Act|Emax,t,Oe,Pe(t),me(t),
KI,NH,RB}。
(20)
式中:G(T)为Agent在T时刻产生的劝说决策;Act表示Agent的情感劝说行为;Emax,t表示t时刻Agent的主导情感,且有{Oe,Pe(t),me(t)}→Emax,t,表示Agent在t时刻的个性Oe;心情Pe(t)、情绪me(t)通过情感映射模型得出t时刻的主导情感Emax,t;KI为劝说Agent的认知,包括Agent劝说意图集合,即Agent对劝说中各属性的期望值和极限值,如在煤炭行业供应链管理中采购商对交货期的期望为3天,极限为5天,对成交价格的期望为500元,极限为800元;NH为劝说案例库,包含对方Agent在以往交易中的劝说过程及结果,可根据这些历史交易数据,预测对方Agent是何种劝说风格。
Agent劝说风格是一个相对的概念,是指相对自身而言,对方Agent在历史交易的劝说过程中针对各劝说属性所体现的明显的决策特点,包括冒险型(adventurous persuasion style)、谨慎型(cautious persuasion style)、合作型(cooperative persuasion style)。为得到Agent的劝说风格,定义Agent的劝说风格评价值:
(21)
(22)
若PUs>PUb,则Agents的冒险性相对更明显;若PUs (1)当PUs-PUb∈[-1,-0.6]时,证明PUs∈[0,0.2],PUb∈[0.8,1],此时双方的劝说风格评价值相差很大,卖方的相对劝说风格为冒险型,买方为合作型。 (2)当PUs-PUb∈(-0.6,-0.2]时,证明PUs∈[0.2,0.4],PUb∈[0.6,0.8],此时双方的劝说风格评价值相差比较大,卖方的相对劝说风格为冒险型且买方为谨慎型,或者卖方为谨慎型且买方为合作型。 (3)当PUs-PUb∈(-0.2,0.2)时,证明PUs和PUb都在[0.4,0.6]之间,此时双方的劝说风格评价值相差较小,买卖双方的相对劝说风格可看成相同。 (4)当PUs-PUb∈[0.2,0.6)时,证明PUs∈[0.6,0.8],PUb∈[0.2,0.4],双方的劝说风格评价值相差比较大,此时卖方的相对劝说风格为合作型且买方为谨慎型,或者卖方为谨慎型且买方为冒险型。 (5)当PUs-PUb∈[0.6,1]时,证明PUs∈[0.8,1],PUb∈[0,0.2],此时双方的劝说风格评价值相差很大,卖方的相对劝说风格为合作型,买方为冒险型。 表3 卖方情感劝说行为的产生规则 表4 买方情感劝说行为的产生规则 Agent初始提议受各属性期望值、初始主导情感和初始劝说行为的影响,根据上述买卖双方Agent劝说行为的产生规则,可定义初始劝说行为产生函数: (23) 其中:T1为Agent针对各属性的初始提议值集合;t1,t2,…,tn为各劝说属性值;TExpectations为Agent针对各属性的期望值集合;τEmax〈t1,t2,…,tn〉为Agent受主导情感影响的让步幅度,如处于Joy情感状态时,关注价格的Agent可能会产生10%的价格让步和20%的交货期让步。将各劝说属性按照主体关注程度从强到弱排序:t(1),t(2),…,t(n),n>10,结合主导情绪类型,可产生如表5所示情感让步幅度[39]。 表5 情感让步幅度表 3.2.2 基于Agent的映射的情感劝说行为更新 处于劝说中的Agent会根据情感产生不同的情感劝说行为,针对劝说中的多个属性,发出相应的劝说提议,从而促使劝说过程得以顺利进行。根据文献[40]可知,Agent当前轮次的劝说提议受上一轮次提议、当前轮次主导情感和当前轮次劝说行为的影响,因此定义劝说行为更新函数: (24) 其中:Tk为Agent当前轮次的提议值集合,Tk-1为Agent上一轮次的提议值集合;τEmax,k〈t1,t2,…,tn〉为Agent受当前轮次主导情感影响的让步幅度,根据Agent情感映射规则,在交互过程中,情绪和心情会直接和间接地导致Agent情感变化。 (25) (2)主导情绪衰减。在心理学上,情绪具有瞬时性[28],根据情感强度第一定律,其衰减函数可以用指数函数来表示,因此选用指数函数作为主导情绪衰减函数: (26) 综上可得,基于Agent的映射的情感劝说交互流程如图4所示。 以煤炭行业供应链管理中的采购商和销售商的交易为背景,采购商为Agent1,供应商为Agent2,双方就煤炭产品的价格(单位:元)和交货期(单位:天)两个主要属性(若有其他属性可通过同样的方法计算)通过中介Agent进行劝说提议的交换。当买方Agent1收到的关于价格和交货期的劝说值小于或等于自身提议值(或卖方Agent2收到的关于价格或交货期的劝说值大于或等于自身提议值)时,劝说成功,结束情感劝说,成交值为买卖双方最终提议的平均值。最大劝说轮次为10,假设买卖双方受资金的限制都更关注价格属性,双方Agent对价格和交货期的期望值和极限值如表6所示,Agent1和Agent2的以往交易案例信息如表7所示。 表6 买卖双方Agent对价格和交货期的期望值和极限值 表7 买卖双方Agent以往交易案例信息 为了增强本文所提模型的合理性,并验证其有效性,使用Python分别对未考虑Agent情感和映射的劝说模型(Persuasion behavior generation Model based on Agent, PMBA)和基于Agent映射的情感劝说行为产生模型(emotional Persuasion behavior Generation Model based on Agent’s Mapping, PGMBA)进行系统实现。 4.1.1 未考虑Agent情感和映射的劝说模型(PMBA) 在传统的基于Agent的劝说过程中,Agent通常按照固定的劝说行为,根据固定的让步步长进行劝说交互,在这种情况下,买卖双方的劝说更新函数如下: Tk〈t1,t2,…,tn〉= (27) 由图5可以看出,不考虑情感和映射时,买卖双方Agent以固定的让步步长,经过7轮达成交易,成交值为双方最终提议的平均值,即[35.5,4.635]。 4.1.2 基于Agent的映射的情感劝说行为产生模型(PGMBA) 采用本文提出的基于Agent的映射的情感劝说行为产生模型进行交互实验,实验参数设置如图6所示,运行结果如图7所示。具体的情感劝说交互过程如表9所示。 由图6可以看出,采用PGMBA模型时,买卖双方Agent根据主导情感和劝说行为,动态地产生劝说提议,经过6轮达成交易。由表9可以看出,双方成交值为双方最终提议的平均值,即[35.06,4.05]。 表9 采用PGMBA模型的劝说过程表 4.2.1 对比分析 观察以上实验结果可得使用PMBA模型和PGMBA模型,买卖双方各属性成交速度对比图如图8所示,买卖双方成交值对比图,如图9所示。 综合分析两种模型的实验结果,可得:①使用PMBA模型的交互轮数为7轮,使用PGMBA模型的交互轮数为6次。可见,使用加入情感和映射的劝说交互速度更快。②使用PGMBA模型的价格成交值和交货期成交值均低于PMBA模型。可见,使用本文模型相对于买方Agent更加有利。③由图9可得,调整合适的参数后,无论是价格还是交货期,使用PGMBA模型都比使用PMBA模型的收敛速度更快。因此,加入情感和映射的劝说交互过程更加符合实际劝说,对买方来说更具有有效性。 4.2.2 灵敏度分析 图10是卖方ω1取最优且双方τEmax取表5中值时,买方的ω1变化对劝说交互过程的影响,图11是买方ω1取最优且双方τEmax取表5中值时,卖方的ω1变化对劝说交互过程的影响。从两图可以看出,随着ω1的减小,劝说的收敛速度加快。由于ω1和ω2分别是上一轮次心情和情绪对当前轮次心情的影响权重,可得到结论:情绪经历(即上一轮次情绪)对当前心情的影响权重越大,劝说收敛速度越快。 图12是买卖双方的ω1都取最优时,单一劝说属性的τEmax变化对劝说收敛速度的影响,图中纵轴的取值是劝说成功所需轮数的倒数,当达到0.5时,代表只需两轮即可劝说成功,达成合作。由图12可以看出,交货期的τEmax固定时,随着价格让步幅度的增大,劝说的收敛速度加快。同样,价格的τEmax固定时,随着交货期让步幅度的增大,劝说的收敛速度也加快。 综上可得:ω1越小,劝说收敛速度越快,τEmax越大,劝说收敛速度越快。 在传统的基于Agent的劝说过程中,Agent通常按照固定的劝说行为,根据固定的让步步长进行劝说交互,产生的Agent劝说与实际劝说提议的产生过程相差甚远,这导致Agent不适用于动态变化的劝说环境,相比现有研究,本文做出的改进和相应的结论如下: (1)将情感引入基于Agent的劝说模型中,让劝说Agent模拟人类情感产生过程的优势在于:使Agent更加拟人化,劝说过程更加符合实际,有助于赋予Agent创造性的思考能力和独立的决策能力。 (2)将映射的概念引入到基于Agent的情感劝说领域,并结合心理学中情感的概念,定义了基于Agent的情感映射,由于性格、心情、情绪和情感的产生并不是独立存在的,它们之间相互影响,通过映射的方法将这些情感特征联系起来,使Agent所产生的情感更符合情感的实际产生过程,更适用于动态变化的劝说环境。 (3)基于Agent的情感产生模型和李海芳等[7-8]研究的多层情感模型相比,加入个性化参数的P-GMM情感映射模型和加入修正矩阵的情感映射模型可以更加精准地映射得到心情和情绪特征值;考虑心情更新、情绪衰减和情绪调节更加精确的量化情感,可以真实地模拟人类情感的产生,提高了对动态变化劝说环境的适应性。 (4)结合人际劝说理论,对基于Agent的情感劝说行为进行详细分类,并引入Agent劝说风格因子的概念,使Agent根据情感状态和自身惯有的劝说风格产生情感劝说行为,并通过实验验证了这种情感劝说行为产生模型的合理性。 基于Agent的情感劝说的研究对企业商务智能中的自动谈判领域及人工智能情感研究领域都有一定的理论和实践意义。 (1)理论方面 在较大程度上将管理中的不确定性问题尤其是Agent的情感转化为参与谈判的企业各方都乐于接受的确定性问题,降低了由于情感导致的不确定性,从而推动了情感和商务智能领域的理论及模型的应用研究。 (2)实践方面 充分考虑了基于Agent的情感的人工智能特性,对企业实际谈判人员的情感及情感变化进行模拟,不仅可以部分或全部代替人完成商务谈判,降低企业成本,还能保证谈判Agent模拟的真实性,优化和提高企业商务谈判速度及效率,改善和提高企业商务绩效及决策水平,更有应用到企业管理中的价值。 由于本文提出的基于Agent的映射的情感劝说行为产生模型具有一定的通用性,建议企业在实际应用中,结合自身业务特点,对实际谈判中的情感进行合理分类,采用以上模型并进一步开发更适合本企业管理特色的同类系统。此外,建议企业管理者在开发使用该类系统前,能充分掌握该类系统能给企业带来的益处,同时能将其作为企业管理理念,对企业所有人员进行培训。 本文初步将Agent模拟人的映射、情感和劝说相结合,构建出系统完整且科学合理的基于Agent映射的情感劝说行为产生模型。但在实际商务谈判中,基于Agent的情感劝说还受Agent模拟人的学习、偏好等其他因素影响,这些都将是下一步的研究方向。4 算例及分析
4.1 算例
4.2 分析
5 研究结论及管理启示
5.1 研究结论
5.2 管理启示